¿Google indexa tus archivos privados de Dropbox?

Mientras perdia el tiempo navegando por Facebook, encontré un post del Utero de Marita ENCONTRANDO ARCHIVOS DROPBOX POR SAN GOOGLE (el linkback va de regalo), inmediatamente me llamo la atención debido a que somos una empresa que hace uso intensivo de esta famosa aplicación Dropbox, también hacemos uso de box.com, google drive, skydrive, iCloud, Amazon Cloud Drive y Mega.co.nz, y estamos analizando la posibilidad de también hacer uso de bittorrent sync, own cloud, ADrive, disk.yandex.com, SugarSync, que son tremendos competidores; pero al leer una noticia como esta obviamente nos preocupamos y decidimos indagar al respecto. En resumen, Miguel Guerra (Autor del post) dice que con comandos de búsqueda en Google (las cuales oculta en sus fotos) ha logrado encontrar archivos que deberían ser «privados», esto es un requisito fundamental de estos servicios, primero me preocupé pero luego de indagar me di cuenta que el señor está equivocado (eso espero ;), y aquí mis fundamentos:

1.- Dropbox robots.txt

Efectivamente, dropbox usa robot.txt para que no indexe el contenido asi que el crawler de google no lo puede (ni debe) indexarlo. Este es el link, no veo porqué ocultarlo, es público https://www.dropbox.com/robots.txt, ah, y el que realmente debe preocuparles es este https://dl.dropbox.com/robots.txt
Dropbox robots.txt
Dropbox robots.txt

2.- Resultados de búsqueda de Dropbox

Con el comando de búsqueda que usa, el cual a mi parecer no debe ocultar, obtiene exactamente 1 solo resultado en cada query como pueden observar en sus propias fotos (sorry por reusarlas). Nosotros usamos el siguiente comando:
site:https://dl.dropbox.com/ marihuana
site:https://dl.dropbox.com/ porn
site:dropbox.com marihuana
etc
Lo pueden usar en Bing o Yandex tambien (conocen yandex verdad?), y también obtenemos 1 sólo resultado.
Búsquedas en Dropbox
Búsquedas en Dropbox

 

3.- Indexación de Google en Dropbox

Google es un crawler, spider o algoritmo de búsqueda, cuyo objetivo es indexar la mayor cantidad de contenido de Internet. Indexar significa crear un indice del contenido (imagínense el indice de MS Word, solo que bastante mas complejo), y de esa manera mostrar solo el titulo, el link y una breve descripción cuando haces una búsqueda. Cuando google va navegando por el contenido mismo y encuentra un link, inmediatamente lo sigue e inicia una nueva ruta de indexación hasta que encuentra un 404 not found y asi sucesivamente, lo que trato de decir en este párrafo es que los resultados encontrados efectivamente fueron puestos manualmente en una web que se deja indexar por Google, asi que si fueron indexados, efectivamente se quería que lo fueran por los dueños del contenido, algunos ejemplos en pdf (hablando de marihuana no?):

 

http://dl.dropboxusercontent.com/u/20388128/Qu%C3%A8-fem-amb-la-marihuana.pdf

https://www.dropbox.com/s/atx8aux64xes0ht/Nuevos%20descubrimientos%20sobre%20la%20marihuana.pdf

http://dl.dropboxusercontent.com/u/1332959/%20Rosa%20Menkman%20-%20Glitch%20Studies%20Manifesto.pdf

Caramba, nunca me tomo tan en serio lo que leo en Facebook, pero esto tocaba mi privacidad y decidí dedicarle unos minutos

 

4.- Folder públicos en Dropbox

Cuando visitas la página web de Dropbox, no hay por ningún lado alguna indicación de que existen folder públicos, a menos que esté logueado con mi propia cuenta, en otras palabras, Google no sabe que el «folder publico» existe, y si no sabe que existe, no lo indexa, y menos cada uno de los documentos dentro de esos folders. Los folders publicos de Dropbox no se indexan, no se preocupen, pero si desean que suceda, pueden incluir un link en una web para que se indexe y listo.

Conclusion «Google no indexa tus archivos privados de Dropbox».

Mi granito de arena, si desean aprender como buscar en google como un pro, lean el siguiente enlace, básico para la universidad y para el trabajo diario

link: http://www.googleguide.com/advanced_operators_reference.html

Sorry Miguel Guerra, pero tu post no agrega conocimiento a los internautas, parece como los titulares de la web de El Comercio online (regresé al papel y a su copia online) y de muchos otros blogs en búsqueda de tráfico solamente, no puedes «proteger» de contenido ilegal a Internet, siempre va a existir, no se que reportaste ni a quien, el contenido ilegal de compra de armas, pornografia infantil, compra de drogas, trata de blancas, etc siempre va a existir, esta en la deep web (tarea para la casa), es como caminar por Lima, sabes que existe el Cerro San Cosme, La huerta perdida, los barracones, etc, pero no caminas (navegas) por ahi, tampoco los puedes reportar ni desaparecer, siempre van a existir o migrar a un lugar más recóndito, sólo podemos aconsejar «cuidadito tus ojitos lo que miran, cuidadito tus manitas lo que tocan».

0 0 votes
Article Rating
Filed under: OtrosTagged with:
Subscribe
Notificarme de
guest

0 Comments
Inline Feedbacks
View all comments