Você está na página 1de 9

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)

UNIDAD 2

BSQUEDA DE INFORMACIN EN LA RED


El acceso masivo a informacin a travs de la Red, exige considerar algunos aspectos para sacar
el mejor provecho de ella. No toda informacin es relevante o pertinente, y para evaluar su utilidad hay estrategias probadas.
La masificacin de la informacin y el relativo
fcil acceso que existe a travs de Internet, no
significa que toda esa informacin sea til, o
que cumpla con los requisitos de rigurosidad
impuestos a la informacin cientfica. Sin embargo, es un excelente medio para acceder a la
que se est generando da a da.
Este sistema obedece a los mismos principios
de la bsqueda en bases de datos y aunque en
los ms conocidos no se utilizan los operadores propiamente tal, s hay otros smbolos que
los reemplazan.
Como cualquier sistema de administracin de
datos, los que los generan deben incorporar en
las muchas bases, los cdigos de acceso y las
reas a las que pertenece la informacin, por
lo que la Association for Computing Machinery calcul en el 2007 que de toda la informacin que contiene Internet, slo un 37% est
registrado en los buscadores. Sin embargo, ese
antecedente es dinmico.
Un buscador de Internet es una herramienta
que permite a un usuario encontrar una pgina Web determinada a partir de la introduccin de un trmino o frase, denominado palabra clave, en un cuadro de bsqueda. Mediante la aplicacin de una serie de criterios de
evaluacin, los buscadores filtran sus resultados de entre los millones de pginas Web existentes en la Red y ofrecen una serie de enlaces
a los sitios que consideran ms relevantes en
funcin de la bsqueda realizada.
Son los tres buscadores ms utilizados en Internet: Google, Bing y Yahoo. Hoy por hoy, los
dos ltimos se esfuerzan por acortar distancias
con el todopoderoso Google. Le han conseguido superar en algn tipo de bsqueda? Sigue siendo Google imbatible en el terreno de
los buscadores?

StatCounter (un sitio que registra y analiza


trfico en la red) establece que en el 2014,
Google era el lder indiscutible de las bsquedas mundiales con un 75,2% de penetracin,
frente al 12,5% de Bing y el 10,4% de Yahoo.
Por su parte, el sitio Consumer.es elabor el
2011 una comparacin en la que establece, por
campos, cules son los puntos fuertes de cada
uno de estos tres buscadores.
En resumen, el estudio determina que Google
es el ms aconsejado para bsquedas bsicas,
de imgenes y de noticias; Bing para elementos multimedia y Yahoo para buscar productos.
Elementos en comn y diferentes. Pese a que
Bing es relativamente nuevo (Microsoft lo lanz hace dos aos), Yahoo usa su tecnologa de
bsquedas desde finales de 2009. Google, por
su parte, cambia el funcionamiento y los parmetros de su algoritmo de forma habitual
para adecuarlo a las nuevas necesidades de los
usuarios.
Ninguno se limita a la indizacin de pginas
Web, sino que integran otras funciones especializadas segn el tipo de contenido, como
imgenes, vdeos, compradores de compras y
noticias. Todos disponen de bsquedas avanzadas mediante la seleccin de diferentes parmetros y filtros, como palabras exactas, fechas, bsquedas dentro de un mismo dominio
o limitadas a algn pas o idioma. Tambin
comparten la opcin que permite la bsqueda
en tiempo real mediante el autocompletado
(con sugerencias) en el casillero de bsqueda.
Los tres integran resultados de Twitter, pero se
diferencian en la integracin de resultados de
Facebook (slo Bing). Solo Google filtra resultados de blogs. Bing carece de funciones referentes a clima, calculadora y cartelera. En lo
1

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 2

referente a la funcin de divisas, quien carece


de ella es Yahoo.

Duck Duck Go

Lo mejor y peor de cada uno:


+

Google: lo mejor es su buena integracin


de los diferentes mtodos de bsqueda. Lo
peor, sus resultados poco relevantes en determinadas palabras genricas.
Bing: lo mejor es su buscador de vdeos,
que destaca sobre sus competidores. Lo
peor y que debe mejorar bastante, el buscador de noticias.
Yahoo: lo mejor es su comparador de productos. Lo peor que carece de funciones
bsicas de segmentacin de las bsquedas.

Los motores de bsqueda son el alma de Internet. Google no es el nico que puede dar
respuesta a todas sus preguntas. Existen otros
motores de bsqueda alternativos que incluso
le darn respuestas ms concretas y fiables.
Esta es una seleccin de los 3 mejores.

Duck Duck Go comparte muchas caractersticas con Google. Sin embargo, su forma de presentar resultados no se centra tanto en la importancia de la pgina que contiene la informacin requerida, como en ofrecer la mejor
respuesta posible a la pregunta que se le formula, aunque no se encuentre en una Web
bien posicionada. Resulta el motor de bsqueda alternativo idneo si le molesta la abrumadora presencia de los anuncios de Google.
Internet Archive

Yippy

Yippy es el motor de bsquedas alternativo


preferido de los espas. En los motores de bsqueda tradicionales, como por ejemplo Google
o Bing, unos programas rastrean la red indexando la informacin. Sin embargo esta catalogacin del contenido es superficial. En
cambio a Yippy, le gusta adentrarse en los callejones oscuros de la Red, para encontrar informacin que habitualmente concierne al gobierno, instituciones estatales o informacin
difcil de encontrar. Es el buscador de la Red
profunda.

Internet Archive, ms que un motor de bsqueda, es la hemeroteca de la Red. Destino


obligado de los nostlgicos amantes de los inicios de Internet. Este motor de bsqueda ha
estado guardando documentos de la Red prcticamente desde su nacimiento. En l puede
encontrar cmo eran las pginas en 1999, o
qu fue noticia un da de hace 10 aos. Naturalmente no es un motor de bsqueda de uso
diario, pero resulta un motor de bsqueda especialmente til en trabajos de investigacin.

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 2

Estrategias de bsqueda en Google


Al usar palabras sueltas (en ingls), por
ejemplo
certification rules california
Google asume el operador OR y esta bsqueda
representa certificacin O normas O California, y por lo tanto arrojar todas las pginas
registradas en el buscador, en que se encuentren cualquiera de las tres palabras.
Si se pretende buscar una asociacin se usa el
smbolo ms (+) que equivale al operador
AND
+certification +rules +california
En esta oportunidad, se asocian las palabras y
la bsqueda arroja todas las pginas donde
aparezcan las tres palabras, aunque no necesariamente en secuencia.
Si se pretende buscar una asociacin tipo secuencia, se utilizan las comillas (xxx xxx)
+certification rules +california
En esta oportunidad, la bsqueda arrojar todas las pginas en las que aparezca California
y el concepto normas de certificacin
Excluir palabras con el signo - y forzar
la inclusin con +
Suponga ahora que busca informacin sobre el
Samsung Galaxy III de esta manera:
Galaxy S3
Pero los resultados estn contaminados de
comparaciones con el iPhone, las cuales no le
interesan en absoluto porque tiene claro en
adquirir el S3. Pero adems, quiere enterarse
de precios.
Pues debe excluir los resultados en los que
aparezca la palabra iPhone y forzar que aparezca la palabra precios con esta bsqueda:
Galaxy S3 phone +precios
El comodn *
El asterisco acta como comodn en las bsquedas de Google. Suponga, por ejemplo, que
quiere cenar en un restaurante que le gust,
pero no se acuerda bien de su nombre. Lo que

sabe es que era Casa algo, un caso perfecto


para centrar la bsqueda al mximo usando el
comodn:
Restaurante Casa * Valdivia
Combinar trminos con OR o |
Google busca por defecto todos los trminos
en las pginas y cuantos ms de ellos aparezcan, ms relevantes se considerar la pgina
(entre otros criterios). Sin embargo, esta premisa no siempre es correcta.
A veces es suficiente que aparezca, al menos,
uno de ellos y no debe tener ms peso por ello.
Puede usar la palabra OR (en maysculas) o
el smbolo | (tecla alt + 1)
Tablet apple | samsung
Buscar con rangos numricos con
xy
Tambin se pueden usar rangos numricos en
las bsquedas para centrarlas un poco mejor.
Poblacin mundial ao 19002000
Pruebe esta bsqueda y luego compare con sta:
Poblacin mundial
Ver cmo con la primera incluye entre los
primeros puestos de los resultados muchas
ms pginas que hablen especficamente de la
evolucin demogrfica en este intervalo de
tiempo, dejando de lado otro contenido que
para lo que queremos nos habra supuesto nada ms que ruido.
Otro ejemplo muy tpico son los importes econmicos:
Casaca cuero 2000030000
Aunque en este caso, Google no va a aplicar el
rango rigurosamente a los precios (que es lo
que se pretende), van a predominar las pginas con precios en este rango y obteniendo en
la prctica un resultado muy til.

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 2

Buscar algo dentro de un sitio Web con


site: o excluirlo con -site
ste es, sin duda, un truco til sobre todo para
tres cosas:
+

Buscar informacin en sitios que sean de


confianza: Por ejemplo, para abordar un
tema a partir de sitios con reputacin para
ver qu publican, tomar ideas o valorar si
la visin que se tiene del tema es suficientemente completa.

Buscar en determinados sitios, algn post


que enlazar con otros, propio o ajeno.

Buscar en foros y sitios similares: Esto es


una de las mayores potencialidades de este
mtodo porque resulta que, en muchos casos, Google funciona mucho mejor que los
propios buscadores del sitio. Adems, tiene otra ventaja el aprender a utilizar un solo buscador, no 10 diferentes de los sitios
que se visita.

Suponga que es, propietario de un Audi, y que


tiene hacer un trabajo de chapa. Querr asegurarse de que le hagan un trabajo impecable.
En ese caso, se recomendara esta bsqueda:
site:audisport-iberica.com taller chapa bueno |
confianza
Con esto, Google buscar exclusivamente en
las pginas del sitio con el dominio audisport-iberica.com que es el de Audisport Ibrica, el foro de Audi ms importante de habla
hispana y donde tienes miles de locos de los
coches y de esta marca en particular, gente que
estos temas los tienen trilladsimos.
Por tanto, la informacin que encuentres aqu
va a ser de una calidad muy superior a lo que
puedes encontrar por lo general en la red sobre el tema, centrando tu bsqueda aqu vas a
descartar mucho ruido y ganar mucha calidad
en los resultados.
Buscar documentos de un determinado
tipo con filetype:
sta es otra de las funcionalidades ms tiles
que permite buscar tipos de documentos especficos indicando la correspondiente extensin,
por ejemplo en documentos PDF, Power Point

u hojas Excel. Es decir, se descartan por completo las pginas Web normales, se devuelven
exclusivamente ficheros con la extensin especificada.
Suponga que por inters personal, porque lo
necesita en su trabajo o porque tiene que hacer
un trabajo acadmico, le vendra muy bien una
hoja Excel con las cifras de poblacin por comuna. Pruebe con esto y observe:
filetype:xls cifras paro 2011
Cunto se habra tardado en dar con este
tipo de documentos de manera convencional en Google?
Estrategias de bsqueda en Bing
Escriba correctamente sus palabras clave para conseguir los resultados ms acertados. Si
sus palabras estn mal escritas, Bing puede
buscar los sitios que contengan sus palabras
claves en su forma mal escrita, lo que puede
resultar en pginas poco profesionales o confiables.
Ingrese combinaciones de palabras que sean
lo ms especficas posible para el contenido
que busca. Esto puede ayudarle a buscar resultados que estn ms alineados a la informacin que quiere. Por ejemplo, ingresa una frase
clave especfica como oso grizzli ataca en
Alaska en lugar de Ataques de osos, lo que
puede mostrarle resultados de osos de todo tipo de razas en todo el mundo.
Ingrese OR o NOT en su frase de bsqueda
para combinar o excluir ciertos resultados.
Por ejemplo, si quiere leer sobre raza de caballos mustang, pero no sobre automviles mustang, ingrese caballo mustang NOT carro en
la barra de bsqueda.
Ingrese diferentes palabras y frases para
ampliar sus resultados de bsqueda. Bing slo
le mostrar los resultados que contengan las
palabras exactas que ingres. Por ejemplo, si
est tratando de encontrar sitios que vendan
diarios, realice una bsqueda de sitios Web
que vendan bitcoras o cuadernos.
Revise las Bsquedas Relacionadas localizadas a la izquierda de los resultados para obtener sugerencias adicionales que Bing le proporciona. En algunos casos, puede que logre
4

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 2

encontrar y utilizar combinaciones de palabras


claves que sean ms efectivas en su bsqueda.

filetype: filtra los resultados por tipos de archivo: manual canon d450 filetype:pdf

Busque frases especficas al colocarla entre


comillas. Por ejemplo, si quiere encontrar sitios que contengan ofertas de trabajo para reporteros independientes, coloque una frase
especfica entre comillas como se busca reportero independiente o se necesita reportero independiente.

loc: y location: filtra los resultados por un


pas o regin concreto: tacos (loc:MX OR
loc:US)

Comandos Bing. Si busca "hotel" y "valdivia" en Bing, la bsqueda por defecto retornar todas aquellas pginas que contengan hotel
y valdivia
Las comillas recuperan la frase exacta "hotel
en valdivia"
OR o | recupera sitios y pginas que contienen
alguna de las palabras clave o ambas, por
ejemplo osorno OR valdivia
+ busca pginas que contengan las palabras
clave marcadas. Algunas palabras son ignoradas en las bsquedas como las palabras muy frecuentes como las stop words.
Otras veces Google por ejemplo, muestra
resultados donde no aparecen las palabras
claves que se han determinado porque
busca sinnimos de forma automtica. Para estas palabras podemos usar este comando o usar las comillas
NOT y - excluye pginas que contengan la palabra marcada: valdivia osorno, busca
pginas que contengan "valdivia", pero no
"osorno"
url: comprueba que la URL esta indexada en
Bing: url:www.elmercurio.com
hasfeed: busca webs que contengan fuentes
RSS o Atom: site:www.latercera.com hasfeed:deportes
feed: para buscar fuentes de RSS:
feed:valdivia
ip: busca en las pginas alojadas en un IP:
IP:217.146.186.51
language: muestra pginas de un idioma
concreto: ftp language:es
site: muestra las pginas indexadas por Bing
de un dominio o subdominio: site:uach.cl

prefer: da nfasis a una palabra clave en concreto: valdivia prefer:comunidad


contains: busca pginas que contienen enlaces al contenido especificado: valdivia
contains:pdf
inanchor: muestra slo pginas que tienen la
palabra clave en el texto de los enlaces que
apuntan a ella: inanchor:valdivia.
inbody: muestra slo pginas que tienen la
palabra clave en el texto dentro del cuerpo
de las pginas: inbody: valdivia.
intitle: muestra slo pginas que tienen la palabra clave en el texto dentro del ttulo de
las pginas: intitle:valdivia.
Estrategias de bsqueda en Yahoo
La bsqueda es por defecto como concepto,
por lo tanto, arroja categoras o sitios con el
concepto de bsqueda
Bsqueda Sencilla. Es un directorio que presenta la informacin mediante un ndice de
temas a partir del cual se obtienen los subtemas correspondientes, en una estructura de
rbol. Ofrece, adems, un sistema de bsqueda
por palabras clave.
Puede hacer clic sobre el enlace Opciones, y
obtener un formulario que permite realizar
bsquedas definiendo diversas opciones. Por
ejemplo si selecciona la opcin correspondencia con todas las palabras (AND),
obligar al buscador que todas las palabras
que ha seleccionado se encuentren dentro de
la pgina Web que le muestre el buscador.
La primera pgina que aparecer ser una lista
de las categoras de Yahoo que corresponden a
lo buscado, seguidas por una lista de los sitios
Web de Yahoo que tambin corresponden a la
bsqueda. Si no se encuentran categoras y sitios Web que corresponden a las palabras clave, si realizar automticamente una bsqueda
de documentos en toda la Web, mediante el
buscador Google.
5

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 2

Si pulsa en los enlaces que aparecen en la barra del men en la parte superior de las pginas, podr acceder a una lista de noticias recientes que corresponden a las palabras clave
de la bsqueda.
Bsqueda Avanzada. Puede utilizar una sintaxis de bsqueda avanzada en el cuadro de
peticin de bsqueda. Dicha sintaxis le permitir definir mejor los resultados de la bsqueda sin tener que dirigirse a la pgina de Opciones de bsqueda. Existen cuatro tipos de sintaxis de peticin:
+

Palabras obligatorias y prohibidas en la


bsqueda. El uso de los siguientes operadores determinar si ciertas palabras deben aparecer o estn prohibidas en los resultados de la bsqueda.
+: Si se aade el signo + a cada palabra,
provoca que la misma aparezca en todos
los resultados de la bsqueda. Ejemplo:
+hroes+silencio en vez de hroes
-: Si se aade el signo - a una palabra, se
prohbe que la misma aparezca en alguno
de los resultados de la bsqueda. Ejemplo:
pantalones -vaqueros en vez de pantalones

Restricciones a secciones de documentos.


Si se coloca uno de los siguientes operadores al principio de una palabra clave, la
bsqueda se limitar a ciertas secciones de
los documentos.
t: Limita la bsqueda al ttulo de los documentos. Ejemplo: t:Alejandro Sanz en
vez de Alejandro Sanz

u: Limita la bsqueda a la URL de los documentos. Ejemplo: u:Seat en vez de Seat


+

Correspondencia (" ") con frases. Si se coloca un conjunto de palabras entre comillas, slo se encontrarn aquellos resultados que correspondan exactamente a una
combinacin de dichas palabras. Ejemplo:
"Costa del Sol" en vez de Costa del Sol

Utilizacin de comodines (*). Si se coloca


un * a la derecha de una palabra, se mostrarn las correspondencias parciales con
lo que est a la izquierda. Ejemplo: bar* en
vez de bar. Dar como resultado trminos
tipo: baraja, bares, baremo, etc.

Sintaxis combinada. Se puede combinar la


sintaxis de la peticin, siempre y cuando la
combinacin siga el orden correcto. El orden
correcto para la sintaxis es el orden en el cual
aparecen los operadores en esta pgina. O sea,
+, -, t:, u:, "" y por ltimo *. Ejemplo:
+t:Ftbol -Bilbao (correcto) con t:+Ftbol Bilbao (incorrecto)
Restricciones de tiempo. Se puede restringir la
bsqueda a aquellos documentos posteriores a
cierta fecha. No hay una sintaxis especfica para las restricciones de tiempo. Este recurso slo est disponible en la pgina de Opciones
de bsqueda.
Presentacin de los resultados. Es posible personalizar el nmero de resultados de la bsqueda que se muestren en las pginas de resultados. Este recurso slo est disponible en la
pgina de Opciones de bsqueda.

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 2

Material Complementario

CUATRO COSAS QUE BING HACE MEJOR QUE GOOGLE


Aunque a muchos les suene a blasfemia, Google, an siendo quiz el mejor buscador de
contenidos y de gran utilidad, no es perfecto.
Si bien Bing debe aprender muchas cosas de
Google, hay algunas de las cosas en las que
Google hace agua y debera mejorar.
1.- Filetype y Extensin. La primera de las
cosas que debe mejorar Google es la implementacin del operador filetype como tal. Hoy
es slo un sobrenombre del operador ext. Es
decir, si se buscan ficheros de filetype:doc,
realmente est buscando URLs en las que la
extensin del fichero acabe en .doc.

Por desgracia Bing solo reconoce algunos de


los filetypes ms comunes. Adems, en Bing
no se puede hacer uso del operador extensin,
lo que tan buenos resultados da a veces en
Google para buscar ficheros ocultos de Unix o
los .listing.
2.- Anlisis de binarios. Esta caracterstica
es muy especial en Bing y es bastante curiosa
ya que Bing est indexando ficheros ejecutables, objetos OCX, ActiveX o DLLs, haciendo
algo muy curioso: Analizarlos. De esta forma
es posible buscar ficheros OCX haciendo uso
del truco de hacer uso del filetype:txt.

Como se puede ver, slo devuelve aquellos que


tengan la extensin del fichero en .pdf. Ahora
si se busca por filetype do, se puede ver cmo
aparecen ficheros con extensin do que devuelven pdf.

Si se mira la cach de la indexacin del fichero


en Bing se accede a una cosa muy interesante
como son los mtodos que exporta, las funciones que utiliza a nivel de kernel o user, las libreras que importa y las secciones que contiene el binario. Muy curioso

A diferencia, si se hace en Bing, se obtienen


tanto los que tienen extensin pdf, como los
que son devueltos por aplicaciones, siempre
que el tipo del fichero sea pdf.
7

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 2

De esta manera, por ejemplo, se pueden buscar ficheros ejecutables y descubrir malware.
Para hacer esta prueba hemos ido a descubrir
malware con droppers publicados en Internet.
Lo que se ha hecho, ha sido un dork para Bing
buscado ficheros ejecutables (com, exe, src),
tal y como ste:

Despus se ha buscado uno de los mtodos utilizados por los droppers como por ejemplo
URLDownloadToFileA y aparecen algunos
muy interesantes.

Despus, para comprobar la suposicin, se ha


mandado la URL de uno de ellos a VirusTotal... y listo!

gle es incapaz de descubrir. Por ejemplo, buscando por un fichero que se sabe que est en
un .zip, en Bing aparece el fichero, aunque
como se puede ver en la extensin es un zip.

En Google, si se busca ese fichero, aparece en


todas las ubicaciones en que se encuentra, pero ninguna, como se puede ver en la siguiente
imagen, en las que est comprimido. Esto
hara que, si un fichero est publicado slo
como archivo comprimido, nunca aparezca
buscando por Google.

Bing no slo indexa los ficheros zip, sino que


otros formatos comprimidos muy tiles para
pentesting como son los .jar, lo que ayuda a
buscar archivos Java utilizados en determinados applets, por ejemplo.

Google, directamente no hace ninguna indexacin de estos ficheros ms all de la URL y de


aquellos que actan como un CGI.

No todos los formatos comprimidos estn


siendo analizados, as los RAR no estn indexados aunque estara bien que siguieran
profundizando en esta lnea.
4.- Operador IP. Este es un clsico para
pentesting, el poder buscar URLs indexadas en
una direccin IP slo se puede hacer con Bing,
lo que lo hace bastante til para pentesting en
muchos entornos. Google no lo permite.
3.- Archivos contenedores. Una de las cosas que ms llama la atencin es la capacidad
de Bing para buscar por el contenido dentro de
determinados formatos de ficheros comprimidos, permitiendo encontrar ficheros que Goo8

TALLER DE EXPRESIN ORAL Y ESCRITA (EPFO-080)


UNIDAD 2

Estas cuatro cosas son slo algunas que vendra muy bien tener en la base de datos de
Google Search, para poder unirlas junto a algunas cosas que tiene Google y no Bing. De
cualquier manera, est claro que si realiza
Google Hacking, Bing Hacking y Shodan
Hacking es mejor que slo con uno de los tres.

Esta obra est bajo la licencia Creative Commons Reconocimiento- No comercial -Sin obras Derivadas 4.0 Licencia
Internacional. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by-nc-nd/4.0/

Você também pode gostar