Você está na página 1de 12

APLICATIVOS DE PROCESAMIENTO DE INFORMACION EN LA NUBE

1. Estrategias de bsqueda de informacin


La bsqueda de informacin, es el conjunto de operaciones o tareas que tienen
por objeto poner al alcance de un usuario la informacin que d respuesta a sus
preguntas, mediante la localizacin y acceso a los recursos de informacin
pertinentes.
Ahora se trata de conocer las estrategias de recuperacin de la informacin. Sus
principios generales son:

Identificar trminos especficos del tema, vocabulario especializado:


Palabras clave: sustantivos, verbos, nombres propios.
Emplear sinnimos de las palabras elegidas, variantes gramaticales.
Trminos relacionados de significado parecido, o del mismo campo

semntico.
Traducir los trminos en otro idioma, fundamentalmente en ingls.
Conocer la existencia del lenguaje documental o controlado (descriptores,
tesauros, encabezamientos de materia) que se utilizan en catlogos, bases
de datos, en pginas de Internet, diferente del lenguaje natural.

Lenguaje natural: trminos libremente elegidos del lenguaje hablado. Al buscar


por trminos del lenguaje natural, se recuperan registros que contienen los
trminos de la pregunta, en todo el registro o en el campo seleccionado. Pero se
pierden los sinnimos, otras posibles formas gramaticales, equivalentes en otras
lenguas, etc.
Lenguaje controlado: trminos de un lenguaje normalizado (tesauros, ndices,
encabezamientos de materia) dnde cada concepto est representado por un
nico trmino y cada trmino representa un nico concepto, de manera que los
problemas de sinonimia y polisemia quedan resueltos.

Utilizar la combinacin de los trminos con los operadores lgicos o


bolanos para buscar en un campo (bsqueda sencilla) o bien en varios
campos (bsqueda avanzada).

Acotar o refinar la bsqueda, en funcin de los resultados.

OPERADORES DE TRUNCAMIENTO: *, #? $
Se utilizan para tener en cuenta variaciones en los finales de palabras (plurales,
races comunes de palabras, variaciones idiomticas, etc.).
Se utiliza el * cuando se omiten una o varias letras y la? cuando se omite una sola,
tanto si es en el medio o al final de la palabra.
Ejemplo: bibliot* recuperar: biblioteca, biblioteconoma, bibliotecario, bibliotecaria,
bibliotecarios, bibliotecarias, bibliotecologa.

OPERADORES DE PRXIMIDAD: NEAR, ADJ, SAME, WITH


Se utilizan para concretar las bsquedas, pues permiten indicar lo cerca que
deben estar unos trminos de otros; cuando ms cerca estn, tendrn mayor
relacin temtica.
Ejemplo: cambio climtico NEAR global

LAS COMILLAS
Se utilizan para recuperar palabras compuestas o frases.
Ejemplo: "cambio climtico", "violencia domstica", "Espacio Europeo de
Educacin Superior"

2. Sistema de bsqueda en internet:


2.1
Motores de bsqueda
Directorios y Motores de bsqueda son las principales herramientas
de bsqueda en la Web. Sin embargo, tambin existen otro tipo de
herramientas que funcionan como intermediarios en la recuperacin

de informacin, ya que actan como interfaz nico a mltiples


motores

de

bsqueda.

Se

trata

de

los

multibuscadores y

Metabuscadores que no son buscadores en s mismos aunque se


basen en ellos y su interfaz suele ser similar a la de los ndices
temticos o motores de bsqueda. Estas herramientas no buscan
2.2

por s mismas, sino que limitan a pedir a otros que busquen por ellos.
ndices temticos o directos
Los directorios son listas de recursos organizados por categoras
temticas que se estructuran jerrquicamente en un rbol de
materias que permite visualizar los recursos descendiendo desde los
temas ms generales situados en las ramas superiores, a los temas
ms especficos situados en las ramas inferiores. Las categoras
ofrecen una lista de enlaces a las pginas que aparecen
referenciadas en el buscador. Cada enlace tambin ofrece una breve
descripcin de su contenido. As pues, los directorios o ndices se
estructuran por temas o categoras principales que, a su vez,
contienen otras subcategoras, y as sucesivamente hasta que al
final se ofrecen enlaces directos a otras pginas o recursos de
Internet.

2.3

Los Metabuscadores
Los Metabuscadores tambin permiten buscar en varios buscadores
al

mismo

tiempo.

Los

Metabuscadores

no

almacenan

las

descripciones de pginas en sus bases de datos, sino que contienen


los registros de los motores de bsqueda y la informacin sobre
ellos, adecuando su expresin a los diferentes motores para remitir
la consulta a los motores. Una vez que reciben la respuesta, la
remiten al usuario no directamente, sino tras realizar un filtrado de
los resultados. Este filtrado consiste en eliminar y depurar los
enlaces repetidos y en ordenar los enlaces. Adems, slo aparecer
un nmero limitado de enlaces, los que se consideren ms
importantes. Los ms repetidos ocuparn los primeros puestos ya
que el metabuscador considerar que son los ms relevantes por
estar dados de alta en mayor nmero de buscadores. Se trata de
herramientas muy tiles, el nico problema es que, por lo general, no
permiten realizar bsquedas tan avanzadas como en un motor de

bsqueda, con lo que las consultas tienen que ser generales y no se


puede buscar en profundidad.

2.4

Agentes de bsqueda
Los buscadores alimentan sus bases de datos mediante la utilizacin
de robots llamados spiders, wanderers o worms, a los que delegan
las tareas de localizacin, acceso, copia y actualizacin de
documentos. Junto a stos, cada vez en mayor medida aumenta la
utilizacin de los agentes personales para la recuperacin de
informacin, que actan como intermediarios entre el usuario y los
motores de bsqueda, tanto si stos son de tipo general como
especializados. No todos los llamados searchbots ofrecen las
mismas prestaciones, ni las mismas caractersticas, ni la misma
forma de uso.
Son muchas las definiciones que existen sobre estos robots de la
web, una de las primeras fue la de Koster en 1995 Un robot web es
un programa que atraviesa la estructura hipertextual de la web para
recuperar un documento y recuperar recursivamente todos los
documentos enlazados con el mismo.
Otra definicin de whatis.com dice en Internet, un agente
inteligente es un programa que busca informacin o desarrolla algn
otro servicio sin la presencia inmediata del usuario y a intervalos

temporales predefinidos. En general se le llama Softbot o Bot


(abreviaturas de robot de software).
Los agentes multibuscadores son aplicaciones cliente que el usuario
instala en su ordenador y ejecuta cuando quiere, sin necesidad de
conectarse previamente a ningn sitio (Hpola, Vargas-Quesada y
Montes, 1999). En algunas modalidades utilizan uno o varios
motores de bsqueda como semilla o punto de partida para realizar
las consultas, de tal forma que los resultados obtenidos, si son
pertinentes, se convierten en semilla para un nuevo salto
hipertextual. La combinacin de resultados de distintos buscadores
incrementa la cobertura y, no el solapamiento o la duplicidad de
informacin.
3. Bsqueda de la informacin
3.1
Bsqueda de libros
Los libros son

documentos que se ocupan de ordenar, clasificar y

proporcionar toda la informacin que se va produciendo, es decir el anlisis


de la documentacin, tanto en lo relativo a su identificacin fsica como a su
ordenacin temtica y a la descripcin de su contenido. Slo la consecucin
de esta funcin documental asegurar la transmisin a los usuarios de la
informacin referencial pertinente que precisan para difundir una respuesta
informativa, presentndose sobre un soporte documental, ya sea en forma
escrita, audiovisual o electrnica.
Los documentos de un centro de documentacin comparten rasgos
comunes con la de una biblioteca o de un archivo, pero se distingue de
ellos porque la documentacin tratada suele ser muy especfica. Los
centros

de

documentacin

acogen

exclusivamente

documentos

secundarios, mientras que en bibliotecas o archivos son primarios.


Ejemplos:

Bsquedas en libros virtuales.

3.2

Bsquedas en libros fsicos de consulta cooperativos.

Bsquedas de libros en diferentes idiomas.

Bsqueda de publicaciones cientficas


Informacin cientfica sera, pues, el conjunto de los registros o
resultados de la ciencia, del conocimiento basado en el mtodo
cientfico, grabados y dados a conocer por procedimientos digitales,
en la Red y tambin por medios impresos (en papel). De acuerdo
con lo dicho antes sobre la ciencia, es un segmento reducido y
cualificado, por ejemplo, de cuanto circula por Internet, que te
interesa reconocer e identificar frente a otros gneros de informacin
o contenido, lo que no siempre es evidente a primera vista.
Hay contenidos comunicativos muy respetables y algunos incluso
pueden ser valiosos bajo determinados puntos de vista, pero que no
son ciencia, no son informacin cientfica. Es importante que
discrimines y, para tus objetivos como estudiante en la universidad
(asimilar el conocimiento cientfico), que te centres en la
informacin cientfica. Tu capacidad de evaluacin crtica ser
siempre de ayuda, y en esta Gua la idea es estimularla.
Ejemplos:
Revista cientfica Science AAAS
Informes cientficos Meteorite
National Geografic

3.3
Bsqueda multimedia
Los sistemas de consulta por imagen es una tcnica de consulta que
implica dotar al sistema CBIR con una imagen de ejemplo, donde sta,
servir para realizar la bsqueda. Los algoritmos de bsqueda subyacente
pueden variar dependiendo de la aplicacin, pero las imgenes resultado
comparten elementos comunes con el ejemplo proporcionado.
Esta tcnica se basa en generar automticamente una extraccin de
informacin de cada elemento de la base de datos en la cual se har la

bsqueda con el fin de compararla con la informacin obtenida del ejemplo.


Esta informacin se incorpora en el archivo en forma de metadatos. Los
metadatos que extraemos de la imagen ejemplo son descriptores de
imagen que pueden ser de color, forma, textura u otros que sirvan para
detectar caras o cuerpos, incluso caras con diferentes estados de nimo u
otros tipos de descriptores, que tambin se pueden combinar con otras
metadatos como palabras clave. De esta manera el sistema CBIR se centra
en el contenido visual de la imagen, dndole ms importancia a lo que se
puede buscar dentro de la imagen.
Gracias a la indexacin audiovisual, que consiste en la asignacin de
etiquetas descriptivas del contenido de su clasificacin, es posible realizar
bsquedas rpidas y eficientes comparando estas etiquetas de la imagen
ejemplo proporcionado con otros contenidos audiovisuales de la base de
datos. De esta manera podemos hacer comparaciones de metadatos
mucho ms rpidas que haciendo comparaciones directas entre archivos,
ms eficientes, generar algoritmos automticos y ms objetivos y comunes
que los que se pueden hacer a mano por una persona. Es importante saber
cules son estos criterios de bsqueda. En primer lugar la tipologa del
contenido audiovisual que estamos buscando: texto, imagen, video,
documentos, audio, posiciones, etc. Y en segundo lugar los descriptores
para clasificar los resultados adecuados segn el contenido visual de la
imagen ya que los resultados pueden variar significativamente segn la
importancia de estos. La mayora de los buscadores realizan esta seleccin
sin que el usuario tenga que preocuparse, pero es necesario hacer un
estudio previo sobre cules son los ms adecuados y los que en general
tienen ms precisin.
Ejemplos:

3.4

Bsqueda de imgenes
Bsqueda de videos
Bsqueda fotogramas

Bsqueda geolocalizadas
Hoy las bsquedas se hacen tambin desde celulares, tabletas, y no pasar
mucho tiempo para que las primeras Google Glass se empiecen a masificar.

Esto qu quiere decir? Que los resultados de bsqueda hoy se presentan en


diferentes tipos de dispositivos, cada uno con un tamao de pantalla diferente,
y con una interfaz diferente. No es lo mismo mover el mouse en un
computador porttil y dar click, que pinchar la pantalla para hacer zoom en un
celular. Cmo sern las bsquedas desde Google Glass? Muy pronto lo
sabremos.

Esto explica por qu a un alto porcentaje de sitios web que visualizamos


desde

un

dispositivo

mvil

les

tenemos

que

hacerzoom-in

desplazamiento hacia los lados para poder visualizar mnimamente bien


sus contenidos, porque hasta hace poco los desarrolladores de sitios web
pensaban solo en sitios de escritorio.
A lo que voy con todo esto es que, de acuerdo con los ltimos cambios
introducidos por Google, los resultados por geolocalizacin van a ser cada
vez ms importantes. No nos sorprendamos si de un da para otro
empezamos a ver en la primera hoja de resultados solo sitios bajo
parmetros de Web Responsive Design, es decir que estn optimizados
para dispositivos mviles. Los que no lo estn posiblemente estn
relegados a una segunda hoja.

Ejemplos:
Google maps
Pixelis maps
NASA.com
4. Caso prctico. Ejemplo
i.
Cmo empezaras a buscar?
Se identifica los trminos especficos del tema, como por ejemplo, consecuencias
ocasionados por las caries.
Se realiza primero la bsqueda en los buscadores horizontales tal como Google,
yahoo entre otros en forma general. Se coloca las palabras claves como verbos,
sustantivos, nombres propios. Adems trminos relacionados con el tema
Por otro lado se puede unir palabras mediante el signo+ o - . por ejemplo
caries+dental.

Tambin podramos hacer la bsqueda uzando la opcin bsqueda avanzada ,


nos permite buscar, el tipo de archivo que queremos , el idioma, entre otros.
Tambien se puede usar otros buscar en buscadores verticales, escribiendo el
buscador la palabra buscador+el tema., y aparecern los buscadores

ii.

Indica que criterios de bsqueda aplicaras

Para evaluar la informacin existen varios criterios que debes conocer. Estos
son: Relevancia, Alcance, Autoridad - Credibilidad, Actualidad, Objetividad y
Exactitud. Una breve explicacin de cada criterio se presenta a continuacin:
Relevancia
Es un elemento basado en el juicio. Usualmente para establecer la relevancia
debes determinar qu informacin necesitas, que tipo de fuentes vas a utilizar
y cmo utilizars la informacin (ensayo, monografa, presentacin). Es
importante determinar la relevancia en torno al tema que estas investigando.
Alcance

Para conocer si el documento que has seleccionado tiene el alcance


adecuado, debes examinar el contenido de la informacin si tiene un balance
entre los datos y las opiniones. Como marco de comparacin debes consultar
otras fuentes que presenten otros puntos de vistas a favor y en contra del
tema. Esto te ayudar a enfocar tu proyecto desde varias perspectivas.
Autoridad / Credibilidad
Para determinar la autoridad de la fuente se toman en consideracin varios
aspectos. Al comparar un documento de una base de datos versus un
documento que aparece en la Internet, se puede inferir que los documentos
contenidos en las bases de datos incluye elementos esenciales tales como:
nombre del autor, el ttulo de la publicacin, la fecha de publicacin y ms. Por
otro lado, en la Internet muchas veces los documentos no presentan estos
datos esenciales.
En cambio, los documentos que aparecen en las bases de datos, pasan por
un proceso de revisin ya que est en juego la reputacin de la empresa,

mientras que los documentos publicados en la Internet no tienen ningn


mecanismo de control de calidad y cualquier persona puede publicar en este
medio sin tener experiencia o peritaje en el tema.
En las fuentes impresas (libros) y audiovisuales, las casas publicadoras
establecen criterios para determinar la autoridad, ya que el seleccionar los
mejores autores le da prestigio a la institucin. Si la informacin no incluye el
nombre del autor, entonces se debe evaluar la institucin o agencia que
auspicia la publicacin y determinar si sta cuenta con la autoridad y el
peritaje necesario sobre el tema. 2 Para determinar la autoridad en la Internet
se puede tomar en consideracin los dominios o direcciones electrnicas (Ej.
http://ponce.inter.edu). Las ms recomendables son: .edu (instituciones
educativas), .gov (agencias del gobierno), .org (organizaciones), .mil (agencias
militares). Las menos recomendadas son las que terminan en .com (comercial)
y .net (network).
Actualidad
Para determinar la actualidad se toma en consideracin la fecha de
publicacin del documento. Hay tres escenarios principales al momento de
buscar informacin que son: informacin actualizada (al da), informacin de
los ltimos tres (3) aos e informacin publicada que excede los ltimos tres
aos (en algunos casos histricos). Entre la informacin actualizada estn los
temas cientficos, negocios y mercadeo, la poltica, algunos temas sociales de
actualidad, la medicina y ms. En los dems casos usualmente se acepta la
informacin de los ltimos tres a cinco aos. En la mayora de los casos
cualquier informacin de los ltimos seis (6) aos o ms se considera
obsoleta. La excepcin son los temas de historia y literatura, donde las fechas
de publicacin no es un factor relevante. Es importante recordar que la
publicacin de un libro puede tomar aos, el publicar un artculo en una revista
puede tomar meses y que la informacin contenida en estas fuentes ser ms
antigua que la fecha de publicacin.

Objetividad
La objetividad se define como la verdad basada en datos comprobables sin
tomar en consideracin las reacciones que esto provoque en otros.
(aceptacin o no aceptacin de la informacin). Si partimos de la premisa que
la informacin nunca es totalmente objetiva, entonces debemos prestar mucha
atencin a este criterio. Existen varios factores que impiden que la informacin
pueda ser objetiva y estos son: las necesidades, la forma en que perciben los
hechos, los valores e intereses de los autores. Otros factores son el contexto
social que refleja las actitudes y valores de la poca en que se escribe el
documento. Para cumplir con este criterio debes evaluar y cuestionar los
diferentes puntos de vista sobre un tema, la verdad y la exactitud de la
informacin.
Exactitud
La exactitud se mide a base de informacin correcta y exacta. Usualmente se
recomienda que para validar la exactitud se compare la informacin con otra
ya investigada y verificar los datos en fuentes impresas. Es importante
considerar que la informacin no actualizada tiende a no ser exacta. Por otro
lado, las pginas electrnicas que pertenecen a una organizacin son estables
y que las pginas electrnicas que pertenecen a un individuo se consideran
inestables, en cuyo caso es mejor no utilizarla.

Você também pode gostar