introducción
Cuando era más joven que ahora, si necesitaba
información de carácter científico, comercial o de cualquier tipo me
dirigía hacia una biblioteca pública, especializada o académica, en la
que un bibliotecario (a veces) me orientaba, o bien podía también
consultar los tradicionales catálogos de autor, título, materia u otro
que describiera los documentos existentes. En el peor de los casos, el
problema se resolvía cuando me mandaban a otra biblioteca. Por
supuesto, tenía mis propios ficheros del material que había leído, con
el lugar donde se encontraba y un breve resumen.
En 1994, con mis compañeros de la UNLu, habíamos calculado que, para
poder estar al día con las publicaciones de nuestra especialidad,
necesitabamos diez años leyendo ocho horas por día. Es decir que nos
atrasábamos diez años por año.
-
Sin necesidad de analizar la evolución de las tecnologías de
información, está claro que su resultado más importante es Internet.
Siguiendo la idea anterior, si necesito realizar una búsqueda de
información, incluso en el tema más sencillo, pienso en Internet y no
en una biblioteca tradicional, y es que Internet, es como una gran
biblioteca, con múltiples departamentos especializados en diferentes
materias; pero es una biblioteca tan grande, que me pierdo entre los
pasillos.
Sucede que Internet es indiscutiblemente un medio de publicación
rápido, libre de arbitraje, requisitos y normas, con cobertura
internacional, que hace de ella el soporte preferido para quien tiene
(o cree tener) algo que informar, y para quien tiene necesidad de
informarse. Súmese a esto el hecho de que muchos documentos que se
editan en soporte impreso, tienen versiones en Internet precisamente a
favor de su acceso y visibilidad.
buscando información
Antes de entrar en tema: una imagen para organizar
ideas:
El navegador de la figura es Firefox (mi preferido), pero todos tienen
una interfaz similar. El buscador es San Google, podemos
decir que es el que marca el rumbo, por lo que la mayoría siguen un
esquema parecido. Las barras superior e inferior corresponden al
sistema operativo que yo utilizo, que no es Windows sino Ubuntu.
Ahora sí, empecemos con el tema.
En el artículo "Buscadores: Los puntos de partida en la red"
(http://www.consumer-revista.com/web/es/20010401/internet/28193.jsp) se
plantea que se dividen básicamente en índices, robots y metabuscadores.
Aquí se consideran los
índices
como los pioneros en Internet, ellos funcionan mediante la
incorporación constante de nuevas páginas a su base de datos,
generalmente disponen de un evaluador (humano) que minimiza el número
de páginas que ingresan al sistema y asegura su calidad.
Los robots (llamados por la gran mayoría
motores de búsqueda) disponen de
programas "arañas" que recorren la red e incluyen de forma automática
"todo cuanto encuentran"; esto genera grandes dificultades para los
navegantes al momento de seleccionar los recursos, sobre todo en el
caso de búsquedas con un alto recobrado.
Finalmente, los
metabuscadores se
limitan a redirigir la pregunta que reciben a varios buscadores a la
vez, y se recomienda el trabajo con ellos cuando no se encuentra
información en los índices y motores.
Un aspecto importante, tratado en http://
www.searchenginewatch.com/webmasters/rank.html, son las partes de los
motores de búsqueda: el primer elemento es el "spider" o "crawler", un
programa encargado de visitar las páginas web, leerlas y analizar sus
enlaces a otras páginas; esta operación se repite cada cierto tiempo en
busca de cambios. El segundo elemento es el índice o catálogo donde se
almacena una copia de cada página web que se encuentra, cada vez que
cambia la página se actualiza con la nueva información, claramente
transcurre un tiempo desde que se encuentra la página hasta que se
indexa y no es hasta entonces que está disponible en el motor de
búsqueda. El tercer elemento es el software, programa que se encarga de
examinar los millones de páginas web contenidas en el índice, busca
aquellas que contengan las palabras iguales a las solicitadas en la
búsqueda, para luego ordenarlas según su relevancia.
Características
de los tipos de buscadores
Directorios temáticos |
Motores de búsqueda |
Metabuscadores |
Bases de datos más pequeñas, menos actualizadas, y más
elaboradas gracias a la presencia del factor humano. |
Bases de datos más amplias y actualizadas. |
No tiene bases de datos propias, sino que buscan
automáticamente en las de otros buscadores. |
Colocan la información por temas y categorías, una vez
recopilada, de forma manual en sus índices. |
Colocan la información, que sean capaces de recoger en la red, en sus
índices sin ordenarlas por temas, de manera automática y periódica. |
No almacenan información porque no dependen de bases de datos
propias. |
No realizan las búsquedas en Internet "en vivo", almacenan
los datos de los sitios y ofrecen enlace a éstos. |
No realizan las búsquedas en Internet "en vivo", sino en las
copias de las páginas que almacenan en sus índices. |
Envían su búsqueda a varios motores, sus resultados dependen de que
estos estén disponibles en el momento de la búsqueda, o se descarguen
en el período de tiempo permisible. |
Son fáciles de usar, permiten, en primer lugar, ubicar la
búsqueda en un tema determinado. |
Son más difíciles, se requiere explotar al máximo las
opciones de búsqueda porque contienen más información. |
Son difíciles de usar para búsquedas muy precisas, porque
tienen menos control de la búsqueda al interrogar varias bases de datos
con interfaces diferentes. |
Son convenientes para buscar información general,
institucional porque devuelve resultados a las páginas principales. |
Se utilizan para buscar información más escasa,
especializada, actualizada o incluida en páginas personales. |
Se recomienda para temas "oscuros", difíciles de encontrar. |
|
Ejemplos |
|
LookSmart (http://www.looksmart.com)
Open Directory (http://dmoz.org)
Yahoo (http://www.yahoo.com) |
Altavista (http://www.altavista.com)
Google (http://www.google.com)
HotBot (http://hotbot.lycos.com) |
Metacrwler (http://metacrawler.com)
NetLocator (http://nln.com)
StartingPoint (http://www.sptp.com) |
Cada categoría difiere de la otra sustancialmente por el funcionamiento
y por las herramientas para la búsqueda en la red, pero incluso dentro
de una misma categoría se diferencian unos de otros. eBlast y Yahoo se
basan en directorios temáticos, pero no son iguales. Altavista y
Northern Light son motores de búsqueda, pero son diferentes.
Metacrawler y Savvy Search son metabuscadores, y difieren entre sí.
Podemos considerar ventajoso el uso de los metabuscadores porque:
* Se accede a una sola página web para formular la
búsqueda.
* Se necesita sólo conocer la interfaz de una página
para la búsqueda.
* Se formula sólo una vez la estrategia de búsqueda.
* Los resultados permiten redireccionar la búsqueda
a otros buscadores.
* Se obtienen los resultados integrados, a partir de
varios buscadores.
¿qué quiero
buscar?, ¿cómo
quiero
buscarlo? ¿dónde puedo encontrarlo?
Encontrar resultados relevantes en Internet es una mezcla de
experiencia, técnicas, aptitudes, inventiva y buena suerte, todas
combinadas con la habilidad de proceder en una dirección clara y
metódica; en otras palabras, es simplemente "navegar con un propósito", depende más de la estrategia de búsqueda que de la
propia herramienta a utilizar.
La bibliografía sugiere la siguiente secuencia lógica de pasos:
* Determinar el tipo de información que se necesita
(artículos científicos, estadísticas, documentos gubernamentales,
presentaciones, videos) y luego determinar qué tipo de organizaciones
pueden ofrecer estos documentos.
* Crear una lista de todas las palabras claves
posibles y de sus sinónimos.
* Determinar qué tipo de herramienta utilizar en la
búsqueda (directorio, motor general o especializado, metabuscador) en
relación a lo que se busca.
* Construir la estrategia de búsqueda y conducirla
(en dependencia del buscador, se definirán las combinaciones de
búsquedas, se debe ser lo más preciso posible y explotar las opciones
disponibles).
* Evaluar los resultados de la búsqueda:si los
primeros 15 registros no se consideran relevantes debe considerarse
replantear la estrategia o cambiar de buscador.
Además, se rescatan los siguientes consejos:
* Escribir en minúsculas y sin acentos.
* No usar una sola palabra en su búsqueda porque se
obtendrán demasiados resultados.
* Emplear varias palabras claves que definan o
determinen específicamente lo que se busca.
* Encerrar "entre comillas" las palabras que se
desean encontrar juntas (frases).
* Usar los operadores más comunes (and, or, not).
* Buscar en las horas de menos tráfico, en
consideración a que la mayoría de los motores están ubicados en los
Estados Unidos.
* Consultar siempre la información disponible de
cada buscador para conocer qué opciones puede utilizar para interrogar
sus bases de datos.
funciones especiales de
búsqueda
Como se dijo mas arriba, un buen planteamiento de la búsqueda es
un factor decisivo para lograr resultados relevantes. La búsqueda por
una sola palabra, o por un grupo de ellas escritas consecutivamente,
sin una relación lógica sería un paso seguro a una búsqueda con
bajísimos, casi nulos, índices de relevancia, pertinencia y precisión.
Por eso, el uso de la lógica matemática es determinante para formular
una búsqueda en la red, sea mediante signos matemáticos, símbolos o
conjunciones en idioma inglés.
La mayoría de los buscadores reconocen el uso de los operadores lógicos
AND, OR y AND NOT para combinar palabras, el uso de comillas o
paréntesis para buscar frases completas, e incluyen también, lo que
algunos llaman funciones especiales de búsqueda, limitadores, entre
otras herramientas. Otros usan los operadores de exactitud, proximidad,
truncado y los posicionales. A continuación una breve descripción de la
naturaleza de cada uno, según los criterios presentes en los trabajos
revisados.
Operadores booleanos
AND: indica que se recuperarán los documentos que contengan todas las
palabras indicadas en la solicitud de búsqueda. Por esto, se considera
muy útil para limitar una búsqueda y reducir el número de registros
recuperados, mientras más términos se utilicen más específicos serán
los resultados.
OR: ordena a la base de datos que devuelva todos los documentos que
contengan, al menos, una de las palabras claves solicitadas. En este
caso, el resultado puede ser: registros, con una, dos o todas las
palabras incluidas en el planteamiento de la búsqueda. Es común
utilizarlo cuando se puede buscar un término por sus sinónimos. En
algunos buscadores se sustituye por el símbolo "|".
NOT o AND NOT: se utiliza entre 2 términos claves y se traduce por
"no". Excluye de la búsqueda aquellos documentos que contengan la
palabra clave a la que se refiere el operador. Es muy útil para
eliminar los problemas causados por la polisemia; generalmente, se
utiliza después de haber realizado una primera búsqueda, donde se
obtengan resultados irrelevantes con las palabras solicitadas, que
aparecen en un contexto diferente al que se busca. En algunos
buscadores se sustituye por el símbolo "-" o "!".
XOR: En la práctica no es un operador de uso muy frecuente, ni se
conocen muchos buscadores que lo utilicen. Pide a la base de datos que
devuelva todos los documentos que contengan una de las 2 palabras
claves, pero excluye aquellos que contengan las 2 a la vez.
Signos matemáticos: más y menos
En algunos buscadores se utilizan en sustitución de los operadores AND
(+) y AND NOT (-). Se colocan al igual que los operadores delante de
las palabras a la que se refiera sin dejar espacios.
Operadores posicionales
Los operadores posicionales definen, de alguna forma, cuál es la
posición de las palabras claves dentro del documento y las
interrelaciona entre ellas, según criterios de proximidad u orden.
NEAR: En español significa "cerca" y solicita los documentos que
contengan ambas palabras claves, pero que no estén separadas por más de
10 palabras o 100 caracteres (aunque este número puede variar según el
buscador). En algunos buscadores se puede sustituir por "~" o por "[]".
FOLLOWED BY: En español significa "seguido de". Sus resultados son muy
parecidos a los que produce Near, pero marca claramente cuál ha de ser
el orden de las palabras claves. No es usado por muchos buscadores.
Operadores de exactitud o truncado ("comodines")
Estos operadores tratan a las palabras claves como cadenas de
caracteres, no como palabras completas. El sistema devuelve aquellos
documentos que contengan a la palabra clave, pero también aquellas en
la que la palabra clave sea raíz o sufijo. Se indican con símbolos
como: *, #, ?, aunque hay buscadores que emplean diferentes símbolos en
dependencia de la cantidad de caracteres que estos representen, por
ejemplo Northern Light utiliza el * para representar varios caracteres,
mientras que usa el % para indicar un solo carácter. Aunque la mayoría
de los buscadores permiten solo el truncamiento a la derecha, los
símbolos se colocarán al inicio, en el medio o al final de la palabra
clave en dependencia de las facilidades permisibles. A esta facilidad
de hacer búsqueda por términos truncados, algunos autores la llaman
"uso de comodín o wildcards".
Búsqueda de frases
En este caso, se considera a las palabras claves como si fueran una
frase, es decir, deben aparecer en los registros recuperados como se
introdujeron, una al lado de la otra, en el mismo orden. Habitualmente
la frase se coloca entre comillas.Es muy útil para hacer búsquedas muy
concretas sobre un tema determinado, sobre todo cuando se considera una
frase como una palabra y se combina con otras, a partir de los
operadores lógicos, o los signos + y -.
Búsqueda por campos
La búsqueda por campos es una herramienta tradicional en la búsqueda en
bases de datos convencionales. Se considera, en Internet, una de las
técnicas más efectivas para restringir los resultados de la búsqueda y
aumentar la relevancia.
Por título
Mediante cualquiera de las técnicas anteriores se indica a la base de
datos que debe buscar solo en el campo título, como se muestra en el
siguiente ejemplo:
title:"Panamerican Health Organization", nótese que no se deben dejar
espacios entre (:) y la palabra clave. En este caso, se devolverán
todos los sitios que incluyan esta frase en el título.
Por dominio
En este caso, se restringe la búsqueda a determinados dominios de
países o tipo de instituciones (educacionales, no gubernamentales,
militares, etc.). Por ejemplo:
domain:cu +sld
La base de datos devolverá los sitios sobre ciencias de la salud en Cuba.
Por Host
Generalmente cuando los sitios son muy grandes los buscadores no los
rastrean completamente sino que se limitan a buscar en las bases de
datos propias de éstos. Esta técnica se utiliza cuando se necesita
encontrar información en un sitio muy grande que no tiene un motor de
búsqueda interno. Con esta técnica, puede especificarse al motor que
busque en todas las páginas de determinado sitio, las palabras claves
de interés. Un ejemplo podría ser: host:www.fda.gov +"clinical guides".
En este caso el motor de búsqueda rastreará el sitio de la FDA completo
en busca de la frase "clinical guides".
Por URL
Se limitan los resultados a páginas web donde las palabras claves se
busquen en la URL. Por ejemplo, para conocer las páginas cuya dirección
incluyen el término Infomed, se enuncia la búsqueda de la siguiente
forma:
url:infomed
Por enlaces
Se utiliza para conocer las páginas que ofrecen enlaces a un sitio en
particular. Por ejemplo, para conocer qué sitios tienen enlaces a
Infomed, la búsqueda se formula de la siguiente forma:
Link:www.infomed.sld.cu
Estas opciones de búsqueda constituyen las más comunes y pueden
encontrarse indistintamente en uno u otro buscador, y aunque ninguno es
capaz de conjugarlas todas, la combinación de búsqueda por diferentes
campos, con la búsqueda de frases y el uso de los operadores lógicos
puede ofrecer resultados muy precisos, por lo que es muy recomendable
para restringir las búsquedas y obtener resultados más relevantes.