introducción

Cuando era más joven que ahora, si necesitaba información de carácter científico, comercial o de cualquier tipo me dirigía hacia una biblioteca pública, especializada o académica, en la que un bibliotecario (a veces) me orientaba, o bien podía también consultar los tradicionales catálogos de autor, título, materia u otro que describiera los documentos existentes. En el peor de los casos, el problema se resolvía cuando me mandaban a otra biblioteca. Por supuesto, tenía mis propios ficheros del material que había leído, con el lugar donde se encontraba y un breve resumen.
En 1994, con mis compañeros de la UNLu, habíamos calculado que, para poder estar al día con las publicaciones de nuestra especialidad, necesitabamos diez años leyendo ocho horas por día. Es decir que nos atrasábamos diez años por año.
-
Sin necesidad de analizar la evolución de las tecnologías de información, está claro que su resultado más importante es Internet. Siguiendo la idea anterior, si necesito realizar una búsqueda de información, incluso en el tema más sencillo, pienso en Internet y no en una biblioteca tradicional, y es que Internet, es como una gran biblioteca, con múltiples departamentos especializados en diferentes materias; pero es una biblioteca tan grande, que me pierdo entre los pasillos.

Sucede que Internet es indiscutiblemente un medio de publicación rápido, libre de arbitraje, requisitos y normas, con cobertura internacional, que hace de ella el soporte preferido para quien tiene (o cree tener) algo que informar, y para quien tiene necesidad de informarse. Súmese a esto el hecho de que muchos documentos que se editan en soporte impreso, tienen versiones en Internet precisamente a favor de su acceso y visibilidad.

buscando información

Antes de entrar en tema: una imagen para organizar ideas:



El navegador de la figura es Firefox (mi preferido), pero todos tienen una interfaz similar. El buscador es San Google, podemos decir que es el que marca el rumbo, por lo que la mayoría siguen un esquema parecido. Las barras superior e inferior corresponden al sistema operativo que yo utilizo, que no es Windows sino Ubuntu.

Ahora sí, empecemos con el tema.
En el artículo "Buscadores: Los puntos de partida en la red" (http://www.consumer-revista.com/web/es/20010401/internet/28193.jsp) se plantea que se dividen básicamente en índices, robots y metabuscadores. Aquí se consideran los índices como los pioneros en Internet, ellos funcionan mediante la incorporación constante de nuevas páginas a su base de datos, generalmente disponen de un evaluador (humano) que minimiza el número de páginas que ingresan al sistema y asegura su calidad.
Los robots (llamados por la gran mayoría motores de búsqueda) disponen de programas "arañas" que recorren la red e incluyen de forma automática "todo cuanto encuentran"; esto genera grandes dificultades para los navegantes al momento de seleccionar los recursos, sobre todo en el caso de búsquedas con un alto recobrado.
Finalmente, los metabuscadores se limitan a redirigir la pregunta que reciben a varios buscadores a la vez, y se recomienda el trabajo con ellos cuando no se encuentra información en los índices y motores.

Un aspecto importante, tratado en http:// www.searchenginewatch.com/webmasters/rank.html, son las partes de los motores de búsqueda: el primer elemento es el "spider" o "crawler", un programa encargado de visitar las páginas web, leerlas y analizar sus enlaces a otras páginas; esta operación se repite cada cierto tiempo en busca de cambios. El segundo elemento es el índice o catálogo donde se almacena una copia de cada página web que se encuentra, cada vez que cambia la página se actualiza con la nueva información, claramente transcurre un tiempo desde que se encuentra la página hasta que se indexa y no es hasta entonces que está disponible en el motor de búsqueda. El tercer elemento es el software, programa que se encarga de examinar los millones de páginas web contenidas en el índice, busca aquellas que contengan las palabras iguales a las solicitadas en la búsqueda, para luego ordenarlas según su relevancia.


Características de los tipos de buscadores

Directorios temáticos Motores de búsqueda Metabuscadores
Bases de datos más pequeñas, menos actualizadas, y más elaboradas gracias a la presencia del factor humano. Bases de datos más amplias y actualizadas. No tiene bases de datos propias, sino que buscan automáticamente en las de otros buscadores.
Colocan la información por temas y categorías, una vez recopilada, de forma manual en sus índices.
Colocan la información, que sean capaces de recoger en la red, en sus índices sin ordenarlas por temas, de manera automática y periódica.
No almacenan información porque no dependen de bases de datos propias.
No realizan las búsquedas en Internet "en vivo", almacenan los datos de los sitios y ofrecen enlace a éstos. No realizan las búsquedas en Internet "en vivo", sino en las copias de las páginas que almacenan en sus índices.
Envían su búsqueda a varios motores, sus resultados dependen de que estos estén disponibles en el momento de la búsqueda, o se descarguen en el período de tiempo permisible.
Son fáciles de usar, permiten, en primer lugar, ubicar la búsqueda en un tema determinado. Son más difíciles, se requiere explotar al máximo las opciones de búsqueda porque contienen más información. Son difíciles de usar para búsquedas muy precisas, porque tienen menos control de la búsqueda al interrogar varias bases de datos con interfaces diferentes.
Son convenientes para buscar información general, institucional porque devuelve resultados a las páginas principales. Se utilizan para buscar información más escasa, especializada, actualizada o incluida en páginas personales. Se recomienda para temas "oscuros", difíciles de encontrar.
  Ejemplos  
LookSmart (http://www.looksmart.com)
Open Directory (http://dmoz.org)
Yahoo (http://www.yahoo.com)
Altavista (http://www.altavista.com)
Google (http://www.google.com)
HotBot (http://hotbot.lycos.com)
Metacrwler (http://metacrawler.com)
NetLocator (http://nln.com)
StartingPoint (http://www.sptp.com)


Cada categoría difiere de la otra sustancialmente por el funcionamiento y por las herramientas para la búsqueda en la red, pero incluso dentro de una misma categoría se diferencian unos de otros. eBlast y Yahoo se basan en directorios temáticos, pero no son iguales. Altavista y Northern Light son motores de búsqueda, pero son diferentes. Metacrawler y Savvy Search son metabuscadores, y difieren entre sí.

Podemos considerar ventajoso el uso de los metabuscadores porque:

    * Se accede a una sola página web para formular la búsqueda.
    * Se necesita sólo conocer la interfaz de una página para la búsqueda.
    * Se formula sólo una vez la estrategia de búsqueda.
    * Los resultados permiten redireccionar la búsqueda a otros buscadores.
    * Se obtienen los resultados integrados, a partir de varios buscadores.

¿qué quiero buscar?, ¿cómo quiero buscarlo? ¿dónde puedo encontrarlo?

Encontrar resultados relevantes en Internet es una mezcla de experiencia, técnicas, aptitudes, inventiva y buena suerte, todas combinadas con la habilidad de proceder en una dirección clara y metódica; en otras palabras, es simplemente "navegar con un propósito", depende más de la estrategia de búsqueda que de la propia herramienta a utilizar.
La bibliografía sugiere la siguiente secuencia lógica de pasos:

    * Determinar el tipo de información que se necesita (artículos científicos, estadísticas, documentos gubernamentales, presentaciones, videos) y luego determinar qué tipo de organizaciones pueden ofrecer estos documentos.
    * Crear una lista de todas las palabras claves posibles y de sus sinónimos.
    * Determinar qué tipo de herramienta utilizar en la búsqueda (directorio, motor general o especializado, metabuscador) en relación a lo que se busca.
    * Construir la estrategia de búsqueda y conducirla (en dependencia del buscador, se definirán las combinaciones de búsquedas, se debe ser lo más preciso posible y explotar las opciones disponibles).
    * Evaluar los resultados de la búsqueda:si los primeros 15 registros no se consideran relevantes debe considerarse replantear la estrategia  o cambiar de buscador.

Además, se rescatan los siguientes consejos:

    * Escribir en minúsculas y sin acentos.
    * No usar una sola palabra en su búsqueda porque se obtendrán demasiados resultados.
    * Emplear varias palabras claves que definan o determinen específicamente lo que se busca.
    * Encerrar "entre comillas" las palabras que se desean encontrar juntas (frases).
    * Usar los operadores más comunes (and, or, not).
    * Buscar en las horas de menos tráfico, en consideración a que la mayoría de los motores están ubicados en los Estados Unidos.
    * Consultar siempre la información disponible de cada buscador para conocer qué opciones puede utilizar para interrogar sus bases de datos.


funciones especiales de búsqueda

.

Como se dijo mas arriba, un buen planteamiento de la búsqueda es un factor decisivo para lograr resultados relevantes. La búsqueda por una sola palabra, o por un grupo de ellas escritas consecutivamente, sin una relación lógica sería un paso seguro a una búsqueda con bajísimos, casi nulos, índices de relevancia, pertinencia y precisión. Por eso, el uso de la lógica matemática es determinante para formular una búsqueda en la red, sea mediante signos matemáticos, símbolos o conjunciones en idioma inglés.

La mayoría de los buscadores reconocen el uso de los operadores lógicos AND, OR y AND NOT para combinar palabras, el uso de comillas o paréntesis para buscar frases completas, e incluyen también, lo que algunos llaman funciones especiales de búsqueda, limitadores, entre otras herramientas. Otros usan los operadores de exactitud, proximidad, truncado y los posicionales. A continuación una breve descripción de la naturaleza de cada uno, según los criterios presentes en los trabajos revisados.

Operadores booleanos

AND: indica que se recuperarán los documentos que contengan todas las palabras indicadas en la solicitud de búsqueda. Por esto, se considera muy útil para limitar una búsqueda y reducir el número de registros recuperados, mientras más términos se utilicen más específicos serán los resultados.

OR: ordena a la base de datos que devuelva todos los documentos que contengan, al menos, una de las palabras claves solicitadas. En este caso, el resultado puede ser: registros, con una, dos o todas las palabras incluidas en el planteamiento de la búsqueda. Es común utilizarlo cuando se puede buscar un término por sus sinónimos. En algunos buscadores se sustituye por el símbolo "|".

NOT o AND NOT: se utiliza entre 2 términos claves y se traduce por "no". Excluye de la búsqueda aquellos documentos que contengan la palabra clave a la que se refiere el operador. Es muy útil para eliminar los problemas causados por la polisemia; generalmente, se utiliza después de haber realizado una primera búsqueda, donde se obtengan resultados irrelevantes con las palabras solicitadas, que aparecen en un contexto diferente al que se busca. En algunos buscadores se sustituye por el símbolo "-" o "!".

XOR: En la práctica no es un operador de uso muy frecuente, ni se conocen muchos buscadores que lo utilicen. Pide a la base de datos que devuelva todos los documentos que contengan una de las 2 palabras claves, pero excluye aquellos que contengan las 2 a la vez.

Signos matemáticos: más y menos

En algunos buscadores se utilizan en sustitución de los operadores AND (+) y AND NOT (-). Se colocan al igual que los operadores delante de las palabras a la que se refiera sin dejar espacios.

Operadores posicionales

Los operadores posicionales definen, de alguna forma, cuál es la posición de las palabras claves dentro del documento y las interrelaciona entre ellas, según criterios de proximidad u orden.

NEAR: En español significa "cerca" y solicita los documentos que contengan ambas palabras claves, pero que no estén separadas por más de 10 palabras o 100 caracteres (aunque este número puede variar según el buscador). En algunos buscadores se puede sustituir por "~" o por "[]".

FOLLOWED BY: En español significa "seguido de". Sus resultados son muy parecidos a los que produce Near, pero marca claramente cuál ha de ser el orden de las palabras claves. No es usado por muchos buscadores.

Operadores de exactitud o truncado ("comodines")

Estos operadores tratan a las palabras claves como cadenas de caracteres, no como palabras completas. El sistema devuelve aquellos documentos que contengan a la palabra clave, pero también aquellas en la que la palabra clave sea raíz o sufijo. Se indican con símbolos como: *, #, ?, aunque hay buscadores que emplean diferentes símbolos en dependencia de la cantidad de caracteres que estos representen, por ejemplo Northern Light utiliza el * para representar varios caracteres, mientras que usa el % para indicar un solo carácter. Aunque la mayoría de los buscadores permiten solo el truncamiento a la derecha, los símbolos se colocarán al inicio, en el medio o al final de la palabra clave en dependencia de las facilidades permisibles. A esta facilidad de hacer búsqueda por términos truncados, algunos autores la llaman "uso de comodín o wildcards".

Búsqueda de frases

En este caso, se considera a las palabras claves como si fueran una frase, es decir, deben aparecer en los registros recuperados como se introdujeron, una al lado de la otra, en el mismo orden. Habitualmente la frase se coloca entre comillas.Es muy útil para hacer búsquedas muy concretas sobre un tema determinado, sobre todo cuando se considera una frase como una palabra y se combina con otras, a partir de los operadores lógicos, o los signos + y -.

Búsqueda por campos

La búsqueda por campos es una herramienta tradicional en la búsqueda en bases de datos convencionales. Se considera, en Internet, una de las técnicas más efectivas para restringir los resultados de la búsqueda y aumentar la relevancia.

Por título

Mediante cualquiera de las técnicas anteriores se indica a la base de datos que debe buscar solo en el campo título, como se muestra en el siguiente ejemplo:
title:"Panamerican Health Organization", nótese que no se deben dejar espacios entre (:) y la palabra clave. En este caso, se devolverán todos los sitios que incluyan esta frase en el título.

Por dominio

En este caso, se restringe la búsqueda a determinados dominios de países o tipo de instituciones (educacionales, no gubernamentales, militares, etc.). Por ejemplo:
domain:cu +sld
La base de datos devolverá los sitios sobre ciencias de la salud en Cuba.

Por Host

Generalmente cuando los sitios son muy grandes los buscadores no los rastrean completamente sino que se limitan a buscar en las bases de datos propias de éstos. Esta técnica se utiliza cuando se necesita encontrar información en un sitio muy grande que no tiene un motor de búsqueda interno. Con esta técnica, puede especificarse al motor que busque en todas las páginas de determinado sitio, las palabras claves de interés. Un ejemplo podría ser: host:www.fda.gov +"clinical guides". En este caso el motor de búsqueda rastreará el sitio de la FDA completo en busca de la frase "clinical guides".

Por URL

Se limitan los resultados a páginas web donde las palabras claves se busquen en la URL. Por ejemplo, para conocer las páginas cuya dirección incluyen el término Infomed, se enuncia la búsqueda de la siguiente forma:
url:infomed

Por enlaces

Se utiliza para conocer las páginas que ofrecen enlaces a un sitio en particular. Por ejemplo, para conocer qué sitios tienen enlaces a Infomed, la búsqueda se formula de la siguiente forma:
Link:www.infomed.sld.cu

Estas opciones de búsqueda constituyen las más comunes y pueden encontrarse indistintamente en uno u otro buscador, y aunque ninguno es capaz de conjugarlas todas, la combinación de búsqueda por diferentes campos, con la búsqueda de frases y el uso de los operadores lógicos puede ofrecer resultados muy precisos, por lo que es muy recomendable para restringir las búsquedas y obtener resultados más relevantes.