|
Todos los servicios ocultos de Google al descubierto
¿Sabía que Google no sólo es capaz de realizar
búsquedas de páginas web e imágenes sino que además
ofrece una gran cantidad de servicios desconocidos? Podemos encontrar desde
un buscador de noticias en tiempo real hasta un equipo de investigadores para
resolver personalmente nuestras consultas, pasando por buscadores de productos
en tiendas virtuales y de catálogos impresos.
Saulo Barajas, Saulo.Net 24dic02.- Internet no sería lo mismo sin Google. El proyecto que comenzaron dos jóvenes
estudiantes de la Universidad de Stanford está revolucionando la forma de usar
Internet. Pero Larry Page y Sergey Brin no sólo han creado el mejor buscador
de páginas web, algo que ya nadie discute, sino que el proyecto es mucho más
ambicioso. Bajo una página principal de apenas 5 KB se esconden docenas de servicios
y nuevos proyectos.
Google fue fundado en 1998. Han sido 4 años de innovaciones continuas y, sin
embargo, sus creadores afirman que todavía están en la fase inicial del
proyecto. La clave del éxito: los algoritmos de ordenación. La filosofía:
exponer los resultados de forma sencilla, útil y eficiente. Todos los servicios
de Google funcionan sin intervención humana, desde la clasificación de
páginas hasta la inserción de publicidad.

Complejos algoritmos con capacidades de inteligencia artificial posibilitan
la clasificación de información más rápida y eficientemente que pudiera
hacerlo un equipo de cientos de personas. Por ejemplo: el nuevo servicio de
clasificación de noticias
muestra siempre las últimas noticias que se han producido en el mundo. Estas
noticias son extraídas de miles de fuentes y clasificadas automáticamente. La
información se renueva con una periodicidad de minutos. ¿Cuántas personas harían
falta para hacer un trabajo tan minucioso? Probablemente fuese inviable.
Buscador de páginas web
Es el servicio original de Google y, habitualmente, el único que los usuarios
conocen. Los resultados de las búsquedas se devuelven clasificados por orden
de relevancia, establecida mediante el índice
PageRank. Este indicador patentado es el corazón de Google: una página es
más importante que otra si tiene un mayor número de enlaces que apunten a ella.
Las páginas de alta calidad serán enlazadas por otras muchas páginas y esto
generará un mayor PageRank que, combinado con otros factores, asegura que las
páginas más próximas a nuestra búsqueda se sitúen en primer lugar.
Aunque el índice PageRank ha demostrado ser la forma más objetiva de
clasificación de páginas, algunos usuarios han buscado la forma de alterar a
su gusto los resultados de Google: si docenas o cientos de webmasters se
pusieran de acuerdo para situar un enlace en sus respectivas páginas a un mismo
sitio y asociarle una serie de palabras clave, los algoritmos de Google
terminarían ofreciendo la dirección del enlace como resultado de las palabras
de búsqueda. Esta forma de alterar malintencionadamente los resultados de las
búsquedas, bautizada como Google bombing, fue utilizada en octubre de
2002 para forzar que la búsqueda de las palabras "Go to hell"
ofreciera el web de Microsoft como primer resultado. Un comentario personal del
autor sobre este fenómeno puede encontrarse en un mensaje
de la lista de correos.
Buscador de imágenes

Se pueden buscar imágenes relacionadas con un determinado tema. Google
devolverá un listado de imágenes en miniatura ordenado por orden de
importancia. Para la clasificación de las imágenes se utiliza el texto que las
rodea en la página original. Estas imágenes en miniatura suelen ocupar menos
de 5 KB cada una y son las únicas que Google almacena en sus servidores. Si
hacemos clic en alguna de ellas se abrirá la página original donde podremos
ver la imagen a tamaño completo dentro de su contexto.
Grupos de noticias
Los grupos de noticias Usenet siempre han sido los grandes desconocidos de
Internet debido a que para acceder a ellos se requería la configuración de un
programa específico y un servidor de news. Pero gracias a Google es
posible el acceso por página web a la enorme base de datos de mensajes publicados en
Usenet. También se permite la publicación de nuevos mensajes. El servicio, desarrollado originalmente por
Deja.com, fue adquirido por Google en febrero de 2001.

El mensaje
más antiguo que se puede encontrar en el archivo de mensajes está fechado
en mayo del año 1981, año en el que una compañía llamada Microsoft
se daba a conocer por el lanzamiento del sistema operativo MS-DOS. El archivo
completo incluye más de 20
años de historia. Podemos encontrar mensajes históricos como el de un joven
llamado Linus Torvalds anunciando que había desarrollado una versión gratuita
de apariencia similar a
Minix (sistema operativo creado por el profesor
Tanenbaum con fines educativos) o el
famoso debate entre profesor y estudiante acerca de Linux: "escribir
un nuevo sistema operativo sólo para el 386 en 1991 te lleva a obtener tu segundo
suspenso para este trimestre. Pero si el examen final lo haces realmente bien,
todavía puedes aprobar el curso", le dijo Tanenbaum al creador de
Linux.
El potente buscador de mensajes es una herramienta complementaria a la
búsqueda de páginas web. Frecuentemente se encuentra en mensajes
información que no está disponible en ninguna página web. Por ejemplo,
reportes de usuarios acerca de problemas técnicos sobre combinaciones
específicas de hardware y software. También es muy útil para conocer
distintas opiniones sobre un tema o producto concreto.
Corrección de errores
En realidad no es un servicio establecido como tal en Google, pero es tan útil
que merece la pena dedicarle un apartado. Por ejemplo, suponga que no está seguro
de si la palabra "Washinton" está bien escrita. Basta hacer una búsqueda
de la palabra dudosa y Google nos indicará la palabra correcta: "Washington".
Esta característica no se basa en un corrector ortográfico sino que parte del
supuesto de que las palabras bien escritas aparecerán más veces en la web que
las incorrectas. La gran velocidad de respuesta de Google probablemente nos
resuelva dudas ortográficas en un menor tiempo que una consulta a un diccionario
o enciclopedia. Aunque no debemos olvidar el método de funcionamiento de esta
característica para interpretar correctamente la validez de los resultados.

La capacidad de enmienda automática de errores está patente incluso en el propio
nombre de dominio de Google. ¿A dónde iremos si escribimos www.gogle.com,
www.gooogle.com o www.googel.com?
Pruébelo y comprobará que Google ha adquirido nombres de dominio similares para
que usuarios despistados sigan llegando al popular buscador.
Configuraciones regionales y traducciones
Google es un proyecto que pretende ofrecer a toda la comunidad internacional
una web ordenada y accesible. El esfuerzo para hacer Google cercano a distintas
comunidades de usuarios se observa accediendo a las versiones específicas del
buscador para países como Japón
e Israel. También se
pueden encontrar versiones para sitios más exóticos como Islas
Vírgenes o Micronesia.

La interfaz de Google se puede mostrar en más de 80 idiomas distintos (para
español es http://www.google.com/intl/es/),
algunos de ellos tan curiosos como el Klingon
(la lengua de Star Trek),
el Elmer Fudd
(el gruñón
de los Looney Tunes) o el Bork
Bork Bork (la jerga que habla el cocinero
sueco de los Muppets). Otro "idioma" curioso es el hacker,
que fue el origen de un bulo que circuló por Internet alertando de una supuesta
intrusión en el popular sitio cuando, en realidad, se trata de una funcionalidad
fruto del gran sentido del humor de sus creadores. Las traducciones están realizadas
por voluntarios,
coordinados por la empresa, que pasan a formar parte de proyectos
de traducción.
Pero no sólo se traduce la interfaz de Google, también se ofrece la posibilidad
de traducir
textos o páginas web completas.
Directorio
Los buscadores se pueden clasificar en motores de búsqueda (indexación automática),
índices (un grupo de personas clasifican las páginas en categorías) y metabuscadores
(buscador que utiliza otros buscadores). Google ha pertenecido siempre al primer
grupo, aunque con la inclusión del directorio,
ahora también al segundo. Sin embargo, no cabe en la filosofía de Google tener
un grupo de empleados realizando las tareas de clasificación (como es el caso
de www.yahoo.com).

¿Cómo funciona entonces el directorio de Google? Muy sencillo: se basa en
Dmoz.org, un proyecto abierto
gestionado por Netscape para la ordenación de la web por voluntarios. Al contrario
que otros buscadores que venden las primeras posiciones de cada categoría, el
directorio de Google ordena las páginas objetivamente, según su índice PageRank.
De esta forma se combina la selección humana de páginas con los algoritmos automáticos
de Google.
Froogle: buscador de productos en tiendas virtuales

El último servicio ofrecido por la compañía es Froogle. Permite encontrar productos
que se estén vendiendo actualmente en tiendas virtuales. Froogle extrae automáticamente
el nombre del producto, una fotografía, precio y descripción. Permite navegar
por un directorio de categorías de productos o realizar búsquedas directas.
Los resultados de las búsquedas están clasificados por importancia según los
algoritmos de Google. Una vez que hemos realizado una búsqueda, podemos acotar
los resultados indicando un precio mínimo y uno máximo. Actualmente Froogle
trabaja únicamente con dólares.
Por ejemplo, podemos obtener un listado
de cámaras digitales de menos de 300 dólares o también un listado de las
tiendas virtuales que ofrecen la cámara Canon
PowerShot G2.
Noticias clasificadas
Si Froogle se especializa en productos de tiendas virtuales, Google News clasifica
la información de la prensa digital. Cada uno de estos dos servicios contempla
partes específicas del web, aunque no se limitan a realizar búsquedas sino que
aportan un verdadero valor añadido. El caso de Google News es la prueba de cómo
una idea sencilla puede ser utilizada para obtener resultados espectaculares.
La primera impresión que obtenemos es que Google entiende lo que dicen
los titulares.

Las noticias son extraídas automáticamente de miles de fuentes,
clasificadas en categorías y relacionadas entre sí. Además se muestra una
imagen de cada noticia destacada. Las mismas noticias en distintos medios
aparecen juntas, bajo el titular del medio más destacado. En ocasiones el
número de fuentes que tratan el mismo tema puede ser de varios cientos. La información se renueva
cada pocos minutos, generándose las portadas de las secciones sin intervención
humana alguna.
Google News es todavía un producto en fase beta. Sería interesante que en un futuro
se incluyesen secciones de noticias por países, así como que se habilitasen
más idiomas. Esto nos permitiría ver exclusivamente las noticias
de ámbito nacional en nuestro propio idioma. Es más: si este servicio se
combinara con la traducción de textos sería posible relacionar
automáticamente una noticia nacional en nuestro idioma con la misma noticia
tratada en medios internacionales.
Por último, otra característica interesante de Google News es la creación
de trazas por fechas de todas las noticias que
se han publicado sobre un mismo tema.
Catálogos
Google Catalogs clasifica los catálogos comerciales en papel que las tiendas
envían por correo postal. Es un servicio completamente distinto a todos
los demás ofrecidos por Google: no clasifica información digital publicada en
Internet como el resto de servicios, sino que clasifica documentos en papel.
La aplicación de la tecnología para la clasificación de documentos a catálogos
de venta por correo es sólo una pequeña muestra de su verdadero potencial.
Google Catalogs ofrece una dirección de correo postal para que los comerciantes
la añadan a la lista de distribución de sus catálogos con precios. Estos catálogos
son digitalizados y convertidos a texto para permitir búsquedas. Por una vez
sí es necesaria la intervención humana, al menos para recoger los catálogos
del correo y situarlos en el escáner, porque entendemos que el resto del proceso
está completamente automatizado.

La novedad del sistema es que los textos buscados aparecen resaltados en el
catálogo original (una imagen) no en la versión de texto, que permanece
invisible para el usuario. El resaltado de textos en la versión textual del
documento ya fue utilizada con los archivos de Adobe Acrobat, en los cuales
Google únicamente almacena la versión convertida. Sin embargo, en este caso se
almacena tanto la imagen como su conversión a texto.
La búsqueda se realiza en las versiones de texto, aunque se muestra la
imagen asociada. En el momento de mostrar la imagen, Google la transforma para
recuadrar el texto que estamos buscando. Pero, ¿cómo sabe en qué posición
debe hacer el recuadro? Esto sería posible haciendo de nuevo un OCR a la
imagen, aunque lo más probable es que la versión textual, creada al incluir el
catálogo a la base de datos, almacene las coordenadas dentro de la imagen donde
está situada cada palabra.
Puede probar Google Catalogs haciendo una búsqueda, por ejemplo, de catálogos
de juguetes.
Investigación de consultas
Mediante Google Answers podemos formular preguntas a investigadores especializados
que tratarán de ofrecernos la mejor respuesta, realizando búsquedas por Internet
u otros medios. Es el único servicio (aparte de la publicidad y soluciones profesionales)
que tiene un coste para el usuario final. ¿Cuánto vale formular una pregunta?
Lo que el usuario estime que vale la respuesta, desde un mínimo de 2 dólares
hasta un máximo de 200 dólares. Debido a que los investigadores deciden las
respuestas que desean responder, darán prioridad a aquellas que tengan un precio
mayor. Los investigadores son consultores independientes que reciben el 75%
del precio que el usuario abona. Una vez que el experto decide investigar una
pregunta, ésta queda bloqueada para otros investigadores y así evitar
que se superpongan sus trabajos (durante un máximo de 2 horas).

La satisfacción del usuario está garantizada: si no está conforme con la
respuesta recibida puede dar una puntuación baja al investigador o bien,
solicitar la devolución de su dinero justificando adecuadamente el motivo.
Aquellos investigadores cuya media de puntuaciones caiga por debajo de un
mínimo establecido serán excluido del equipo de investigadores de Google.
Las preguntas ya respondidas quedan publicadas por categorías en Google
Answers y se pueden consultar libremente.
Actualmente el cupo de investigadores está cubierto, aunque en un futuro es
probable que se acepten solicitudes. Los candidatos deben superar un cuestionario
de evaluación como requisito para incorporarse al equipo. A partir de este momento,
deben cuidar que los usuarios estén satisfechos con las preguntas respondidas.
Todos los detalles de Google Answers están cuidados al máximo, generando
beneficios tanto para usuarios, investigadores como para Google. La mayor parte
de las consultas son respondidas satisfactoriamente en apenas unas horas.
¿Qué se cocina en Google?
En el laboratorio de Google
podemos encontrar nuevos proyectos con un desarrollo muy avanzado. Por ejemplo,
un buscador de definiciones de términos (Google
Glossary), un generador de términos relacionados indicando al menos dos del
conjunto (Google Sets)
y un buscador de referencias o explicaciones del sitio que estamos buscando en
otros sitios (Google
WebQuotes). Los proyectos de Google Labs pueden evolucionar a una versión
beta y posteriormente, a una versión final. En el momento en que lea estas
líneas puede que los proyectos abiertos sean distintos y por lo tanto no
funcione algún enlace.
Veamos algunos ejemplos de utilización de los tres proyectos anteriores. Con
Google Glossary
podemos buscar la definición de las siglas XML
o de la palabra sniffer.
Ahora vamos a utilizar Google
Sets para obtener marcas
de automóviles, ofreciendo como muestra del conjunto los términos "Audi"
y "Reanult". Finalmente, queremos encontrar comentarios de lo que
dicen otros sitios sobre tutoriales
de HTML.
¿Pero estos chicos no van a parar?
Parece que no y es que en Google están dispuestos a continuar revolucionando
la búsqueda de información desde todos los frentes sin conformarse con su situación
actual de liderazgo. Mostrar la información de forma clara, ordenada y accesible
es su objetivo. Y la información no tiene fin. Después de conocer Google Catalogs
tenemos la sensación de que Internet parece insuficiente para Google. Puede
que más adelante se decidan por clasificar otro tipo de documentos escritos
o incluso, información multimedia como sonidos o vídeos. Desde luego, esto es
sólo el principio pero los comienzos no pueden haber sido más acertados.
|