Ricardo Baeza – Funcionamiento de los buscadores
Escrito por Álvaro el 11 de Mayo de 2006 - 5 Comentarios
El primero de los ponentes fue Ricardo Baeza de Yahoo! Research. Ricardo aprovechó su tiempo para hablarnos acerca de la estructura de internet y el funcionamiento de los buscadores.
Según datos facilitados por Ricardo, se estima que el 50% de las webs son “islas”, o lo que es lo mismo, webs sin links entrantes ni salientes. Esta situación dificulta, por no decir imposibilita, la tarea de indexación por parte de los buscadores. La consecuencia de esto es clara: el 50% de estas “islas” mueren/desaparecen en menos de 1 año.
A continuación Ricardo nos explicó el funcionamiento del modelo de búsqueda. Todo comienza con una tarea a ser realizada. Esta tarea crea una necesidad de información que acaba con una verbalización de la petición. Esta petición se realiza mediante “dos palabras” que introducimos en la caja de búsqueda, para realizar la búsqueda de algo mucho más complejo que dos palabras. El problema posterior para los buscadores es la polisemia de las palabras así como los sinónimos.
Los objetivos del acceso a Internet son según sus estudios en un 50% de los casos para obtener información. Otro 20% representa la necesidad de navegación y el 30% de los usuarios acceden para realizar una interacción con la web, ya sea una compra o cualquier otro tipo de interacción.
Otro número interesante que pudimos ver, aunque es bastante conocido, es que el 20% de los usuarios que utilizan los buscadores, no llegan a leer la primera página de resultados al completo. Otro 27% lee la primera página al completo y un 25% llega a visitar la segunda página de resultados.
Un dato que me pareció curioso es que el 50% de la web cambia o es modificada cada 6 meses. Impresionante la velocidad a la que se mueve este mundo.
Uno de los últimos temas que trató fue los problemas que tienen los buscadores a la hora de recorrer e indexar la web y su funcionamiento. El primer problema con que se encuentra el robot es el crawling. El robot ha de buscar conseguir un óptimo entre cantidad, frescura y calidad, dado que cada una de estas variables es una pequeña contradicción respecto a las otras. El segundo problema de los buscadores es el ranking de resultados. Actualmente para realizar esta tarea los buscadores utilizan variables como el tráfico generado a la web desde los resultados del buscador, anchor text, texto dentro del documento o el metadata.
Para finalizar Ricardo nos mostró Yahoo! Mindset, una herramienta que dependiendo del tipo de búsqueda realizada (información-interacción) mostraba unos resultados u otros. Una herramienta interesante sin duda alguna.
Para finalizar Ricardo pronunció una frase que me pareció una verdad como una casa y me encantó: “Mucha Información crea problemas de atención”.
Si te gustó esta noticia, entérate antes que nadie de las últimas novedades de nuestro blog.
5 Comentarios. Déjanos el tuyo...



[...] Charla de Ricardo Baeza [...]
¿no vas a escribir sobre la mesa redonda y demas temas?
Hola Pep,
pues en un principio si tenía pensado, pero pasó lo de siempre que tienes planes: Tuvimos una punta de trabajo y para cuando pude retomarlo, me pareció que estaba fuera de contexto.
Si sigues interesado no dudes en contactar conmigo y responderé a tus preguntas sin ningún problema.
Un saludo
[...] cuando googleas a los políticos? Lo que aparece en la primera página de Google es muy importante porque la mayoría de las personas sólo buscan en esa primera página y por tanto todo candidato o político debería preocuparse de los temas a los que se asocia su [...]
[...] cuando googleas a los políticos? Lo que aparece en la primera página de Google es muy importante porque la mayoría de las personas sólo buscan en esa primera página y por tanto todo candidato o político debería preocuparse de los temas a los que se asocia su [...]