¿Cómo funciona Google?

Miércoles, 10 Diciembre 2008

La verdad, es que nadie exactamente sabe como funciona Google, ya que es un secreto empresarial como puede ser el de la Coca-cola. De todas formas, hay algunas pistas sobre el funcionamiento exacto. Por un lado, Google publicó ya hace algún tiempo un artículo donde se explicaba la arquitectura.
A pesar de este artículo, nadie sabe a ciencia cierta la formula del algoritmo PageRank, que es el que realmente pone cada enlace en un ranking según su “calidad”. Existen varios intentos imaginativos de describir la posible formula del algoritmo (p.e. aqui ). Lo cierto es que el Google trata de aplicar un ratio de importancia del sitio basado en factores tales como la importancia del dominio, palabras claves que contiene el enlace o calidad de los enlaces entrantes.
No solo eso,…., al parecer el algoritmo podría ser lo suficientemente inteligente como para restar puntos si el enlace cumple determinadas condiciones, como Black-hat o Sandbox.
También hay una suposición de que Google trata unos sitios diferentes a otros según cuanto tiempo tienen en la red. Por ejemplo yo llevo un año y un mes de existencia, y hasta el año justo he llegado a tener hasta 1400 visitas diarias. Esto cambio al pasar 12 meses, reduciendose el número de visitas, pero por contra ahora me dejan más comentarios y segun las estadísticas, parece que tengo una actividad distinta. Seguro que son cosas de Google…..
Dicho esto, voy a pasar a exponer una reflexión basada en algunos datos. Se sabe que Google es usado en España por el 99% de los usuarios, en USA por un 42% o UK un 75%. ¿A qué se debe que en ciertos paises haya menos porcentaje de uso? Mi opinión es que esto es debido a las diferencias sociales y culturales de cada pais. Por ejemplo, que en España lo usen el 99% de los usuarios no es ni más ni menos síntoma de que los resultados obtenidos satisfacen al usuario, pero en USA, el mismo algoritmo no devuelve los resultados deseables por el usuario, haciendo que este migre a otros buscadores, cuyo algoritmo y sistema experto devuelve resultados deseables. Lo que en España se considerá una buena busqueda, en USA u otros paises no tienen por qué ser así.
Estadisticas Google: aqui
Cabe destacar que google no es solo una herramienta de busqueda, como muchos de vosotros ya sabreis, sino que tienen otras aplicaciones, como Google-Reader, Google-groups, ….
Como complemento al artículo, deciros que hay paises en los que Google no se come un rosco. Por ejemplo en Rusia se usa www.yandex.com (46% de mercado), www.seznam.cz en la República Checa, www.baidu.com que es la más visitada en China, www.naver.com es el más usado en Corea del Sur con un 60% de cuota de mercado, y por ultimo, www.yahoo.co.jp es el más usado en Japon con un 50% de las búsquedas, y eso que es estadounidense.

Reflexiones sobre Google

Martes, 13 Noviembre 2007

Hoy me resultaba dificil que tema elegir para hablar. Con casi 80 visitas al día, y algunos pidiendome hablar sobre música, otros sobre curiosidades…… en fin, paciencia porque pienso, poco a poco, hablar de todo. Hoy toco un tema para dar a algunos que pensar.

Vamos a ello….. Algunos datos sobre estadísticas de uso de Google según el total de internautas por paises que lo usan:

EEUU, 42%; Reino Unido, 75%; Alemania, 91%; España 99%; China 21%; ….

España es el pais con más éxito. En otros paises la tarta se reparte con otros buscadores como Yahoo o MSN.

¿Por qué Google tiene tanto éxito en España? Cuesta entender ese “dominio absoluto”. La respuesta más apropiada sería porque las búsquedas dan respuesta a lo que los españoles esperan de un buscador. Aún así sería interesante un estudio en profundidad, ya que el resto de buscadores ni siquiera suponen más del 1%, y eso es un fenomeno muy muy muy raro. Sociologicamente debe tener alguna explicación.

¿Qué características tienen los algorítmos de búsqueda? Ciertamente sería deseable un algoritmo que fuera público. En este sentido Wikia, un nuevo buscador de Wikipedia que estará disponible en Diciembre, basará sus búsquedas en un algoritmo de código abierto desarrollado por “la comunidad”, donde primarán la valoración que hagan los usuarios sobre las páginas, y no en parámetros de calidad medibles por un algoritmo automático, como hace Google.

Que el algoritmo sea público tiene mucha más importancia de la que puede resultar a simple vista. Por ejemplo, Google es uno de los donates de fondos del partido republicano en EEUU. Dicho esto, ¿quién garantiza que en las búsquedas no se está primando a las webs o blogs que hablan bien de este partido? La transparencia es la mejor de las tarjetas de presentación de una empresa u organismo, por eso que el público conozca el algoritmo sería un punto muy importante.

El tema de la transparencia tiene una gran analogía con la seguriad informática. Allí, la seguridad de los algoritmos que se usan en el cifrado de datos está muy relacionada con que el algoritmo de cifrado sea público o no. Si es público, el algoritmo es puesto a prueba por cientos de personas (criptoanálisis). Cuanto más público, mejor, porque si el algoritmo “no se rompe”, significa que es muy buen algoritmo. Sin embargo, si el algoritmo no es público, no se puede garantizar parte de su seguridad, al no haber estado “sometido a prueba”.

Dejo al lector hacerse algunas preguntas sobre los buscadores, y que piense en ello un poco:

  • ¿Debe un algoritmo de búsqueda ser público?
  • ¿Debe un buscador solo primar la popularidad de un sitio? ¿Qué pasa con la calidad del contenido? ¿está el segundo relacionado con el primero? ¿o no siempre?
  • ¿Debe un buscador primar la accesibilidad, el diseño o las capacidades multimedia?
  • ¿puede una web o blog sin recursos monetarios posicionarse mejor que una compañía que puede invertir dinero en ello?

Wikia viene a resolver algunos de estos interrogantes, gracias a la transparencia y la intervención humana en la valoración de los sitios. Evidentemente también hay algunos problemas asociados, parecidos a los que tiene la Wikipedia (bandalismo, disputas “filosóficas” sobre lo apropiado del contenido, etc…..), aunque de eso intentare hablar en otra ocasión. Estaremos atentos al futuro de este buscador….

A….. y mientras tanto estudios nos dicen que Google solo indexa el 0.02% del total de información de Internet. ¿no es sorprendente?

Saludos

Fer

Fuentes usadas para el artículo:
  1. "Documental 'Google tras la pantalla' " 
  2. Noticia de 'El Mundo'