¿Cómo funciona Google?

Miércoles, 10 Diciembre 2008

La verdad, es que nadie exactamente sabe como funciona Google, ya que es un secreto empresarial como puede ser el de la Coca-cola. De todas formas, hay algunas pistas sobre el funcionamiento exacto. Por un lado, Google publicó ya hace algún tiempo un artículo donde se explicaba la arquitectura.
A pesar de este artículo, nadie sabe a ciencia cierta la formula del algoritmo PageRank, que es el que realmente pone cada enlace en un ranking según su “calidad”. Existen varios intentos imaginativos de describir la posible formula del algoritmo (p.e. aqui ). Lo cierto es que el Google trata de aplicar un ratio de importancia del sitio basado en factores tales como la importancia del dominio, palabras claves que contiene el enlace o calidad de los enlaces entrantes.
No solo eso,…., al parecer el algoritmo podría ser lo suficientemente inteligente como para restar puntos si el enlace cumple determinadas condiciones, como Black-hat o Sandbox.
También hay una suposición de que Google trata unos sitios diferentes a otros según cuanto tiempo tienen en la red. Por ejemplo yo llevo un año y un mes de existencia, y hasta el año justo he llegado a tener hasta 1400 visitas diarias. Esto cambio al pasar 12 meses, reduciendose el número de visitas, pero por contra ahora me dejan más comentarios y segun las estadísticas, parece que tengo una actividad distinta. Seguro que son cosas de Google…..
Dicho esto, voy a pasar a exponer una reflexión basada en algunos datos. Se sabe que Google es usado en España por el 99% de los usuarios, en USA por un 42% o UK un 75%. ¿A qué se debe que en ciertos paises haya menos porcentaje de uso? Mi opinión es que esto es debido a las diferencias sociales y culturales de cada pais. Por ejemplo, que en España lo usen el 99% de los usuarios no es ni más ni menos síntoma de que los resultados obtenidos satisfacen al usuario, pero en USA, el mismo algoritmo no devuelve los resultados deseables por el usuario, haciendo que este migre a otros buscadores, cuyo algoritmo y sistema experto devuelve resultados deseables. Lo que en España se considerá una buena busqueda, en USA u otros paises no tienen por qué ser así.
Estadisticas Google: aqui
Cabe destacar que google no es solo una herramienta de busqueda, como muchos de vosotros ya sabreis, sino que tienen otras aplicaciones, como Google-Reader, Google-groups, ….
Como complemento al artículo, deciros que hay paises en los que Google no se come un rosco. Por ejemplo en Rusia se usa www.yandex.com (46% de mercado), www.seznam.cz en la República Checa, www.baidu.com que es la más visitada en China, www.naver.com es el más usado en Corea del Sur con un 60% de cuota de mercado, y por ultimo, www.yahoo.co.jp es el más usado en Japon con un 50% de las búsquedas, y eso que es estadounidense.

Enlaces interesantes

Sábado, 8 Diciembre 2007

Sigo de vacaciones, y este es un mensaje escrito antes de irme y publicado automáticamente con WordPress. Escribo este artículo para hablar de algunos enlaces que considero interesantes.

En Miniguias, teneis a vuestra disposición muchos artículos interesantes. En uno de los últimos teneis un artículo dedicado a temas de seguridad que todo usuario tendría que tener en cuenta. La web completa está muy bien y recomiendo echarle un vistazo.

Y si te gusta la música y estás aprediendo piano, este enlace titulado “Lo mejor del mundo: la música es muy interesante. Su autor dedica tiempo y recursos para enseñar a los lectores. No tiene desperdicio y se nota una alta implicación del autor con el blog. Altamente recomendado.

Saludos

Fer


Al hilo del post anterior: Más sobre Google

Miércoles, 14 Noviembre 2007

Al hilo del post anterior, he recibido información de un amigo que la reproduzco a continuación por su interés.

Sin desperdidio, pincha en los links de las noticias:
http://www.worldnetdaily.com/news/article.asp?ARTICLE_ID=44125

http://www.jornada.unam.mx/2006/07/27/037n1tec.php
http://www.eluniversal.com.mx/finanzas/w51058.html

Las donaciones deben ser públicas y aquí se registran:
http://www.fec.gov/

Proposición republicana en el congreso, sin desperdicio:
http://mashable.com/wp-content/uploads/2007/11/110607_hearing_request_letter.pdf

Acojonante.


Reflexiones sobre Google

Martes, 13 Noviembre 2007

Hoy me resultaba dificil que tema elegir para hablar. Con casi 80 visitas al día, y algunos pidiendome hablar sobre música, otros sobre curiosidades…… en fin, paciencia porque pienso, poco a poco, hablar de todo. Hoy toco un tema para dar a algunos que pensar.

Vamos a ello….. Algunos datos sobre estadísticas de uso de Google según el total de internautas por paises que lo usan:

EEUU, 42%; Reino Unido, 75%; Alemania, 91%; España 99%; China 21%; ….

España es el pais con más éxito. En otros paises la tarta se reparte con otros buscadores como Yahoo o MSN.

¿Por qué Google tiene tanto éxito en España? Cuesta entender ese “dominio absoluto”. La respuesta más apropiada sería porque las búsquedas dan respuesta a lo que los españoles esperan de un buscador. Aún así sería interesante un estudio en profundidad, ya que el resto de buscadores ni siquiera suponen más del 1%, y eso es un fenomeno muy muy muy raro. Sociologicamente debe tener alguna explicación.

¿Qué características tienen los algorítmos de búsqueda? Ciertamente sería deseable un algoritmo que fuera público. En este sentido Wikia, un nuevo buscador de Wikipedia que estará disponible en Diciembre, basará sus búsquedas en un algoritmo de código abierto desarrollado por “la comunidad”, donde primarán la valoración que hagan los usuarios sobre las páginas, y no en parámetros de calidad medibles por un algoritmo automático, como hace Google.

Que el algoritmo sea público tiene mucha más importancia de la que puede resultar a simple vista. Por ejemplo, Google es uno de los donates de fondos del partido republicano en EEUU. Dicho esto, ¿quién garantiza que en las búsquedas no se está primando a las webs o blogs que hablan bien de este partido? La transparencia es la mejor de las tarjetas de presentación de una empresa u organismo, por eso que el público conozca el algoritmo sería un punto muy importante.

El tema de la transparencia tiene una gran analogía con la seguriad informática. Allí, la seguridad de los algoritmos que se usan en el cifrado de datos está muy relacionada con que el algoritmo de cifrado sea público o no. Si es público, el algoritmo es puesto a prueba por cientos de personas (criptoanálisis). Cuanto más público, mejor, porque si el algoritmo “no se rompe”, significa que es muy buen algoritmo. Sin embargo, si el algoritmo no es público, no se puede garantizar parte de su seguridad, al no haber estado “sometido a prueba”.

Dejo al lector hacerse algunas preguntas sobre los buscadores, y que piense en ello un poco:

  • ¿Debe un algoritmo de búsqueda ser público?
  • ¿Debe un buscador solo primar la popularidad de un sitio? ¿Qué pasa con la calidad del contenido? ¿está el segundo relacionado con el primero? ¿o no siempre?
  • ¿Debe un buscador primar la accesibilidad, el diseño o las capacidades multimedia?
  • ¿puede una web o blog sin recursos monetarios posicionarse mejor que una compañía que puede invertir dinero en ello?

Wikia viene a resolver algunos de estos interrogantes, gracias a la transparencia y la intervención humana en la valoración de los sitios. Evidentemente también hay algunos problemas asociados, parecidos a los que tiene la Wikipedia (bandalismo, disputas “filosóficas” sobre lo apropiado del contenido, etc…..), aunque de eso intentare hablar en otra ocasión. Estaremos atentos al futuro de este buscador….

A….. y mientras tanto estudios nos dicen que Google solo indexa el 0.02% del total de información de Internet. ¿no es sorprendente?

Saludos

Fer

Fuentes usadas para el artículo:
  1. "Documental 'Google tras la pantalla' " 
  2. Noticia de 'El Mundo'


Sobre los servicios de sindicación

Domingo, 11 Noviembre 2007

A raíz de una discusión mantenida con los miembros de mi club de ajedrez, voy a postear unas breves explicaciones de que es eso de RSS, la Web 2.0 y los servicios de sindicación.

Para empezar, decir que hoy en día, una gran cantidad de personas escriben blogs, además hay montones de periódicos y servicios de noticias, servicios de información meteorológica, revistas, …… Casi todos estos servicios ofrecen contenidos que se actualizan con mucha frecuencia. Ahí es donde RSS tiene importancia, ya que estos portales suelen ofrecer servicios RSS, que consisten, básicamente, en “informar” a un gestor de contenidos RSS de que actualizaciones se han hecho en la página en cuestión.

Para pintarlo de una manera más clara, me pongo como ejemplo. Yo estoy dado de alta en Bloglines (http://www.bloglines.com), que es un gestor de sitios. Al darme de alta me instale un plugin en el navegador: un botón. Así, cuando veo una web que me gusta, le doy al botón y automáticamente bloglines ya sabe que yo quiero seguir ese portal. Yo tengo aproximadamente unos 40 sitios de los cuales hago un seguimiento.

A diario, o cada dos días, me conecto a bloglines, y este me informa de qué sitios han publicado nueva información desde la última vez que los ví; así, en vez de recorrerme las 40 páginas para ver si hay algo nuevo, solo tengo q conectarme a blogline y este ya me lo dice. Vamos….. que es muy útil.

http://reader.google.es también ofrece el mismo servicio.

Teneis una guía fácil en: http://es.geocities.com/rss_guia_facil/ 

Espero haberos sido de ayuda. Si alguno quiere que le ayude que me llame al tfno. o me escriba un correo.

Saludos

Fer