El algoritmo de Google: PageRank

el-algoritmo-de-googleCada buscador tiene un algoritmo diferente, Google utiliza el PageRank aunque no es una idea original de éste buscador, sino que fueron Larry Page y Sergei Brin quienes ofrecieron en el año 1997 el algoritmo a Yahoo por un millón de dólares y rechazaron la oferta. Google sí que la aceptó y en el año 2002 Yahoo intento deshacer su error y adquirirla por 3 millones, pero Google como es lógico se negó. Aunque el primer uso práctico del algoritmo fue en 1971 por el economista Wassily Leontief. Por lo que el mérito de Google fue implementarlo eficientemente en la red de miles de millones de nodos.

Tal y como describen Larry Page y Sergey Brin, la importancia de una web es algo inherentemente subjetivo pero aun así, con ayuda del algoritmo podemos obtener un método objetivo y mecánico, en el que se mide la atención e interés de los usuarios hacia las webs. Estos dos estudiantes de doctorado establecieron el método para calcular la importancia de las webs pero fue Google quien supo implementarlo correctamente para pasar de indexar 24 millones de páginas web a 4.000 millones de direcciones. Es ahí donde reside el verdadero valor de este buscador, en saber indexar el mayor porcentaje de páginas existentes y evaluar los vínculos entrantes y salientes de cada una de ellas.google-algoritmo

En cuanto a los orígenes del algoritmo, el análisis de redes ya había nacido antes que Internet y era una de las formas más comunes para medir y evaluar la centralidad o influencia de un nodo en la red, es decir, la centralidad del vector propio. Fueron muchos los que ya hicieron uso de este algoritmo, pues Jon Kleinberg utilizó uno muy similar con el que trataba a las páginas como emisoras o receptoras de votos, Gabriel Pinski y Francis Narin también detacaron la importancia de un texto según su centralidad o el ya mencionado anteriormente, Wassily  Leontief. Éstos son algunos de sus usos históricos, sin embargo, también han surgido usos más recientes, pues Stefano Alesina y Mercedes Pascual lo han empleado para estudiar las extinciones animales, basándose en el soporte vital que suponen para la existencia de otras.

En la actualidad Google emplea PageRank y no es otra cosa que una familia de algoritmos con los que asigna de forma numérica una determinada relevancia a las webs. Para medir dicha relevancia de una web sobre otra utiliza el algoritmo:

google-pagerank

En el que PR(A) es el PageRank de la página web A.

PR(i) son los valores de PageRank de las páginas que enlazan a la web A.

C(i) es el número total de enlaces salientes de la página i , enlacen hacia A o no.

posicionar-google

A través de los resultados que Google obtiene con el PageRank, establece una relevancia de webs entre todas y las ordena de forma que cuando buscamos algo, los primeros resultados que aparecen son aquellas webs que tienen un mejor PageRank. Las páginas ascienden o descienden en función de esta valoración entre todas las páginas de la World Wide Web, por este motivo es importante un posicionamiento web constante y aplicar correctamente las técnicas de posicionamiento seo.

Esta entrada fue publicada en Algoritmo de Google. Guarda el enlace permanente.