¿El PageRank se divide entre todos los enlaces de la página o sólo entre los enlaces únicos?

En Twitter, un profesional de SEO le preguntó a John Mueller sobre el PageRank. Para aquellos que no lo saben, en SEO, PageRank es el algoritmo de Google para medir el “valor” de un sitio web, desarrollado por el cofundador de Google, Larry Page, y que por eso lleva su nombre.

Su pregunta fue: la semana pasada tuvieron un debate que no pudieron resolver. ¿El Page Rank (link Juice) se divide entre todos los enlaces dofollow de la página o sólo entre los enlaces dofollow únicos?

Señalaron que Google tampoco proporcionó respuestas específicas.

John sugirió mirar la documentación que habla sobre PageRank, más específicamente, la documentación que existe en Wikipedia.

Revisaría los documentos sobre PageRank, https://t.co/yv12xrlkWE tiene una buena descripción general. Es un algoritmo bastante bien documentado.

— 🐝 johnmu.csv (personal) 🐝 (@JohnMu) 23 de junio de 2022

¿Qué dice la documentación sobre PageRank?

Si no lo ha hecho antes, hay mucho que digerir en el artículo de Wikipedia. Pero las partes del artículo sin ecuaciones dicen lo siguiente:

“Algoritmo

El algoritmo PageRank genera una distribución de probabilidad que se utiliza para representar la probabilidad de que una persona que hace clic aleatoriamente en enlaces llegue a una página en particular. El PageRank se puede calcular para colecciones de documentos de cualquier tamaño. En varios artículos de investigación se supone que la distribución se divide uniformemente entre todos los documentos de la colección al comienzo del proceso computacional. Los cálculos de PageRank requieren varias pasadas, llamadas “iteraciones”, a través de la colección para ajustar los valores aproximados de PageRank para reflejar más fielmente el valor real teórico.

Leer:  Una guía para principiantes sobre los métodos de envío de Magento 2: qué son y cómo funcionan Cómo empezar

Una probabilidad se expresa como un valor numérico entre 0 y 1. Una probabilidad de 0,5 se expresa comúnmente como un “50% de probabilidad” de que algo suceda. Por lo tanto, un documento con un PageRank de 0,5 significa que hay un 50% de posibilidades de que una persona que haga clic en un enlace aleatorio sea dirigida a dicho documento.

Algoritmo simplificado

Supongamos un pequeño universo de cuatro páginas web: A, B, C y D. Los enlaces de una página a sí misma se ignoran. Varios enlaces salientes de una página a otra se tratan como un solo enlace. PageRank se inicializa con el mismo valor para todas las páginas. En la forma original de PageRank, la suma del PageRank de todas las páginas era el número total de páginas en la web en ese momento, por lo que cada página en este ejemplo tendría un valor inicial de 1. Sin embargo, las versiones posteriores de PageRank y el En el resto de esta sección, supongamos una distribución de probabilidad entre 0 y 1. Por lo tanto, el valor inicial para cada página en este ejemplo es 0,25.

El PageRank transferido desde una página determinada a los destinos de sus enlaces salientes en la siguiente iteración se divide en partes iguales entre todos los enlaces salientes.

Factor de amortiguamiento

La teoría del PageRank sostiene que un navegante imaginario que hace clic aleatoriamente en enlaces eventualmente dejará de hacer clic. La probabilidad, en cualquier paso, de que la persona continúe es un factor amortiguador d. Varios estudios han probado diferentes factores de amortiguación, pero generalmente se supone que el factor de amortiguación se establecerá alrededor de 0,85.[5]

El factor de amortiguación se resta de 1 (y en algunas variaciones del algoritmo, el resultado se divide por el número de documentos (N) de la colección) y este término luego se suma al producto del factor de amortiguación y la suma de los puntuaciones de PageRank entrantes.

Leer:  Estrategia de SEO de vídeo: cree su propia estrategia de promoción de vídeo

Por lo tanto, el PageRank de cualquier página se deriva en gran parte del PageRanks de otras páginas. El factor de amortiguación ajusta el valor derivado hacia abajo.

La diferencia entre ellos es que los valores de PageRank en la primera fórmula suman uno, mientras que en la segunda fórmula cada PageRank se multiplica por N y la suma se convierte en N. Una afirmación en el artículo de Page y Brin de que “la suma de todos los PageRanks es uno “[5] y reclamaciones de otros empleados de Google[29] apoya la primera variante de la fórmula anterior.

Page y Brin confundieron las dos fórmulas en su artículo más popular, “La anatomía de un motor de búsqueda web hipertextual a gran escala”, donde afirmaron erróneamente que la última fórmula formaba una distribución de probabilidad entre las páginas web.[5]

Google recalcula las puntuaciones de PageRank cada vez que rastrea la Web y reconstruye su índice. A medida que Google aumenta la cantidad de documentos en su colección, la aproximación inicial del PageRank disminuye para todos los documentos.

La fórmula utiliza un modelo de un navegante aleatorio que llega a su sitio de destino después de varios clics y luego cambia a una página aleatoria. El valor de PageRank de una página refleja la posibilidad de que un navegante aleatorio llegue a esa página haciendo clic en un enlace. Puede entenderse como una cadena de Markov en la que los estados son páginas y las transiciones son enlaces entre páginas, todas las cuales son igualmente probables.

Leer:  Cómo hacer que los vídeos se reproduzcan automáticamente en la historia de Instagram

Si una página no tiene enlaces a otras páginas, se convierte en un sumidero y, por lo tanto, finaliza el proceso de navegación aleatoria. Si el navegante aleatorio llega a una página receptora, elige otra URL al azar y continúa navegando nuevamente.

Al calcular el PageRank, se supone que las páginas sin enlaces salientes enlazan con todas las demás páginas de la colección. Por lo tanto, sus puntuaciones de PageRank se dividen equitativamente entre todas las demás páginas. En otras palabras, para ser justos con las páginas que no son receptores, estas transiciones aleatorias se agregan a todos los nodos de la Web. Esta probabilidad residual, d, generalmente se establece en 0,85, estimada a partir de la frecuencia con la que un navegante promedio usa la función de marcadores de su navegador”.

Toda esta es información antigua y puede que no refleje exactamente al 100 por ciento lo que hace Google hoy en día, pero sigue siendo útil leerla si no tienes idea sobre el PageRank y cómo se calcula.

También vale la pena señalar que el PageRank no ha desaparecido. Simplemente se ha trasladado a una mención más interna para que Google no tenga que hacerlo público.

El Googler Gary Illyes dijo lo mismo en 2017 sobre esto:

¿DIK que después de 18 años seguimos usando PageRank (y cientos de otras señales) en la clasificación?

¿Quieres saber cómo funciona?https://t.co/CfOlxGauGF pic.twitter.com/3YJeNbXLml

— Gary 鯨理/경리 Illyes (@methode) 9 de febrero de 2017

Nuevas Publicaciones:

Recomendamos