Google PageRank, comment fonctionne le calcul des liens aujourd’hui
Il était une fois le PageRank… ou l’est-il encore ? Le site Search Engine Watch a consacré une étude approfondie à la méthode de calcul de la qualité et de la quantité des liens reçus par un site, qui détermine sa crédibilité et son autorité sur les moteurs de recherche, en essayant de dissiper certaines idées fausses qui persistent encore aujourd’hui.

L’histoire du PageRank
En 2008, le PageRank était la partie principale de l’algorithme de classement de Google, a déclaré Udi Manber, alors vice-président de la société californienne, mais les évolutions ultérieures du moteur de recherche ont beaucoup changé la situation, et nous savons qu’il existe aujourd’hui au moins 200 facteurs de classement utilisés pour déterminer la position d’un site et de ses pages.
Métriques pour calculer la quantité et la qualité des backlinks
Au début, le PageRank était un indice de la popularité d’un site sur le Web, déterminé par le nombre de liens retour qu’il recevait d’autres sites, qui représentaient des « votes » de confiance et d’approbation, lesquels avaient à leur tour un poids différent selon la valeur du site de liaison et sa popularité.
Formule simplifiée
L’algorithme complet de calcul du PageRank fait appel à la théorie des processus de Markov et est classé dans la véritable catégorie des algorithmes de classement par analyse des liens. À partir de la formule initialement développée par les fondateurs de Google, Sergey Brin et Larry Page, il est possible de comprendre comment le PageRank est distribué entre les pages :
Où :
PR[A] est la valeur du PageRank de la page A que nous voulons calculer.
N est le nombre total de pages connues.
n est le nombre de pages qui contiennent au moins un lien vers A. Pk représente chacune de ces pages.
PR[Pk] sont les valeurs de PageRank de chaque page Pk.
C[Pk] sont le nombre total de liens contenus dans la page proposant le lien.
d (damping factor) est un facteur décidé par Google et qui dans la documentation originale prend la valeur 0.85. Il peut être ajusté par Google pour décider du pourcentage de PageRank qui doit passer d’une page à l’autre et de la valeur minimale de PageRank attribuée à chaque page de l’archive.
D’après la formule, on peut donc voir que plus le nombre total de liens de sites pointant vers A augmente, plus le PageRank augmente.
Adieu au PR dans la barre d’outils Google
La dernière mise à jour publique officielle de PageRank a eu lieu en décembre 2013, et en octobre de l’année suivante, l’adieu à PageRank dans la barre d’outils Google a été annoncé, cette même barre étant retirée du navigateur deux ans plus tard.
Cependant, comme nous l’avons mentionné dans un article plus ancien sur l’algorithme RankBrain et Hummingbird de Google, le PageRank s’est en quelque sorte fondu dans le système plus général et plus complexe avec lequel le moteur de recherche gère le contenu et les classements, devenant l’un des facteurs d’évaluation.
Le PageRank est toujours un facteur de classement des moteurs de recherche
Ainsi, le PageRank de la barre d’outils a disparu, mais il existe différentes indications sur l’architecture qui sous-tendait la métrique : en 2017, Gary Illyes a confirmé sur Twitter que le PageRank était toujours un signal de classement, et en avril 2018, Google a mis à jour et étendu le brevet PageRank 2018. On peut dire que le système d’analyse des liens existe toujours et est toujours pris en compte par Google, et c’est à partir de cette réflexion que s’ouvre l’article signé par Aleh Barysevich.
Le « PageRank de Google est l’une des métriques qui a tout déclenché », déclare l’auteur en ouverture, rappelant que le terme figurait déjà dans le tout premier document de recherche qui a jeté les bases de tout le système de classement de Google, signé par Sergey Brin et Lawrence Larry Page.
Qu’est-ce que le PageRank de Google ?
En bref, le PageRank est une méthode permettant de détecter l’importance, la crédibilité et le « poids » d’une page web en fonction du type de backlink qu’elle reçoit. Il s’agit d’un système qui fonctionne de manière similaire aux citations académiques : plus le profil de backlink est solide, plus un site reçoit de backlinks appropriés et faisant autorité, plus il a de chances d’être bien classé sur Google.
Par conséquent, depuis que le PageRank a été adopté, la communauté des référenceurs tente d’optimiser les sites en fonction de ces valeurs. Au cours de sa longue histoire en tant que « facteur de classement vital », le PageRank a été entouré d’une multitude d’idées fausses, dont celles mises en évidence par l’article américain.
Le PageRank est une métrique obsolète (idée fausse N°1)
La première idée fausse consiste précisément à considérer que le système PageRank est vieux, obsolète et dépassé, ou du moins le raisonnement qui sous-tend la métrique. Certes, l’internet et le système de recherche de Google évoluent constamment à la vitesse de l’éclair, mais le PR reste à bien des égards une pierre angulaire de l’ensemble du système de classement de Google, conçu à l’origine pour aider les utilisateurs à éviter les résultats inutiles dans leurs recherches.
En outre, de nombreux changements ont été apportés à la formule du PageRank depuis la version de 1999, reflétant les évolutions de l’algorithme et du paysage du Web.
Google n’utilise plus le PageRank ? (idée fausse N°2)
Une considération connexe suit : Google n’utilise plus cet outil depuis qu’il a cessé de le mettre à jour publiquement. En fait, et comme mentionné, il n’y a jamais eu d’interruption officielle du PageRank, il a juste été rendu non ouvertement disponible aux utilisateurs.
En pratique, cela pourrait signifier (et Barysevich en semble tout à fait convaincu) que Google a seulement cessé de montrer les scores PR publics (la valeur de un à dix de toute page visitée, qui apparaissait également via la barre d’outils Google susmentionnée), mais que son utilisation interne reste valable.
Pourquoi Google a supprimé le PageRank
Cette révolution était nécessaire car les informations publiques sur le PageRank avaient facilité les activités d’optimisation manipulatrices (y compris par le biais de techniques SEO black hat) et l’utilisation de spam de liens afin de forcer le classement. Cette situation a donné naissance à l’algorithme Pingouin et à ses pénalisations massives, et a également conduit à l’émergence de l’attribut nofollow pour les liens ou de l’outil de désaveu des liens, qui étaient utiles pour éviter que le PageRank ne soit influencé négativement par certains backlinks suspects ou hors de contrôle.
Malgré cela, de nombreuses agences et sites de référencement ont continué à travailler en se concentrant uniquement sur la manipulation du PageRank, au détriment de la qualité du contenu et de la « finalité bénéfique » des pages pour les utilisateurs réels, ce qui a contraint Google à une répression finale et définitive.
Vous ne pouvez pas mesurer le poids d’une page (idée fausse N°3)
La prochaine idée fausse fréquente concerne la possibilité d’évaluer le poids d’une page : selon cette idée fausse, depuis que le PageRank n’est plus public, il n’y aurait aucun autre moyen de savoir quelle valeur Google accorde à une page.
En réalité, même si aucune entreprise ni aucune équipe de développeurs ne peut prétendre connaître exactement le PageRank d’une page, il existe des outils alternatifs utiles (à utiliser toujours avec sagesse et professionnalisme), parmi lesquels le CF de Majestic.
L’objectif de cette métrique doit être clair : une indication claire et immédiate pour quiconque souhaite connaître le jugement du moteur de recherche sur une page, en fonction des estimations de trafic, des possibilités de développement, de la confiance dans le domaine, de la stabilité de la position, etc.
Lectures supplémentaires
PageRank a perdu du poids
Venons-en au dernier point : par rapport au passé, le PageRank a perdu du poids et de l’importance pour Google, qui privilégie d’autres facteurs pour effectuer ses classements.
Il s’agit en fait d’une évaluation complexe, car il est impossible d’établir avec certitude quels critères ont un impact prioritaire pour l’algorithme : par exemple, dans les occasions publiques, des Googlers comme Martin Splitt parlent ouvertement de la qualité du contenu ou de la performance, tandis que la référence aux backlinks est presque toujours négligée, plus ou moins délibérément.
Cependant, les liens ont toujours une valeur concrète et solide, et les expériences de référencement le confirment : pour cette raison, le link building reste une option valable pour tenter de dynamiser des pages de valeur de manière naturelle et non manipulatrice, si évidemment il est réalisé correctement et sans erreurs qui pourraient alarmer Google.