17 janvier 2007

Résumé sur le Page Rank Google

Il y a quelques jours les variations de notation du PageRank de Google m'ont poussé à investiguer plus encore sur le sujet. Ma connaissance du sujet pouvait alors se résumer à ceci :

Le PageRank est une invention de Google. C'est un système de notation de popularité d'une page web, sur une échelle de 0 à 10. Il est possible pour tout internaute d'afficher cette note en téléchargeant et installant la barre d'outil Google sur son navigateur. Certains sites tous nouveaux peuvent très bien ne pas avoir de PR. Personne ne sait exactement comment est calculé ce score. La note donnée sur la toolbar est représentative du PR "ancien" du site car elle est mise à jour environ 3 fois par an après chaque Google Dance. Lors de ces Google Dance les notes peuvent varier sans aucune logique, et ce n'est que quelques temps après cette opération que les PR affichés sont stables...

Au vu de mes dernières lectures, il apparaît que quelques notions énoncées ci-dessus sont obsolètes ou incomplètes.

Ainsi, exit les Google Dance, welcome les PR export. Le PR est mis à jour en continu, c'est donc bien seulement après les exports que la valeur est mise à jour sur la toolbar. Confirmation donc : l'indice de la petite barre verte n'est qu'un relevé à un instant T qui date du dernier export. C'est donc relativement biaisé et il faudrait constamment garder ce fait à l'esprit en visitant les pages.

Autre confirmation : un PR élevé ne garanti en rien que la page est bien positionnée ou première sur les requêtes liées à sa thématique. Ainsi, à titre exemple, la page du trio punk-rock nantais El Royce dédiée à la promotion de son groupe de musique sur internet et à fortiori sur My Space ne totalise qu'un PR de 3, depuis déjà de nombreux mois (incluant donc plusieurs exports). Il en va de même pour d'autres pages à fort traffic comme celle sur la personnalisation de sa page profil My Space ou encore comment accroître sa popularité et étendre son réseau My Space ?.

Ces pages arrivent pourtant très bien classées avec des requêtes comme "personnaliser myspace" ou "customiser myspace", et enregistrent de nombreuses visites quotidiennes directes via Google (source : Google Analytics). En fait, elles surclassent même complètement le nombre de visiteurs qui viennent sur le site après avoir tapé "groupe de rock" ou "trio punk rock nantais", pourtant leur PR n'évolue pas. CQFD.

Le PR est donc une indication qui reste bien mystérieuse, regroupe tellement de paramêtres et fait appel à un panel de connaissances diverses : connaissances réseaux pour les histoires de datacenters Google, connaissances statistiques et mathématiques pour appréhender un tant soi peu les algorithmes généraux sur le sujet, connaissances sémantiques, connaissances techniques sur le webmastering et les langages de programmation pour faire la différence entre les liens durs, mous, les redirections http; connaissances en référencement enfin pour les stratégies à déployer et les techniques d'optimisation de pages web pour les agents intelligents (seo).

Voilà peut-être pourquoi il y a tant de bruit autour du référencement et (entre autres choses) du PageRank.

Et l'invention est géniale, car elle reste auréolée de mystère tout en ayant imprégnée les habitudes de bien des internautes, par comodité et paresse principalement : plutôt que de faire quelques tests sur les moteurs de recherche afin de savoir si telle page est populaire et mérite un echange de liens (par exemple), la simple vérification de la note du PR via la barre d'outil me donne une indication (obsolète il faut s'en rappeler).

Du coup, il faut l'asséner encore et encore : Non Google n'est pas Dieu ! et non, le PR n'est pas son (meilleur) apôtre ;-)

Quelques sources (en anglais) :

http://www.mattcutts.com/blog/more-info-on-pagerank/

http://www.mattcutts.com/blog/infrastructure-status-january-2007/

PS : Et je confirme le billet ci-dessous, les indices des PR sont bien revenus aux chiffres indiqués initialement.