Augmenter son PageRank
Voici une question que se pose souvent les webmasters…
Je vais présenter dans cet article des éléments de réponse (tirés de mes slides du SEO CAMPUS 2009 et plus qu’inspirés d’un article issu des travaux d’une équipe de Stanford).
Une première question : pourquoi augmenter le PageRank d’un page
La question mérite d’être posée, non ? la réponse est relativement simple : pour faire son classement lors qu’on lui demande une recherche pour une requête particulière, un moteur de recherche va effectuer deux tâches. La première consiste à trouver toutes les pages qui sont pertinentes par rapport à la requête (voir mon billet sur le cosinus de Salton par exemple) tandis que la deuxième consiste en un classement global de toutes les pages relativement à leur PageRank.
Une fois ceci effectué, lorsqu’un utilisateur fait une recherche, le moteur va croiser l’ensembles de pages pertinentes pour la recherche avec le classement global et va donc obtenir un classement partiel, qui sera celui renvoyé à l’utilisateur (dans la réalité d’autres facteurs rentrent en compte mais l’idée est bien celle-la).
Ainsi, un bon PageRank permet de bien sortir sur le moteur lorsqu’on est pertinent pour la requête demandée.
Comment augmenter son PageRank ?
La plupart des webmasters l’ont compris : il faut obtenir de nombreux liens vers sa page web. La meilleure solution est donc de fabriquer son propre ensemble de pages, qui pointeront ensemble vers une page cible, celle qui recevra le PageRank de tout le monde. Il s’agit donc de faire quelque chose du genre suivant :
Même si ce type de structuration d’un ensemble de pages fonctionne, on peut faire beaucoup mieux, ce qui a été théorisé dans l’article suivant :
Zoltan Gyongyi, Hector Garcia-Molina. Link Spam Alliances. 31st International Conference on Very Large Data Bases (VLDB), 2005.
Cet article donne la structure optimale pour maximiser le PageRank d’une page cible.
Le dessin suivant présente le résultat de l’article :
A gauche on a la structure classique tandis qu’à droite on a une structure optimale. Elle a été obtenu juste en mettant des liens (dit retour) depuis la page cible vers les pages de la ferme (boosting pages). Avec cette structure, on obtient un PageRank quasiment 4 fois plus fort qu’avec la structure classique.
Vous pouvez remarquer également que cette structure est celle d’un annuaire avec liens réciproques (l’annuaire est la page rouge).
On peut créer un autre structure optimale de la façon suivante :
Mais elle a ses avantages et inconvénients. L’avantage est qu’elle est facile à construire (moins de liens) mais qu’elle est plus dure à indexer : il faut indexer séparément chaque boosting pages alors que dans le cas précédent il suffit d’indexer n’importe quelle page de la structure pour faire entrer les robots partout.
Critères d’optimalité
Au final, il y a trois critères qui permettent d’atteindre l’optimalité :
1. Toutes les pages de la ferme pointent sur la cible (et pasailleurs)
2. Le PR détourné pointe la cible (et pas ailleurs)
3. il y a des liens de la cible vers une ou plusieurs pages de la ferme
L’intuition est simple : il s’agit de maintenir le surfeur aléatoire chez soi (i.e. dans la ferme de liens). On sait que le PageRank est proportionnel à la présence de ce dernier, cela aura donc une conséquence positive sur le PageRank.