les vrais leviers du SEO
Je vous ai déja parlé dans un billet précédent de l’article sur le déclassement du spam que j’ai écrit avec Thomas Largillier (c’est ici). En regardant les articles qui allaient être présentés à la conférence pour trouver ceux qui sont à ne pas rater, je suis tomber sur :
How to Improve Your Google Ranking: Myths and Reality
A.-J. Su, Y. C. Hu, A. Kuzmanovic, and C.-k. Koh
In IEEE/WIC/ACM International Conference on Web Intelligence, Toronto, Canada, August 2010.
Comme en parallèle le milieu SEO français parlait un peu de l’histoire du gars de l’AFNIC qui n’aimait pas les SEO, et qui critiquait notamment le fait qu’on ne pouvait pas savoir quels étaient les vrais leviers avérés du SEO, je me suis dit que j’allais parlé de cet article. Vous pouvez trouver l’article sur la page suivante.
Cet article présente une méthode rigoureuse et scientifique, basée sur l’utilisation de techniques d’apprentissages, pour valider les hypothèses que l’on peut faire sur le fonctionnement d’un moteur de recherche. Les auteurs présentent des résultats réels sur l’algorithme de Google. Par exemple, l’article montre que la méthode peut prédire correctement le rang de 7 pages parmi le top 10 pour 78% des mots clés considérés (bien sur les mots clés choisis sont loin de ceux que les SEO considèrent la plupart du temps, mais les auteurs ont des évidences statistiques que cela fonctionne aussi pour des mots clés très compétitifs). Au final, les auteurs fournissent également une liste des critères dont ils ont une garantie qu’ils sont importants au sein de l’algorithme de classement de Google. Cette liste est ordonnée, et (je me repète) à été obtenue par une méthode valide d’un point de vue statistique.
A l’origine, j’avais prévu d’expliquer en détail le fonctionnement de la méthode, et en particulier de ses fondements mathématiques (utiliser un programme linéaire dont les poids sont calculés via une méthode d’apprentissage standard). Mais je me rends compte que cela ne risque pas d’intéresser mes lecteurs (et renvoient les warriors vers l’article lui même). Je me contente donc de donner la liste des critères valides, dans l’ordre d’importance :
- La PageRank est LE facteur le plus important, on en déduit donc que le linking est plus important que le contenu, et toc !
- Le mot clé apparait dans l’hostname.
- Le mot clé apparait dans le titre du header HTML.
- Le mot clé apparait dans la meta description (discussion dans les commentaires !)
- Le mot clé apparait dans le chemin de l’URL (mais pas dans le hostname). Ce point m’a surpris, je pensais que l’URL hors hostname était plus importante que le titre, ce n’est pas le cas).
Par ailleurs, l’article valide deux hypothèses assez courantes dans le monde du SEO : tout d’abord le fait que les erreurs de code HTML n’ont AUCUNE importance, mais aussi le fait que les blogs ont moins de valeurs que d’autres types de sites (ils sont moins bien classés à contenu et liens égaux).
Voilà, n’hésitez pas à donner votre point de vue dans les commentaires !