mai, 8, 2008
Sylvain
Avant de continuer plus en avant dans la description (et mes pensées profondes) des techniques de lutte contre le spam sur le web, Il est peut-être bon de rappeler ce que les chercheurs dans le domaine considèrent comme la définition du spam de site web. La seule présentation claire et simple que je connaisse d’une taxonomie du spam sur le web est celle de Gyöngyi et Garcia-Molina (voir l’article [1]). C’est du contenu de cet article que nous allons principalement parler aujourd’hui. Il ne faut jamais oublier l’objectif du référenceur : référencer, c’est à dire faire apparaître dans le top […]
Read More
Level 2, SEO |
mai, 3, 2008
Sylvain
Dans le folklore SEO, il y a de nombreux serpents de mer de la catégorisation de pages web en page spammy ou légitimes. On peut mentionner le Trustrank (théorisé par Gyongyi, Garcia-Molina et Pedersen [2] en 2004, personne ne sait si il est implanté dans un moteur), l’analyse des liens et l’utilisation de classifiers (par Becchetti, Castillo, Donato, Baeza-yates et Leonardi [1]) et aussi, et c’est le sujet de ce billet, le classifier basé sur des critères in text de Ntoulas, Najork, Manasse et Fetterly [3]. Et c’est amusant, chacun des articles dont je viens de parler est relié à […]
Read More
Level 2, SEO |