Le spam de moteur n'est pas si compliqué


Merci à ApocalX et à google-filter pour nous autoriser à reproduire cet article.

Le but de ce petit cours n'est pas de vous inciter à spammer Google, mais de démontrer a quel point le procédé est simple et pernicieux. Il s'agit ici de sensibiliser le plus grand nombre d'internautes à ce fléau grandissant.

ApocalX ( google-filter) explique comment spammer un moteur de recherche en 2 leçons

Attention, cet article sera un peu technique.

Leçon 1: La motorisation

Allons droit au but, l'essentiel dans les sites spammeurs que nous critiquons est la façon dont les pages sont automatiquement générées, pouvant ainsi innonder les moteurs de recherche sans se fatiguer. Rien de plus simple: si vous faites appel a certains fournisseurs de liens sponsorisés, ils vous donneront eux-même le script nécessaire pour générer des pages dynamiquement, à partir d'un mot ou groupe de mots.

Voici un petit exemple très simplifié d'une page php (avec du html de base) qui génère dynamiquement des pages de réponses.
http://www.google-filter.com/exemple/exemple.php?mot=spammeur
N'étant pas nous-même spammeurs nous n'avons pas utilisé de liens sponsorisé, mais l'Api Google.
Une variable 'mot' est passée par l'url de la page. Il s'agit du mot sur lequel la page sera créée et optimisée automatiquement. Il suffit donc de changer le mot pour créer un nombre infini de page.

Comme vous l'aurez peut-etre remarqué, il y a un air de famille avec les pages de résultats des moteurs de recherche. En effet, c'est le même principe, à la différence près que les moteurs de recherche dignes de ce nom n'autorisent pas l'indexation de leurs pages de résultats, en utilisant le fichier robots.txt ( Comment ca marche un robots.txt ). Il serait facile pour n'importe quel moteur de recherche de spammer ainsi ses concurrents, voir même de s'autospammer, ce qui devriendrait encore plus absurde.

Leçon 2: Les liens

Nous avons maintenant des pages qui peuvent se générer automatiquement pour peu que l'on change un mot dans l'url.
Quelques exemples:
http://www.google-filter.com/exemple/exemple.php?mot=spammeur
http://www.google-filter.com/exemple/exemple.php?mot=google
http://www.google-filter.com/exemple/exemple.php?mot=blacklist
etc...

Mais pour que ces pages soient indexées par les moteurs de recherche, il faut les lier entre elles afin de former un véritable site. C'est la condition sine qua non pour qu'un moteur de recherche puisse parcourir les pages et les indexer.
Certains spammeurs utilisent des bases de données de mot-clés gigantesques pour ça. Nous n'irons pas jusque la car le procédé est plus complexe à mettre en place. Nous nous limiterons donc à faire juste une page d'accueil type, avec un grand nombre de liens vers des pages pour lesquels nous avons choisi des mots-clés très généralistes

Voila ce que donne le site ainsi terminé:
http://www.google-filter.com/exemple/

Conclusion

Nous avons bien entendu mis un fichier robots.txt sur notre site pour que ces pages ne viennent pas s'ajouter à la pollution des moteurs de recherche.

Comme vous avez pu le voir, spammer un moteur de recherche est assez facile. Vous comprendrez donc qu'avec l'appât du gain, la perspective de l'argent généré grâce aux liens sponsorisés incite beaucoup de personnes et de sociétés qui ont franchi le pas en devenant eux-même des spammeurs. Certains arrivent à gagner leur vie avec, mais plus le nombre de spammeurs augmente, plus cela devient une source de revenue incertaine. De plus, les sites spammeurs sont de plus en plus facilement identifiés et décriés, notamment grâce à des site comme Google-Filter. Attacher le nom d'une personne ou d'une société à ce genre de sites ne peut que ternir la réputation de ceux qui s'en occupent. Refléchissez y bien avant de vouloir ouvrir un tel site, et surtout rappelez-vous d'une chose: Personne n'est réellement anonyme sur Internet.

MENU

Note : ce site est totalement indépendant de Google