Analyse 2005 de la Sandbox


Cet article est une traduction autorisée par SEOmoz (thanks Rand)

=> Page d'origine en Anglais

Introduction

Le terrible et mal nommé Effet Sandbox a été observé depuis début 2004. Beaucoup continuent d'argumenter sur les causes et effets de cet élément particulier de l'algorithme, mais il n'y a aucun débat viable sur son existence. A un moment, la meilleure explication trouvée se résumait à :

"La pénalité qui engendre une dévaluation du positionnement dans Google concerne les sites lancés après Mars 2004".

Cependant, les observations se sont raffinées avec le temps pour donner :

"Un site qui a de grosses variations de positionnement entre Google et les autres moteurs (Yahoo, MSN et Teoma) est un résultat sur les mêmes requêtes"

Ce système de pénalisation est connu pour être imprévisible et particulièrement difficile à analyser car il se comporte bizarrement.
Cet article va résumer l'expérience vécue de plusieurs webmasters et de leurs sites qui sont tombés sous l'Effet Sandbox. Plusieurs douzaines de sites affectés par le filtre ont été analysés, notamment grâce aux contacts réalisés par l'outil de détection Sandbox sur le site SEOmoz.
Bien que je ne puisse pas révéler les noms ou URLs des sites audités, les effets observés sont significatifs de la plupart des sites optimisés depuis Mars 2004.

Liste des effets Sandbox observés

L'effet Sandbox semble affecter plusieurs aspects du positionnement dans les résultats de recherche de Google. Cette liste comporte les observations les plus répandues et les facteurs les plus évidents.

La Sandbox est connue pour affecter ...

Il a été observé à propos de la Sandbox, qu'elle relâche les sites en masse car il n'y a quasiment aucun exemple de site qui soit sorti indépendamment. Ainsi, il apparaît que certaines mises à jour de Google relâchent plusieurs sites en même temps. Des spéculations impliquent que Google montrerait par ce biais que l'évaluation manuelle n'est pas de mise.

Explications technologiques sur la Sandbox

Plusieurs théories ont émergées au fil du temps pour expliquer comment Google choisit les sites qui vont tomber dans la Sandbox et pourquoi cet effet n'est pas universel. Les explications suivantes sont les plus populaires et/ou les plus logiques.

Filtre de sur optimisation

Beaucoup suspectent que Google a initialement identifié les sites à sandboxer en analysant les parties d'un site habituellement optimisées comme la structure des backlinks, la densité trop importante de mots clefs et la fréquence d'arrivée des liens entrants. Il y a de fortes chances que Google sache différencier une structure naturelle de liens et un site de spam.

Optimisation sur des mots clefs commerciaux

Malgré le peu d'évidence sur le sujet, certains pensent qu'en ciblant des mots clefs commerciaux, votre site peut être plus enclin à tomber dans le filtre de la Sandbox. Cependant, il existe de très nombreux exemples de sites non commerciaux qui se sont trouvés sandboxés. Notre opinion personnelle est que la Sandbox ne discrimine pas selon les requêtes.

Analyse de texte naturel

Plusieurs brevets et livres blancs ont été écrits par les principaux moteurs de recherche pour analyser et différencier le texte écrit par des humains et celui généré à l'aide de logiciels ou scripts. Le texte généré automatiquement étant plus enclin à figurer sur des sites spammeurs. Donc, Google conduirait une analyse profonde pour essayer de dénicher le contenu généré automatiquement. Heureusement, les référenceurs qui écrivent leur propre contenu n'auront aucun problème à contourner ce problème car il y peu de chances qu'un texte écrit à la main mal analysé. Cependant, il a été souvent observé que des sites entièrement rédigés par des humains et jamais dupliqués (généralement de bonne qualité de surcroît) ont été sandboxés. Notre opinion personnelle est que l'analyse de texte n'entre pas en compte dans les effets Sandbox, même si le texte de mauvaise qualité peut pré disposer un site à engendrer des pénalités et aussi rendre plus difficile une sortie de Sandbox.

Audit manuel

Merci à Henk Van Ess' Search Bistro, l'auteur de Eval.Google, qui suggère que Google révise manuellement les nouveaux sites qui reçoivent un très important nombre de liens entrants, reçoivent un trafic important ou déclenchent des paramètres spécifiques. Ce nombre de sites audités manuellement serait en hausse drastique. Cette théorie n'est peut-être pas fausse, car Craig Manning, un représentant de Google au SES de New York a précisé que Google auditait les sites manuellement comme par exemple ChristopherReeve.org ou Tsunami.Blogspot.com pour voir si un grand nombre de liens ou le bon positionnement était valide. Craig ajouta que c'était une manière de garder les sites de mauvaise qualité d'arriver à un bon positionnement grâce à des techniques apparentées au Google Bombing.

Au sein de l'industrie du référencement, nombreux sont ceux qui rejettent l'idée de l'audit manuel car cela serait trop cher et pas assez efficace pour Google. Google se glorifie de privilégier une technologie juste et automatique, ce qui irait à l'encontre d'un jugement subjectif d'un humain.

L'audit manuel est certainement une explication qui rentre parfaitement dans la logique car cela expliquerait les inconsistances et les applications de la Sandbox, ainsi que le temps de pénalité variable, mais aussi le nombre important de sites qui présentent des traces d'optimisation pour le référencement.

Principaux mythes et contre-exemples

Pour chaque règle sur la Sandbox, il existe un contre-exemple, alors que très peu de règles irréfutables existent. Il est important de préciser certains facteurs d'exceptions qui sortent du domaine de compréhension du phénomène.

Solutions possibles et suggestions

De nombreuses suggestions ont émergé concernant la prévention des effets de la Sandbox, mais peu se sont trouvées efficaces. L'utilisation de sous-domaines ou nom de domaine existant a rencontré un succès mitigé, alors que d'autres comme "ne pas faire ce type de liens" sont une pure perte. Les meilleurs conseils que nous avons entrevus sont :

Prédictions et conclusions

L'existence de la Sandbox de Google et son impact sur les résultats de recherche sont difficiles à percevoir pour le néophyte. Il y a ceux qui argumentent que Google est devenu moins spammé, alors que d'autres assurent du contraire. Dans le même ordre d'idée, il est question de la pertinence de Google dans les débats. Ce qui a émergé de cette étude de 18 mois est qu'il est certain que la Sandbox a réduit le niveau de spam et de manipulation des liens visant à augmenter la popularité d'un site afin d'améliorer le positionnement dans les résultats de Google.

Ainsi, la meilleure façon d'éviter la pénalité est de ne pas utiliser de techniques de spam. Malheureusement, depuis que Google souhaite moins de spam, les sites légitimes qui sont éjectés des meilleures positions sont en augmentation. Il est important, afin d'éviter tout analyse redondante et d'être conscient des qualités du filtre, de s'identifier facilement. Bien que ceux qui préfèrent attendre soient nombreux, nous n'approuvons pas cette approche car "attendre" n'est jamais un bon conseil en matière de promotion de site Web.

Le futur semble projeter d'autres phénomènes similaires à la Sandbox par Google. Malgré la frustration des webmasters, notre opinion est que les ingénieurs de Google sont contents du succès de leur filtre et qu'ils ne prévoient pas de l'enlever de sitôt. Pour le long terme, nous prédisons que les filtres anti-spam et analyses sophistiquées de liens vont émerger pour remplacer la Sandbox. Le brouillon actuel du filtre suggère que les sites légitimes qui sont sandboxés vont être de moins en moins nombreux grâce à une constante évolution des filtres des moteurs de recherche.

Ressources et outils additionnels (en Anglais)

Autres articles sur la Sandbox (en Français)

MENU

Note : ce site est totalement indépendant de Google