Fonctionnement d'un moteur de recherche
Comment marche un moteur de recherche ?
Les moteurs de recherche opèrent une courte liste d’opérations fondamentales qui leur permettent de retourner des résultats de recherche pertinents aux internautes qui les utilisent.
- Crawler le Web
Les moteurs de recherche font tourner des programmes automatiques, appelés bots ou spiders, qui utilisent la structure des liens hypertextes pour « crawler » les pages et les documents qui sont contenus dans le World Wide Web.
- Indexation de documents
Une fois qu’une page a été crawlée, son contenu peut être “indexé”, c’est-à-dire qu’il est stocké dans une base de données géante qu’on nomme "l’index" du moteur de recherche. Cet index est géré de manière très efficace puisque les moteurs retournent en une fraction de seconde des résultats qui proviennent d’une recherche parmi des milliards de documents.
- Traitement des requêtes
Quand une demande d’information est effectuée sur un moteur de recherche (cela est fait des centaines de millions de fois par jour), le moteur va chercher dans son index tous les documents qui sont en rapport avec la requête. La pertinence du document dépend des termes ou phrases de la requête de l’internaute qui sont contenus dans le texte du document, mais aussi de la manière dont l’internaute a composé sa requête dans le champ de recherche du moteur. Par exemple, une requête pourauto magazineretourne 134 millions de résultats (chiffres au 01/04/2006), mais la même requête entre guillemets "auto magazine" retourne simplement 487 000 résultats (chiffres au 01/04/2006). Dans la première requête, qu’on appelle aussi mode "Findall" Google retourne tous les documents qui contiennent les termes « auto » et « magazine » ; la seconde requête retourne les documents qui contiennent exactement les termes dans cet ordre et sans autres termes entre les deux mots. Il existe de nombreux opérateurs qui peuvent changer les résultats de recherche (Google propose11 opérateurs de recherche).
- Résultats de recherche
Une fois que le moteur a déterminé quels résultats sont pertinents pour la requête, c’est au tour de l’algorithme de se mettre en marche. Il s’agit d’une équation mathématique qui permet de trier selon un ordre de pertinence et de popularité. Le calcul effectué par l’algorithme permet d’afficher des résultats triés par ordre décroissant de pertinence, afin que l’internaute dispose des meilleurs résultats en premier.
Bien que les opérateurs de recherche soient faciles à exploiter pour l’utilisateur, il s’agit en fait de systèmes extrêmement complexes qui figurent parmi ceux qui demandent le plus de ressources de processus au monde. Il faut imaginer que les moteurs opèrent des millions de calculs chaque seconde, et répondent à aux demandes d’informations d’un très grand nombre d’utilisateurs.
Retour au sommaire
Note : ce guide est le fruit d'une collaboration entre SEOmoz, AltiRef et 7 Dragons.