Catégories Visibilité et marketing

Google BERT pour lutter contre les fakes news


Google BERT lutte contre les fake news

À l’instar de Facebook, Google souhaite s’engager davantage dans la lutte contre la diffusion de fausses informations sur internet, plus connues sous l’appellation fake news. Récemment, Google a publié deux articles mettant en lumière sa vision concernant la qualité des informations et des données fournies aux internautes à partir de leurs recherches (Google Search et Google News).

Google renforce sa lutte contre les fake news

Sur les blogs anglophones de Google, Danny Sullivan et Pandu Nayak ont publié des articles qui ont pour principal objectif d’expliquer les investissements réalisés par la firme pour optimiser la qualité des informations diffusées sur internet via le moteur de recherche classique et Google News.

Dans un premier temps, Danny Sullivan et le vice-président de Google ont affirmé que le moteur de recherche a toujours conçu ses systèmes de classement pour identifier et privilégier les informations ainsi que les données fiables et utiles aux internautes.

Ils ont ensuite déclaré que Google a développé des fonctions de recherche qui ont pour but de donner du sens aux informations et aux données visibles par les utilisateurs sur internet, mais aussi de permettre à ces derniers d’accéder aisément aux contenus proposés par des entités gouvernementales et des organismes de santé.

Pour finir, ils ont affirmé que le moteur de recherche a mis en place des politiques qui permettent de garantir la fiabilité et la qualité des contenus mis à la disposition des internautes sur les pages de résultats (Google Search et Google News).

Google BERT : une technologie utilisée dans le cadre de la lutte contre les fake news

Si les articles publiés sur les blogs anglophones de Google semblent être de simples réitérations des engagements du moteur de recherche dans l’amélioration de la qualité et de la fiabilité de ses résultats, il faut savoir que Danny Sullivan et Pandu Nayak ont néanmoins délivré des informations intéressantes, notamment sur l’algorithme BERT.

D’après le Public Search Liaison et le vice-président de Google, BERT devrait être davantage impliqué dans la lutte contre les fake news. En d’autres termes, le moteur de recherche souhaite s’appuyer sur la capacité de l’algorithme à traiter le langage naturel pour identifier les données fiables et bannir les contenus délivrant de fausses informations.

Outre Google BERT, les articles de Danny Sullivan et de Pandu Nayak ont évoqué les 10 000 Quality Raters qui évaluent continuellement la qualité des résultats fournis par le moteur de recherche sur ses pages de résultats, ainsi que la notion d’EAT.

Les Google Search Quality Raters ont pour rôle de tester les pages de résultats du moteur de recherche et de noter les données et les informations fournies par celles-ci. Pour évaluer un site ou une page web, ils doivent suivre une procédure spécifique et attribuer des scores à différents aspects : pertinence du contenu, absence ou présence de maliciels, etc.

La notion d’EAT (Expertise, Authoritativeness and Trustworthiness) est présente dans les guidelines rédigées par Google et adressées aux Quality Raters. Elle comprend un certain nombre de critères d’évaluation que les testeurs doivent prioriser pour déterminer la qualité des données et des informations délivrées par les sites web, surtout ceux dits « YMYL » (Your Money, Your Life).

Selon les articles publiés par Danny Sullivan et Pandu Nayak, elle joue un rôle prépondérant dans la lutte contre les fake news, notamment dans les domaines sensibles tels que la santé, l’assurance ou la finance, et dans les situations de crise.

Google : d’autres mesures pour lutter contre les fake news

Hormis Google BERT, les Quality Raters et Google EAT, la firme de Mountain View a mis en œuvre d’autres mesures pour lutter contre les fake news.

En juin 2020, bien avant la publication des articles de Danny Sullivan et de Pandu Nayak, Google a fait le ménage dans son Play Store pour réduire les risques de propagations de données erronées et de fausses informations concernant la pandémie liée au coronavirus. L’entreprise de Larry Page a supprimé les applications créées par des développeurs non reconnus par des organismes comme l’Organisation mondiale de la santé, et qui diffusent des contenus relatifs à la Covid-19.

Si cette décision de Google a permis de bloquer certaines applications partageant de fausses informations et de fausses données sur le coronavirus, elle a entraîné des débats houleux entre l’entreprise et la communauté des développeurs. Dans l’optique d’apaiser, dans une certaine mesure, les tensions, Hiroshi Lockheimer a publié un tweet dans lequel il a déclaré que l’entreprise effectuait juste des réglages pour lutter contre la désinformation.

À titre d’information, Google a pris la décision de supprimer les applications proposant des données sur la Covid-19 suite à la mesure prise par Twitter concernant les tweets comportant des informations fausses ou contestées.

Pour lutter contre les fake news, le réseau social de microblogage a décidé d’apposer des labels et d’avertir les auteurs de tweets diffusant des données erronées ou trompeuses.

Google BERT en bref

Google BERT (Bidirectional Encoder Representations) a été développé pour améliorer significativement la compréhension d’un contenu par l’algorithme du moteur de recherche.

Déployée en 2019, entre le mois d’octobre et celui de décembre, cette nouvelle technologie tire profit de l’intelligence artificielle et du machine learning pour fournir des résultats plus pertinents aux internautes. En se basant sur les mots et la sémantique d’un contenu, elle peut déterminer avec une certaine précision si celui-ci correspond à l’intention de recherche d’un internaute ou non.

Si, avant le déploiement de BERT, l’algorithme de Google pouvait différencier des mots simples tels qu’avocat (profession) et avocat (fruit), il est aujourd’hui capable de définir l’intention de recherche d’un utilisateur tapant des requêtes complexes.

À noter que Google BERT peut fournir des résultats pertinents sur les nouvelles requêtes des utilisateurs, délivrer directement des réponses sur les SERP et comprendre plus efficacement les requêtes longues (plus de quatre mots), grâce au NLP (Natural Language Processing).

Aujourd’hui, le moteur de recherche s’appuie en partie sur cette technologie pour filtrer les données diffusées sur internet et proposer aux internautes des pages de résultats exemptes de fake news, aussi bien sur Google Search que sur Google News.