5 façons de continuer à améliorer la recherche Google
Développer un moteur de recherche est un défi complexe. Pourtant, cela semble si simple : vous saisissez une requête et nous trouvons les résultats correspondants. Mais nous avons relevé des défis techniques aussi difficiles que nombreux pour faire de Google ce qu'il est aujourd'hui.
En réalité, la problème de la recherche Google n'est jamais résolu. Les anciens défis évoluent et d’autres apparaissent. Car Internet et le monde changent constamment.
Jetons donc un coup d'œil sur certaines des plus grandes avancées technologiques que nous ayons réalisées et sur les domaines dans lesquels nous continuons à repousser les limites de l'innovation, à mesure que nous développons et améliorons la recherche Google.
1. Proposer des résultats de qualité
Il est important que nous classions l’information sur la base de ce qui est pertinent pour votre recherche, mais aussi en fonction de ce qui est utile et fiable. C'est cette approche qui a permis à Google de se démarquer dès le premier jour : notre algorithme PageRank ne se contentait pas de relier une requête à des mots clés sur une page web. Il examinait la façon dont les sites étaient liés les uns aux autres pour déterminer quelles pages étaient importantes ou faisaient autorité.
Nous avons adapté nos techniques au fil des ans, au fur et à mesure de l'évolution du Web et des progrès technologiques. Par exemple, avec la montée de la désinformation, nous avons mis au point de nouvelles manières d’identifier les thèmes les plus susceptibles de générer des contenus peu fiables, comme les théories complotistes ou la désinformation médicale. Dans de telles situations, nous sommes en mesure d'orienter notre classification vers davantage de sites faisant autorité.
Chaque année, nous effectuons des centaines de milliers d’évaluations pour nous assurer que nous tenons nos objectifs exigeants en termes de qualité. Nous effectuons régulièrement d'importantes mises à jour générales de nos systèmes (les « core updates ») ainsi que des mises à jour plus spécialisées, comme notre mise à jour de contenu utile, pour continuer de fournir des résultats pertinents.
Certaines dimensions de la qualité de l’information continuent d'évoluer et nécessitent de nouvelles approches. Par exemple, un des défis que nous rencontrons est le manque d'informations existantes pour certains sujets (les « data voids »), et donc le risque qu'une information de haute qualité ne soit disponible. Nous avons conçu des moyens d'afficher des notifications quand des sujets évoluent rapidement ou lorsque nous n'avons pas un confiance élevée dans la qualité des résultats. Nous avertissons les utilisateurs afin qu'ils examinent ces résultats attention. Nous avons aussi investi dans d’autres outils de maîtrise de l’information qui aident les utilisateurs à vérifier les sources et à connaître le contexte pour évaluer ce qu’ils trouvent.
2. Décrypter le sens
Comprendre l’information – c'est-à-dire comprendre à la fois le sens des requêtes des gens et les documents issus Web – a été une priorité pour Google depuis des années. Au début, nos systèmes reposaient en grande partie sur la simple correspondance de mots. Des choses comme l’orthographe sont alors devenues vraiment importantes. À l’époque, si vous épeliez un mot de manière incorrecte, vous ne trouviez que des pages qui épelaient mal ce mot ! Nous avons donc créé notre premier système de Machine Learning dans la recherche Google pour relever ce défi.
Au fil des années, nos systèmes sont devenus beaucoup plus sophistiqués et se sont mis à mieux comprendre les synonymes et le contexte des mots. Des avancées telles que le Knowledge Graph nous ont aidés à comprendre ce qui relie les personnes, les lieux et les choses dans le monde les uns avec les autres, à comprendre le monde davantage comme le font les gens, afin que nous puissions vous proposer exactement ce que vous cherchez, et même aller plus. Par exemple : si vous tapez le titre d'un nouveau film populaire, vous obtiendrez des informations sur le casting, la durée de sa diffusion, ainsi que sur les cinémas près de chez vous qui le diffusent, sans oublier des liens pour acheter des billets.
Développés par Google Research, les grands modèles de langage comme BERT nous ont permis de faire des progrès majeurs dans le décryptage des requêtes écrites dans un langage naturel et des documents disponibles su le Web. Cela nous permet afin que de proposer des résultats plus pertinents dans toutes les langues incluses dans la recherche Google. Et nous avons créés des outils comme Google Traduction pour faire disaparaître la barrière de la langue, afin que chacun puisse mieux comprendre les informations disponibles à l'échelle mondiale.
Les dernières technologies d'IA générative et des grands modèles de langage peuvent nous aider à réinventer la recherche Google, en ouvrant la voie à de nouvelles questions et en transformant la manière dont nous organisons l'information. Nous menons actuellement une expérimentation en appliquant l'IA générative à la recherche avec Search Labs et nous mettons à jour rapidement cette expérience au fur et à mesure que nous explorons son potentiel.
3. Comprendre les images, les vidéos et plus encore
Il y a tant d’informations dans le monde qui ne sont pas du texte et tant de façons de chercher des choses qui n'ont rien à voir avec le fait de taper une requête dans une barre de recherche.
En 2008, grâce aux derniers développements en matière de traitement du langage naturel ( « Natural Language Processing » ou NLP), nous avons rendu possible le fait de lancer une recherche avec votre voix, ce qui rend la recherche plus naturelle sur mobile.
En 2015, les progrès de la vision par ordinateur ont permis de rechercher ce que vous voyez avec Google Lens. Nous avons transformé l'appareil photo de votre téléphone en un moyen d'explorer et de poser des questions sur le monde qui vous entoure, afin que vous puissiez en apprendre davantage sur cette fleur ou cet insecte que vous avez vu lors d'une promenade près de chez vous. Aujourd'hui, les gens effectuent plus de 12 milliards de recherches visuelles chaque mois avec Google Lens.
L'année dernière, nous avons lancé Multisearch, qui a amélioré ces fonctionnalités pour vous permettre d'ajouter du texte à vos recherches visuelles. Désormais, vous pouvez faire des choses comme prendre une photo d'un canapé que vous aimez, ajouter le mot « chaise », et Google utilisera l'image et le mot pour vous montrer des pièces correspondantes à ajouter à votre salon.
Les percées de l’IA nous ont également permis de comprendre la sémantique des vidéos pour identifier automatiquement les moments clés, vous permettant ainsi de parcourir ces moments comme les chapitres d’un livre. Que vous cherchiez une étape précise dans un tutoriel pour rénover votre maison ou un but particulier dans le résumé vidéo d'une rencontre sportive, vous pouvez trouver ce que vous voulez !
4. Détecter et stopper les spams
Quiconque a déjà consulté son dossier spam peut apprécier tout le travail nécessaire pour garder ces courriers indésirables hors de votre boîte de réception. Dans la recherche Google, nous avons créé des systèmes avancés pour lutter de la même manière contre les spams. Sans nos protections avancées, les résultats de recherche seraient remplis d'informations totalement inutiles, de tentatives d'hameçonnage et de liens vers des logiciels malveillants.
Nous développons constamment de nouvelles techniques et mettons en œuvre des mises à jour de nos systèmes de classification pour nous protéger contre les spams. Mais ceux-ci s’adaptent et évoluent également. Ils exigent l'attention constante de nos équipes.
Ces dernières années, nous avons appliqué de nouvelles techniques fondées sur l'IA pour détecter les spams, ce qui nous a permis de conserver des résultats de recherche exempts de spams à plus de 99 %. Ce domaine reste un investissement important pour nous : tant que les gens viendront sur Google pour rechercher des informations, les spammeurs tenteront de contourner nos protections. Nous devons donc rester vigilants et garder une longueur d'avance.
5. Rendre la recherche plus sûre
Au fil des années, nous avons maintenu un engagement ferme envers nos principes consistant à optimiser l’accès à l’information, tout en aidant les gens à rester en sécurité et à garder le contrôle. Notre objectif est d’aider chacun à trouver des informations qui respectent le cadre de l’expression légale, sans les exposer par inadvertance à des contenus de mauvaise qualité ou dangereux qu’ils n’ont pas demandé à voir.
Nous avons abordé cela en élargissant nos politiques de protection, donnant la possibilité aux utilisateurs de supprimer les informations personnelles sensibles de nos résultats, et en améliorant nos systèmes de classification, dans un souci de sécurité et d'inclusion.
Par exemple, nous avons lancé des améliorations pour réduire le classement du contenu explicite indésirable dans la recherche et les mises à jour pour flouter les images explicites par défaut, ainsi que des améliorations de classement pour limiter la portée des sites qui utilisent des pratiques assimilables à de d'exploitation. Entre-temps, nous avons mis à jour nos règles afin que les personnes de moins de 18 ans puissent voir les images d'elles-mêmes supprimées de la recherche, et avons lancé de nouveaux outils tels que « Results about you » pour faciliter le contrôle de la façon dont vos informations personnelles apparaissent dans les résultats de recherche.
Des milliards de personnes comptent sur Google pour obtenir des informations. Nous pouvons donc toujours faire davantage et il y a toujours nouvelles questions pour lesquelles nous pouvons aider les gens. C'est pourquoi nous nous efforçons chaque jour d'améliorer la recherche Google.