À propos du système de recommandation de YouTube
Lorsque les recommandations de YouTube fonctionnent bien, elles relient des milliards de personnes dans le monde à des contenus qui les inspirent, leur enseignent des choses et les divertissent. Pour ma part, elles me permettent de me plonger dans des conférences sur l’éthique des technologies actuelles et de regarder les faits saillants des matchs de football de l’Université de Californie du Sud que je me souviens d’avoir vus quand j’étais enfant. Pour ma fille aînée, c’était les éclats de rire et le sentiment de communauté avec les Vlogbrothers. Les recommandations ont également amené mon fils aîné à mieux comprendre l’algèbre linéaire grâce aux explications animées de 3Blue1Brown – entrecoupées de pauses pour regarder des vidéos de KSI.
Comme l’illustre ma famille, il y a un auditoire pour presque chaque vidéo et notre système de recommandation a pour tâche de le trouver. Imaginez-vous à quel point il serait difficile de s’y retrouver parmi tous les livres d’une immense bibliothèque sans l’aide des bibliothécaires. Les recommandations favorisent plus de la moitié des visionnements sur YouTube, même plus que les abonnements à des chaînes ou la recherche. J’ai consacré plus d’une dizaine d’années à bâtir le système de recommandation de YouTube et je suis fier de constater qu’il est devenu une partie intégrale de l’expérience YouTube de tout un chacun. Toutefois, les recommandations sont trop souvent perçues comme une mystérieuse boîte noire. Nous tenons à ce que le public comprenne ces systèmes. Permettez-moi donc de vous en expliquer le fonctionnement, leur façon d’évoluer et les raisons pour lesquelles notre principale priorité consiste à offrir des recommandations responsables.
En quoi consiste le système de recommandation?
Notre système de recommandation part du simple principe de vouloir aider les gens à trouver des vidéos qui les intéressent et qui ont de la valeur pour eux. Vous pouvez voir les recommandations à l’œuvre principalement à deux endroits : sur votre page d’accueil et dans le volet « prochaine vidéo ». La page d’accueil, c’est ce que vous voyez en ouvrant YouTube. Elle affiche un amalgame de recommandations personnalisées, d’abonnements ainsi que l’information et les nouvelles les plus récentes. Le volet « prochaine vidéo » apparaît lorsque vous regardez une vidéo. Il vous suggère du contenu additionnel en fonction de ce que vous êtes en train de visionner ainsi que d’autres vidéos qui pourraient vous intéresser.
En 2008, lorsque nous avons commencé à établir notre système de recommandation, l’expérience était complètement différente. Supposons que vous regardez surtout des vidéos de cuisine. Ne serait-il pas frustrant que votre page d’accueil ne vous recommande que les dernières vidéos de sport et de musique parce qu’ils génèrent le plus de visionnements? C’est ainsi que fonctionnait YouTube à ses débuts. Le système classait les vidéos selon leur popularité pour créer une grande page de « tendances ». Peu de gens regardaient ces vidéos et la plupart des visionnements YouTube provenaient de recherches ou de liens partagés en dehors de la plateforme.
Aujourd’hui, notre système fait le tri entre des milliards de vidéos pour vous recommander du contenu adapté à vos champs d’intérêt précis. Par exemple, notre système a reconnu que je regardais un fait saillant classique d’une partie de football de l’USC et il m’a trouvé d’autres grands moments sportifs de ma jeunesse. Sans les recommandations, je n’aurais jamais su que ces vidéos étaient accessibles. Contrairement aux autres plateformes, nous ne relions pas les spectateurs à du contenu en passant par leur réseau social. Le succès des recommandations de YouTube repose plutôt sur la précision avec laquelle elles prévoient les vidéos que vous souhaitez regarder.
Pour y arriver, nous partons du principe que chaque personne a des habitudes de visionnement uniques. Ensuite, notre système compare vos habitudes de visionnement avec celles qui sont semblables. Il emploie alors cette information pour suggérer d’autres contenus que vous pourriez avoir envie de regarder. Donc, si vous aimez les vidéos de tennis et que notre système remarque que ceux qui aiment les mêmes vidéos apprécient également les vidéos de jazz, il pourrait vous en recommander même si vous n’en avez jamais regardé (pour des catégories comme les nouvelles et l’information, cela peut fonctionner différemment, mais nous en parlerons plus tard). Il y a quelques années, notre système a recommandé des vidéos de Tyler Oakley à ma fille aînée parce que de nombreux amateurs des Vlogbrothers regardaient également ses vidéos à l’époque. Elle est devenue une de ses grandes admiratrices, à tel point qu’un peu plus tard, nous l’avons amenée à l’une de ses rencontres.
Bien sûr, nous sommes aussi conscients que ce n’est pas tout le monde qui souhaite toujours partager ces renseignements avec nous. C’est pourquoi nous avons établi des commandes qui vous permettent de décider quelles données vous voulez fournir. Vous pouvez mettre sur pause, modifier ou supprimer votre historique de recherche et de visionnement quand vous le voulez.
Personnalisation des recommandations
Pour offrir une sélection de contenus aussi personnalisée, notre système de recommandation ne fonctionne pas à partir d’un « mode d’emploi ». Il évolue constamment et apprend chaque jour à partir de plus de 80 milliards d’éléments d’information que nous appelons des signaux. Assurer un maximum de transparence est donc plus complexe qu’il n’y paraît, car il ne suffit pas de fournir une simple liste de formules. Pour y arriver, il faut comprendre toutes les données qui alimentent notre système. Plusieurs signaux s’additionnent les uns aux autres pour informer notre système de ce que vous trouvez satisfaisant : clics, durée de visionnement, réponses aux sondages, partages, ce que vous aimez ou n’aimez pas.
- Clics : Si vous cliquez sur une vidéo, il y a de fortes chances que vous la trouverez également satisfaisante. Après tout, vous ne cliqueriez pas sur quelque chose que vous n’avez pas envie de regarder.
Cependant, comme nous l’avons appris en 2011, ce n’est pas parce que vous cliquez sur une vidéo que vous la regardez nécessairement. Supposons que vous recherchiez les faits saillants d’un match à Wimbledon une certaine année. Vous faites défiler la page et cliquez sur l’une des vidéos dont l’image miniature et le titre suggèrent qu’elle montre une séquence du match, mais il s’agit plutôt d’une personne dans sa chambre qui parle du match. Vous cliquez ensuite sur une vidéo que notre système recommande dans le volet « prochaine vidéo », mais vous tombez encore une fois sur un amateur de tennis qui parle du match. Vous continuez ainsi à cliquer sur ces vidéos jusqu’à ce que le système vous en recommande enfin une qui contient une séquence du match que vous voulez voir. C’est pourquoi en 2012 nous avons ajouté la durée de visionnement à l’équation. - Durée de visionnement : Votre durée de visionnement (les vidéos que vous regardez et pendant combien de temps) fournit à nos systèmes des signaux personnalisés à propos de ce que vous serez le plus susceptible de vouloir regarder. Donc si notre amateur de tennis a regardé 20 minutes de faits saillants de Wimbledon et seulement quelques secondes d’analyses de matchs, nous pouvons présumer avec assez de certitude qu’il préfère regarder ces faits saillants.
Lorsque nous avons commencé à intégrer la durée de visionnement dans les recommandations, nous avons constaté une diminution immédiate de 20 % dans les visionnements. Mais nous avons jugé qu’il était plus important pour nous d’offrir plus de valeur aux utilisateurs. De plus, la durée de visionnement n’a pas toujours la même valeur. Parfois, je veille tard en regardant des vidéos au hasard, alors que j’aurais pu apprendre une nouvelle langue sur YouTube ou perfectionner mes talents en cuisine avec un créateur. Nous ne voulons pas que les utilisateurs regrettent le temps passé à regarder des vidéos et nous avons constaté que nous devions en faire encore plus pour évaluer la valeur que vous tirez du temps passé sur YouTube.
- Réponses aux sondages : Pour nous assurer que les utilisateurs sont satisfaits du contenu qu’ils regardent, nous évaluons ce que nous appelons la « durée de visionnement utile ». Il s’agit du temps que vous avez passé à regarder une vidéo que vous jugez utile. Nous évaluons la durée de visionnement utile à l’aide de sondages auprès de l’utilisateur, qui doit coter la vidéo regardée en lui donnant d’une à cinq étoiles. Ainsi, nous obtenons une mesure pour déterminer à quel point vous êtes satisfait du contenu. Si vous donnez une ou deux étoiles à une vidéo, nous vous demandons pourquoi vous avez accordé une cote si faible. Et si vous lui donnez quatre ou cinq étoiles, nous vous demandons pourquoi elle était si inspirante ou significative. Seules les vidéos auxquelles vous avez accordé une cote élevée de quatre ou cinq étoiles sont comptabilisées dans la durée de visionnement utile.
Évidemment, ce n’est pas tout le monde qui répond à un sondage pour chaque vidéo regardée. Selon les réponses que nous obtenons, nous avons formé un modèle d’apprentissage machine pour anticiper les réponses potentielles au sondage pour chaque personne. Pour tester la précision de ces prédictions, nous omettons intentionnellement certaines des réponses au sondage de l’entraînement de l’algorithme. Nous surveillons ainsi la précision de notre système par rapport aux réponses réelles. - Partages, ce que vous aimez ou n’aimez pas : En général, les gens sont plus susceptibles d’être satisfaits des vidéos qu’ils partagent ou qu’ils aiment. Notre système se sert de cette information pour essayer de déterminer la probabilité que vous partagiez ou que vous aimiez d’autres vidéos. Si vous indiquez ne pas avoir aimé une vidéo, c’est un signal que vous n’avez sans doute pas eu de plaisir à la regarder.
Mais comme pour vos recommandations, l’importance de chaque signal dépend de vous. Si vous êtes le genre de personne qui partage toutes les vidéos regardées, y compris celles auxquelles vous n’accordez qu’une ou deux étoiles, notre système apprendra à ne pas se fier trop étroitement à vos partages pour recommander du contenu. Tout cela nous aide à comprendre pourquoi notre système ne suit pas une formule établie. Il se développe plutôt de façon dynamique au fil de l’évolution de vos habitudes de visionnement.
L’importance des recommandations responsables
Les clics, les visionnements, la durée de visionnement, les sondages auprès des utilisateurs, les partages, ce que vous aimez ou n’aimez pas fonctionnent très bien pour orienter les recommandations portant sur des sujets comme la musique et le divertissement, qui attirent la plupart des utilisateurs de YouTube. Cependant, au fil des ans, un nombre croissant d’utilisateurs se sont tournés vers YouTube pour y trouver des nouvelles ou de l’information. La qualité de l’information et la mise en contexte sont alors essentielles, qu’il s’agisse de la nouvelle de l’heure ou de recherches scientifiques complexes. Quelqu’un peut se dire très satisfait de vidéos dans lesquelles on prétend que la Terre est plate, mais cela ne nous amènera pas nécessairement à recommander ce type de contenu de piètre qualité.
C’est pourquoi les recommandations jouent un rôle si important dans notre façon d’entretenir une plateforme responsable. Elles mettent les utilisateurs en contact avec de l’information de grande qualité et réduisent la probabilité qu’ils tombent sur du contenu problématique. De plus, elles complètent le travail effectué par notre robuste Règlement de la communauté, qui définit ce qui est permis ou non sur YouTube.
Depuis 2011, nous utilisons les recommandations pour éviter que le contenu de faible qualité ne soit diffusé à grande échelle. C’est à ce moment que nous avons mis en place des classificateurs pour détecter les vidéos osées ou violentes et empêcher leur recommandation. Ensuite, en 2015, nous avons remarqué que le contenu de tabloïds sensationnalistes apparaissait sur des pages d’accueil et nous avons pris des mesures pour le reléguer au second plan. Un an plus tard, nous avons commencé à prévoir la probabilité qu’une vidéo présente des mineurs dans des situations risquées afin de la supprimer des recommandations. En 2017, afin de nous assurer que notre système de recommandation soit équitable pour les communautés marginalisées, nous avons commencé à évaluer l’apprentissage machine sur lequel repose notre système pour qu’il soit équitable envers les groupes protégés, comme la communauté LGTBQ+.
La croissance de la désinformation ces dernières années nous a amenés à développer notre système de recommandation de façon à ce qu’il puisse reconnaître la désinformation problématique et le contenu limite (c’est-à-dire qui frôle le non-respect du Règlement de la communauté, sans pour autant franchir la limite). Cette catégorie comprend les vidéos sur les théories conspirationnistes (« l’atterrissage sur la lune était un truquage ») ou d’autres contenus qui diffusent de la désinformation (« le jus d’orange peut guérir le cancer »).
Nous y arrivons en employant des classificateurs pour déterminer si une vidéo est « digne de foi » ou « limite ». Ces classifications sont effectuées par des personnes qui évaluent la qualité de l’information dans chaque chaîne ou vidéo. Ces évaluateurs couvrent le monde entier et sont formés au moyen de lignes directrices accessibles au public. Nous faisons également appel à des experts certifiés, comme des médecins, lorsque le contenu concerne de l’information sur la santé.
Pour déterminer la fiabilité d’une vidéo, les évaluateurs répondent à quelques questions clés. Est-ce que le contenu tient sa promesse ou atteint son objectif? Quel est le type d’expertise nécessaire pour atteindre l’objectif de la vidéo? Quelle est la réputation de l’orateur dans la vidéo et quelle est celle de la chaîne qui la diffuse? Quel est le principal sujet de la vidéo (nouvelles, sports, histoire, science, etc.)? Le contenu se veut-il avant tout satirique? Ces réponses et d’autres permettent de déterminer à quel point la vidéo est digne de foi. En matière de nouvelles et de contenu informationnel, plus la note est élevée, plus nous ferons la promotion de la vidéo. Pour déterminer le contenu limite, les évaluateurs considèrent des facteurs qui visent entre autres à voir si le contenu est erroné, trompeur ou mensonger; insensible ou intolérant; et nuisible ou présentant une possibilité de nuire. Les résultats sont regroupés pour indiquer par une cote à quel point la vidéo contient de la désinformation nuisible ou limite. Toute vidéo classée comme limite est refoulée dans les recommandations.
Ces évaluations humaines servent ensuite de modèles au système et sont ainsi appliquées à toutes les vidéos qui se retrouvent sur YouTube.
Réponse à quelques questions courantes sur les recommandations
Les recommandations jouent un rôle pivot dans notre communauté en présentant aux utilisateurs des contenus qui leur plaisent tout en aidant les créateurs à accéder à de nouveaux auditoires. Pour la société dans son ensemble, les recommandations peuvent aussi avoir leur importance en contribuant à bloquer la diffusion de désinformation nuisible. Les clics, la durée de visualisation, les sondages auprès des utilisateurs, les partages, ce que vous aimez et n’aimez pas demeurent des signaux importants qui alimentent notre système. Cependant, ils peuvent céder le pas à notre engagement de respecter notre responsabilité envers la communauté YouTube et la société.
Il reste quelques questions que l’on me pose souvent à propos de notre système de recommandation et je pense qu’il est important d’y répondre :
1. Est-ce que le contenu limite suscite davantage l’intérêt?
À vrai dire, les sondages et les commentaires nous indiquent que la plupart des utilisateurs ne tiennent pas à ce que du contenu limite leur soit recommandé. Plusieurs le trouvent même troublant et rebutant. En fait, lorsque nous avons refoulé le contenu licencieux et de type tabloïd, nous avons constaté que la durée de visionnement avait augmenté de 0,5 % en deux mois et demi par rapport à la période où nous ne posions aucune limite.
De plus, nous n’avons aucune preuve que le contenu limite est en moyenne plus attirant que les autres types de contenus. Prenons par exemple le contenu provenant des adeptes de la Terre plate. Même si les vidéos où l’on prétend que la Terre est plate sont beaucoup plus nombreuses que celles dans lesquelles on dit qu’elle est ronde, elles génèrent en moyenne beaucoup moins de visionnements. Les sondages indiquent que le contenu limite n’est satisfaisant que pour une très faible proportion des utilisateurs sur YouTube. Nous avons investi beaucoup de temps et d’argent pour nous assurer que notre système de recommandation ne lui permette pas de joindre un plus vaste auditoire. Actuellement, le contenu limite est surtout visionné à partir d’autres plateformes qui se connectent à YouTube.
2. Est-ce que le contenu limite fait augmenter la durée de visionnement pour YouTube?
La grande majorité des gens ne considèrent pas qu’ils ont passé du temps de qualité sur YouTube en visionnant du contenu limite. C’est pourquoi nous avons commencé en 2019 à refouler ce type de contenu dans nos recommandations. Depuis, nous avons constaté une baisse de 70 % dans la durée de visionnement du contenu limite recommandé sans abonnement aux États-Unis. Actuellement, la consommation de contenu limite provenant de nos recommandations est bien inférieure à 1 %.
3. Est-ce que les recommandations orientent les utilisateurs vers du contenu de plus en plus extrême
Comme je l’ai expliqué, nous reléguons activement au second plan l’information de faible qualité dans les recommandations. D’un autre côté, nous prenons aussi de nouvelles mesures pour montrer aux utilisateurs des vidéos dignes de foi sur des sujets qui peuvent les intéresser. Disons que je regarde une vidéo à propos du vaccin contre la COVID-19. Dans mon volet « prochaine vidéo », je verrai des vidéos provenant de sources réputées comme Vox et Bloomberg Quicktake. Je ne verrai pas de vidéos contenant de l’information trompeuse sur les vaccins (dans la mesure où notre système peut les détecter).
En plus de ces nouvelles sur la COVID-19 et de ces vidéos explicatives, j’obtiendrai également des recommandations personnalisées sur d’autres sujets en fonction de mon historique de visionnement (par exemple un sketch tiré de Saturday Night Live ou une conférence TEDx à propos de l’effet Super Mario). Cette diversité personnalisée permet aux utilisateurs d’accéder à de nouveaux sujets et formats au moyen d’un enchaînement du même type de vidéos.
De plus en plus de chercheurs indépendants examinent l’incidence des plateformes techniques sur la consommation de contenu limite. Tandis que les recherches se poursuivent, des articles récemment publiés concluent que les recommandations YouTube n’orientent pas les utilisateurs vers du contenu extrême. La consommation de nouvelles et de contenu politique sur YouTube reflète plutôt les préférences personnelles qui peuvent être constatées dans leurs habitudes en ligne.
4. Est-ce que le contenu limite rapporte des profits?
Tout d’abord, nos consignes sur les contenus adaptés aux annonceurs interdisent déjà la monétisation de nombreux contenus limites. Plusieurs annonceurs nous ont dit qu’ils ne voulaient pas être associés à ce type de contenu sur YouTube et refusent souvent que leurs annonces l’accompagnent. Cela signifie que chaque vidéo limite regardée correspond à une occasion perdue de générer des revenus; ce qui entraîne une perte sèche pour YouTube. De même, ce type de contenu engendre la méfiance et suscite des inquiétudes non seulement chez les partenaires annonceurs, mais aussi dans le public, dans la presse et chez les décideurs politiques. En réalité, notre travail sur la responsabilité progresse, de même que notre entreprise et toute l’économie de la création. La responsabilité est bonne pour les affaires.
En tenant compte de tout cela, pourquoi ne supprimons-nous pas le contenu limite tout simplement? La désinformation a tendance à bouger et à évoluer rapidement et, contrairement à des domaines comme le terrorisme ou la sécurité des enfants, elle ne fait pas toujours l’objet d’un consensus clair. De plus, elle peut varier en fonction des points de vue personnels ou du contexte. Nous sommes conscients que, parfois, cela nous porte à conserver du contenu controversé ou même choquant. Nous continuons donc à mettre fortement l’accent sur l’établissement de recommandations responsables et nous prenons de sérieuses mesures pour empêcher notre système de recommander ce contenu à grande échelle.
Dans l’ensemble, tout notre travail sur la responsabilité en matière de recommandations a eu une incidence réelle. La durée de visionnement de nouvelles dignes de foi a grandement augmenté et celle du contenu limite a diminué. Cela ne veut pas dire que les problèmes sont résolus, mais plutôt que nous devons continuer à raffiner nos systèmes et à investir afin de poursuivre leur amélioration. Notre objectif consiste à ce que les visionnements de contenu limite suggérés par recommandation demeurent inférieurs à 0,5 % de tous les visionnements sur YouTube.
La mission de YouTube consiste à donner une voix à chacun et à faire découvrir le monde. J’ai constaté au sein de ma propre famille des effets positifs considérables. Les vidéos qui donnent des exemples d’empathie et de tolérance ont eu une profonde influence sur le caractère de ma fille aînée. Mon fils a pu passer à travers de moments difficiles dans ses cours d’algèbre linéaire. J’en ai appris beaucoup sur le contexte et les nuances de l’éthique des technologies en regardant des conférences données par des experts en la matière. Et notre souci d’ouverture a permis l’expression de nouvelles voix et de nouvelles idées qui n’auraient pas eu de plateforme autrement. Des créateurs comme Marques Brownlee, MostlySane et NikkieTutorials ont inspiré des millions de personnes grâce à leur expertise, à leurs causes et à leur honnêteté.
Notre système de recommandation s’améliore chaque jour grâce à vos commentaires, mais on peut toujours faire mieux. Mon équipe et moi sommes déterminés à poursuivre ce travail tout en vous offrant l’expérience la plus utile et profitable possible.