Comment YouTube s’est transformé

Google, YouTube, FB, Twitter, Instagram, tout comme votre site d’information ou de commerce préféré semblent immuables…, alors qu’ils ne cessent de se modifier, d’une manière qui nous est bien souvent invisible. Les techniques qui les font fonctionner évoluent sans même qu’on y prenne garde. Pour The Verge (@verge), Casey Newton (@CaseyNewton) revient en détail sur l’évolution du moteur de recommandation de YouTube.

Longtemps, en matière de personnalisation, YouTube est resté assez timide : l’utilisateur pouvait s’abonner à des chaînes… et c’était à peu près tout. Le temps moyen passé sur YouTube ne progressait guère. Désormais (au grand drame des youtubeurs d’ailleurs), les chaînes ne dominent plus YouTube. Quand vous ouvrez YouTube, quelques recommandations proviennent encore des chaînes auxquels vous vous êtes abonnés, mais pas l’essentiel. Il vous recommande plutôt des vidéos selon des critères d’audience, de fraîcheur des contenus ou de centre d’intérêts liés aux mots clefs qui les indexent. Petit à petit, YouTube a modifié ses outils de recommandation dans le but d’augmenter le temps moyen que chacun passe à regarder des vidéos.

Ce qui a tout changé, explique Jim McFadden, le responsable technique des recommandations de YouTube, c’est quand le moteur de recommandation a décidé de baser ses recommandations algorithmiques non pas sur le nombre de personnes ayant cliqué sur une vidéo, mais sur le temps que les gens passaient à la regarder, le fameux time watch. Le temps passé sur YouTube a alors augmenté de 50 % par an (et ne cesse d’augmenter à un rythme soutenu). Pour YouTube, le fait de regarder une vidéo est devenu un indicateur de sa qualité, tout comme le nombre de liens pointant vers une page a été le critère principal de qualité du pagerank de Google Search.

Ce changement et cette réussite, YouTube le doit à Google Brain, la division intelligence artificielle de Google, à laquelle YouTube a recours depuis 2015. Alors que YouTube a longtemps recommandé des vidéos très similaires (d’autres vidéos d’un même compte ou d’un même humoriste par exemple), l’apprentissage automatisé a permis d’élargir la recommandation. Pour cela, YouTube a développé la catégorisation des vidéos (un peu comme Netflix et ses générations de catégories à la volée que décodait Ian Bogost…). Si pour l’instant elles ne semblent pas générées automatiquement, les catégories permettent de recommander des vidéos adaptées : recommander une vidéo politique à quelqu’un qui regarde de la politique par exemple.

Google Brain s’est mis aussi à recommander des vidéos plus courtes à ceux qui se connectent à YouTube depuis un mobile et plus longues à ceux qui se connectent depuis un écran de télévision. YouTube a réalisé quelque 190 changements en 2016 et il devrait en réaliser plus de 300 cette année. Des tas de petites améliorations qui s’ajoutent les unes aux autres au fil du temps. Il a également adopté un fonctionnement plus rapide qui permet de mieux repérer les vidéos les plus récentes et identifier les vidéos virales pour mieux les recommander. Brain a eu un très fort impact : 70 % du temps passé sur YouTube est le fait des recommandations algorithmiques, estiment ses promoteurs.

Pour Casey Newton, YouTube est devenu bien différent des autres plateformes qui façonnent nos vies numériques. Facebook est basé surtout sur ce que vos relations publient et ce avec quoi vous interagissez, mais YouTube est une plateforme basée sur la performance. Pour lui, elle élargit notre horizon bien plus que d’autres plateformes. Pour Todd Beaupre, responsable de la découverte chez YouTube, le moteur de recommandation de YouTube réussit à la fois à croiser ce que vous avez déjà aimé (essentiellement les catégories liées aux contenus sur lesquels vous avez passé du temps) avec ce qui est à la mode et populaire (lié aux mêmes catégories).

quand on cherche réchauffement climatique, le moteur de recommandation de Youtube pointe vers bien plus de complotismes que Google Search ou Youtube Search explique Guillaume ChaslotReste que tout le monde ne partage pas cet avis. Plutôt que d’élargir les choix, beaucoup reprochent à YouTube d’être très enfermant, notamment du fait de son choix de recommander ce que d’autres ont également regardé et sur lequel ils ont passé du temps. Ces choix de conception ne sont pas sans biais, comme le relevait lors des élections présidentielles Algotransparency, en tentant d’observer les différences de recommandation faite par YouTube des candidats à la présidentielle Française, pointant le fait que le moteur aurait tendance à plus recommander certains candidats plutôt que d’autres (voir l’article que consacrait le Monde à ce sujet). Dans un précédent billet, l’un des membres d’Algotransparency, Guillaume Chaslot, soulignait que le système de recommandation de YouTube, bien plus que le moteur de recherche de YouTube ou de Google (qui n’est pourtant pas sans biais, comme le souligne avec constance le chercheur Olivier Ertzscheid), avait tendance à recommander bien plus de contenus peu recommandables que ses confrères.

Reste qu’essayer de comprendre le système de recommandation de YouTube reste compliqué. La popularité et l’addictivité semblent être devenues des critères forts de la recommandation chez YouTube, plus fort que la personnalisation déterminée par les like et dislike (qui semblent n’avoir plus aucun impact), les abonnements ou l’historique de navigation. Mais, comme le soulignent Algrotransparency, il demeure difficile de comprendre YouTube. YouTube n’indique pas par exemple le nombre de fois où une vidéo a été suggérée par son algorithme. Effectivement, si le watch time devient le critère principal, peut-être faut-il envisager que nous puissions y avoir accès ?

MAJ : L’artiste et designer James Bridle a posté sur Medium une longue réflexion sur la production quasi automatique de vidéo pour enfants sur Youtube de contenus adaptés aux mots clefs les plus chauds du moment pour ces publics spécifiques (voir le compte rendu qu’on fait Rue89 en français). Comme le souligne le journaliste Will Oremus sur Slate.com, on ne sait pas vraiment qui sont les opportunistes qui font ces vidéo. Pour Oremus, ce que montre ces vidéos, c’est une forme de génération de fake vidéos algorithmiques produites pour faire de l’audience, une forme de détournement d’audience et de revenus que l’on retrouve sur toutes les plateformes (même sur Spotify). Des détournements auxquels les plateformes peinent à répondre.

Sur son blog, Geoff Manaugh souligne que nous sommes bien plus là dans un Big Dada incompréhensible que dans un Big Data. Quand Netflix a utilisé des mots clefs pour mettre en production House of Cards, il aurait pu également produire des vidéos surréalistes et automatiques, sauf que cela n’aurait pas produit beaucoup d’audience. Le fait de s’adresser aux enfants, voire ici, au plus petits, change la donne. Animations de stocks, pistes audio libres de droits… les collages suréalistes réalisés sans queue ni tête permettent de produire des flux ininterrompu de vidéos. Et Manaugh de s’interroger… (avec ironie ?) Est-ce que ces enfants exposés à ces vidéos produites par des IA seront mieux à même de comprendre les IA ? Pas sûr !

Pour le New Scientist, ces nouveaux contenus soulignent l’impasse dans laquelle se retrouvent les plateformes à refuser l’éditorialisation, et ce surtout quand on développe un Youtube pour les enfants. Pour le New Scientist, pour les enfants, Youtube est l’un des sites les plus problématiques alors qu’ils y sont les plus nombreux. Plus encore qu’avec ses autres contenus, Youtube est confronté toujours plus avant à sa responsabilité éditoriale. L’amélioration de ses algorithmes ne pourra que retarder le problème, pas sûr qu’il parvienne à le régler !

À lire aussi sur internetactu.net