Comment YouTube s’est transformé

Google, YouTube, FB, Twitter, Instagram, tout comme votre site d’information ou de commerce préféré semblent immuables…, alors qu’ils ne cessent de se modifier, d’une manière qui nous est bien souvent invisible. Les techniques qui les font fonctionner évoluent sans même qu’on y prenne garde. Pour The Verge (@verge), Casey Newton (@CaseyNewton) revient en détail sur l’évolution du moteur de recommandation de YouTube.

Longtemps, en matière de personnalisation, YouTube est resté assez timide : l’utilisateur pouvait s’abonner à des chaînes… et c’était à peu près tout. Le temps moyen passé sur YouTube ne progressait guère. Désormais (au grand drame des youtubeurs d’ailleurs), les chaînes ne dominent plus YouTube. Quand vous ouvrez YouTube, quelques recommandations proviennent encore des chaînes auxquels vous vous êtes abonnés, mais pas l’essentiel. Il vous recommande plutôt des vidéos selon des critères d’audience, de fraîcheur des contenus ou de centre d’intérêts liés aux mots clefs qui les indexent. Petit à petit, YouTube a modifié ses outils de recommandation dans le but d’augmenter le temps moyen que chacun passe à regarder des vidéos.

Ce qui a tout changé, explique Jim McFadden, le responsable technique des recommandations de YouTube, c’est quand le moteur de recommandation a décidé de baser ses recommandations algorithmiques non pas sur le nombre de personnes ayant cliqué sur une vidéo, mais sur le temps que les gens passaient à la regarder, le fameux time watch. Le temps passé sur YouTube a alors augmenté de 50 % par an (et ne cesse d’augmenter à un rythme soutenu). Pour YouTube, le fait de regarder une vidéo est devenu un indicateur de sa qualité, tout comme le nombre de liens pointant vers une page a été le critère principal de qualité du pagerank de Google Search.

Ce changement et cette réussite, YouTube le doit à Google Brain, la division intelligence artificielle de Google, à laquelle YouTube a recours depuis 2015. Alors que YouTube a longtemps recommandé des vidéos très similaires (d’autres vidéos d’un même compte ou d’un même humoriste par exemple), l’apprentissage automatisé a permis d’élargir la recommandation. Pour cela, YouTube a développé la catégorisation des vidéos (un peu comme Netflix et ses générations de catégories à la volée que décodait Ian Bogost…). Si pour l’instant elles ne semblent pas générées automatiquement, les catégories permettent de recommander des vidéos adaptées : recommander une vidéo politique à quelqu’un qui regarde de la politique par exemple.

Google Brain s’est mis aussi à recommander des vidéos plus courtes à ceux qui se connectent à YouTube depuis un mobile et plus longues à ceux qui se connectent depuis un écran de télévision. YouTube a réalisé quelque 190 changements en 2016 et il devrait en réaliser plus de 300 cette année. Des tas de petites améliorations qui s’ajoutent les unes aux autres au fil du temps. Il a également adopté un fonctionnement plus rapide qui permet de mieux repérer les vidéos les plus récentes et identifier les vidéos virales pour mieux les recommander. Brain a eu un très fort impact : 70 % du temps passé sur YouTube est le fait des recommandations algorithmiques, estiment ses promoteurs.

Pour Casey Newton, YouTube est devenu bien différent des autres plateformes qui façonnent nos vies numériques. Facebook est basé surtout sur ce que vos relations publient et ce avec quoi vous interagissez, mais YouTube est une plateforme basée sur la performance. Pour lui, elle élargit notre horizon bien plus que d’autres plateformes. Pour Todd Beaupre, responsable de la découverte chez YouTube, le moteur de recommandation de YouTube réussit à la fois à croiser ce que vous avez déjà aimé (essentiellement les catégories liées aux contenus sur lesquels vous avez passé du temps) avec ce qui est à la mode et populaire (lié aux mêmes catégories).

quand on cherche réchauffement climatique, le moteur de recommandation de Youtube pointe vers bien plus de complotismes que Google Search ou Youtube Search explique Guillaume ChaslotReste que tout le monde ne partage pas cet avis. Plutôt que d’élargir les choix, beaucoup reprochent à YouTube d’être très enfermant, notamment du fait de son choix de recommander ce que d’autres ont également regardé et sur lequel ils ont passé du temps. Ces choix de conception ne sont pas sans biais, comme le relevait lors des élections présidentielles Algotransparency, en tentant d’observer les différences de recommandation faite par YouTube des candidats à la présidentielle Française, pointant le fait que le moteur aurait tendance à plus recommander certains candidats plutôt que d’autres (voir l’article que consacrait le Monde à ce sujet). Dans un précédent billet, l’un des membres d’Algotransparency, Guillaume Chaslot, soulignait que le système de recommandation de YouTube, bien plus que le moteur de recherche de YouTube ou de Google (qui n’est pourtant pas sans biais, comme le souligne avec constance le chercheur Olivier Ertzscheid), avait tendance à recommander bien plus de contenus peu recommandables que ses confrères.

Reste qu’essayer de comprendre le système de recommandation de YouTube reste compliqué. La popularité et l’addictivité semblent être devenues des critères forts de la recommandation chez YouTube, plus fort que la personnalisation déterminée par les like et dislike (qui semblent n’avoir plus aucun impact), les abonnements ou l’historique de navigation. Mais, comme le soulignent Algrotransparency, il demeure difficile de comprendre YouTube. YouTube n’indique pas par exemple le nombre de fois où une vidéo a été suggérée par son algorithme. Effectivement, si le watch time devient le critère principal, peut-être faut-il envisager que nous puissions y avoir accès ?

MAJ : L’artiste et designer James Bridle a posté sur Medium une longue réflexion sur la production quasi automatique de vidéo pour enfants sur Youtube de contenus adaptés aux mots clefs les plus chauds du moment pour ces publics spécifiques (voir le compte rendu qu’on fait Rue89 en français). Comme le souligne le journaliste Will Oremus sur Slate.com, on ne sait pas vraiment qui sont les opportunistes qui font ces vidéo. Pour Oremus, ce que montre ces vidéos, c’est une forme de génération de fake vidéos algorithmiques produites pour faire de l’audience, une forme de détournement d’audience et de revenus que l’on retrouve sur toutes les plateformes (même sur Spotify). Des détournements auxquels les plateformes peinent à répondre.

Sur son blog, Geoff Manaugh souligne que nous sommes bien plus là dans un Big Dada incompréhensible que dans un Big Data. Quand Netflix a utilisé des mots clefs pour mettre en production House of Cards, il aurait pu également produire des vidéos surréalistes et automatiques, sauf que cela n’aurait pas produit beaucoup d’audience. Le fait de s’adresser aux enfants, voire ici, au plus petits, change la donne. Animations de stocks, pistes audio libres de droits… les collages suréalistes réalisés sans queue ni tête permettent de produire des flux ininterrompu de vidéos. Et Manaugh de s’interroger… (avec ironie ?) Est-ce que ces enfants exposés à ces vidéos produites par des IA seront mieux à même de comprendre les IA ? Pas sûr !

Pour le New Scientist, ces nouveaux contenus soulignent l’impasse dans laquelle se retrouvent les plateformes à refuser l’éditorialisation, et ce surtout quand on développe un Youtube pour les enfants. Pour le New Scientist, pour les enfants, Youtube est l’un des sites les plus problématiques alors qu’ils y sont les plus nombreux. Plus encore qu’avec ses autres contenus, Youtube est confronté toujours plus avant à sa responsabilité éditoriale. L’amélioration de ses algorithmes ne pourra que retarder le problème, pas sûr qu’il parvienne à le régler !

MAJ : Le Guardian revient longuement sur l’enquête d’Algotransparency pour souligner combien l’algorithme de Facebook tord la réalité. Dans un édito pour le New York Times, la chercheuse Zeynep Tufekci qualifie Youtube de plus puissant instrument de radicalisation du 21e siècle. Pour elle, les algorithmes de Google visent à retenir le public et pour cela leur propose des contenus plus radicaux que ceux par lequel ils parviennent sur Youtube.

MAJ : Le Washington Post pointe que les nouvelles modalités de Youtube ont modifié la visibilité. Devenir un youtubeur star est devenu plus difficile que jamais. Les vues médianes par vidéo sont passé de 10 000 à moins de 100 par vidéo entre 2006 et 2016. L’élite de Youtube, les 3 % de chaînes qui font le plus de vues, remportent 90 % en 2016 contre 64 % en 2006. L’effet superstar s’est donc considérablement amplifié. Les récents changements d’attribution de revenus publicitaires offrent de moins en moins d’espoir aux aspirants Youtubeurs d’en tirer un revenu.

MAJ : Problème supplémentaire évoqué par Le Temps : les vidéos ne doivent pas seulement affronter l’indifférence algorithmique, elles doivent aussi lutter contre la pudibonderie économique de Google, comme le souligne très bien le combat des vidéastes féminines de la plateforme, invisibilisées selon les thèmes qu’elles défendent.

MAJ : Sur Towards data science, on trouve un article assez technique sur l’évolution de la recommandation dans YouTube. Sur son blog, Youtube annonce des évolutions pour améliorer le référencement de vidéos de qualité en favorisant des contenus qualifiés pour lutter contre la désinformation.

À lire aussi sur internetactu.net