En quelques années, Netflix est devenue la plus grande plateforme de vidéo en streaming par abonnement. Non seulement, elle croule sous les succès (en terme d’abonnements), mais elle ne cesse d’investir sans compter dans des productions originales pour se démarquer des concurrents (les chaînes câblées américaines notamment). Des productions dont la particularité est que leurs modalités ont souvent été imaginées depuis les préférences des utilisateurs de la plateforme. Plus que jamais, Netflix semble faire corps avec son moto : « Tout est recommandation ».
Pourtant, quand on s’intéresse au fonctionnement de la recommandation chez Netflix, force est de constater qu’on n’en sait pas grand-chose. Comme tous les acteurs du numérique : le silence est d’or. La complexité et les modifications incessantes des systèmes rendent l’opacité des fonctionnements de Netflix toujours plus étrangers à l’utilisateur.
En décembre 2015, Carlos Gomez Uribe, alors responsable de la personnalisation algorithmique chez Netflix (il est désormais responsable de l’intégrité de l’algorithme du fil d’information de Facebook) et Neil Hunt responsable produit chez Netflix, ont publié l’un des rares articles de recherche disponible sur le fonctionnement de la recommandation chez Netflix. Sans dévoiler les secrets industriels des algorithmes de Netflix ni évoquer tous les systèmes qu’utilise la plateforme, l’article montre néanmoins la complexité et l’intrication algorithmique à l’oeuvre.
De la valeur commerciale des algorithmes : retenir l’abonné
Dans leur article, les deux responsables de Netflix soulignent que le temps de séduction est compté : les utilisateurs perdent intérêts dès qu’ils dépassent 60 à 90 secondes à choisir un film, c’est-à-dire dès qu’ils dépassent les 10 à 20 titres proposés (et ce alors que nous avons beaucoup de mal à choisir un film). Et le risque bien sûr, est que si les utilisateurs ne lancent pas un film, ils abandonnent le service. L’article souligne très bien que la rétention de l’abonné est l’obsession des ingénieurs et que le système de recommandation est entièrement dédié à ce seul objectif.
Quand, en 2006, Netflix avait lancé un concours pour améliorer son moteur de recommandation (voir également « Comment améliorer les moteurs de recommandation »), Netflix était encore majoritairement un système qui envoyait des DVD par la poste, et son algorithme de recommandation reposait essentiellement sur les notes que les utilisateurs donnaient aux films. Ce système d’étoiles qui était devenu non plus une notation moyenne, mais une prédiction de l’intérêt que chacun trouverait à un film a d’ailleurs disparu en avril au profit de simples pouces levés ou abaissés, à la Facebook, rapporte Business Insider. Plutôt que de montrer une évaluation entre 1 et 5 étoiles, Netflix propose désormais un pourcentage qui représente la probabilité que vous appréciiez le contenu que Netflix suggère. Reste, comme le pointe Dave Smith de Business Insider, que ce système semble très perfectible, suggérant des contenus pas toujours en phase avec l’utilisateur. Un système binaire ne permettant pas de mettre beaucoup de nuances dans ce qu’apprécient les utilisateurs.
Désormais, Netflix sait tout de ses utilisateurs : ce qu’ils regardent, quand, la manière dont ils le regardent, l’intensité de ce qu’ils regardent… Et surtout la façon dont les utilisateurs trouvent ce qu’ils regardent. Autant de données qui ont permis d’améliorer le système de recommandation qui semble ne plus du tout reposer sur les films qui sont les mieux notés par les utilisateurs, mais plutôt sur de nouvelles métriques comme « l’efficient catalog size » qui tente de mesurer la quantité de visionnage que produit chaque vidéo du catalogue.
Reste que depuis le concours pour améliorer son moteur de recommandation, Netflix n’avait pas divulgué grand-chose de son fonctionnement. On avait appris au détour d’une enquête réalisée par The Atlantic que Netflix produisait des dizaines de milliers de catégories, quasiment à la volée, pour classer ses contenus et affiner sa recommandation (voir également « Les algorithmes sont-ils notre nouvelle culture »). Par exemple : « documentaire criminel afro-américain » ou « romances acclamées par la critique ».
En fait, expliquent les deux ingénieurs de Netflix, le site de vidéo sur abonnement utilise une grande variété d’algorithmes adaptés aux supports des utilisateurs et aux thèmes qu’ils préfèrent.
Les algorithmes de Netflix
Il y a le Personalized Video Ranker (PVR, pour classement vidéo personnalisé) qui commande pour chaque profil un classement personnalisé selon les catégories… et la popularité des contenus (qui, elle, n’est pas personnalisée). Un autre algorithme qui détermine la recommandation et la page d’accueil du service est le Top-N Video Ranker, qui vise à fournir les meilleures recommandations pour chaque profil en se concentrant uniquement les vidéos les mieux classées, valorisant une « tête » de catalogue, c’est-à-dire d’une certaine manière les plus vues. Se combine aussi un autre algorithme de « tendances récentes », car les tendances à court terme sont un autre prédicteur puissant du visionnage. C’est un algorithme qui permet de faire entrer de la considération sociale dans les recommandations, liée à l’actualité par exemple. Un autre algorithme est le Continue watching qui consiste à recommander du contenu selon ce qui a déjà été visionné en prenant en compte le temps écoulé depuis le visionnage d’un épisode ou le point d’abandon des séries… L’algorithme « de similitude vidéo à vidéo », lui, active une recommandation du type : « parce que vous avez regardé » qui fait une recommandation depuis une des vidéos visionnées par un utilisateur. Celui-ci est un algorithme non personnalisé qui pointe vers des vidéos semblables calculées pour chaque vidéo du catalogue. Un autre algorithme encore assure la diversité de la page d’accueil et de la recommandation.
Image : la page d’accueil de Netflix, une orchestration de recommandation algorithmique.
Ces 6 algorithmes forment l’algorithme de recommandation de Netflix, précisent leurs concepteurs, tout en soulignant que bien d’autres encore entrent en compte, comme des algorithmes qui caractérisent la « sélection évidente », c’est-à-dire ceux qui tentent de déterminer ce que l’utilisateur veut vraiment… et qui prend en compte la côte des films, leurs métadonnées (les réalisateurs, acteurs, année de réalisation, prix qu’a remporté un film…) ou celui qui génère des images adaptées de chaque film qui peuvent être différentes selon ces croisements d’informations, afin d’améliorer le lancement d’un visionnage. Enfin, il y a les algorithmes liés au moteur de recommandation (qui compte pour 20 % des recommandations, quand la page d’accueil traite 80 % de celles-ci !). La spécificité de celui-ci, outre le fait de prendre en compte les algorithmes précédents, repose sur sa capacité à faire des recommandations adaptées quand les utilisateurs cherchent des films qui ne sont pas dans le catalogue. Sa spécificité également est qu’il peut faire des suggestions adaptées depuis quelques lettres seulement… Tapez « Fra » et le moteur recommande des films français par exemple.
Tous ces algorithmes reposent sur l’apprentissage machine et l’apprentissage statistique, à la fois supervisé (notamment pour la classification) et non supervisé, soulignent les ingénieurs de Netflix.
De la finalité de la recommandation
La recommandation est au coeur du business modèle de Netflix. Celle-ci a aussi pour but d’aider le système à trouver un public même pour des vidéos de niches. Pour cela, Netflix introduit encore des nouvelles métriques, on l’a vu, comme l’efficient catalog size qui tente de mesurer la quantité de visionnage que produit chaque vidéo du catalogue. Une espèce de time watch à la Youtube qui produit des recommandations liées à chaque film. La personnalisation (PVR) permet de générer une multitude de recommandations et d’éviter que tout le monde se voie recommander les mêmes vidéos, se défendent Carlos Gomez Uribe et Neil Hunt. Elle permet de maximiser l’exploration du catalogue et améliore significativement la recommandation par rapport à une recommandation aléatoire. Mais cette insistance sur la personnalisation semble minimiser le rôle de la popularité des contenus. Selon eux, le « taux de prise », c’est-à-dire le calcul des recommandations qui donnent lieu à un visionnage effectif est nettement amélioré par la personnalisation (PVR) par rapport à la seule popularité des vidéos. Reste qu’elle semble malgré tout limitée. A ce qu’on en comprend, la personnalisation active surtout les multiples catégories, mais pas la popularité des films. Au final, House of cards, l’une des séries phares de Netflix, demeure un des produits les plus recommandés, comme bien des productions maison.
En fait, soulignent les ingénieurs de Netflix, les recommandations améliorées par ces systèmes entraînent une augmentation significative de l’engagement global à l’égard du produit et réduisent les taux d’annulation d’abonnement. Le taux de désabonnement est inférieur à 10 % et une grande partie de ces désabonnements est plutôt liée à des défauts de paiement qu’à un choix volontaire. Pour les chercheurs, l’enjeu de Netflix a été de faire fortement diminuer ces dernières années ce taux de désabonnement. La finalité des algorithmes de Netflix est bien avant tout de retenir le client.
Carlos Gomez Uribe et Neil Hunt estiment encore que ceux qui développent des algorithmes doivent apprendre à faire la part des choses. D’un côté, les clients demandent du choix et des outils de recherche et de navigation exhaustifs, mais de l’autre, cette grande liberté n’est pas nécessairement ce qui fonctionne le mieux. Il est toujours difficile de trouver la meilleure variante d’un algorithme de recommandation et la pertinence apparente n’est pas toujours évidente quand on la confronte à la mesure des résultats. Au final, comme bien des moteurs de recommandation (celui d’Amazon notamment), Netflix cède la pertinence à l’efficacité et à la popularité.
Image : exemple de recommandation liée à House of Cards. La recommandation de la ligne inférieure est plus pertinente, mais elle produit moins de résultats effectifs, c’est-à-dire de visionnages, que de montrer des vidéos qui ont une popularité plus forte, comme c’est le cas de la ligne de recommandation supérieure.
Les deux ingénieurs soulignent que Netflix ne cesse de s’améliorer. En conclusion de leur article, ils pointent une feuille de route de critères à améliorer. Par exemple parvenir à mieux équilibrer les recommandations de contenus selon les formes courtes et longues, alors qu’aujourd’hui, l’algorithme semble plutôt favoriser les séries. Autre objectif : améliorer les recommandations nationales (visiblement, Netflix duplique ses algorithmes par pays où il est présent), notamment dans les pays où un nombre insuffisant de clients rend la recommandation plus difficile, où les langues et sous-titres disponibles ne sont pas toujours dans la langue vernaculaire du pays. Parmi les autres défis à résoudre, les chercheurs estiment qu’il leur faut améliorer les recommandations pour ceux qui découvrent Netflix durant le premier mois gratuit, et ce alors que le système ne les connaît pas. Dans leur article, ils soulignent également des enjeux pour améliorer encore la page d’accueil, mais également la distinction des profils dans les abonnements familiaux (afin que le fait de jouer une vidéo pour son enfant ne vienne pas « polluer » la recommandation pour les parents). Et aussi améliorer la recommandation destinée aux enfants, notamment en prenant en compte d’une manière prédictive leurs changements de goûts avec l’âge.
Un tableau bien incomplet des capacités algorithmiques de Netflix
Si l’article est intéressant, il l’est plus encore par les silences et les non-dits. Rien ne nous est dit par exemple sur le fait que l’algorithme de recommandation de Netflix favoriserait certains films de niches (qui coûtent moins cher à négocier) ou optimiserait ses propres productions plutôt que les blockbusters qu’il achète auprès d’autres diffuseurs et producteurs. On voit bien également que la personnalisation demeure au service des intérêts de l’entreprise : elle reste liée à la popularité et son but, unique, n’est pas tant de vous faire des recommandations pertinentes que de vous faire apprécier le service et y rester.
Au final, Netflix semble en fait assez peu favoriser les films de niche. Zach Sonfeld pour Newsweek se désolait il y a peu de l’inexistence de films classiques dans le catalogue de Netflix. Au moment de son enquête, il n’a compté qu’une quarantaine de films qui datait d’avant les années 70 (le catalogue de Netflix évolue sans arrêt au grès des accords et achats). Alors que le Netflix qui envoyait des DVD était le paradis du cinéphile, le Netflix du streaming, lui, ne l’est plus. Qu’importe si, la conséquence est que ce qui n’est pas accessible en streaming n’existe plus. Par contre, ses algorithmes cherchent assurément à favoriser ses contenus comme le soulignait Wired (voire la traduction de Usbek et Rica) cet été en montrant comment la création d’une série avec des superhéros aux personnalités très différentes les unes des autres, permettaient d’amener des abonnés à regarder ce type de contenus par la recommandation, même si les utilisateurs appréciaient peu les films avec des superhéros. De quoi relativiser les vertus de la personnalisation.
Rien ne nous est dit non plus de bien d’autres usages de Netflix, et notamment de l’utilisation de la recommandation pour initier la production de contenus. Ed Finn (@zonal), directeur du Centre pour la science et l’imagination de l’université d’Etat de l’Arizona, dans son livre What Algorithms wants rappelle d’ailleurs, dans un article pour Slate, un autre usage de la recommandation chez Netflix, absolument pas évoquée par les 2 ingénieurs de la compagnie : la façon dont Netflix a utilisé ses données pour initier des productions capables de plaire à la plupart de ses utilisateurs. Ainsi pour House of Cards, Netflix s’est basé sur le succès de la mini-série éponyme produite par la BBC dans les années 90, le fait que ceux qui l’appréciaient appréciaient aussi les films avec Kevin Spacey, pour produire sa première série. House of Cards, ni nombre des séries qui ont suivi n’ont pas été créées par des algorithmes, comme le souligne Todd Yellin, directeur de l’innovation de Netflix, mais la technologie a permis de choisir une histoire et des composants qui avaient du potentiel.
Derrière l’idéal de personnalisation algorithmique qu’incarne doublement la série House of Cards (dans sa production comme dans son mode de diffusion), il est nécessaire de prendre un peu de recul. House of Cards semble bien plus l’expression de la popularité que de la personnalisation. Et la série phare de Netflix est surtout recommandée différemment à la plupart des abonnés selon de multiples catégories : l’essentiel étant de la leur recommander ! Netflix exploite très bien cela, et a même publié une infographie pour montrer à partir de quel épisode les abonnés avaient tendance à devenir accros à leurs séries. Reste, comme le confiait les gens de Netflix eux-mêmes au Guardian, cette façon de faire n’assure pas la martingale à chaque fois.
Le Binge Watching est-il une conséquence de l’optimisation de la recommandation ?
Le fait de publier toute une saison d’un coup a également permis à Netflix d’impliquer autrement ses abonnés dont les algorithmes bichonnent la fidélité. 2 % des abonnés américains à Netflix ont par exemple visionné l’intégralité de la saison 2 de House of Cards dès le week-end où la série a été publiée. Tant et si bien qu’on peut se demander si le Binge Watching, c’est-à-dire le fait de regarder des épisodes de série en rafale, favorisé à la fois par le lancement automatique de l’épisode suivant et par la publication d’une série d’un coup – plutôt qu’avec un délai entre chaque épisode, comme c’est le cas avec la télé traditionnelle – n’est pas aussi une conséquence de l’optimisation de la recommandation. Si le Binge Watching n’est pas né avec Netflix, comme le souligne un remarquable article d’Inaglobal sur le sujet, mais le fait de publier une saison d’un coup a accéléré le phénomène.
Eric Thurm sur RealLife Mag va plus loin encore. « Plutôt qu’une expansion infinie, mais linéaire de l’écoute télévisuelle, Netflix s’attend implicitement à ce que ses consommateurs s’engagent dans des crises de consommation intenses qui les laissent abasourdis et confus. » Telle est la finalité du Binge Watching : faire que le spectateur s’optimise à la recommandation qu’il reçoit. Et à nouveau, ce qui n’est pas sans conséquence sur les productions de séries elles-mêmes, souligne Thurm. Les saisons se terminent sur des ambiguïtés, comme pour ne jamais se terminer. La plupart des épisodes finaux des plus importantes séries de ces 20 dernières années ouvrent des espaces d’interrogation : comme si le spectacle ne pouvait rester dans la mémoire culturelle s’il était définitif, estime Thurm. A l’heure du streaming infini, les séries doivent pouvoir continuer perpétuellement, à l’image des recommandations que fournit Netflix à tout nouvel abonné pour ses propres séries, même si les premiers épisodes ont désormais 5 à 6 ans… La vie continue des séries nécessite de maintenir les ambiguïtés. La production et la diffusion semblent avoir été toujours liées et Netflix cristallise cette réalité. Pour Eric Thurm, le succès des séries est lié au fait qu’elles vous permettent toujours de vous investir dans une consommation de plus, jamais rassasiée, jamais terminée, toujours recommencée, comme relancée automatiquement, d’un épisode l’autre. Comme si leur finalité était juste de capter le spectateur, indépendamment de tout contenu. L’écoute en rafale est la résultante d’une logique prescriptive que réalisent les algorithmes de Netflix, rappelle la chercheuse Gabrielle Drumond, qui parle « d’usagers configurés » par la personnalisation et la catégorisation algorithmique au service d’une « économie de la jouissance ».
Le « Peak TV » qu’incarne la série aujourd’hui évoque la réalisation d’un marché du divertissement infini. Le but des séries semble désormais uniquement de faire s’investir le consommateur dans sa consommation. Le médium télévisuel génère une vision d’une audience captive permanente. N’était-ce d’ailleurs pas le but affiché par les ingénieurs de Netflix ? Retenir à jamais l’abonné ? Faire que jamais il ne se désabonne ?
Hubert Guillaud
0 commentaires
Usbek et Rica consacre un rapide article à la sélection algorithmique des vignettes de Netflix qui s’affichent différemment selon les caractéristiques de votre profil.
Le Monde rapporte une polémique liée aux tweets du Community Managers de Netflix qui fait état des chiffres annuels en s’amusant de pratiques d’audiences de certains abonnés. Des tweets qui ont inquiétés des utilisateurs qui se sont demandés qui a accès à ce que regardent les utilisateurs… Si Netflix s’est excusé, l’entreprise n’a pas répondu 😉
MacGeneration revient en détails sur le fonctionnement technique de Netflix et comment ses serveurs distribués permettent de servir les vidéos.