Spotify possède 6 ans de mes données musicales, mais ne comprend toujours pas mes goûts (enfin, pour l’instant) – The Guardian

Stuart Dredge pour le Guardian revient sur les limites de Spotify, le célèbre service d’abonnement musical en streaming. Il utilise le service depuis 2008 et il est devenu son principal service de lecture de musique. Il a demandé à Spotify son “profil de goût”, c’est-à-dire le profil musical qu’il détient pour chaque utilisateur afin de lui adresser des recommandations pertinentes. L’algorithme de recommandation se base sur plusieurs critères pour établir un profil, lui explique le spécialiste de la personnalisation chez Spotify, Ajay Kalia : les chansons écoutées et les artistes, les styles de musiques correspondants, l’acoustique, le tempo et la “dansabilité” des chansons sont prises en compte. Ces données sont comparées à celles des autres utilisateurs et donne un profil organisé par “Cluster” de genres musicaux les plus appréciés. Il classe également l’utilisateur selon son profil d’écoute : écoute-t-il beaucoup de musique ou peu, fait-il beaucoup d’échantillonnage, écoute-t-il les artistes en profondeur ou en surface… Ce système de recommandation devrait donner naissance prochainement à Nestify, un outil encore en test en interne chez Spotify, qui délivre des playlists adaptées à vos goûts musicaux basé sur EchoNest, une startup rachetée par Spotify qui a déjà développé de nombreuses applications de recommandation musicales.

En septembre, Walt Hickey pour FiveThirtyEight avait été l’un des premiers à tester Nestify. Nestify devrait être capable de prendre en compte également le temps. Ce que vous avez écouté récemment devrait être plus pondéré que ce que vous avez écouté il y a quelques semaines, ou ce que vous écoutez le soir par rapport à ce que vous écoutez le matin selon le moment où vous écoutez de la musique. Contrairement aux “radios” qui dans Spotify se nourrissent d’un artiste ou d’une chanson pour vous en recommander d’autres, Nestify se basera sur ces “clusters” pour générer trois types de playlist : Ma musique, basé sur les chansons qu’on écoute beaucoup, Découverte, pour des chansons hors cluster, et une playlist par défaut, entre ces deux comportements extrêmes. Pour Walt, la playlist de recommandation Découverte semble l’avoir conquis. “L’algorithme m’a "clou锓, conclut-il. 

En attendant la sortie de Nestify, Mark Boyd pour ProgrammableWeb revenait récemment sur la conférence APIdays qui se tenait en décembre à Paris et notamment sur l’intervention de Cedric Begoc de Spotify qui a montré plusieurs projets d’utilisation des API de Spotify et de The EchoNest pour développer de nouveaux systèmes de recommandation musicales comme le Jukebox Infini, qui vous propose de trouver des musique qui ont le même rythme que votre chanson préférée ; l’explorateur d’artistes, qui permet de voir les connexions entre artistes dans Spotify.   

Dans son article, Walt Hicker évoque notamment les recherches de Brian Whitman (@bwhitman), le ”music scientist“ de Spotify et cofondateur d’Echonest, qui a publié une étude pour tenter de déterminer l’affiliation politique d’un utilisateur selon son profil musical. Son étude, montre ainsi que les Républicains semblent avoir une moindre diversité musicale que les Démocrates.

Brian Whitman a également un autre signé un autre article passionnant sur la recommandation musicale, qui distingue les techniques pour favoriser la découverte musicale (la similitude, la recommandation personnalisée, la génération de playlists). Il explique très bien les différences de formes de recommandation entre la plupart des services musicaux. Pandora s’appuie surtout sur des sondages auprès de spécialistes de la musique. Songza sur les playlists des fans et des éditeurs. Last.fm sur les tags et les données d’activités des artistes et chansons ainsi que sur une analyse acoustique des titres. Amazon sur les achats et l’historique de navigation. iTunes Genius sur les achats et les données d’iTunes. EchoNest sur l’analyse acoustique et l’analyse de texte… Autant d’exemples qui montrent qu’il y a de nombreuses approches possibles de la recommandation passant par les données d’activité, l’examen critique ou éditorial (des données elle-mêmes), l’analyse acoustique ou l’analyse de texte.  

Cela pose de nombreux problèmes, notamment d’échelle. Pour faire de bonnes recommandations, il faut une grande base d’artistes et de musiques. Et cela ne peut plus se faire à la main. Wikipédia ne propose que 130 000 pages sur les artistes. Pandora a mis 10 ans pour franchir la barre de 1 millions de chansons et ne connaît la plupart pas les nouveaux artistes. EchoNest, lui, suis plus de 2 millions d’artistes et 30 millions de chansons. L’analyse des données d’activité souffre également d’un problème d’échelle, qui vise à vous recommander le plus simple, le plus évident. Pour Brian Whitman, la pathologie du filtrage repose souvent sur le manque de données pour les artistes les moins populaires. Whitman explique que pour remédier à cela EchoNest explore le web en permanence pour chercher de l’information sur la musique et analyser le texte qui s’y réfère pour comprendre les associations et les descriptions de la musique. La quantité des conversations sert également à informer la popularité de l’artiste et des chansons. Mais cela ne suffit pas. EchoNest utilise aussi l’analyse acoustique. Seule, cette analyse génère la plupart du temps de très mauvaise recommandations, mais les ordinateurs savent bien reconnaître le tempo, les instruments, la mélodie dominante. Les utilisateurs attendent une recommandation culturelle que l’analyse du signal seul, ne sait pas proposer. Mais cela permet de mieux programmer la succession des chansons dans une playlist par exemple. Brian Whitman explique finalement très bien que le filtrage algorithmique n’a de ses que s’il est associé à un filtrage culturel, lui aussi automatisé. 

L’avenir selon lui est au filtrage social et collaboratif, estime-t-il en évoquant This is my jam et Swarm.fm. Mais s’ils sont précieux pour découvrir de la musique entre amis, ils ne sont pas des bases pour construire des moteurs de recommandation. Les gens préfèrent que ce soit des hommes qui leur disent quoi écouter plutôt que des machines. L’avenir est également à l’intelligence de l’écoute, c’est-à-dire la prise en compte du contexte dans lequel vous écoutez la musique (écoutez vous la musique de la même façon le soir et le matin, le week-end et la semaine, les jours de soleil ou de pluie ?…). C’est tout l’enjeu du profil de goût sur lequel travail EchoNest, conclut sont directeur scientifique.  

MAJ : Slate.fr explique comment fonctionne la playlist de découverte générée automatiquement chaque semaine pour chaque utilisateur.

À lire aussi sur internetactu.net

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.