Comment améliorer les moteurs de recommandation ?

Il y a deux ans, Netflix, le loueur de DVD en ligne américain, avait lancé un concours pour améliorer la pertinence de son moteur de recommandation de films de 10 %. Plusieurs équipes de recherche s’étaient lancées dans le défi, mais les propositions avaient du mal à améliorer le moteur de plus de 8,5 % (voire notre billet et les commentaires). Le concours est toujours ouvert, rappelle Wired et les équipes se sont même mises à collaborer entre elles pour essayer de décrocher le gros lot (1 million de dollars de récompense).

Pour Alex Iskold de ReadWriteWeb, l’amélioration des moteurs de recommandation ne dépend pas de la qualité des algorithmes, mais plutôt de la présentation des résultats. Dit autrement : quelles recommandations les gens veulent-ils et quand sont-ils ouverts à celles-ci ? Quel est notre niveau de tolérance à une mauvaise recommandation ?

Le concours NetflixLes moteurs de recommandation fonctionnent souvent de la même façon et se contentent d’offrir aux utilisateurs un système de notation pour faire des recommandations adaptées aux notes attribuées. Pour Alex Iskold, il faut distinguer les recommandations personnalisées (adaptées à nos comportements passés), sociales (adaptées au comportement d’utilisateurs similaires) ou sur l’objet (les spécifications du produit génèrent la recommandation, comme en comparant les qualités d’un livre à celles d’un autre, à la manière du projet BookLamp).

Les recommandations sociales s’appuient sur un filtrage collaboratif : les gens qui aiment le Seigneur des anneaux vont apprécier Eragon et les Chroniques de Narnia. Le problème de ce type d’approche est que les goûts des gens ne se superposent pas toujours à des catégories aussi simples. Si deux personnes aiment les films de ce type, cela ne veut pas dire qu’ils aimeront les mêmes drames ou les mêmes polars. De même, on pourrait ajouter que si vous aimez un titre de ce genre pour ses qualités de réalisation, il n’est pas sûr que vous apprécierez un autre titre de ce genre dont la réalisation ou l’approche scénaristique seront différentes.

La psychologie pour aider les moteurs

Dans les moteurs de recommandation basés sur les objets, comme Pandora sur la musique, chaque morceau est doté de plusieurs centaines de caractéristiques, à la manière de gènes. La complexité des moteurs de recommandation est due à la multitude des compositions possibles. Quel est le gène particulier qui est responsable du trait distinctif qui fait que nous allons mettre 5 étoiles à tel morceau ? « Le fait que ces classements soient faits par des humains est une information importante que devrait être mieux utilisée », explique à Wired le psychologue Gavin Potter (blog), qui s’est récemment lancé dans le concours Netflix. Potter suggère par exemple de donner plus de poids aux notes récentes qu’aux anciennes (Netflix existe depuis plus de 8 ans) ou de mieux évaluer notre inertie. Car notre façon de noter est contextuelle, explique Potter, elle dépend beaucoup de la précédente note que nous avons attribuée au précédent objet, film ou musique proposé par le système. « Enrichir les formules avec une dose de psychologie humaine est donc certainement une bonne idée », clame Alex Iskold à la suite de Potter, qui vient de bousculer le classement des compétiteurs de Netflix par son approche.

« Quand un ami vous recommande un film ou un restaurant, vous avez souvent envie de le voir, mais vous êtes au final souvent déçu. Si un ami vous déconseillait un film et qu’au final vous l’appréciez, vous n’allez pas avoir une expérience aussi négative de la recommandation. Cet exemple démontre notre différence de réaction à un faux négatif (les films déconseillés qu’on apprécie) ou à un faux positif (les films recommandés qu’on n’apprécie pas) », explique Alex Iskold. « Si les moteurs nous permettaient de connaître les films que nous ne devrions pas aimer, l’algorithme pourrait être le même, mais la perception serait différente ».

D’où l’idée de défendre des systèmes de recommandation qui réduiraient le bruit ambiant plutôt que de le concentrer. « Nous avons besoin de filtres à bruit, un algorithme qui nous dirait : tu ne vas pas aimer cela, comme nos boites à mails gèrent le spam. Nous avons besoin de boutons capables de filtrer les choses pour nous et de faire le tri pour les éliminer plutôt que pour nous les recommander. »

Construire un moteur de recommandation parfait est un défi complexe. En appliquant un peu de psychologie à nos systèmes sociotechniques, nous serions peut-être mieux à même d’apprécier leurs résultats, suggère avec raison Alex Iskold. Il est temps de préférer les disséminateurs aux agrégateurs.

A compléter avec ce billet de ReadWriteWeb qui distingue 10 moteurs de recommandation à surveiller comme MyStrands, Veenix, The Filter, SeeqPod, Scouta ou MatchMine pour la musique, Criticker pour les films, ou Zync pour les lieux.

A compléter aussi avec un papier d’IEEE Spectrum qui s’intéresse aux moteurs de recommandation dans l’information en ligne, montrant comment la recommandation a permis à Google News d’augmenter son taux de clic de 38 % (« Ils peuvent déterminer si un nouveau développement d’une histoire que vous avez suivi devrait vous intéresser, mais ils ne peuvent faire un saut logique, par exemple, reconnaître depuis votre intérêt dans un article passé sur l’intelligence extraterrestre que vous seriez fasciné par un article sur la découverte d’une planète habitable dans un autre système solaire »).

À lire aussi sur internetactu.net

0 commentaires

  1. Hubert,
    J’aurais adoré pouvoir discuter avec toi du sujet car justement la psychologie joue beaucoup et c’est ce sur quoi nous avons travaillé depuis le lancement de notre projet.

    Mystrands a lancé aussi un concours avec 100k$ à la clé (ce qui semble assez étrange pour une start-up travaillant dans le domaine et ayant levé 25M$). Nous avions un peu critiqué la méthode du concours de netflix çà l’époque avec mon associé et nous sommes très heureux de voir que 2 ans après le gens commencent à voir pourquoi ;-D

    La france est en pointe sur ce sujet, c’est triste de en pas le mentionner. Je pense en particulier à Criteo (et puis un peu à nous) .

    je ne connaissais pas booklamp et suis content de le découvrir marrant de retrouver le gus qui avait fait le voyage jusqu’à chez google en poussant des cris webesques. Comme moi ici finalement ;-D

    Voici les articles en questions :
    http://ulik.typepad.com/leafar/2006/10/netflix_prize_u.html
    http://ulik.typepad.com/leafar/2007/01/more_about_netf.html

  2. À propos de filtrage, avez-vous déjà essayé FeedHub, qui vous permet de noter des items dans des fils RSS, et qui, sur cette base, ne présente que ceux qui sont censés vous intéresser.
    D’ailleurs, il y a deux notes:
    1. ça m’a intéressé,
    2. je ne veux plus voir ça.

    http://www.feedhub.com

    Apparemment, la catégorisation n’est pas encore adaptée au français, mais la prise en compte des notes est effective.

  3. Clive Thompson pour le New York Times a réalisé une grande et passionnante enquête sur le concours pour améliorer l’algorithme de recommandation de Netflix, le loueur de DVD en ligne américain.

    Après avoir rencontré toutes les équipes en liste, montré leur difficulté à décrocher le prix en proposant un système qui puisse améliorer le moteur, Clive Thompson s’arrête sur les lacunes des données de Netflix qui empêchent peut-être de franchir cette étape. D’abord certains films, inclassables, ne rentrent pas dans les algorithmes : les critiques à leur égards sont trop tranchées et trop imprévisibles.

    Ensuite, Netflix se refuse à mieux personnaliser ses données utilisateurs, se refusant à utiliser les critères d’âge ou de localisation pour mieux cibler les recommandations par catégories sociales, niveau d’étude ou âge.

    Enfin, le moteur ne sait pas encore prendre en compte l’aspect social des recommandations, du genre si mes amis ont vu ce film alors je veux le voir aussi, ou l’influence de l’actualité sur les choix (du style les gens se précipitent sur les films parlant de Wall Street suite à l’actualité de la crise économique).

    Pour obtenir de meilleurs algorithmes, Netflix travaille donc à développer de nouvelles techniques, comme par exemple en permettant à ses utilisateurs d’étiquetter les films de mots clefs. Peut-être arrivera-t-il ainsi à mieux comprendre l’imprédictible intelligence humaine en intégrant ces informations subjectives à sa base ?