Le Wall Street Journal publiait il y a peu une intéressante enquête sur la tarification algorithmique des sites de commerce en ligne. Les journalistes Jennifer Valentino-Devries, Jeremy Singer-Vine et Ashkan Soltani ont cherché à comprendre comment les prix des produits d’un magasin en ligne tel que Staples, un site de fournitures de bureau américain, variaient pour les utilisateurs.
Visiblement, plusieurs paramètres entrent en compte pour déterminer le prix d’un produit expliquent-ils. La localisation attribuée à votre IP (qui n’est pas forcément très fiable, notamment si vous vous connectez depuis une ligne téléphonique fixe), mais également la distance à laquelle vous êtes situé d’un magasin physique d’un concurrent ! Parmi les facteurs qui vont faire varier le prix du produit que vous consultez, le revenu moyen de la zone où vous habitez semble également entrer en ligne de compte, comme l’explique clairement l’infographie associée à l’article. Au final, la différence sur le prix d’un article peut atteindre 10 %, ce qui n’est pas bien grave sur une agrafeuse à 14 $, mais peut-être plus conséquent sur un produit plus cher.
Image : extrait de l’infographie du Wall Street Journal montrant la variation des prix des articles de site Staples selon la localisation de l’internaute.
De plus en plus de sites personnalisent les résultats et notamment les prix des produits qu’ils affichent à l’internaute selon un ensemble de paramètres dont l’utilisateur n’est pas conscient. Plus qu’une simple tarification dynamique, qui consiste seulement à faire varier les prix selon la demande (moins un produit est demandé, moins il est cher), nous assistons là à une démocratisation de ce qu’on appelle le yield management (ou « optimisation de la recette tarifaire »), en faisant varier les prix d’un produit ou d’un service selon les différents segments de marchés en fonction de données et de traitements de plus en plus accessibles. Les progrès de l’analyse de données permettent désormais à de plus en plus de sites de commerce en ligne de faire varier les prix de leurs produits via des outils de plus en plus accessibles à de plus en plus d’acteurs. Les conséquences sont que l’obscurité si souvent dénoncée des tarifs des voyages en train ou en avion risque de se répandre partout.
L’essor de la tarification algorithmique
Le concept du prix algorithmique consiste à faire varier le prix d’un produit en fonction d’algorithmes et de données plus ou moins sophistiquées, pouvant se baser sur une grande liste de critères, allant de la demande en temps réel à la disponibilité, en passant par la concurrence entre les produits, l’actualité, et bien sûr les caractéristiques de l’acheteur (sa situation sociale, son âge, sa localisation, le système technique qu’il utilise pour se connecter, sa fidélité…).
Les vendeurs des places de marchés d’Amazon utilisent souvent des logiciels et algorithmes pour fixer les prix des ouvrages d’occasion qu’ils vendent, comme le rapportait cette histoire emblématique mise en avant par Tom Roud de guerre entre deux algorithmes sur un livre d’occasion faisant monter leur prix à 2 millions de dollars ! En fait, ces guerres de prix complètement automatisées sont facilitées par le fait qu’il existe de nombreux logiciels sur le marché comme AppEagle, Teikametrics, SellerEngine ou Feedvisor… permettant d’adapter le prix de son produit à la demande.
Mais il n’y a pas que les vendeurs des places de marché d’Amazon qui utilisent ces outils. Amazon utilise lui-même de nombreux algorithmes. Celui qui gère les recommandations de titre (en fonction des critiques et des achats), celui qui gère les classements des ventes (eh oui, elles sont pondérées dans la durée et les modifications de ces algos – régulières – ne sont pas sans attirer les foudres des auteurs/vendeurs)… et également des algorithmes pour faire varier le prix des produits qu’il propose. Mais on ne sait pas grand-chose de ces derniers et de leurs fonctionnements. Ils sont par essence les plus précieux secrets des sites de vente en ligne. On voit leur action apparaître dans les plaintes assez régulières d’utilisateurs (en 2005, en 2008…) étonnés de voir les prix d’un même produit bouger d’une connexion l’autre ou d’un compte d’utilisateur l’autre. Les algorithmes (c’est-à-dire les traitements que l’on applique aux données) sont souvent abscons aux utilisateurs. Pourtant, nous vivons entourés d’eux. Quand vous réservez une place de train, un billet d’avion, les tarifs fluctuent ainsi selon d’innombrables paramètres dont vous n’avez pas connaissance et sur lesquels vous n’avez pas prise et pour lesquels vous n’avez pas d’indications claires.
Pourtant, les utilisateurs n’aiment pas beaucoup cela, estiment de nombreuses enquêtes. Ils trouvent ces pratiques très discriminatoires. La tarification dynamique, jusqu’à présent, utilisait plutôt l’information disponible sur d’autres sites pour adapter le prix des produits à ceux de la concurrence. Désormais, à l’heure de la tarification algorithmique, tout dépend d’où vous vous connectez et pourquoi faire. L’enquête du Wall Street Journal montre ainsi que les remises sont souvent plus fortes pour ceux qui achètent depuis un terminal mobile que depuis un ordinateur par exemple…
Quels recours aurons-nous ?
A mesure que les techniques d’analyse se démocratisent, la tarification algorithmique ne va cesser de se répandre. La restitution des données à l’utilisateur que prône le mouvement MesInfos ne suffira pas à armer les utilisateurs, s’ils ne peuvent être conscients des traitements que leurs données subissent. Car nos données finalement ne sont qu’un champ d’entrée entre d’autres données, et c’est ce croisement avec d’autres corrélations qui leur donne une valeur pour celui qui les exploite. Votre code postal n’a de valeur que parce qu’il est augmenté de données sur les revenus moyens des communes qu’il recouvre et d’un classement entre toutes ces communes.
Face aux nouveaux outils dont se dotent les sites d’e-commerce, les clients ont besoin d’être mieux armés. Nous avons besoin, a minima, que soit précisé, quelque part, comment sont utilisées nos données et pas seulement y avoir accès. Quels critères font varier la tarification dynamique dont nous sommes l’objet. Car en fait, nos données ne sont qu’un élément de l’algorithmie qui se met en place autour d’elles. Le problème n’est pas tant la récolte des données que l’utilisation qui va en être faite.
La solution pourrait être simple, à minima. Que tous les sites d’e-commerce aient une page « Tarification algorithmique » qui expliquerait les critères pris en compte. Google News publie par exemple la liste des facteurs pris en compte pour le classement des actualités. L’EdgeRank de Facebook, malgré sa complexité, publie à minima les critères qui sont censés faire afficher l’information qui nous parvient. Demain, les sites de commerce en ligne doivent-ils nous prévenir des critères modifient leurs tarifs ? Les sites de rencontres doivent-ils nous dire plus clairement selon quels facteurs ils accomplissent leurs appariements ? Entre dévoiler l’algorithme mis au point et expliciter au moins les critères mis en place, il y a certainement un espace pédagogique a habiter.
Comme l’expliquait Alexis Madrigal traduit par Xavier de la Porte, il n’y a pas que les données qui sont importantes pour comprendre les systèmes techniques qui nous entourent : les traitements qu’elles subissent sont certainement encore plus important. Plus qu’une bulle de données que dénonçait Eli Pariser, nous vivons désormais dans l’ombre des traitements. Et nous aurons de plus en plus besoin d’outils qui vont nous permettre de voir plus clair dans les traitements dont nous sommes la cible. Peut-on ainsi imaginer, sur le modèle de Collusion de Mozilla, ce logiciel qui nous permet d’observer le traçage publicitaire dont nous sommes l’objet, un logiciel qui nous permette demain de vérifier les prix d’un produit de n’importe quel site d’e-commerce depuis une autre IP que la nôtre ou d’autres caractéristiques d’utilisateurs afin d’échapper ou de mieux prendre conscience du ciblage publicitaire personnalisé dont nous sommes l’objet. Assurément, il y a certainement là de l’outillage de consommateur à imaginer !
Hubert Guillaud
0 commentaires
» il y a certainement là de l’outillage de consommateur à imaginer ! »
Dans le cadre bien connu de la lutte du pot de terre contre le pot de fer, du poulet libre dans un poulailler ouvert à la liberté des poulets(*) et des renards, sans doute
(*)sauf s’ils envisagent de migrer de poulailler à poulailler (encore pour l’instant) un peu mieux chauffé, bien entendu…
En discutant avec plusieurs personnes suite à la publication de ce billet, on voit bien que la question des algorithmes ne concerne pas que les sites de commerce en ligne. Quand un algorithme détermine les articles de presse auxquels vous accédez, les utilisateurs aussi devrait pouvoir être au courant ou avoir un espace pour comprendre comment se détermine une Une ou des recommandations. L’invisibilité des traitements nécessite en tout cas des explications aux utilisateurs. Elles ne peuvent pas être invisibles par nature. C’est aussi une question de confiance.
Sur Twitter, Guillaume Champeau de Numerama suggère une autre option : faut-il interdire la discrimination tarifaire ?…
Etudiant, je travallais dans un hotel. Les prix étaient affichés, mais nous avions la possibilité d’ajuster dans une fourchette de 40%. Si certains critères étaient des classiques compréhensibles, d’autres variations étaient totalements opaques. Comment le client aurrait il pu être au courant des prix pratiqués sur d’autres. Je sais que c’est différent du traitement automatique mais la base n’est elle déja pas en place.
En commentaire à la republication de cet article sur notre blog hébergé par LeMonde.fr, un participant suggère une autre idée : un système qui modifie la localisation de son IP pour trouver automatiquement le prix le plus bas sur un site.
Rafaele Rivais pour SOSConso détaille également le fonctionnement de l’IP tracking qui consiste à augmenter le prix d’un produit automatiquement à chaque fois que votre IP se reconnecte à un site pour déclencher l’achat rapidement.
La député socialiste européenne Françoise Castex demande l’ouverture d’une enquête sur l’”IP tracking” utilisé par les opérateurs européens de transport.