Cartographier l’usine algorithmique de Facebook

Cartographier la boîte noire du plus grand réseau du monde, tel est l’ambition du collectif de recherche Serbe Share Labs. Avec 1,6 milliard d’utilisateurs actifs, Facebook se dirige vers l’accomplissement de leur mission sociale : connecter chaque personne sur cette planète pour rendre le monde plus ouvert. Mais si FB rend ses utilisateurs plus transparents, l’entreprise, elle, est loin d’être ouverte et transparente sur son fonctionnement. Sur FB, des algorithmes décident quels contenus feront partie de votre réalité et quels contenus seront censurés ou supprimés. Pour les animateurs de Share Labs, Facebook est une usine qui engendre de nouvelles formes d’exploitation, de nouveaux mécanismes de manipulation… pour faire suite aux réflexions de Trebor Scholz et Laura Liu sur le Digital Labor. Le travail que nous accomplissons sur FB (l’équivalent de 300 millions d’heures de travail gratuites par jour) ne produit pas tant des textes, des images ou des vidéos, que des analyses, des schémas, des modèles et des profils, expliquent-ils dans la première partie de leur enquête. Les utilisateurs travaillent en permanence au réglage de leur propre ciblage marketing.

L’un des fondements de l’Empire FB est la collecte de données qui repose sur ce que vous y versez et les interactions que vous y accomplissez, c’est-à-dire votre comportement… ainsi que sur les informations de profil, plus statiques. Mais FB collectionne aussi vos empreintes numériques, c’est-à-dire vos modalités de connexions et les outils que vous utilisez pour cela et bien sûr les cookies permettant de tracer les sites où nous surfons. Cette collecte peut devenir très intrusive : localisation, identité de vos contacts, contenus de vos messages, journal d’appel, enregistrement audio… Et encore faut-il ajouter à ce constat les entreprises détenues et exploitées par FB comme Facebook Payments, Instagram, WhatsApp, Oculus… qui visent à approfondir toujours plus loin la capture de données des utilisateurs. Sans compter que depuis 2013, FB a lancé des partenariats d’échanges de données avec Acxiom, Datalogix ou Epsilon… pour ne citer que les plus importants spécialistes de la capture et de l’analyse de données pour le marketing.

Les chercheurs du Share Labs ont utilisé une base de données des brevets accessibles au public déposés par FB pour tenter de comprendre l’objectif de l’analyse de données qu’opère FB, via le graphe social, qui relie chaque utilisateur et objet aux autres. D’après les brevets de FB, les chercheurs estiment qu’il y a 3 bases de données qui alimentent le graphe social de FB : la base de données des actions des utilisateurs, celle des contenus, et l’edge store, qui stocke les informations décrivant les connexions entre les utilisateurs et les objets, décrivant des scores d’affinités avec les objets avec les lesquels nous interagissons. Enfin, chaque utilisateur est associé à un profil qui permet de l’identifier en dehors de FB comme à l’intérieur et de créer des appariements entre utlisateurs.

Le ciblage en fonction des contenus utilise un moteur qui identifie les sujets de ce contenu et des mots clefs qui y sont associés. Le profilage des utilisateurs les regroupe selon des attributs. La seconde partie de l’enquête tente ainsi d’expliquer le fonctionnement de plusieurs algorithmes de FB, comme celui qui gère les événements ou celui qui rapproche les utilisateurs selon leur géolocalisation, ou celui qui tente de déterminer les revenus de l’utilisateur pour le mettre dans les catégories marketing adaptées.

Dans la 3e et dernière partie de l’enquête, les chercheurs rappellent l’étude de Herman et Chomsky, sur la fabrique du consentement, qui montrait que les médias ne produisaient pas tant des journaux qu’un public pour la publicité. Sur les médias sociaux, le travail algorithmique produit une multitude de publics pour la publicité.

Il existe 3 principales options de ciblage estiment les chercheurs : le profilage de l’utilisateur sur la base d’informations de base (localisation, âge, sexe, langue…), le ciblage détaillé (basé sur la démographie, les intérêts, le comportement) et celui basé sur les connexions (aux applications, aux pages ou aux événements). Le chiffre d’affaires de FB (17,93 milliards en 2015) dépend directement de la qualité du profilage des utilisateurs. Plus le profilage est précis, meilleurs sont les produits offerts aux annonceurs. « Le produit final de l’économie de la surveillance de FB est un aperçu en profondeur de vos intérêts et comportements, une connaissance exacte de qui vous êtes vraiment et une capacité à prédire la façon dont vous allez vous comporter à l’avenir, le tout emballé dans des profils d’utilisateurs distincts. » Entre autres catégories, FB propose ainsi un ciblage basé sur l’affinité ethnique en utilisant l’analyse des relations sociales des utilisateurs… FB propose également de cibler des publicités selon l’engagement de vos relations dans certains sujets. FB cible également ses utilisateurs sur la base de leurs opinions politiques et sur leur capacité à s’investir dans ces sujets. Il est capable également de cibler les utilisateurs qui voyagent ou se déplacent. FB déduit également votre niveau de revenu depuis les informations que vous laissez sur les postes que vous avez occupés ou que vous occupez, les relations familiales, le statut marital, les sites web que vous visitez ou les achats que vous faites en ligne…

facebookfactory-small

Cette tentative de cartographie de FB se révèle bien sûr complexe et imparfaite. Et l’on peut se demander si les cartes que tentent de dessiner ce collectif de chercheurs produisent une quelconque lisibilité de la complexité algorithmique de FB, et ce d’autant plus que, comme ils le disent eux-mêmes, l’Empire de FB change sans cesse. La base de brevets depuis laquelle ils ont travaillé n’est accessible au public que deux ans après que les brevets aient été soumis aux organismes de protection… Et 2 ans dans le monde des algorithmes correspond à des siècles. Même à l’intérieur de FB, il est probable que personne ne dispose d’une carte complète de tous les processus algorithmiques qui s’y produisent. Cette cartographie se veut un plaidoyer, un outil éducatif, pour tenter de nous aider à comprendre les calculs dont nous sommes l’objet. L’effort est plus que louable, mais il n’est pas sûr qu’il y parvienne.

À lire aussi sur internetactu.net