Taxonomie des données sociales

Pour mieux répondre aux nombreuses questions que posent la vie privée des utilisateurs à l’heure des sites sociaux, le spécialiste de la sécurité, Bruce Schneier a tenté de construire une intéressante Taxonomie des données, car ce qu’on appelle données dans le monde des sites sociaux recouvre plusieurs réalités différentes (voir notre dossier Critique du Web²). Il distingue ainsi :

  • Des « données de services » : les données que vous confiez à un site social afin de l’utiliser. Ces données peuvent inclure votre nom légal, votre âge voir le numéro de votre carte de crédit.
  • Les « données divulguées », c’est-à-dire celles que l’utilisateur publie sur ses pages : billets de blogs, photographies, messages, commentaires.
  • Les « données confiées », c’est-à-dire celles que l’utilisateur publie sur les pages des autres. Ce sont le même type de données que les données divulguées, à la différence qu’une fois qu’elles sont postées, quelqu’un d’autre en a le contrôle.
  • Les « données fortuites » sont celles que d’autres personnes publient à votre propos.
  • Les « données comportementales » sont celles que le site recueille sur vous en surveillant ce que vous faites et avec qui vous le faites. Il peut s’agir de jeux auxquels vous jouez, des sujets sur lesquels vous écrivez, des articles auxquels vous accédez (et qui permettent de prévoir votre appartenance politique).
  • Les « données dérivées » sont des données concernant l’utilisateur issu de toutes les autres données. Par exemple, si 80 % de vos amis s’auto-identifient comme gays, vous êtes susceptibles d’être gay à votre tour.

dataflow
Image : exemple de flux de données dans les médias sociaux par Anne Helmond.

Comme l’explique encore Bruce Schneier, il y a d’autres façons d’analyser les données des utilisateurs. Il y a celles qu’on donne au site en toute confiance, en attendant du service qu’il les sauvegarde. Celles qu’on publie ouvertement et celles que d’autres utilisent pour vous trouver. Celles que l’utilisateur ne partage qu’avec un petit nombre de proches. Sans compter que le site social peut toutes les monétiser, notamment en vendant de la publicité ciblée par exemple.

Bien sûr, les nombreux sites de réseaux sociaux donnent aux utilisateurs différents droits pour gérer chaque type de données (souvent notamment des paramètres de contrôle sur les données selon la relation qu’on établit avec les gens : mais toute la difficulté consiste alors pour l’utilisateur à parvenir à catégoriser correctement ces relations). Mais les droits sur les données confiées, les données fortuites, voire les données comportementales sont souvent bien moins clairs pour l’utilisateur, rappelle le chercheur.

Comme le rappelait danah boyd dans la Technology Review : « la façon dont la vie privée est encodée dans le logiciel ne se recoupe avec la façon dont nous la traitons dans la vie réelle ». Dans le monde des ordinateurs, la vie privée est souvent gérée via des contrôles d’accès. Or, elle n’a rien à voir avec une gestion des accès. La gestion de la vie privée consiste à comprendre un contexte social, faire sens de la façon dont nos informations circulent auprès d’autres, en les partageant de manière négociée. Pour que les médias sociaux deviennent plus matures, explique la chercheuse, il faudra d’abord repenser la façon dont on encode la vie privée dans ces systèmes.

À lire aussi sur internetactu.net