Les enjeux de l’extension de l’Open Data au monde de l’entreprise

« Ainsi donc, nous souhaitons étendre le nombre et la diversité des données réutilisables. Mais pourquoi, en fait ? Pourquoi, en particulier, les entreprises contribueraient-elles à l’Open Data ? » C’est avec cette question que Daniel Kaplan, délégué général de la Fondation internet nouvelle génération, entamait son intervention de synthèse de la session sur l’Open Data appliquée au monde de l’entreprise pendant la semaine européenne de la réutilisation des données publiques qui se tenait à Nantes du 21 au 26 mai 2012. « Certes, beaucoup d’entreprises veulent agir en bons citoyens, mais cette motivation ne peut pas leur suffire… »

Nous n’avons jamais pris les données au sérieux

« Nous n’avons jamais pris les données au sérieux et aujourd’hui, elles se vengent », estime Daniel Kaplan.

Les données sont pour la plupart des constructions ad hoc visant à remplir les variables des programmes, explique-t-il. Elles sont strictement définies en fonction des objectifs du programme. Comme les programmes sont souvent conçus comme s’ils étaient uniques au monde, leurs données se retrouvent souvent dupliquées, sous des formes diverses, un peu partout dans les systèmes d’information des organisations. Et l’on ne se préoccupe guère d’en limiter le nombre : « pourquoi chercher à réduire l’effort nécessaire à la collecte et au traitement des données s’il n’existe pas d’autre programme que le mien ? » Plus souvent qu’on ne le pense, elles sont aussi très mal entretenues et ont tendance à survivre à leur pertinence et à leur utilité, conservées ad vitam ad aeternam…

dkaplanfingodwnantes
Image : Daniel Kaplan sur la scène de l’Open Data Week, photographié par Mathieu Drouet pour la Fing.

Mais à l’heure de l’innovation ouverte, la plupart des chaînes de valeur et des modèles de services associent de multiples organisations. Le web ne relie plus seulement des pages, mais des services, des applications et des données. Du côté des utilisateurs, les « entrepôts de données personnels » et la « gestion de la relation commerçant » (VRM) modifient également la dynamique d’interaction : les sociétés ne sont plus les seules à utiliser des systèmes d’informations, leurs clients disposent également des leurs.

Ce Nouveau Monde relie d’une manière souple les organisations, les projets, les services et les applications autour de données et de services (au sens de « web services »). Pour fonctionner, il a besoin de données fiables, cohérentes, précisément décrites, liées, accessibles (dans des conditions claires) et peu coûteuses. Les systèmes sont appelés à collaborer de plus en plus entre eux et c’est là que se nicheront à l’avenir le progrès, la croissance, les échanges, estime Daniel Kaplan.

L’ouverture banalisée

« Par conséquent, faire en sorte que la plupart des données soient en quelque sorte « ouvertes » sera bientôt une décision ordinaire pour les entreprises. »

A l’avenir, les systèmes d’informations sépareront vraiment les données des process – ce que les méthodes de conception proclament depuis des années, avec des résultats décevants. Les données existeront dans des serveurs et des entrepôts, avec des mécanismes et règles d’accès lisibles et claires, comme c’est déjà le cas avec les interfaces de programmation (API). « L’ouverture des données ne relèvera pas de décisions binaires (ouvrir ou fermer), mais plutôt d’un réglage fin des degrés d’ouverture et d’autorisations d’accès : à d’autres entités de l’organisation ? A ses partenaires habituels ? A son « écosystème » étendu ? A tout le monde, de manière gratuite ou payante ?… »

A l’avenir, les entreprises devront constamment accéder à des données externes, en particulier aux entrepôts de données de leurs clients, fournisseurs et utilisateurs. Pour mériter l’accès, il faudra qu’il soit réciproque et que l’usage des données respecte les règles définies par leur source, comme l’expliquait très bien Alan Mitchell : « l’enjeu est de responsabiliser l’entreprise sur les données qui lui sont confiées, selon les conditions définies par l’utilisateur ».

Dans ce contexte, la question de la transparence ne sera pas la motivation principale à l’ouverture des données, estime Daniel Kaplan. La responsabilité sociale de l’entreprise fera certes partie intégrante des motivations, mais elle jouera comme d’habitude un rôle secondaire. « Le partage des données sera la façon normale de travailler. Parce que l’alternative serait tout simplement trop stupide et inefficace. »

Les enjeux des données d’entreprise ouvertes

La vraie question n’est donc pas de savoir si les entreprises ouvriront leurs données. Elles les ouvriront. Ni de savoir si elles vont vendre leurs données. Elles ne les vendront pas la plupart du temps, parce que « l’information veut être libre et gratuite » comme le clamait Steward Brand dès 1987 et parce que « leur valeur commerciale réside dans ses usages et non pas dans leur existence brute ».

Il ne s’agit donc pas de savoir si l’on va ouvrir les données, mais comment et à quel niveau. C’est là que se situent les enjeux insiste Daniel Kaplan en nous invitant à nous concentrer sur deux d’entre eux : la minimisation et l’autonomisation.

Minimisation
L’Open Data est souvent associé aux « Big Data », une tendance récente de l’informatique qui se propose d’explorer un Nouveau Monde de connaissances, des corrélations inédites et de prédictibilité.

Le marketing constitue le principal marché des Big Data. Il s’agit d’accumuler et de traiter un maximum d’information pour deviner ce que vont acheter les utilisateurs et à quel moment. Or dans ce domaine, la protection des données personnelle a donné naissance à une autre expression en vogue, la data minimization. Pour protéger la vie privée des consommateurs « dès la conception » des systèmes informatiques (privacy by design), on cherchera à collecter et à exploiter aussi peu d’informations personnelles que possible, et pendant la durée la plus courte possible.

Certes, la plupart des données « ouvertes » ne sont pas nominatives. Mais il y a nombre d’exemples où l’agrégation de données disparates et anonymes fournit d’assez bonnes informations sur les situations et comportements individuels. Dans le monde des Big Data, la plupart des données peuvent devenir personnelles.

« En ce sens, la minimisation ne revêt pas seulement une signification éthique. Elle a également un sens économique et commercial : moins d’informations inutiles à gérer, moins de risques d’erreur, plus de confiance. Moins vous cherchez à en savoir sur vos clients, plus il vous est facile de répondre à leur demande de transparence. »

« Mais il y a encore une autre raison pour minimiser les données, autrement dit, de réfléchir sérieusement à celles dont vous avez besoin pour accomplir une tâche donnée. Les données sont des constructions. Elles sont créées par des personnes, des machines et des interfaces particulières, dans des buts, des contextes et des faisceaux de contraintes spécifiques. En les réutilisant sans autre forme de procès, dans d’autres contextes, nous risquons de nous faire des illusions sur le caractère mesurable et intelligible de la réalité. » Le risque est par exemple d’automatiser trop de décisions ou de relations, comme l’explique très bien Helen Nissenbaum.

« La tension entre les données ouvertes et la minimisation est productive. Elle nous aide à penser. Elle ne doit pas nous empêcher de partager des données, mais nous aider à garder à l’esprit que ce n’est pas parce que les données deviennent toujours plus ouvertes et réutilisables que nous devrions tout transformer en données. »

Autonomisation
« A qui l’ouverture confère-t-il du pouvoir, des nouvelles capacités ? », interroge Daniel Kaplan. « Nous aimerions croire qu’il s’agit de tout le monde. Mais ça ne se passera pas comme ça, sauf si nous le voulons vraiment. »
Initialement, ouvrir quelque chose sert souvent à donner du pouvoir à ceux qui en ont déjà (empower the empowered) : ceux qui disposent des moyens et du savoir-faire, ceux qui savaient que cela allait se passer et qui ont planifié en conséquence… A titre d’exemple, plusieurs études sur la libération des données de la propriété foncière et le prix des logements ont montré qu’elles ont d’abord été utilisées par des professionnels, que ce soit pour expulser les pauvres des terres qu’ils occupaient de manière informelle au Bangladesh, ou pour repérer des New-Yorkais qui ne payaient pas les loyers maximaux qui pouvaient être espérés dans leurs quartiers.

L’ouverture permet ensuite à de nouveaux acteurs dominants d’émerger, parce qu’ils savent mieux que d’autres exploiter cette ressource nouvelle.

« Si nous ne pouvions espérer que cela de l’ouverture des données, alors il faudrait en remettre en cause son existence même », insiste Daniel Kaplan. « La raison d’être de l’Open Data est de générer autant d’interprétations et d’usages féconds que possible (ce qui signifie qu’il en faut aussi beaucoup de stériles) ; de faire des gens des contributeurs à la production des données elles-mêmes, y compris celles des entreprises ; de créer un terreau fertile pour toutes sortes d’interactions, de discussions sur des questions communes… »

« Mais si les données, mêmes ouvertes, restent inaccessibles et mystérieuses à la plupart des gens, nous ne bénéficierons pas de l’innovation, de la contribution, de la proximité, de la qualité du débat que nous attendons de cette libération des données », insiste Daniel Kaplan. Cela signifie que nous avons besoin d’être actifs dans la création de plateformes, d’outils, de lieux dans lesquels l’existence et la signification des données ouvertes deviennent visibles et qui aident les gens à les utiliser. Nous devons créer une culture des données entre tous les types d’acteurs, entre tous les partenaires de la chaîne de valeur : que ce soit les organismes publics, les PME, les médias, les ONG, les groupes de consommateurs… Nous avons besoin de médiateurs et d’activistes des données à l’intérieur comme à l’extérieur de nos organisations, comme nous y invite le concept – émergent – d’Info Labs. « L’innovation ouverte a besoin d’innovateurs et par conséquent, d’un écosystème qui permette aux acteurs, du plus puissant au plus petit, de se rencontrer. L’Open Data a exactement les mêmes besoins parce qu’il est de même nature. »

Hubert Guillaud

Disclamer : Daniel Kaplan est délégué général de la Fing, éditeur d’InternetActu.net.

Retrouvez notre dossier réalisé à l’occasion de la semaine européenne de l’Open Data :

À lire aussi sur internetactu.net

0 commentaires

  1. OpenData appliqué au monde de l’entreprise ? Appliqué au domaine publique l’utilité n’est pas à démontré, par contre pour faire partager des données privées avec le monde via Internet, nous ne sommes pas encore mûrs, quel intérêt de partager ses propres chiffres, issus et liés directement ou indirectement au monde de l’entreprise ?

  2. Exemple simple : obtenir les horaires et arrêts de l’ensemble des compagnies de bus et cars privés en france avec des données ouvertes pour les croiser avec celles de la SNCF, etc. et créer ainsi des solutions standards pour aider les utilisateurs pour voyager comme il faut dans toute la france et estimer au mieux du coup leurs déplacements. Voilà des données non publiques qu’il faudrait ouvrir avec un contexte mutualisé !