Données publiques ouvertes : comment faire ?

Les données publiques s’annoncent comme une nouvelle ressource pour l’innovation et la participation. L’information publique est une source majeure de nouveaux services, de création de valeur, de production de connaissance et de participation citoyenne. Mais qu’est-ce que l’ouverture de données publique transforme ? Telle était la question que posait la seconde édition de Lift France à quelques-uns des spécialistes de la question.

Des données ouvertes pour la liberté

“La Bible était une arme de guerre, un outil pour la guerre. 400 ans plus tard, la traduction est encore une propriété de la Couronne, et si je veux republier l’une des premières Bibles anglaises, il me faut demander l’autorisation à la Reine ». Reporter free-lance, Michael Cross découvrit un jour que le gouvernement britannique se retrouvait ainsi à devoir payer très cher des données publiques contrôlées par des agences… publiques (en charge de la météorologie ou de la géographie notamment).

Pire : le gouvernement se retrouvait également à devoir payer des frais d’avocat et des amendes parce que certaines de ces agences publiques lui reprochaient une violation des conditions d’utilisation des licences propriétaires appliquées à des données publiques. Une étude de Rufus Pollack estima que l’économie britannique gagnerait 200 millions de livres par an, en frais de licences et de justice, si le gouvernement avait le droit d’utiliser des données publiques.

De la naquit la campagne “Rendez-nous les joyaux de la Couronne” (voir aussi le site dédié, Free our data), lancée en 2006 par le journal le Guardian, qui décida de publier au moins un article par semaine sur les problèmes d’accès et de réutilisation des données publiques jusqu’à ce que le gouvernement fasse évoluer le droit, et les pratiques :

« Cette idée du contrôle de l’information, du secret, de la censure, est une tradition très ancienne et fait partie de l’ADN des gouvernements. L’échange des informations est un business. Avant ça ne portait pas à conséquence, mais aujourd’hui, ça conduit à des restrictions et à ce genre de situations absurdes et scandaleuses où des agences publiques font du business anticoncurrentiel et crée des obstacles au sein même du gouvernement. »

Michael Cross explique ainsi que, pour le recensement, l’administration n’a pas le droit de réutiliser la base de données (publiques) des codes postaux, et qu’elle va devoir dépenser 11 millions de livres sterling pour créer une nouvelle base… avant de devoir la détruire, en vertu des conditions d’utilisation des licences privatives en vigueur dans l’agence britannique chargée des données géographiques. De même, s’il est possible de consulter la base de données des circonscriptions électorales, il est interdit de l’exploiter, tout comme celle des lieux susceptibles d’être inondés.

L’initiative du Guardian a intéressé nombre d’universitaires, eux aussi bloqués dans leurs travaux de recherche à cause de ce genre de limitations, explique encore Michael Cross. De son côté, la société de géographie lança quant à elle une campagne médiatique pour la discréditer. « Mais peu à peu, l’opinion s’est mobilisée », témoigne Michael Cross. Une étude a condamné les pratiques de l’agence de géographie, qui a donc commencé à partager certaines de ses données. Le maire de Londres s’est engagé à ouvrir les données publiques londoniennes. L’opposition au gouvernement en a fait un cheval de bataille. Le parti au pouvoir a dû lui aussi, lors de la dernière campagne électorale, plaider pour davantage de transparence et de droit d’accès et de réutilisation des données publiques.

En quatre ans, la situation a considérablement évolué. Et si certaines agences refusent toujours de partager “leurs” joyaux de la Couronne, le mouvement est lancé. « On a gagné », clame Michael Cross : “On est passé de l’ère de la Bible du Roi à un principe de libertés ». Même si, comme il le reconnaissait dans un tchat au Monde.fr : « les données publiques doivent pouvoir être réutilisées aussi de manière commerciale, même par des entreprises que nous n’aimons pas, et pour des buts que nous n’approuvons pas. »

Des données ouvertes pour collaborer

Dans une ville, il existe de nombreux silos de données produits par de manière propriétaire par des sociétés variées, explique Jarmo Eskelinen, président du Forum Virium à Helsinki, une société de R&D qui appartient à la Ville d’Helsinki et à 16 entreprises et PME dont l’objet est de faire du financement de la recherche pour aider le secteur public a travailler avec le secteur privé pour mettre au point de nouveaux services. « Les autorités de transport produisent des informations de transports, les autorités de l’environnement produisent des données environnementales ou des données météorologiques… Mais ces spécialistes sont souvent des amateurs en matière de données, parce que ce qu’ils savent faire, c’est de l’information. Bien souvent, ils ne voient pas la différence entre l’information et les données. L’information, ce sont des données transformées en produit et auquel on a accès d’une seule manière : celle dont le public consomme les données. Mais les données ouvertes ce n’est pas cela. Avec les données ouvertes, on veut accéder à la source originelle des données et qu’elles soient libres de réutilisation. »

jarmoeskelinen
Image : Jarmo Eskelinen sur la scène de Lift Marseille, photographié par Benjamin Boccas.

« Nous voulons des données brutes et nous voulons des données maintenant », clamait Tim Berners Lee à TED 2009. C’est-à-dire, explique Jarmo Eskelinen, il faut que les données soient ouvertes et liées à d’autres sources de données intelligemment, car c’est dans leur relation que les données seront intelligentes.

L’Europe a estimé la valeur des services d’information en Europe à 27 milliards d’euros. Mais Cap Gemini a estimé que la mauvaise qualité des échanges d’information entre les entreprises et les institutions coûtaient 46 milliards d’euros par an. Et ce constat est particulièrement vrai dans le secteur public où les agences travaillent difficilement entre elles ; et ce constat est particulièrement vrai dans ce continent très subdivisé où les données sont particulièrement éparpillées. « Or si vous décidez d’utiliser les données, il faut collaborer », souligne Jarmo Eskelinen. « C’est le produit secondaire de l’ouverture des données, mais pas le moindre. » Il faut se mettre d’accord sur les formats, harmoniser les plates-formes. Et cela ne peut être que bénéficiaire aux institutions comme aux entreprises…

C’est ce qu’est en train d’accomplir le programme Helsinki Region Infoshare, un programme de partage de données au niveau régional. Pour les partager, le programme a d’abord cartographié les informations géospatiales de la ville pour s’apercevoir qu’il existait une centaine de Systèmes d’informations géographiques différents à Helsinki, preuve qu’on peut largement optimiser les ressources et que l’absence de coopération est une vraie gabegie.

Sur le modèle d’Apps for Democracy, ce concours de développement d’applications à partir d’une libération de bases de données (à Helsinki, Jarmo Eskelinen a libéré 200 bases de données (contre plus 3000 aux Etats-Unis), le Forum Virium a lancé une première édition d’un concours du même genre (Apps for Finland). L’avantage est de permettre d’obtenir des applications peu chères et souvent originales. Le site Palvelukartta dresse la carte des services publics de la ville d’Helsinki : c’est devenu le meilleur annuaire de la ville, qui permet à la fois de voir les carences des services publics sur certains quartiers et aux services de mieux communiquer entre eux en disposant enfin d’un annuaire fiable.

La transparence est la justification essentielle de l’ouverture des données, estime Jarmo Eskelinen. Par exemple, ils ont développé un arbre fiscal permettant de visualiser où va l’argent des impôts et d’accéder via cet arbre interactif jusqu’aux services de la ville concernés, jusqu’aux agents responsables de ces budgets. « La visualisation est l’un des points clefs pour montrer la valeur des données, souligne Jarmo Eskelinen, « celle-ci est bien souvent abstraite et ne devient concrète que grâce à la visualisation.

Reste que le passage aux données ouvertes n’est pas si simple, rappelle Jarmo Eskelinen. « Pour faire bouger les choses, il faut un mandat, c’est-à-dire qu’il faut être l’autorité en charge de cela. Il faut aussi faire bouger l’état d’esprit des gens qui se sentent souvent menacés quand on parle de données ouvertes. Dans notre monde, l’information est le pouvoir : on veut en garder le contrôle. Il faut être diplomate pour trouver de manière structurée le bon chemin pour libérer des données. »

Faire apparaître des répertoires, des catalogues de données est utile pour créer du mouvement entre les services et montrer les bonnes pratiques. Mais surtout, il faut de la méthode, c’est-à-dire utiliser une boite à outils, explique Jarmo Eskelinen. « A Helsinki, on a mis en place un catalogue de données bien sûr, mais pas seulement. Nous avons créé une “chambre de compensation centrale” pour aider les détenteurs de données à améliorer leurs données, à les publier, à créer des API (interfaces de programmation), et leur proposer des interfaces simples qu’ils peuvent utiliser… La chambre accepte et valide les catalogues et les distribue. » En ce sens le Forum Virium est une plate-forme commune, qui permet à chacun de publier ses données dans des formats et avec des outils qui permettent à tous d’en profiter. En 2012, Helsinki sera la capitale mondiale du design, et l’équipe espère lancer d’ici cette date, via cette plate-forme, un “Open Helsinki”, un « Helsinki ouvert », avec toute l’ambition que recouvre cette généralisation du processus.

« Quand on travaille avec des administrations, les craintes et les défis sont nombreux. Il faut montrer le coût d’une sous-optimisation par rapport au bénéfice du partage des données. Il faut aussi adopter une approche progressive, étape par étape, en apportant un appui technique aux multiples partenaires. Enfin, il faut montrer la valeur des applications créées. Il faut également gérer les questions de licence et de responsabilité. Il faut construire des API ouvertes que chacun puisse utiliser et, tout le long du processus, garder les choses simples.

Pour y arriver, il faut laisser les gens faire les liens, ouvrir les jeux de données et surtout ne pas chercher à protéger l’information derrière les enclos de la propriété intellectuelle. Nous avons plus à gagner à ouvrir et à collaborer. »

Des données ouvertes pour de nouvelles offres de services

La ville de Rennes a pris récemment la courageuse décision d’ouvrir ses données au public, afin de promouvoir une offre de service qui soit hyperlocale et dense.

Il y a beaucoup de données dans l’administration, explique Hugues Aubin, chargé de mission TIC de la ville de Rennes. Mais elles restent séparées dans des systèmes isolés, stockées dans des formats propriétaires et utilisées par des logiciels tout aussi fermés. Et ce d’autant que ces données sont le plus souvent concentrées entre les mains de petits services super-spécialisés et sectorisés. Enfin, de nombreux services perçoivent des redevances en échange d’informations.

huguesaubin
Image : Hugues Aubin dans les couloirs de Lift France, photographié par Benjamin Boccas.

Il n’est pas si simple dans ce contexte d’ouvrir les données et de les rendre gratuites et librement échangeables.

Si on compare tous ces flux de données à des ruisseaux, le défi consiste à créer un “lac”, un écosystème actualisé en permanence autour duquel se développera une multitude de “jardins”, de petits services, comme l’illustre la présentation d’Hugues Aubin.

En ouvrant ses données, la ville de Rennes poursuit plusieurs objectifs :

  • Valoriser les données publiques. Certes une partie de ces informations sont accessibles, mais leur potentiel n’est pas révélé tant que les données brutes ne sont pas disponibles.
  • Susciter une floraison de services et d’usages.
  • Développer l’image d’un territoire innovant.
  • Dynamiser un tissu local d’innovateurs.
  • Développer la citoyenneté par la transparence des données publiques.

Et très modestement, Hugues Aubin évoque ses premiers retours d’expérience liée à l’ouverture des données de transport de Rennes Métropole. Une petite startup nommée In-Cité a créé une API pour accéder aux données sur les stations de vélo via une simple URL. On peut y connaitre les vélos disponibles en temps réel, les possibilités de paiements…

Deux mois plus tard, 11 applications mobiles avaient vu le jour. Elles ne concernent pas uniquement le prêt de vélos, mais mélangent diverses données (par exemple, elles affichent les dispositions combinées des vélos et des taxis).

Par exemple, il existe une infovisualisation sur la fréquence des prêts de vélos qui permet de découvrir que certaines stations marchent tandis que d’autres sont mal placées.

La ville s’apprête à lancer un concours pour favoriser le développement d’applications autour de ces données. Un concours portant certains critères de mise en oeuvre, comme l’accessibilité au plus grand nombre.

Il reste évidemment bien des tâches à accomplir, explique Hugue Aubin. Câbler et recenser d’autres sources de données publiques, offrir des outils pour créer des services y comprit pour des non-développeurs afin de permettre à de simples habitants de traiter les infos et les afficher sur leurs blogs,… Il ne faut pas non plus négliger de développer des liens autour du sujet, d’organiser des ateliers avec les utilisateurs et les développeurs, etc.

Cependant, il existe encore plusieurs freins à lever, estime le chargé de mission de la ville de Rennes. Au niveau juridique, il faudra réfléchir à la bonne licence à employer. Sur le plan financier, il ne faut pas oublier que la vente ou la location de certaines de ces données s’avère rentable. Mais en réalité, seuls 10 % d’entre elles font l’objet d’un commerce. Il devrait donc être possible de libérer sans trop de contestation les 90 % restants… Enfin, il faut encore réussir à lever le frein culturel. L’idée d’ouvrir complètement les systèmes constitue une énorme rupture par rapport aux habitudes. Mais on constate que bien souvent, rencontrer physiquement les divers responsables de services et discuter avec eux permet d’aplanir bien des difficultés. Comme le disait Jarmo Eskelinen, l’avantage du levier de l’ouverture des données est certainement de permettre de réintroduire de la discussion et de la coopération entre les services. C’est visiblement un levier qu’Hugues Aubin utilise.

Jean-Marc Manach, Hubert Guillaud et Rémi Sussan

Mise à jour du 15 juillet 2010 : Intéressante interview vidéo des trois conférenciers.

À lire aussi sur internetactu.net