L’avenir de la réutilisation des données publiques

En préfiguration de Lift avait lieu l’Open Data Garage, une journée d’ateliers et de conférences qui a permis de faire le point sur les initiatives open data françaises. Retour sur cette journée via ses contributions les plus éclairantes.

« Trop souvent, le savoir c’est le pouvoir et les élus pensent que le pouvoir ne se partage pas », estime Christophe Castaner, vice-président de la région PACA et maire de Forcalquier en introduction de cette journée. « Il est important de porter le discours politique comme quoi l’information est un droit, un service public. On sait que la libération des données publiques concourt directement à l’attractivité d’un territoire, à sa capacité d’innovation. C’est pour cela que nous devons assurer l’exemplarité et engager un chantier pour que l’institution régionale applique à elle-même ces principes. Marseille Provence 2013 s’est engagée dans le mouvement de libération des données publiques et doit faire la démonstration de ce droit », affirme vigoureusement l’élu régional. Reste qu’il n’est pas sûr que l’information publique comme droit soit ce qu’on retiendra le plus de cette journée.

Un monde de données réutilisables

Pour Charles Nepote, responsable du programme Réutilisation des données publiques de la Fing, il y a des confusions entre l’accès à l’information et la réutilisation des informations publiques. Depuis la loi de 1978, on peut demander à consulter les documents publics produits par les acteurs publics. Bien sûr, le mouvement de mise en accès de la documentation publique est lent. Mais, surtout, cet accès ne suffit pas à tirer profit des données d’une manière optimale. « Les documents ne permettent pas d’automatiser le traitement de l’information qui créé de la valeur ». Actuellement, Google est celui qui sait le mieux profiter de l’accès aux informations publiques par sa capacité d’indexation, même de données discrètes comme le montre Google Transit qui exploite l’information ouverte des transports en commun.

L’accès aux données en tout cas ne suffit pas : c’est bien de réutilisation dont il est question. « Quand on parle de données, on ne parle pas des archives, des documents. Mais de données structurées et factuelles (mesures, statistiques, descriptions, coordonnées, horaires, budgets, données en temps réel…). Des données publiques, qui touchent toutes les domaines de la vie publique, y compris des données à caractère personnelles à l’exclusion des données touchant à la vie privée.

Les données sont partout. Les capteurs se sont multipliés et se sont affinés. La puissance de traitement et de stockage les rend plus accessibles. Et cela va continuer ! Mais surtout, désormais, ces données sont produites par tous. La coproduction de données par les utilisateurs est une pratique ancienne dans le domaine de la botanique ou de l’astronomie, mais elle ne cesse de s’étendre à d’autres domaines comme la cartographie, la mesure environnementale ou citoyenne. « Les données ne viennent plus d’une seule source, d’un seul acteur, mais suivent des chemins et des agrégations de plus en plus complexes. Tant et si bien que le pouvoir est désormais chez ceux qui font circuler l’information plutôt que de la conserver. »

La réutilisation des données publiques est un droit opposable depuis 2005 en droit français (sauf en ce qui concerne les données sensibles, privées, ou celles de sécurité publique…). « La réutilisation des données publiques est une contrainte légale pour les acteurs publics : l’enjeu est de la transformer en opportunité ! » C’est tout l’enjeu du mouvement Open Data. Plusieurs dizaines de villes, d’Etats, de collectivités publiques à travers le monde se sont saisies du sujet. C’est même un sujet qui s’invite dans le débat public et qui est dans le programme des deux grands partis politiques français pour la présidentielle de 2012.

Reste à comprendre ce que ce mouvement produit : « Cela ne produit pas seulement de la transparence, de la culture, du développement économique, mais aussi de nouveaux services, de la prospective, du débat public, de la connaissance et souvent toutes ces choses à la fois », conclut Charles Népote.

Quel impact économique ?

L’une des critiques les plus récurrentes de l’ouverture des données publiques repose sur son évaluation. Or, il n’est pas si simple de montrer l’impact économique des données ouvertes au niveau local, rappelle Simon Chignard responsable de la Cantine numérique Rennaise et président de l’association rennaise Bug dans sa présentation.

Il demeure difficile d’évaluer l’impact de l’open data. Plusieurs approches ont cours. Celle consistant à évaluer le marché global de l’information publique (le « public sector information » (PSI) qui va bien au-delà du seul mouvement de réutilisation des données publiques donc). Une étude européenne l’a évalué à 27 milliards d’euros par en 2006 (.pdf). Une autre étude commandée par l’Agence du patrimoine immatériel de l’Etat (APIE) s’est intéressée à la tarification optimale (.pdf) de l’information publique. L’approche Business elle s’intéresse à comment gagner de l’argent avec de l’information publique ouverte…

Mais ces approches ne répondent pas à la nécessaire évaluation du « retour sur investissement » (ROI) local. L’un des rares chiffres dont on dispose est celui lié au concours Apps for Democracy lancé par la ville de Washington DC en 2008 qui calculait le ROI pour ce concours et l’évaluait à 4000 % ! Mais ce calcul était tout de même assez basique, explique Simon Chignard. Il consistait à regarder le nombre d’applications que le concours avait permis de développer (47), le coût que leur aurait coûté le développement individuel de chaque application (environ 37 000 dollars par application) moins le coût total du concours (50 000 dollars). « On voit bien que c’est une approche partiale et partielle qui ne reflète pas les bénéfices collectifs de l’open data local. » Cette approche ne regarde pas la redondance des applications créées, pas plus qu’elle n’évoque les réponses particulières que l’acteur public aurait identifié et favorisé dans le cadre d’un appel d’offres classique. Mais surtout, cette approche n’arrive pas à mesurer la teneur de la participation…

Rennescatalogueopendata
Image : le catalogue de données de Rennes.

Or, le retour sur investissement d’un concours, comme celui lancé par la ville de Rennes est difficile à estimer. Sur les 43 participants, un tiers seulement étaient des entreprises. Aurait-il été possible de s’ouvrir aux individus et aux associations en usant des formes traditionnelles de l’appel d’offres ? Le premier bénéfice pour Rennes Métropole estime Simon Chignard, c’est d’abord l’exploitation de données longtemps réservées à l’usage interne. C’est aussi bien sûr, les fortes retombées médias et presse. C’est enfin le dynamisme qu’inspire le numérique. « Rennes est la 3e ville de France en nombre de comptes Twitter actifs et le concours Open Data a permis de mettre la ville en connexion avec le tissu local d’innovateurs qu’il provienne d’entreprises, d’associations comme d’usagers. »

Le bénéfice a aussi été notable pour les entreprises locales. Keolis Rennes, le délégataire local de transport public, a montré sa maîtrise de l’infomibilité et s’est également connecté à un tissu d’innovateurs local en ouvrant ses données. La société NewLC a créé une application générique (EOCity), réutilisable sur d’autres territoires, qui lui sert de démonstrateur de son savoir-faire.

Enfin, il ne faut pas oublier les habitants et usagers de la ville. Car le vrai bénéfice ne repose pas sur la donnée, mais sur l’application qui en est faite. Pour les usagers, en l’occurrence, aujourd’hui, c’est plus de 60 applications locales disponibles autour d’une grande variété de thématiques. « Et surtout avec une forte incitation à l’usage de modes alternatifs aux véhicules personnels. Et c’est cela qu’il faudrait pouvoir également mesurer… »

Pour Simon Chignard, il est essentiel de regarder 3 indicateurs principaux :

  • L’utilisation des applications : nombre de téléchargements, taux d’usage réel, effet sur les transports… Suite au concours, l’application la plus téléchargée a été Transports Rennes (5000 téléchargements, alors qu’on estime le nombre de possesseurs d’iPhone à Rennes à 25 000). Ce qui montre bien que la promotion ciblée doit encore progresser.
  • Il est essentiel de standardiser au niveau régional, national, européen… pour permettre de reproduire des applications locales ailleurs et finir par leur donner un avantage compétitif…
  • L’open data est assurément un élément d’attractivité d’un territoire pour des entreprises. Reste à réussir à le transformer en succès !

Initiatives locales de l’open Data : l’essentiel c’est le dialogue !

A Rennes, explique Bernadette Kessler, responsable du service innovation numérique de la ville et de Rennes métropole, tout à commencé par le lancement d’un service de vélo en libre-service qui a incité son opérateur à ouvrir les données du service. Ensuite, tout s’est fait graduellement, même si le concours, lancé d’octobre 2010 à mars 2011, a bien sûr été un moment fort pour fédérer les initiatives.

Bernadette Kessler retient surtout de cette aventure qu’il n’y a pas d’open data sans réseau : sans les acteurs locaux, sans le réseau d’innovateurs rien n’aurait été possible. Pour autant, que ce soit pour les services de la ville, les associations, les institutions ou les entreprises partenaires, chacun devait avoir en commun de décaler son point de vue. Reste que l’open data ne fait pas tout : « Il faut pouvoir mesurer ce qu’il se passe. Une donnée brute reste une donnée brute. Il faut savoir en chercher le sens. »

Cela illustre bien les questions qui restent en suspens autour de ce programme. Celle qu’évoquait Simon Chignard, bien sûr, vient en tête : Comment évaluer ce programme (et pas seulement économiquement) ? Quels sont les coûts exacts ? Mais ce n’est pas la seule question à laquelle le programme doit répondre. Comment faire pour que l’open data soit un ferment durable de démocratie ? Qu’en est-il de l’utilité sociale de l’open data ? Peut-on sortir du cercle des geeks pour parler à des gens plus éloignés de la technique ? Enfin, il faut également se poser la question du rapport entre l’open data et la mission de service public. « Si l’ouverture des données c’est se débarrasser de l’évaluation et du repositionnement de nos missions, alors nous aurons raté quelque chose ! Lors du lancement du concours par exemple, nous avons insisté pour que les questions d’accessibilité soient présentes. » Et cette question est importante, insiste Bernadette Kessler. Désormais, dans les appels d’offres de la ville, les données sont en open source et ni la ville ni les prestataires n’ont à payer pour les réutiliser.

Reste que la ville reconnait manquer de données coproduites. La ville de Rennes va lancer une étude sur les piétons en demandant aux gens de documenter leurs cheminements par GPS.

Faire les choses avec les gens, c’est ce que fait Libertic à Nantes. Libertic est une association de promotion de l’ouverture des données publiques. Depuis 2010, l’association fait des interventions pour présenter le principe et valoriser les données locales produites. En décembre 2010, elle a été à l’origine d’une lettre ouverte aux élus locaux… à la suite de laquelle le député-maire s’est engagé dans un programme d’ouverture des données. Mais Libertic a demandé à ce que cette ouverture soit participative, afin qu’elle se fasse avec les acteurs qui sont déjà moteurs du mouvement. La ville a joué le jeu. La plateforme de données ouvertes de la ville de Nantes devrait ouvrir d’ici novembre 2011.

Claire Gallon qui représente l’association, insiste sur le rôle essentiel que joue la collaboration entre acteurs du territoire et institution. Par des rencontres, des formations… LiberTic a fait monter les acteurs en compétences. Ce dialogue a eu des effets réels sur les formats que la collectivité va proposer, sur les licences que la ville a retenues et même sur les jeux de données libérés. Ce dialogue a permis surtout de lever l’appréhension de la collectivité comme celle des acteurs demandeurs de jeux de données. Le projet OpenData a donné lieu à la création d’un poste de Community Manager à la ville pour en partie gérer la relation entre la ville et les autres acteurs de cette question.

Reste qu’il faut maintenant maintenir la motivation de la communauté, élargir le cercle pour démocratiser l’open data…

Pour Arnaud Willaime en charge d’un projet open data depuis décembre 2010 pour la Ville de Brest et Brest Métropole, tout l’enjeu est désormais de capitaliser les réussites antérieures menées par d’autres villes, comme Rennes notamment. Pour Brest, qui envisage d’ouvrir un répertoire de données à l’automne, l’idée est de dupliquer les politiques locales qui ont réussi, notamment en demandant à leur opérateur de transport (Keolis) d’ouvrir leurs données comme ils l’ont fait à Rennes. Brest dispose depuis mars 2010 de ses données géographiques ouvertes. Brest à une activité ancienne autour des usages coopératifs avec des productions exemplaires comme les participations à la cartographie ouverte de Plouarzel. Toute la difficulté demeurant de rendre lisible la valeur ajoutée de l’open data pour l’ensemble des acteurs. Pour Arnaud Willaime, la question est de savoir si les programmes Open Data peuvent aider à éclairer la question de l’attention que les citoyens demandent à leurs particularités dans le cadre d’une collectivité qui doit agir pour l’intérêt général.

L’open data par et pour les citoyens

L’open data peut-il être l’enjeu d’une confiance renouvelée des citoyens pour la vie politique ? C’est en tout cas le crédo de Regards Citoyens, explique Benjamin Ooghe-Tabanou. L’association, créée en juillet 2009, s’est réunie autour du projet de réutilisation des données publiées par l’Assemblée nationale. NosDeputes.fr n’avait pour ambition que de les rendre plus simples et plus accessibles. Pour cela, l’association a créé des programmes capables de récupérer de façon automatique des données depuis le site de l’Assemblée nationale pour les redistribuer en open data de manière structurée et permettre d’en faire des visualisations, des comparaisons. Suivre l’actualité des députés est devenu plus simple et plus clair.

regardscitoyenshome
Image : Page d’accueil de Regards Citoyens.

La libération de ces données, « volées » au site de l’Assemblée nationale a permis notamment de créer l’application de sanctions financières sur la présence des députés qui a été ajoutés au règlement de l’Assemblée à partir de juillet 2009. Un résultat on ne peut plus concret.

Un autre projet de Regards Citoyens visait à comprendre le redécoupage des circonscriptions électorales voté en 2009 nécessitant d’effectuer la géolocalisation des bureaux de vote, permettant de voir si le redécoupage allait avoir un impact sur les résultats. Pour cartographier les bureaux de vote, l’association s’est appuyée sur le crowdsourcing citoyen d’une manière plutôt réussie. L’évaluation de l’impact du redécoupage électoral a montré que celui-ci, finalement, était politiquement plutôt neutre.

Autre projet notable de Regards Citoyens : celui consistant à mesurer l’influence des lobbyistes à l’Assemblée nationale en dressant les listes des personnes auditionnées que l’on trouve dans les rapports de l’Assemblée nationale. Là encore, un travail de fonds, qui repose en partie sur de la programmation pour automatiser des traitements dans des corpus de documents non structurés.
« L’open data doit respecter certains principes pour que les données soient réutilisables par un maximum d’acteurs. Elle doit utiliser des formats ouverts et interopérables bien sûr, mais aussi et surtout des licences libres permettant cette réutilisation », rappelle Benjamin Ooghe-Tabanou… L’association a d’ailleurs publié une « Déclaration de l’open data » pour inciter les acteurs à choisir des formats libres.

Des portails pour retrouver les données

DataPublica est un annuaire des données publiques, explique son fondateur François Bancilhon. L’idée est de créer une cartographie des données publiques : de les identifier, de les stocker, de les archiver, de leur ajouter des métadonnées pour permettre de faire des recherches. « Sur les 6,5 millions de fichiers disponibles en France, seulement 175 000 sont des tableurs (donc de la donnée structurée). Et 5,5 millions sont des PDF ! C’est-à-dire des documents dont il faut extraire la donnée pour pouvoir les exploiter. »

Tout ces documents ont des valeurs différentes. Par exemple, le fichier du prix des carburants dans les stations d’essence coûte 35 000 euros pour son usage commercial (et 5000 euros pour un usage non commercial).

DataPublica a plusieurs activités. Il propose un catalogue et un moteur gratuit. Une actualité sur le sujet. Mais ce qui génère des revenus c’est de construire des jeux de données sur mesure (en trouvant les sources, en les intégrant, en les livrant sous forme d’abonnement). A terme, DataPublica a pour ambition de devenir un supermarché où acheter et vendre des données.

Le marché des données en France représente 1,6 milliard de chiffres d’affaires annuels (qui se découpe en plusieurs catégories dont les principales concerne la finance, les données de solvabilités (entre banques), la presse…). 50 à 60 % des données vendues sur ces marchés proviennent de données publiques. Mais ce marché va être bouleversé par l’arrivée de données de meilleure qualité, plus nombreuses et à moindre coût sur des sujets plus critiques, estime François Bancilhon. D’où l’importance d’ajouter de la valeur ajoutée à ces données.

DataPublica n’est pas la seule initiative de catalogage des données. On trouve également NosDonnees.fr, DataLift, et bien sûr EtatLab, l’initiative gouvernementale menée par Severin Naudet (blog) qui devrait ouvrir d’ici la fin de l’année… ainsi que des initiatives européennes et internationales comme l’OpenDataSearch mené par l’Open Knowledge Foundation.

Questions sur les enjeux de l’open data

A écouter une journée durant, les projets autour de l’open data, on se rend compte combien le sujet de prospective est devenu, en l’espace d’un peu plus d’un an, une réalité. On voit bien combien la réutilisation des données publiques a joué un rôle stratégique notamment dans le cadre de la libération des informations de transports. Bien souvent, l’ouverture des données publiques a permis de lever la tension, ancienne, récurrente entre institutions et délégataires du service public autour de la question de l’ouverture des informations de transports.

Reste que, passé les applications de transports, voire celles d’accessibilité, l’impact de l’open data local demeure faible. Non pas qu’il n’y ait pas d’autres exemples d’utilisation, mais celles-ci demeurent pour l’instant, en France et au-delà, anecdotiques, tant en nombre d’utilisation qu’en terme d’appropriation. Le sujet semble déjà être devenu un enjeu de communication publique plus que de politique où faire preuve de sa modernité semble déjà plus important que d’offrir des répertoires de données intéressants. Alors que les territoires ont là un levier pour se doter d’outils leur permettant de prendre des décisions éclairées et de rendre des comptes transparents, il va être certainement plus simple pour eux de fournir des données non stratégiques, quitte à tuer la promesse de l’open data.

Pire, la publication de données structurées nous a peut-être éloignés de l’ouverture des données non structurées : beaucoup de villes et collectivités ne proposent pas encore sur leur site web un espace documentaire digne de ce nom, où tout citoyen pourrait trouver tous les rapports que la ville commande ou finance ou tous les documents qu’elle échange dans le cadre de son fonctionnement. La structuration des données rend plus facile la publication du budget municipal, certes. Mais celui-ci, qui est l’objet de toutes les attentions, peaufiné mois après mois, est-il plus essentiel par exemple, que la publication des factures d’électricité ou de téléphone de chacun des bâtiments municipaux ? Si avec l’open data l’institution publique ne sert que son propre but, elle risque bien de voir échouer les promesses de transparence et d’information. Le risque de l’open data est de ne devenir qu’un élément de communication parmi d’autres.

Ce qui était intéressant également dans cette journée, c’est de voir les ramifications du sujet au-delà des données publiques. Il était intéressant d’entendre dans ce cadre, Thomas Perianu directeur du développement durable de Suez Environnement dont l’intervention clôturait la journée. Celui-ci expliquait que Suez, l’un des principaux délégataires publics dans le domaine du traitement de l’eau et des déchets, s’intéressait au sujet d’abord et avant tout, car son métier même l’amène à collecter des données. Et d’évoquer ensuite comment l’open data se met à intéresser les sociétés privées qui pourraient demain proposer des services liés aux données de leurs compteurs ou de leurs collectes. L’informatique embarquée, les télérevelés, les capteurs pour surveiller les réseaux… sont déjà des réalités pour ce type d’acteurs. Dors et déjà, Suez propose des services aux villes (comme CityBiose) et demain aux particuliers. « Tout cela n’est pas nécessairement de l’open data, mais nous générons des données qui peuvent être des candidats à l’ouverture si les collectivités le souhaitent. » Suez a libéré des données auprès de services techniques à la CUB de Bordeaux qui vient d’ailleurs d’ouvrir son portail de données. Reste que pour l’instant, Suez n’envisage pas d’ouvrir ses données aux citoyens, mais de proposer un service supplémentaire (payant) aux villes. On voit bien que cet élargissement des données ouvertes publiques à des informations privées, mais d’intérêt général va être l’un des enjeux à venir du sujet.

Pourtant, il y a quelque chose qui demeure stimulant dans le domaine de l’open data. C’est d’abord ce que l’acteur public ne publie pas. C’est-à-dire à la fois les documents volés (comme l’a montré Wikileaks) et l’exploitation des documents non structurés comme le font Regards Citoyens ou d’autres acteurs qu’évoquait Nicolas Kayser-Bril à Lift. Ce qui est intéressant, bien souvent, c’est d’abord ce qui n’est pas montré, ce qui demeure fermé.

Et surtout, ce sont les initiatives de coproduction avec les citoyens qui demeurent les plus stimulantes, même si elles ne portent pas toutes leurs fruits, comme l’a justement rappelé Nicolas Kayser-Bril. Il y a là un réservoir de création de données utiles à tous qui redonne du sens à la relation institutions-citoyens. Et rien que pour cela, on devine que c’est le vrai trésor des données ouvertes.

Hubert Guillaud

À lire aussi sur internetactu.net

0 commentaires

  1. Je vous sais gré de me faire transmission de tout élément relatif à ce sujet, qui retient toute mon attention.

    Dans cet esprit, je vous prie de croire en ma considération.

    Christian-Marie MOSCHETTI

  2. Je ne vois pas pourquoi des données personnelles devraient faire partie de la réutilisation : je ne veux pas être classifié sous prétexte que je suis dans l’annuaire ou que j’ai acheté un objet ouo que ‘jai été malade, par des marchands qui vont associer mon nom, et donc moi-même, à des données qui me sont étrangères, que je ne contrôle pas, et qui vont contribuer à donner une image de moi que je réprouve. Voire qui vont me nuire, à moi et à mes proches.

    Ce genre d’entreprise nuisible accroit la méfiance que tout individu doit désormais nourrir envers l’Etat (qui collecte beaucoup de données personnelles) et envers toute entreprise cherchant à utiliser des données personnelles. Parce que ce n’est que ça, du fichage. Nous serons bientôt aussi traçable qu’un boeuf à l’abattoir.
    Je paie en liquide, je mens aux sondages et aux questionnaires, je n’ai pas de portable ni de trucmuche électronique, et je suis prêt à cogner sur tout contact utilisant ce genre de canal (ah, vous avez eu mes coordonnées par …. vous croyez savoir que … vous vendez quelque chose ? Très bien : DEHORS et MON PIED AU CUL).

    C’est une DICTATURE qui se met en place, auprès de laquelle El Assad ou Khadafi feront figure de jeunes filles au pair.

    Dans cette époque de mollassons et de clic-bouton, et où pour paraitre moderne, il fait avoir l’air de téléphoner d’un air absorbé, je ne suis pas étonné de voir qu’on appelle « progrès » tout ce qui restreint les libertés et la dignité humaine.

  3. « C’est-à-dire à la fois les documents volés (comme l’a montré Wikileaks) »

    Quelle blague ….. Wikileaks a-t-il empêché les Etats-Unis et la France, ces deux exemples de bonne gestion des deniers publics, de voler la Lybie et de la bombarder, ce qui est un cas d’agression d’un pays en paix, pour installer des hommes d’affaires à eux et pomper la richesse de ce petit pays ? de réitérer la même chose avec la Syrie ?