Pour un opendata des usagers

Par le 08/03/11 | 1 commentaire | 1,964 lectures | Impression

Aujourd’hui, comme le montre le mouvement opendata, les administrations mènent la danse de l’ouverture des données. Mais cette politique de l’offre doit être remplacée par une démarche qui prenne en compte la demande, estime Nicolas Kayser-Bril, chargé du pôle datajournalisme chez Owni. Il est temps que les usagers demandent des comptes directement à leurs administrations… Et que celles-ci leurs répondent !

Depuis mai 2009 et la mise en ligne de data.gov, l’ouverture des données publiques a avancé à pas de géants. Les catalogues de données publiques se sont multipliés. Le Royaume-Uni a sorti data.gov.uk, la Suède édite opengov.se et même les gouvernements les moins transparents s’y mettent, avec, par exemple, opengovdata.ru en Russie. On compte près de 60 initiatives de ce type à travers le monde, comme le montre la carte collaborative des initiatives opendata des gouvernements.


World Map of Open Government Data Initiatives

Ces catalogues ne sont pas que des concessions faites à quelques activistes. Ils se développent, avec le soutien de certaines administrations. Data.gov, par exemple, a multiplié par 10 le nombre de séries de données disponibles sur le site depuis son lancement.

Tim Berners Lee, père fondateur de data.gov.uk et grand défenseur de l’opendata, est revenu l’année dernière sur la croissance phénoménale du nombre de données ouvertes. Internautes, entrepreneurs et administrations se saisissent des jeux de données pour les manipuler et, in fine, leur ajouter de la valeur.

Les perspectives ouvertes par les données publiques sont vertigineuses, comme l’a rappelé Xavier Crouan lors du CapCom de Rennes. Même à Paris, alors que le projet ParisData et ses 19 (!) jeux de données ont essuyé de nombreuses critiques lors du lancement, des internautes ont su mettre à profit cette nouvelle matière mise à leur disposition. Mounir et Simon ont produit en quelques jours une carte politique de la ville, où l’on voit à quel point les populations de droite et de gauche se mélangent peu.

Inégalités et culs-de-sac techniques

Pourtant, ces initiatives ne changent pas grand-chose. Les catalogues de données représentent une avancée, mais ils ne relèvent pas vraiment d’une démarche d’ouverture et de transparence. Avec ces catalogues, l’administration décide toujours de ce qui est public et de ce qui reste sous clé.

L’argument selon lequel la croissance des jeux de données disponibles conduira à plus de transparence ne tient pas non plus. Il serait extrêmement cher de mettre en ligne l’ensemble des données produites par l’administration. Si chaque fonctionnaire en France n’écrivait que 10 000 signes de documents potentiellement publics par jour, on aurait déjà 50 gigas de données à mettre en ligne toutes les 24 heures. Sans compter les entreprises réalisant une mission de service public, qu’il faudrait inclure à ce total, ou encore les archives nationales.

L’approche par l’offre, telle qu’on la pense aujourd’hui, est également porteuse d’inégalités. On demande à l’administration de mettre en ligne des données, de préférence dans un format compréhensible par les machines, mais le citoyen est rarement le premier bénéficiaire de ces efforts. Tout le monde ne peut pas lire un tableau au format Excel ou une base de données organisée au format sémantique RDF, ce qu’exigaient certains défenseurs de l’opendata lors de l’Open Government Data Camp du 18 novembre dernier.

Pour caricaturer, on pourrait dire que les lobbyistes de l’opendata demandent à l’administration de dépenser l’argent du contribuable pour créer des bases de données. Or, celles-ci ont vocation à être utilisées en priorité par… les lobbyistes de l’opendata. Le contribuable, qui paye pour la mise en ligne des données, n’est pas le principal bénéficiaire de l’opération.

Repenser l’approche de l’opendata

Aujourd’hui, les administrations sont au cœur du processus de publication des données. Nous les laissons décider elles-mêmes de la direction à prendre. Nous leur laissons le soin de s’autoréguler. Mais l’autorégulation n’est pas la panacée, surtout lorsqu’elle n’est pas assortie de sanctions. Les banques nous en ont offert un bel exemple lors de la crise des subprimes (voir cet article, “Self-regulation means no regulation”, pour les détails techniques). Dans l’industrie aussi, une étude (.pdf) de plus de 4000 entreprises montre que les programmes d’auto-régulation n’ont pas beaucoup d’impact. L’administration fera peut-être exception à la règle, mais mieux vaut ne pas compter dessus.

L’ouverture des données publiques doit se faire par le bas, dans un processus bottom-up plutôt que top-down. C’est aux demandeurs de s’organiser pour transformer les données de l’administration en une base utilisable par les machines, pas aux contribuables. Mais c’est également à l’administration de s’adapter pour répondre aux besoins des demandeurs et fournir les données.

Les répertoires gérés par les réutilisateurs permettent déjà d’organiser les données publiques libérées, sans qu’une administration ne soit impliquée dans sa gestion. Qu’ils soient privés comme data-publica ou ouverts comme nosdonnées.fr, ils montrent que le problème ne tient pas à l’organisation des données – ils le font déjà – mais bien à la possibilité pour les citoyens de pouvoir demander un jeu de données. Fait révélateur, presque aucun des catalogues gérés par des administrations n’invite les utilisateurs à demander des données non encore disponibles (la Suède fait exception).

Cette démarche, prévue par la loi, n’est pas défendue aujourd’hui. Pourtant, comme le montre l’enquête que nous avons réalisée auprès d’une vingtaine de collectivités, l’administration n’est absolument pas en mesure de respecter la loi de 1978 relative à l’accès aux documents administratifs.

Lorsqu’un journaliste, un chercheur ou un citoyen demande des données à l’administration, il se heurte presque systématiquement à un refus initial. S’il a la chance de connaître l’existence de la loi de 1978, il peut faire appel du refus de communication auprès de la CADA (Commission d’accès aux documents administratifs). Or, aujourd’hui, la CADA ne fait qu’appeler l’administration en question pour lui demander des explications, puis rend un avis.

Son budget de 1 million d’euros (6 fois moins que l’HADOPI) et ses 12 agents ne lui permettent pas de mener l’enquête lorsqu’une administration affirme ne pas détenir les données demandées. Elle n’a pas les moyens d’analyser en profondeur les 350 demandes mensuelles qu’elle reçoit (voir son excellent rapport d’activité au format .pdf). Surtout, elle n’a pas de pouvoir de sanction – elle doit se borner à rendre des « avis ».
On comprend alors que si les données recherchées n’ont pas été gracieusement mises en ligne par l’administration, vos chances de les obtenir sont très minces.

Si l’ouverture des données par le haut reste une initiative louable, la transparence ne progressera que lorsque tous les fonctionnaires seront formés pour répondre aux demandes concernant les documents administratifs. Tout comme les standardistes des administrations disposent de pense-bête lorsqu’on leur demande les pièces nécessaires à l’établissement d’un passeport ou d’une carte grise, il devrait y avoir une marche à suivre pour satisfaire les demandes de documents administratifs.

Les données publiques, en France, ne seront réellement disponibles que lorsque :

D’ici là, les catalogues continueront à grossir, mais les données qui n’y figurent pas seront toujours aussi difficiles à obtenir.

Nicolas Kayser-Bril

Ce billet a été publié originellement sur Owni.fr.