Journaliste de données : data as storytelling

En préfiguration de Lift France, l’un des ateliers était consacré au Journalisme de données, cette “nouvelle” façon de faire du journalisme, en utilisant les données comme matériel pour construire de l’information. Qu’est-ce que le data journalisme ? Quels sont les enjeux ? Décryptage, pour mieux comprendre la richesse du croisement entre données publiques et journalisme.

Le journalisme de données, c’est l’exploitation de données sous des formats plus ou moins structurés, explique Lideth Rodriguez Solorzano, animatrice de l’atelier. Pour Nicolas Kayser-Bril, l’un des rares journalistes de données de l’assemblée, qui travaille dans l’équipe regroupée par Owni.fr, qui rassemble statisticiens, journalistes, designers et développeurs (voir l’article de présentation d’Alice Antheaume), le journalisme de données s’inspire du travail précurseur d’Adrian Holovaty et ses cartes du crime de Chicago, qui étaient l’un des premiers mashups développé via Google Maps. Le journalisme de donnée, c’est une nouvelle façon de raconter des histoires, allant du webreportage à la visualisation de données.

Une narration visuelle

Pour Caroline Goulard, qui vient de lancer le site ActuVisu (blog), un laboratoire étudiant de la visualisation de données, ce qui définit cette nouvelle profession ce sont les données. Le travail de journaliste de données consiste à exploiter des données que ce soit en amont ou en aval d’un reportage, et d’utiliser des bases de données comme source en les donnant à lire via de nouvelles formes de visualisation. « La définition commence avec le terme de data. Pour le journaliste traditionnel, la brique de base est l’article. Le journaliste travaille sur la narration. Avec les données, on n’est plus dans la narration verbale, mais dans une narration construite autour d’éléments grammaticaux qui appartiennent au lexique visuel. Le journaliste de donnée s’adresse à l’intelligence visuelle. »

C’est un usage qui vient s’ajouter aux autres formes de journalisme, pour conceptualiser et visualiser l’information. Le but n’est pas de remplacer le journalisme traditionnel bien sûr, mais de trouver un angle nouveau pour traiter une question, qui entre pleinement dans la panoplie des outils du journaliste qui se demande face à un sujet comment le traiter : sous forme de brève, d’interview, d’enquête… « L’angle data est un angle de traitement parmi d’autres. »

Les chiffres sont aussi subjectifs que les mots

« Quand on fait du datajournalisme, on apporte une vision aux données qu’on récupère ou dont on dispose », explique Nicolas Kayser-Bril, en y apportant un travail d’éditorialisation. Par exemple, l’agenda d’Obama développé par le Washington Post qui montre l’importance des questions que le président aborde lors de ses déplacements, explique Lisbeth Rodriguez. Ici, le but est de rendre lisible l’information en provenance de l’agenda du président américain, autrement, sous forme d’une TreeMap, une forme de visualisation qui fait apparaître les structures hiérarchiques. Mais la forme n’est pas sans critique, estime un participant. Qu’est-ce qui préside à la spatialisation de cette visualisation ? La représentation qu’offre la carte à un rôle, une valeur, un sens… « Typiquement, dans cette visualisation, on remarque d’abord ce qui est au centre du tableau, ce qui est mis en valeur avec certaines couleurs plus que d’autres… La représentation, même faite par des algorithmes, n’est pas objective ».

agendaobama
Image : L’agenda d’Obama dont le flux d’information a été retraité sous forme graphique par la rédaction du Washington Post. Exemple concret de journalisme de données.

« Mais le datajournalisme ne prétend pas tout objectiver, au contraire », objecte Charles Nepote en charge du projet Partage de données publiques à la Fing. « Comme c’est déjà le cas avec les mots, les graphiques n’objectivent pas tout ».

Tout à fait, insiste Caroline Goulard. Un schéma est plus clair qu’une liste. Cependant, « le datajournalisme est aussi subjectif qu’un article. La seule différence est que la médiation ne passe pas par les mêmes outils. Jouer avec des données, permet de construire des interprétations. Manipuler les données permet, comme les mots, de raconter une histoire. » Il y a un travail important sur le sens, les couleurs, les représentations, les volumes… à la manière de ce qu’expliquaient il y a déjà longtemps les précurseurs Edward Tufte ou Jacques Bertin en France. La médiation visuelle n’est pas nouvelle. Elle s’accompagne de légendes, d’explications… Elle ne se livre jamais seule.

La visualisation… un outil relationnel ou une machine à cash ?

Avec le journalisme de données, on n’est pas seulement dans le registre visuel, il y a aussi la dimension de manipulation et d’interaction : on retient mieux quelque chose quand on peut manipuler les indicateurs. Cela renforce le mode d’engagement que le lecteur peut avoir avec l’information, explique encore Caroline Goulard. On n’a pas la même attention quand on doit personnaliser ses parcours, manipuler des données que quand on lit un article. C’est important dans la question de la relation avec le public, mais aussi dans le modèle économique.

Car la question du journalisme de données est bien avant tout économique. Il permet de créer un contenu à forte valeur ajouté, qui rend crédible d’autres modèles économiques : il permet de mieux exploiter le côté immersif du modèle publicitaire, il favorise le modèle de paiement direct (comme le propose aujourd’hui Blomberg avec ses tableaux d’analyses financières en temps réel…). Alors qu’il demeure difficile de valoriser des contenus facilement duplicables, comme des articles, il est peut-être plus facile de monétiser des contenus plus différenciant, comme des visualisations.

Les visualisations sont des machines à pages vues, rappelle l’animateur de l’atelier. En ce sens, tout le monde voit bien l’intérêt économique pour autant que les coûts de développements ne soient pas prohibitifs même pour de petites équipes rédactionnelles. Certes, explique Caroline Goulard, le datajournalisme ce n’est pas du temps court : cela prend du temps pour apprendre, pour former. Mais l’avantage des dispositifs de data journalisme est que leur pérennité peut-être plus longue, si la base de données demeure active et à jour.
On peut raconter des histoires depuis tout type de données, s’amuse Nicolas Kayser-Bril, en prenant l’exemple d’un fichier de vente aux enchères trouvé dans un porte-document des locaux de la Chambre de commerce et d’industrie de Marseille où se tenait l’atelier. A partir d’un simple listing d’objets, on pourrait observer qui a acheté le plus d’objets, quels sont les acheteurs qui les ont payés au meilleur prix, ceux qui ont payé le plus cher par rapport au prix de vente initial, quels types d’objets se sont le mieux vendus, etc.

« Mais la donnée est-elle de l’information ? », demande Xavier de Porte, l’animateur de Place de la Toile. Il y a des graphiques sur la durée de possession de balle par les joueurs lors d’un match de foot, mais cela n’a aucun rapport avec les résultats du match. « Oui, le journalisme doit s’emparer des données, mais pour en faire quoi ? Pour dire quoi ? Que représente-t-on et que cherche-t-on à représenter ? S’il est un processus pour lire la complexité du monde de l’information, quel nouveau processus de relation à l’information introduit-il ? »

Dans le Guardian, en haut des articles en ligne du DataBlog, on peut souvent accéder aux données que le journaliste a collectées pour faire son article. De même, le Guardian invite les lecteurs à créer des infographies pour les publier sur un groupe Flickr. Ces exemples montrent que le journalisme de données peut aussi tisser un autre rapport avec le lecteur en terme de participation et de confiance. Oui, mais rappelle Nicolas Kayser-Bril, le datajournalisme ne change rien à la confiance. Il pose les mêmes questions que le journalisme traditionnel, d’autant qu’on peut manipuler les données comme l’information. Un site russe a ainsi manipulé une cartographie des lieux de cultes en Russie en augmentant le nombre de mosquées…

Reste que le recours aux lecteurs peut-être important. Nicolas Kayser-Bril, évoque le projet de localisation des bureaux de vote en France lancé par Owni, pour lequel il a fallu exploiter des données non mises en formes. Owni a construit un outil basique pour que quelque 300 internautes saisissent 13 000 adresses de bureaux de vote à la main. Un journal belge a utilisé le même système pour évaluer l’état des pistes cyclables.

Le Guardian a ainsi fait analyser par les internautes 50 % des 548 000 pages de documents sur les feuilles de frais des députés britanniques qu’ils ont récupérées. Mais le crowdsourcing peut également connaître des limites, rappelle Philippe Kerignard, notamment quand il devient commercial. Il peut aussi servir à injecter de fausses données. Et de faire référence à une société commerciale qui recrute et rémunère des gens pour donner des notes aux applications iPhone afin de les faire évoluer dans le classement et les rendre plus visibles…

La donnée… une autre manière de raconter des histoires

Le journalisme de données raconte également l’essor du storytelling, car il consiste finalement à raconter une histoire d’une autre façon, à l’adapter, à la rendre plus interactive. Le but n’est pas de construire un nouveau jargon, mais bien de revenir à l’histoire, via les données.

L’assistance semble demeurer en partie sceptique. Diversifier les données et les équipes de rédaction suffit-il à faire un meilleur journalisme ? Ne risque-t-on pas d’aller vers un fétichisme du chiffre, avec des données qui peuvent être manipulées facilement ? Oui, reconnaît Caroline Goulard, « le problème du traitement de l’information comme de la fiabilité des sources demeure le même que dans le journalisme traditionnel. Il faut néanmoins un meilleur journalisme pour analyser les données qui sont devenues plus nombreuses. Cela ne remet pas en question l’éthique du journalisme, au contraire. Le journalisme de données est un journalisme comme un autre. L’exploitation du chiffre est un éclairage aussi subjectif que l’utilisation des mots. »

Néanmoins, il peut être utile pour expliquer des phénomènes complexes, à travers une représentation claire. Si le journalisme s’empare des données, c’est parce qu’elles se démultiplient à l’heure du web. Il devient un intermédiaire entre les données et le lecteur, pour l’aider à trier, à comprendre, à voir… Le journalisme de données est également porteur de valeur d’investigation, comme le montre les enquêtes publiées par Nicolas Kayser-Bril sur Owni, que ce soit sur l’industrie de l’éolienne, sur l’économie du G8 ou la crise grecque… Il n’est finalement qu’une nouvelle possibilité offerte par le web quand elle s’applique au journalisme, conclut Caroline Goulard.

À lire aussi sur internetactu.net

0 commentaires

  1. 1. Données, informations, connaissances : il y a une approche précise et du sens, que tous les journalistes formés devraient avoir à l’esprit
    2. Sur la visualisation de celles-ci, cela fait des années que des entreprises et des chercheurs travaillent dessus. Et les Français sont particulièrement bons sur cette question Malheureusement, les médias ne s’en font pas l’écho et certains fleurons ne sont plus