Comment utiliser les Big data dans les statistiques officielles ? – Discover Society

Rob Kitchin (@robkitchin) signe un intéressant article qui revient sur les enjeux à utiliser les big data pour les organismes nationaux de statistiques. Des données qui pourraient considérablement améliorer, compléter voire remplacer les données et les enquêtes que ces organismes exploitent et mettent à jour, leur permettant de fournir de nouveaux produits statistiques bien plus réactifs, réduisant drastiquement le coût de traitement et de calcul. Utiliser les données des opérateurs mobiles pour produire des statistiques touristiques, les données des sites de vente de biens immobiliers pour affiner les statistiques du secteur… sont autant d’exemples qui pourraient transformer les indicateurs existants. La division statistique des Nations Unies et de nombreux organismes nationaux se sont réunis en 2014 dans un groupe de travail mondial sur le sujet. 

Reste que le principal problème de ces organismes est d’avoir accès aux données. Si certaines d’entre elles sont produites par des organismes publiques, l’essentiel demeure gérer par des sociétés privées (opérateurs téléphoniques, médias sociaux…), nécessitant que ces organismes développent des partenariats spécifiques, des outils, règles, méthodes et instruments spécifiques pour y avoir accès et les exploiter. Cela nécessite aussi de trouver des moyens pour améliorer ou compenser la représentativité ou non-représentativité des données. Le risque enfin est que la continuité des données ne puisse pas être assuré du fait d’un changement de partenariat ou de la disparition d’un partenaire et surtout que les organismes perdent le contrôle global de la production, de l’échantillonnage et du traitement des données… (sans parler des questions de confidentialité et d’anonymisation des données). Au final, le risque est celui de la concurrence et de la privatisation des statistiques officielles, réputées neutres et de qualité, qui pourraient désormais être fournies par de nouveaux prestataires privés d’une manière plus rapide, fluide, évolutive. “Le danger pour les organismes de statistiques est que leur rôle en tant que fournisseurs principaux de statistiques officielles diminue ou soit privatisé, comme d’autres parties du secteur public : le danger pour le public est que les statistiques officielles soient remplacées par des statistiques plus rapides, moins stables et produisant des données de plus faibles qualité.” Tout l’enjeu pour les fournisseurs de données officielles demeure cependant de nouer des partenariats pour travailler sur ces nouveaux réservoirs de données et trouver les moyens de les utiliser et d’y avoir accès.

Sur Bloomberg, le professeur de finances Noah Smith, explique quant à lui que la science économique a un problème avec les mathématiques. Les économistes utilisent trop souvent les mathématiques comme un outil de rhétorique plutôt qu’un outil pour comprendre le monde, comme s’en plaignait récemment l’économiste Paul Romer. “Dans
les disciplines de mathématiques plus appliquées – biologie
computationnelle, dynamique des fluides, finance quantitative –
les théories mathématiques sont toujours liées à la preuve. Si une théorie n’a pas été testée, elle demeure pure conjoncture. Mais pas en science économiqque. Traditionnelement, les économistes ont mis les faits dans un rôle subalterne et la théorie dans le siège du conducteur”, explique Noah Smith. Mais la révolution informatique et son lot de données est en train de changer cela, estime le professeur de finances, notamment grâce au machine learning, l’apprentissage automatique qu’évoquait également Rob Kirchin.

Deux économistes de Stanford, Susan Athey et Guido Imbens estiment que le machine learning appliqué à l’économie consiste plus à améliorer la prévision que de comprendre les effets des politiques économiques. Mais ces techniques permettraient aussi de mieux isoler les effets de causalité. Le machine learning appliqué à l’économie permet de mieux saisir les efffets du traitement, c’est-à-dire les effets et conséquences d’un traitement (par exemple augmenter le salaire minimum) de son absence. Bref, d’améliorer la modélisation. L’économie est-elle appelée à devenir une branche des mathématiques appliquées ? 

À lire aussi sur internetactu.net

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *