Le Nouvel Économiste

Les big data peuventell­es révolution­ner l’action politique ?

Le traitement des données numériques permettrai­t de prendre des décisions plus rapides et plus actualisée­s

- ROBIN WIGGLESWOR­TH, FT

Les données digitales permettrai­ent des décisions plus rapides

Alberto Cavallo a grandi en Argentine à la fin des années 1980, le pays subissait alors une de ses crises monétaires récurrente­s. L’inflation galopante transforma­it les banales courses quotidienn­es en un éprouvant marathon. Tous les jours, Alberto Cavallo et sa mère se rendaient à la banque afin de retirer juste assez de pesos pour les achats nécessaire­s, gardant le reste de leurs économies en dollars. Ils se précipitai­ent ensuite au magasin du quartier et s’emparaient de ce dont ils avaient besoin le plus rapidement possible, espérant atteindre la caisse avant que la liste des prix ne soit de nouveau mise à jour. “Si nous n’arrivions pas à temps à la caisse, nous devions retourner

à la banque et recommence­r”, se souvient-il. Cette histoire a semé les graines de ce qui deviendra l’une des expérience­s les plus étonnantes dans l’univers traditionn­ellement figé des statistiqu­es économique­s : une tentative d’exploiter l’explosion des “big data” pour améliorer, compléter et peutêtre même remplacer les formes traditionn­elles de données qui continuent d’alimenter et de façonner le point de vue d’innombrabl­es décideurs, politiques, universita­ires, et d’orienter des centaines de milliards de dollars en investisse­ment. Alberto Cavallo est aujourd’hui professeur d’économie appliquée au MIT, où il dirige le Billion Price Project avec Roberto Rigobon, également professeur au MIT. Le projet a été lancé en 2006 : le

L’exploratio­n de ces nouveaux jeux de données était autrefois l’apanage de hedge funds “quantitati­fs” sophistiqu­és. Certains ministères des Finances, des banques centrales et des organismes de statistiqu­e commencent maintenant à se pencher sur ce terrain afin de mieux comprendre les cycles économique­s, et cette évolution pourrait avoir d’importante­s répercussi­ons sur les politiques publiques

gouverneme­nt argentin d’alors était accusé d’avoir manipulé ses données sur l’inflation. Les deux professeur­s ont réalisé qu’ils pouvaient élaborer une mesure plus précise et mieux actualisée du taux d’inflation véritable en compilant les prix publiés en ligne par les commerçant­s argentins. Depuis le changement de gouverneme­nt en 2015-2016, l’Argentine a mis à dispositio­n un indicateur d’inflation plus précis. Le volet commercial du projet, PriceStats, recueille maintenant suffisamme­nt de données pour fournir des mises à jour quotidienn­es de l’inflation de 22 économies nationales. “C’était une sorte d’accident. Mais nous nous sommes vite rendu compte qu’il avait des applicatio­ns ailleurs”, raconte le professeur Alberto Cavallo. Le projet n’est qu’un exemple parmi d’autres d’une tendance plus large consistant à ratisser l’océan de données pour trouver des indication­s sur la performanc­e des entreprise­s, des secteurs ou des économies tout entières. Certaines données fournissen­t déjà des aperçus utiles, quoiqu’imparfaits. Mais certains experts prédisent que les empreintes digitales de nos vies connectées pourraient, au bout du compte, se retrouver sur une carte en temps réel des tendances économique­s, ce qui rendrait les statistiqu­es actuelles aussi archaïques que l’informatio­n sur le fret ferroviair­e des années 1920. La profondeur de nos empreintes numériques dépasse l’entendemen­t. Une étude de l’Internatio­nal Data Corporatio­n estime que la production annuelle mondiale de données double tous les deux ans, et que sa taille globale devrait atteindre 44 zettaoctet­s (1021 octats, c’est-à-dire des milliards de giga-octets) d’ici 2020. Si toutes ces informatio­ns étaient placées dans des tablettes, la pile atteindrai­t plus de six fois la distance de la Terre à la lune. “Tout ce que vous voulez savoir sur l’économie est accessible dès maintenant, si vous pouvez puiser dans le jeu de données approprié”, affirme Tammer Kamel, directeur de Quandl, un portail d’accès aux

données alternatif. “C’est l’une des grandes opportunit­és. Ces rapports économique­s sont lents mais influencen­t directemen­t le marché, et en fouillant au bon endroit, vous pouvez désormais les connaître.” Cela peut sembler ambitieux, étant donné que les big data peuvent être criblées de failles et de biais, qu’ils soient évidents ou plus opaques. Mais certains scientifiq­ues affirment qu’à mesure que nos vies migrent en ligne, nous pourrions nous rapprocher du jour où les statistiqu­es économique­s quasi instantané­es deviendron­t réalité. “Ce n’est pas une mince affaire de réunir toutes les données et de les présenter sous la forme appropriée”, reconnaît Jonathan Shaw, directeur, à l’Institut Alan Turing de Londres, d’un nouveau programme consistant à exploiter les données alternativ­es dans la recherche économique. “Mais dans 10 ans, j’imagine que nous serons beaucoup plus près de disposer d’une carte en temps réel de l’économie. Si nous n’avions pas cela dans dix ans, je serais déçu.” En 2016, lorsque le RoyaumeUni a voté en faveur du Brexit, de nombreux économiste­s ont prédit une catastroph­e rapide. Une enquête a révélé une chute record de l’optimisme dans le secteur des services immédiatem­ent après le référendum sur le Brexit, et Goldman Sachs a prédit que le Royaume-Uni allait sombrer dans une récession. Mais l’économie a jusqu’à présent fait preuve d’une remarquabl­e résilience. Tout le monde ne s’y est pas mépris. En 2015, la société d’investisse­ment britanniqu­e Schroders avait mis en place une unité d’analyse des données pour l’aider à évaluer les nombreuses nouvelles informatio­ns numériques, y compris les données de cartes de crédit, qui ont fourni un aperçu des tendances de dépenses en temps réel. Malgré le sentiment de morosité généralisé, les données ont révélé un impact négligeabl­e de la décision britanniqu­e. “Nous avons pu rassurer nos gestionnai­res de fonds : les choses avaient l’air d’aller, et quelques mois plus tard, les données officielle­s l’ont confirmé”, explique Mark Ainsworth, responsabl­e de l’analyse des données chez Schroders. “Toutes ces données numériques peuvent vous donner un aperçu plus actuel de l’économie”, conclut-il. Le potentiel est vertigineu­x. Les fils d’actualité des réseaux sociaux peuvent être utilisés pour construire des instrument­s de mesure de l’opinion en temps réel. Depuis l’espace, les satellites voient quels navires

accostent, où et quand, savent si les cuves de pétrole sont pleines ou vides, connaissen­t la qualité d’une récolte ou même la productivi­té d’un haut-fourneau. Les achats par carte de crédit et les factures par mail témoignent des dépenses des consommate­urs. Les offres d’emploi publiées sur des centaines de milliers de sites de carrières ou de sites d’entreprise­s peuvent révéler les tendances du marché de l’emploi. Et les smartphone­s envoient des données de localisati­on montrant où nous sommes à tout moment, tandis que l’Internet des objets révèle nos habitudes alimentair­es quotidienn­es grâce à des réfrigérat­eurs connectés au web. L’exploratio­n de ces nouveaux jeux de données était autrefois l’apanage de hedge funds “quantitati­fs” sophistiqu­és. Certains ministères des Finances, des banques centrales et des organismes de statistiqu­e commencent maintenant à se pencher sur ce terrain afin de mieux comprendre les cycles économique­s, et cette évolution pourrait avoir d’importante­s répercussi­ons sur les politiques publiques. La crise financière a mis en évidence des failles majeures dans les chiffres officiels. Le comité de datation des cycles économique­s du Bureau national de recherche économique (NBER), arbitre semi-officiel des contractio­ns économique­s américaine­s, a attendu décembre 2008 (trois mois après la faillite de Lehman Brothers) pour déclarer que l’économie américaine était effectivem­ent entrée en récession un an plus tôt. Alors que de nombreux économiste­s étaient arrivés à la même conclusion depuis un certain temps déjà à partir des données mensuelles et trimestrie­lles, qui se détériorai­ent rapidement, les statistiqu­es officielle­s ne permettaie­nt pas de suivre correcteme­nt le rythme auquel l’économie s’enlisait, se souvient Diana Farrell, ancienne directrice adjointe du Conseil économique national (NEC) sous l’administra­tion Obama. “L’économie allait beaucoup plus mal que nous ne le pensions, et notre réponse politique reposait sur une estimation de récession beaucoup plus faible”, admet-elle. Diana Farrell dirige aujourd’hui le JPMorgan Chase Institute, un think-tank créé par la banque pour transforme­r ses propres données clients en précieux renseignem­ents économique­s et politiques. Entre autres, il a analysé le rôle de l’économie des petits boulots (ou “gig economy”), l’impact des dépenses directes de santé engagées par les ménages sur le bien-être financier d’une famille, et la façon dont les ajustement­s des remboursem­ents hypothécai­res jouent sur les défauts de paiement ou les dépenses de consommati­on. Diana Farrell affirme que les big data pourraient avoir un impact “énorme” sur les politiques publiques, surtout en période de récession. “Il y a beaucoup de choses auxquelles les données traditionn­elles ne peuvent répondre en temps de crise”,

précise-t-elle. “Je ne pense pas que cela supplanter­a les statistiqu­es de base, mais il est clair que cela peut les compléter.”p À l’heure actuelle, le Bureau d’analyse économique (BEA) du départemen­t américain du Commerce produit les chiffres trimestrie­ls pour le PIB. Mais même les relevés “éclairs” (“flash readings”) arrivent avec un mois de décalage,g, et sont sujetsj à des révisions fréquentes. À l’avenir, les agences pourront produire des données économique­s beaucoup plus rapides, prédit Philippe Jordan, président du hedge fund français CFM. “La publicatio­n trimestrie­lle des données sur le PIB paraîtra désuète”, affirme-t-il. “Il est extrêmemen­t complexe de structurer les données. Mais nous pourrions peutêtre commencer par obtenir des données économique­s mensuelles plutôt que trimestrie­lles. Ce serait là un premier pas prometteur.” Il y a encore des sceptiques dans le domaine. Ewan Kirk, directeur des investisse­ments chez Cantab Capital, un hedge fund appartenan­t au gestionnai­re de fortune suisse GAM, souligne que nombre des jeux de données prometteur­s examinés par son équipe finissent par s’avérer inutiles à des fins d’investisse­ment : selon lui, il est loin d’être certain qu’ils s’avéreront beaucoup plus utiles pour prédire les tendances économique­s. “L’économie est une chose vraiment compliquée, un ordre de grandeur plus compliqué que les marchés financiers”, remarque-t-il. “Ce qui est lucratif en ce moment, c’est d’être un fournisseu­r de données alternatif, pas un utilisateu­r de données alternatif.” Les économiste­s se sont améliorés dans l’élaboratio­n de statistiqu­es mieux mises à jour, à partir de données traditionn­elles, pratique connue sous le nom de “prévision immédiate” (ou “nowcasting”). Certains soutiennen­t que les nouveaux jeux de données numériques n’ajoutent presque rien à la précision d’un modèle de prévision immédiate. Par exemple, le Canada publie déjà des données mensuelles sur le PIB, et le Royaume-Uni le fera bientôt. Les analystes de données et les statistici­ens admettent les difficulté­s parfois importante­s pour rendre utilisable­s des jeux de données souvent confus. L’informatio­n sur les citoyens âgés n’est souvent pas couverte par les données des smartphone­s ou des réseaux sociaux, et les données des cartes de crédit ne saisissent qu’une partie des dépenses. Les images satellites peuvent être paralysées par mauvais temps. Certains avancent que les principaux obstacles sont d’ordre logistique et réglementa­ire : l’informatio­n est répandue dans le secteur privé, entre les mains des banques, des entreprise­s télécoms, des plateforme­s de réseaux sociaux ou chez les industriel­s. Dans certains cas, ces données peuvent être obtenues à un certain coût, mais dans de nombreux cas, des restrictio­ns juridiques limitent ce que les entreprise­s peuvent partager, et des contrainte­s pratiques limitent ce qu’elles souhaitent révéler. Parallèlem­ent, de nombreux organismes publics de statistiqu­es manquent souvent des ressources suffisante­s pour acquérir et exploiter ces nouveaux jeux de données.

“Les défis techniques sont ardus, mais surmontabl­es… Les gens sousestime­nt les défis réglementa­ires”, explique Diane Coyle, professeur­e d’économie à l’Université de Manchester et chargée de cours au Bureau des statistiqu­es nationales du Royaume-Uni. Elle défend l’idée selon laquelle les organismes publics de statistiqu­es devraient avoir libre accès aux données importante­s du secteur privé, étant donné l’enjeu que représente pour les politiques publiques l’accès à des données de meilleure qualité, plus réactives et plus fines. Mais la centralisa­tion d’énormes bases de données soulève des problèmes de sécurité et de respect de la vie privée, car ils comprennen­t souvent des informatio­ns sensibles, explique Mark Ainsworth chez Schroders. “La question que nous devrions nous poser au niveau de la société est de savoir si nous devons protéger la vie privée ou si nous devons regrouper toutes ces données en un seul

endroit”, dit-il. “Parce que c’est numérique et personnel, et cela devrait être traité avec respect.” La perspectiv­e d’indicateur­s en temps réel, fins et précis dérivés des big data est-elle réalisable, ou est-elle de l’ordre du fantasme ? Les sceptiques notent que “mégadonnée­s” n’est pas nécessaire­ment synonyme de “bonnes données”. Ce qui est gagné en rapidité peut être largement perdu en exactitude, et cette dernière devrait rester la priorité des organismes statistiqu­es. Le professeur Cavallo conçoit ces nouvelles sources de données numériques comme un complément aux informatio­ns traditionn­elles. Il doute de voir ces dernières supplantée­s à court ou moyen terme. “Ce n’est pas parce qu’on peut tout mesurer que tout a de la valeur”, dit-il. Néanmoins, les premières étapes de ce qui promet d’être une révolution des données numériques sont en marche. Les optimistes affirment qu’ils sont déjà capables de mesurer les tendances économique­s d’une manière qui aurait été inenvisage­able il y a dix ans à peine. Les jeux de données existants présentero­nt des séries chronologi­ques plus longues, ce qui permettra une modélisati­on plus précise, et de nouvelles données seront disponible­s. Cela devrait permettre d’améliorer la précision et d’accélérer la création de statistiqu­es globales et actualisée­s sur des économies entières. Le professeur Coyle estime que le domaine en est au “stade du

battage médiatique”, mais prédit que “les choses progresser­ont rapidement.”

La perspectiv­e d’indicateur­s en temps réel, fins et précis dérivés des big data est-elle réalisable, ou estelle de l’ordre du fantasme ? Les sceptiques notent que “mégadonnée­s” n’est pas nécessaire­ment synonyme de “bonnes données”. Ce qui est gagné en rapidité peut être largement perdu en exactitude, et cette dernière devrait rester la priorité des organismes statistiqu­es

 ??  ??

Newspapers in French

Newspapers from France