Pourquoi il faut (encore) croire aux statistiques
HOW TO MAKE THE WORLD ADD UP. TEN RULES FOR THINKING DIFFERENTLY ABOUT NUMBERS
THE BRIDGE STREET PRESS,
SEPTEMBRE 2020.
WWWWW
Les Alsaciens avaient raison. Ce sont bien les cigognes qui amènent les bébés. Les statistiques le prouvent. Il suffit de comptabiliser la population de cigognes dans chaque pays, ainsi que le nombre de naissances annuelles. La corrélation est frappante : plus il y a de cigognes, plus il y a de bébés. Partant de ce constat, un journal scientifique de renom a calculé le taux de probabilité que ces volatiles livrent bien les nouveau-nés : il s’établit à 0,008. Le fait qu’il ne soit pas nul ouvre un gouffre de réflexion. Le biais de ces statistiques est évident : la taille des pays étudiés. Plus ils sont grands, plus on y recense de cigognes, et plus il y a de naissances… C’est ainsi que Tim Harford, économiste, essayiste et journaliste britannique en vue, débute son livre consacré à la foi que nous devons porter ou non aux chiffres et aux statistiques dont nous sommes abreuvés chaque jour.
Cette réflexion tombe à pic : jamais nous n’aurons vécu à ce point sous la dictature de la data. Des milliards de milliards de données nourrissent les logiciels d’intelligence artificielle qui en tirent des corrélations inattendues, voire farfelues. La crise du Covid-19 livre, chaque jour, un flot de statistiques, de prévisions, de probabilités, de l’exactitude desquelles dépend en partie notre santé et qui nourrissent la décision politique, même la plus inattendue comme celle du confinement.
Tim Harford est parfaitement conscient du fait que cette marée numéraire est complexe à appréhender. La réaction la plus fréquente devant les statistiques est de douter de celles qui nous dérangent. C’est une loi vieille comme les statistiques ellesmêmes. On a pu l’observer en particulier au milieu des années 1950, lorsque les premières études sur le rapport entre le cancer du poumon et la consommation de tabac ont été publiées, et que les fumeurs les ont rejetées en bloc. Il faut dire que les fabricants de cigarettes avaient mis en oeuvre une stratégie elle aussi bien connue et qui sera largement appliquée dans les décennies suivantes : « Lorsqu’un chiffre vous dérange, semez le doute sur sa pertinence et jetez-en plein d’autres en pâture. »
Pour Harford, cette méfiance envers les statistiques est problématique : « Le cynisme actuel à propos des chiffres est non seulement une honte, mais aussi une tragédie, écrit-il. Si nous cédons au sentiment de ne plus avoir les moyens de savoir ce qui est vrai, alors nous nous privons d’un outil vital. Bien sûr, nous ne devons pas être crédules. Cependant, l’antidote à la crédulité n’est pas de ne croire en rien, mais d’accueillir l’information avec curiosité et avec un scepticisme constructif. Mon but est de convaincre que les statistiques peuvent nous aider à éclairer la réalité avec limpidité et honnêteté. » On ne saurait mieux décrire l’esprit de ce livre, parfaite antithèse du best-seller de 1954, sans cesse réimprimé depuis, How to Lie with Statistics, écrit par Darrell Huff, un journaliste alors inconnu, à qui il vaudra richesse et célébrité.
W