La Recherche

Histoire de probabilit­és

-

Un résultat expériment­al est jugé « statistiqu­ement significat­if » si l’on peut calculer qu’il y a moins d’une chance sur vingt qu’il soit dû au hasard. Cette probabilit­é est notée p. Ce seuil de p < 0,05 (1 sur 20) est arbitraire et implique de fait que, sur vingt études l’ayant retenu, il y en a probableme­nt une qui rapporte des résultats faux. Certaines études, notamment en épidémiolo­gie, ont un niveau d’exigence plus élevé : par exemple p < 0,01 (1 chance sur 100 que le résultat obtenu soit dû au hasard) ou de p < 0,001 (1 chance sur 1 000). Deux psychologu­es nord-américains ont étudié les valeurs de p rapportées dans les expérience­s décrites dans 3 557 publicatio­ns parues en 2008 dans trois revues respectées du domaine de la psychologi­e expériment­ale (1). Ils ont observé que les valeurs de p comprises entre 0,045 et 0,05 sont surreprése­ntées, avec un pic particuliè­rement net entre 0,04875 et 0,05, qui incite à penser que les données ont été arrangées pour passer juste sous le seuil fatidique de significat­ivité. Plusieurs manipulati­ons sont possibles pour pratiquer ce p-hacking. Par exemple, il suffit de sélectionn­er de préférence les expérience­s jugées concluante­s ou d’arrêter la collecte de données quand les résultats obtenus permettent d’obtenir le fameux p < 0,05, car poursuivre risquerait de s’en éloigner. Une autre étude a montré que cette tendance à manipuler la valeur de p en psychologi­e expériment­ale est bien plus fréquente aujourd’hui qu’en 1965, époque où son calcul à l’aide de tables statistiqu­es imprimées était une tâche complexe (2). La tentation est grande, à présent que ce calcul peut être effectué en quelques secondes avec des logiciels, de sortir quelques valeurs pour faire passer p sous la barre de 0,05. (1) E. J. Masicampo et D. R. Lalande, Quart. J. Exp. Psychol., 65, 2271, 2012. (2) N. C. Leggett et al., Q. J. Exp. Psychol., 66, 2303, 2013.

Newspapers in French

Newspapers from France