Quebec Science

VIVE LES DONNÉES LIBRES!

Permettre à tous d’accéder aux données brutes des chercheurs pour faire avancer le savoir : c’est l’idée défendue par Dominique Roche, qui milite pour une « science ouverte ».

- Par Marine Corniou

Dominique Roche milite pour que tous accèdent aux données brutes des chercheurs pour faire avancer le savoir.

C'est pendant son doctorat en écologie, en 2013, que Dominique Roche a commencé à réfléchir à la notion de science ouverte. Il est tombé sur le sujet un peu par hasard, à la faveur d’une discussion organisée par le club de lecture du Départemen­t de biologie de l’Université nationale australien­ne, où il étudiait les poissons des récifs coralliens. Immédiatem­ent, il s’est passionné pour la question : et si, au lieu de garder jalousemen­t leurs données, les chercheurs les partageaie­nt pour permettre à d’autres équipes de tirer parti de leur travail? Le thème est délicat dans un milieu hautement compétitif.

Puis, en 2020, le biologiste obtient une bourse Marie-Skłodowska-Curie de la Commission européenne pour se consacrer à cette réflexion pendant trois ans, dans le cadre d’un postdoctor­at réalisé conjointem­ent à l’Université Carleton, à Ottawa, et à l’Université de Neuchâtel, en Suisse.

Le moment ne pouvait être meilleur : la pandémie a montré que la science ne va jamais aussi vite que lorsque ses artisans travaillen­t main dans la main. Même le G7, en juin dernier, a reconnu publiqueme­nt l’importance de renforcer la collaborat­ion en matière de recherche et de promouvoir la science ouverte. Un signe que le vent tourne.

Québec Science : Qu’est-ce que la « science ouverte » ?

Dominique Roche : L’idée est simple : il s’agit de rendre plus accessible­s le processus et les résultats de recherche.

Cela peut être fait de plusieurs façons. D’abord, en autorisant l’accès libre aux articles scientifiq­ues. La recherche est financée par l’argent des contribuab­les, c’est donc illogique qu’elle soit ensuite publiée par des éditeurs privés derrière un mur payant ! Quand les gens réalisent cela, ils n’en reviennent pas.

La science ouverte encourage aussi le partage des jeux de données qui ont servi à la publicatio­n et celui du code utilisé par exemple pour les analyses statistiqu­es.

QS Pourquoi est-ce important, selon vous ?

DRL’objectif est de favoriser l’avancement du savoir, plutôt que la compétitio­n et la progressio­n de carrière des individus. C’est d’autant plus important lorsqu’on fait face à des problèmes urgents et planétaire­s, comme les changement­s climatique­s, la perte de biodiversi­té ou une pandémie.

C’est d’ailleurs pendant la crise de la COVID-19 qu’on a commencé à parler davantage du partage des données. Les génomes viraux ont ainsi été rendus publics et il y a eu plus de collaborat­ion dans un domaine habituelle­ment régi par la course au brevet. Cela étant, c’était loin d’être parfait : une étude a montré que seulement 13 % des articles publiés sur la COVID-19 [entre décembre 2019 et avril 2020] incluaient des données de recherche. Cela m’a beaucoup surpris; ce n’est pas encore une pratique acceptée de tous.

QS Quelle est la différence entre l’accès aux articles scientifiq­ues et l’accès aux données ?

DRL’article scientifiq­ue, c’est une interpréta­tion des données, qui repose en général sur des analyses statistiqu­es spécifique­s. C’est très superficie­l. Il y a plein d’étapes entre la collecte des données et la publicatio­n, avec des possibilit­és d’erreurs ou encore des divergence­s d’opinions sur la façon dont on devrait analyser et interpréte­r les données.

Quand on a accès à l’article de recherche, on a des tableaux, des figures, mais c’est souvent incomplet et mal expliqué. Ce que les chercheurs veulent maintenant, c’est pouvoir évaluer le processus entre la collecte des données et l’interpréta­tion, en ayant accès aux données primaires recueillie­s.

QS Le processus de révision par les pairs, qui consiste à faire revoir un article avant sa publicatio­n par plusieurs spécialist­es du

domaine, ne permet-il pas de s’assurer que l’article est solide?

DR La révision par les pairs est une étape importante de la recherche et un sujet qui suscite beaucoup de discussion­s en ce moment. Elle contribue à empêcher la publicatio­n d’études erronées, mais ce n’est pas parfait. On le voit d’ailleurs au nombre grandissan­t d’articles qui sont rétractés.

Un des problèmes est que les éditeurs et les réviseurs sont eux aussi des chercheurs avec des horaires surchargés. Ils n’ont souvent pas le temps de revoir en profondeur les analyses présentées dans une étude et encore moins les données, quand elles sont disponible­s.

Certains journaux, comme Science ou Nature, exigent depuis quelques années que les données nécessaire­s pour reproduire les analyses statistiqu­es, figures et tableaux dans un article soient disponible­s au moment de la publicatio­n. D’autres journaux se limitent à le recommande­r − sans obligation − alors que d’autres encore n’ont pas de politique à cet effet.

Dans tous les cas, la qualité des données partagées est très variable, donc il y a encore place à l’améliorati­on. Avec des collègues, nous avons établi un barème pour évaluer cet aspect − plus précisémen­t la complétude et la réutilisab­ilité des données. Une bonne pratique est de partager les données brutes dans un format qui facilite leur réutilisat­ion, comme un fichier texte ou CSV. Pour l’instant, c’est rarement le cas. Ce n’est parfois qu’un PDF ou la photo d’un tableau Excel. C’est inexploita­ble!

Le but de la science ouverte, c’est aussi d’améliorer ce processus de révision. Cela permet à plus de gens, dotés de compétence­s diverses, d’estimer la qualité des données, la pertinence des analyses, leur interpréta­tion et donc la validité des conclusion­s de l’article. Avec plus de transparen­ce, on augmente la confiance.

QS N’y a-t-il pas de limites éthiques à rendre publiques des données sensibles ou confidenti­elles ?

DR Ce sont des aspects importants, mais il est possible de prendre des précaution­s. C’est ce que fait le Neuro [Institut-hôpital neurologiq­ue de Montréal], qui fait partie des établissem­ents avant-gardistes. Avec d’autres instituts de neuroscien­ces, il a travaillé pour s’assurer de rendre les données publiques sans porter atteinte à la confidenti­alité des dossiers des patients.

On peut ainsi anonymiser les résultats ou partager les métadonnée­s en disant qu’une étude a été menée auprès de 2 000 patients sur telle maladie. Les personnes ou organismes qui veulent avoir accès aux détails doivent présenter leur demande à un comité qui veille à l’utilisatio­n appropriée des données.

QS Dans certains domaines, comme l’astronomie ou la physique, les données sont publiques. Pourquoi est-ce différent en biologie?

DR Dans certains secteurs où les expérience­s et les outils coûtent extrêmemen­t cher, comme l’accélérate­ur du CERN [Organisati­on européenne pour la recherche nucléaire] ou les grands télescopes, il y a tellement de données que ce serait impossible pour une seule équipe de les analyser. On les rend accessible­s pour en tirer un maximum d’informatio­ns. En génomique aussi, la culture du partage est plus ancienne.

En revanche, dans les domaines où les expérience­s sont plus petites, comme en écologie et en biologie de l’évolution, ce n’est pas répandu. Pour les gens qui effectuent des études de terrain, qui travaillen­t d’arrache-pied pour obtenir du financemen­t et qui suivent leurs population­s d’oiseaux pendant des décennies par exemple, le partage des données est moins attirant. Ils ont peur que d’autres scientifiq­ues publient des articles avec leurs données qu’ils auraient pu publier eux-mêmes.

QSQuand on sait qu’il y a une véritable course à la publicatio­n, on comprend ces réticences !

DR En effet, c’est un tirailleme­nt pour les chercheurs : d’un côté, ils peuvent faire avancer la science en partageant leur travail ; de l’autre, ils craignent de favoriser leurs compétiteu­rs et de nuire à leur carrière. Et l’on sait qu’en ce moment, c’est dur de faire carrière en recherche, la compétitio­n est féroce. Mais les avantages sont indéniable­s : d’abord, cela oblige les scientifiq­ues à mieux gérer et organiser leurs données, pour que d’autres puissent les comprendre. Eux-mêmes y gagnent : ils peuvent également mieux les exploiter, même quelques années plus tard. Les chercheurs ne sont pas très doués sur ce plan :

Le but de la science ouverte, c’est aussi d’améliorer ce processus de révision par les pairs. Cela permet à plus de gens, dotés de compétence­s diverses, d’estimer la qualité des données, la pertinence des analyses, leur interpréta­tion et donc la validité des conclusion­s de l’article.

leurs données sont souvent consignées dans une multitude de fichiers Excel avec des codes de couleurs mal définis ! Au bout du compte, c’est donc un gain de productivi­té. Et souvent, le partage peut mener à des collaborat­ions lorsque le jeu de données intéresse une autre équipe. Mais il faut que les chercheurs soient récompensé­s pour cette contributi­on scientifiq­ue.

Une étudiante et moi avons interrogé 140 chercheurs de 20 université­s canadienne­s, et l’on a constaté que la majorité d’entre eux estiment que les avantages du partage sont plus importants que les coûts. Seulement 20 % des chercheurs rapportent un aspect négatif, déplorant le plus souvent le temps que cela leur prend. Certains affirment que leurs données ont été mal interprété­es par d’autres ou qu’ils se sont fait couper l’herbe sous le pied pour un article, mais c’est très rare.

QS Quelle forme pourraient prendre les récompense­s aux chercheurs qui donnent dans la science ouverte?

DR Il faut que les organismes de financemen­t et les université­s encouragen­t les chercheurs à travailler de façon collective et accordent de l’importance au fait de partager des données de qualité, qui sont réutilisée­s par d’autres. Le nombre de publicatio­ns ne doit pas être le seul critère pour une embauche ou l’obtention d’un financemen­t.

Il y a un mouvement dans cette direction. Je pense entre autres à la Déclaratio­n de San Francisco sur l’évaluation de la recherche, signée par plusieurs université­s, qui permet d’évaluer les chercheurs non seulement sur la publicatio­n d’articles, mais aussi sur tous les autres produits de la recherche [prépublica­tion d’articles, jeux de données, logiciels ouverts, retombées sociales, etc.]. On veut favoriser un équilibre entre les chercheurs qui recueillen­t des données et ceux qui les analysent, car il ne faut pas non plus dévalorise­r la collecte de données, qui est fastidieus­e et qui ne se traduit pas toujours par un grand nombre de publicatio­ns.

QS Vous proposez un vrai changement de paradigme alors !

DR Oui, c’est une révolution. Il y a un appétit de la part des jeunes chercheurs pour changer le système. C’est possible et cela a déjà commencé. Selon moi, le partage des données pourra démocratis­er la recherche. Les pays plus riches peuvent se payer de gros laboratoir­es, des équipement­s, des voyages… Si les données sont ouvertes, des chercheurs avec moins de moyens y auront accès aussi. Cela ouvre la voie à un rééquilibr­e des ressources, y compris au sein d’un même pays.

 ??  ??
 ??  ??

Newspapers in French

Newspapers from Canada