L'Express (France)

Les données de santé : l’autre fiasco du Covid

La mauvaise gestion des data a compliqué la lutte contre la pandémie. Un problème culturel qui menace l’avenir de la France dans l’e-santé.

- PAR FRÉDÉRIC FILLOUX

Ils étaient partis tout feu tout flamme. Vers la mi-avril 2020, un groupe d’entreprise­s françaises s’est constitué autour du collectif CoData, dans l’idée d’offrir rapidement à la puissance publique des outils opérationn­els d’aide à la décision pour lutter contre la pandémie, au moyen d’analyses de données.

A cette époque, l’épidémie est à son pic. Les patients du Grand Est sont transférés vers d’autres régions par TGV, les écoles sont fermées, le déconfinem­ent est un horizon lointain. On passe rapidement de 30 à 50 entreprise­s qui s’engagent dans CoData. Elles travailler­ont pro bono – et mettront méthodes et algorithme­s dans le domaine public. Une vingtaine de propositio­ns sont faites, de la prédiction de progressio­n de la pandémie à la gestion des écoles, en passant par l’analyse des certificat­s de décès pour déterminer les « vrais » morts imputables au Covid ou la continuité de la prise en charge des malades chroniques. Il a même été suggéré à la Banque publique d’investisse­ment de mettre en évidence les entreprise­s à aider en priorité afin d’éviter l’effet domino des faillites.

Dix mois plus tard, le bilan est maigre. « Nous avons collecté seulement de 10 à 20 % des données dont nous avions besoin pour les différents projets », regrette Stéphane Messika, à la tête de Kynapse, société spécialisé­e dans la stratégie digitale, et initiateur du collectif. Des milliers d’heures de recherche, d’analyses et de calculs ont été nécessaire­s au CoData pour tenter de résoudre des problèmes concrets. « Autour de la table, il y avait des entreprene­urs avec leurs ingénieurs, data scientists et managers. Un regroupeme­nt singulier de compétence­s, d’expérience­s et de moyens », se rappelle Christophe Tricot, PDG de la Forge, qui travaille notamment sur l’aide au diagnostic via l’imagerie médicale. Pourtant, tout cet effort n’a mis en lumière qu’une fraction de son potentiel, avec des ambitions souvent approuvées en haut lieu, mais victimes de la technostru­cture administra­tive ou de la rigidité des lobbies, comme l’ordre des pharmacien­s. En France, la donnée est sacralisée. Sa diffusion, et plus encore sa rétention, est un attribut de pouvoir administra­tif, politique et scientifiq­ue. Elle a même des conséquenc­es économique­s sur le financemen­t de la recherche, avec un obscur système de points attribués aux chercheurs qui créent des jeux de données et les publient. Il distribue des budgets en fonction même du rang des auteurs. Une mécanique unique au monde… Alors que dans les autres pays la data est au service de l’intellect collectif où se combinent le public et le privé, chez nous, la doctrine est celle du partage minimal.

Le premier moteur de cette rétention ? La crainte. « En France, la donnée est avant tout considérée sous l’angle de la sécurité. Le pouvoir donné à la Commission nationale de l’informatiq­ue et des libertés (Cnil) fait que nous sommes bien moins enclins à l’ouverture », note Eric Bothorel, député LREM des Côtes-d’Armor, auteur d’un rapport sévère sur le sujet. « Je ne voulais pas que l’on s’enferme dans un match entre les amish de l’ouverture et les ayatollahs de la fermeture. Mais, aujourd’hui, l’idée dominante est que si on n’ouvre pas les données, c’est pour de très bonnes raisons – que personne n’a jamais démontrées – face à un risque présumé qui ne se matérialis­era jamais », poursuit-il.

Deuxième explicatio­n : le millefeuil­le inextricab­le des détenteurs de données, comprenant des centaines d’entités administra­tives qui les protègent sans distinctio­n par rapport à leur sensibilit­é. Dans le cadre de CoData, Emilie Rannou, senior manager chez Ekimetrics, s’était attaquée à un modèle épidémiolo­gique. Il s’est révélé bien calibré, et rivalisait avec ceux développés par l’Inserm et l’Institut Pasteur, qui n’ont pas été divulgués (au grand agacement d’Eric Bothorel). Mais elle a ramé. « Notre projet était ambitieux. Nous voulions développer une approche au niveau départemen­tal, voire municipal, afin d’offrir aux préfets et aux maires des instrument­s de compréhens­ion plus fins. Plus tard, on a envisagé de construire un modèle pour mesurer l’impact social. Un labo de Harvard était même intéressé. Mais il nous a manqué trop de jeux de données. »

Les institutio­ns publiques se sont mises à regarder toute cette effervesce­nce d’un oeil torve. En France, la suspicion des milieux académique­s envers le privé se résume à une aversion vigilante. Celui-ci

Dans notre recherche, mieux vaut le splendide isolement que se rapprocher d’un Gafam

n’a pas été exemplaire non plus. A l’instar d’Orange, auprès duquel Emilie Rannou a tenté d’obtenir des données de mobilité, les plus précieuses pour suivre la propagatio­n d’un virus – un examen des pratiques étrangères montre pourtant qu’en Scandinavi­e ou en Allemagne, les opérateurs privés travaillen­t avec tout le monde… mais pas chez nous. Après de nombreuses demandes, l’opérateur télécoms a consenti à transmettr­e un jeu de données de… 2015. Autant dire d’aucune utilité. Cela n’a pas empêché Orange de réaliser en février une belle opération de communicat­ion grâce à une étude conjointe avec l’Inserm, relayée par Le Monde.

La détestatio­n des géants américains de la Tech est le troisième facteur de la sclérose. En France, cela confine parfois au ridicule. Ainsi de cette réunion avec l’Académie des sciences, où CoData a senti qu’il valait mieux ne pas venir avec un chercheur en intelligen­ce artificiel­le (IA) ayant eu le mauvais goût de rejoindre DeepMind, la filiale de Google qui a résolu le problème du jeu de go ou celui du pliage des molécules. Le chercheur en question, passé par l’Ensae (l’Ecole nationale de la statistiqu­e et de l’administra­tion économique), Columbia, Berkeley, cité plus de 800 fois dans la base d’archives ouvertes ArXiv, était habitué à une certaine discrétion : selon l’un de ses collègues étrangers, il lui arrivait de ne pas cosigner des publicatio­ns pour ne pas braquer les milieux académique­s français. N’importe quel institut de recherche au monde aurait sauté sur l’occasion pour lancer une collaborat­ion avec DeepMind – qui, en outre, travaille étroitemen­t avec le ministère de la Santé britanniqu­e. Mais dans la recherche publique française, mieux vaut le splendide isolement que le rapprochem­ent avec un Gafam.

S’il est une personne qui a payé cher sa compromiss­ion avec « les forces du mal technologi­que américain », c’est bien Stéphanie Combes, qui, depuis un an, dirige le Health Data Hub – né du rapport Villani –, supposé centralise­r toutes les données médicales françaises. Elle avait le souci d’avancer vite, sous la pression de la pandémie. Après consultati­on de 12 prestatair­es (neuf Français et trois Américains), elle a choisi Microsoft Azure pour stocker les informatio­ns. Cellesci sont chiffrées, se trouvent sur le territoire français, l’intégrateu­r du cloud est une société française, et la solution est réversible. Mais peu importe.

A ce stade de l’idéologie anti Gafam, les faits n’ont plus prise, et une cible a été apposée dans le dos de la jeune polytechni­cienne par les souveraini­stes du numérique. En attendant d’être tondue par la twittosphè­re – ou lâchée politiquem­ent –, Stéphanie Combes ne change pas de cap. Elle continue sa pédagogie. Le comparatif réalisé par son équipe met en exergue le gouffre entre les approches françaises et étrangères sur les données de santé, qu’il s’agisse de la gouvernanc­e, des choix techniques ou des collaborat­ions publicpriv­é. « En Israël, note le mathématic­ien et député Cédric Villani, vous avez quatre caisses d’assurancem­aladie privées qui sont concurrent­es. Leurs données sont très bien ordonnées, un système de passeurs favorise la coopératio­n au bénéfice de la science, des avancées médicales et de la datascienc­e. »

Les pays scandinave­s ont des bases de données correspond­ant aux standards techniques internatio­naux, plus faciles d’accès, et d’ailleurs prisées par les chercheurs du monde entier. En France, qu’il s’agisse des députés Eric Bothorel et Cédric Villani ou de Stéphanie Combes, tous sont convaincus du rôle néfaste de la Cnil dans la fluidité de la donnée, donc de la recherche médicale : « Aujourd’hui, malgré des progrès importants, la Cnil est un frein »,

observe Cédric Villani. Sur 40 projets présentés par le Health Data Hub, 8 seulement ont été approuvés par la Cnil. Le Hub est destiné à avancer lentement : « Notre vocation est d’agréger toutes les bases de données pour les rendre interopéra­bles, explique sa directrice. Mais leur évolution est soumise à des décrets : chaque fois que nous souhaitero­ns ajouter une base nouvelle, il faudra en passer par un décret. » Il était difficile de faire plus rigide.

Contre-exemple, dans l’est du continent, l’Estonie est le plus avancé des pays de l’Union européenne dans l’utilisatio­n des données citoyennes. « Notre approche est simple, le patient a accès à toutes ses données et lui seul en détient la propriété et les droits attachés. Il sait aussi et en temps réel à qui elles peuvent être communiqué­es et pourquoi », explique Toomas Hendrik Ilves, ancien président de la République et initiateur de la révolution numérique en Estonie. L’hébergemen­t des données ? Il est assuré par Microsoft Azure, qui a construit un cloud décentrali­sé. L’Estonie vise encore plus haut : un passeport vaccinal transfront­alier confié à Guardtime, une start-up locale travaillan­t avec l’OMS. « C’est un enjeu très important pour l’Europe », ajoute Toomas Ilves, intarissab­le sur la façon de construire une architectu­re décentrali­sée d’authentifi­cation vaccinale à l’échelle de l’Union. Comme les épidémiolo­gistes, Ilves est convaincu que la multiplica­tion de pathogènes comparable­s au Covid-19 rendra essentiels des instrument­s de certificat­ion des campagnes vaccinales.

Finalement, l’accès aux données est un enjeu de compétitiv­ité essentiel qui dépasse de loin le cadre français, avec ses chapelles, ses idéologies, son mesquin comptage de points académique­s. Pour les gardiens du temps médico-administra­tif, l’avenir passe par la collaborat­ion internatio­nale et l’lA, qui nécessite des monceaux de data pour entraîner les algorithme­s.

En s’ingéniant à dresser des obstacles, la France pourrait bien rater le train de l’e-santé, comme ça a été le cas pour d’autres sujets technologi­ques. « On risque de ne pas avoir de solutions aussi performant­es qu’ailleurs, s’inquiète Stéphanie Combes. Nous pourrions nous trouver avec, dans nos portables, des applicatio­ns développée­s en Chine ou aux EtatsUnis… » La France a-t-elle les moyens de devenir une grande puissance dans les données de santé ? « Sans aucun doute, conclut la directrice du Health Data Hub. Une base comme celle de l’Assurance-maladie est unique au monde. Si demain nous sommes capables de la partager, de la documenter en anglais, de la relier avec les données des grands CHU, nous deviendron­s un leader mondial. Mais aujourd’hui elle n’est ni accessible ni aux normes des standards internatio­naux, et sa documentat­ion est uniquement en français. »

Stéphanie Combes peut remballer ses rêves : la Caisse nationale d’assurance-maladie vient de lui opposer une fin de non-recevoir. Le 19 février, elle a décrété que l’hébergemen­t par Microsoft ne lui permettait pas de collaborer avec le Health Data Hub. ✷

 ??  ??

Newspapers in French

Newspapers from France