Les données de santé : l’autre fiasco du Covid
La mauvaise gestion des data a compliqué la lutte contre la pandémie. Un problème culturel qui menace l’avenir de la France dans l’e-santé.
Ils étaient partis tout feu tout flamme. Vers la mi-avril 2020, un groupe d’entreprises françaises s’est constitué autour du collectif CoData, dans l’idée d’offrir rapidement à la puissance publique des outils opérationnels d’aide à la décision pour lutter contre la pandémie, au moyen d’analyses de données.
A cette époque, l’épidémie est à son pic. Les patients du Grand Est sont transférés vers d’autres régions par TGV, les écoles sont fermées, le déconfinement est un horizon lointain. On passe rapidement de 30 à 50 entreprises qui s’engagent dans CoData. Elles travailleront pro bono – et mettront méthodes et algorithmes dans le domaine public. Une vingtaine de propositions sont faites, de la prédiction de progression de la pandémie à la gestion des écoles, en passant par l’analyse des certificats de décès pour déterminer les « vrais » morts imputables au Covid ou la continuité de la prise en charge des malades chroniques. Il a même été suggéré à la Banque publique d’investissement de mettre en évidence les entreprises à aider en priorité afin d’éviter l’effet domino des faillites.
Dix mois plus tard, le bilan est maigre. « Nous avons collecté seulement de 10 à 20 % des données dont nous avions besoin pour les différents projets », regrette Stéphane Messika, à la tête de Kynapse, société spécialisée dans la stratégie digitale, et initiateur du collectif. Des milliers d’heures de recherche, d’analyses et de calculs ont été nécessaires au CoData pour tenter de résoudre des problèmes concrets. « Autour de la table, il y avait des entrepreneurs avec leurs ingénieurs, data scientists et managers. Un regroupement singulier de compétences, d’expériences et de moyens », se rappelle Christophe Tricot, PDG de la Forge, qui travaille notamment sur l’aide au diagnostic via l’imagerie médicale. Pourtant, tout cet effort n’a mis en lumière qu’une fraction de son potentiel, avec des ambitions souvent approuvées en haut lieu, mais victimes de la technostructure administrative ou de la rigidité des lobbies, comme l’ordre des pharmaciens. En France, la donnée est sacralisée. Sa diffusion, et plus encore sa rétention, est un attribut de pouvoir administratif, politique et scientifique. Elle a même des conséquences économiques sur le financement de la recherche, avec un obscur système de points attribués aux chercheurs qui créent des jeux de données et les publient. Il distribue des budgets en fonction même du rang des auteurs. Une mécanique unique au monde… Alors que dans les autres pays la data est au service de l’intellect collectif où se combinent le public et le privé, chez nous, la doctrine est celle du partage minimal.
Le premier moteur de cette rétention ? La crainte. « En France, la donnée est avant tout considérée sous l’angle de la sécurité. Le pouvoir donné à la Commission nationale de l’informatique et des libertés (Cnil) fait que nous sommes bien moins enclins à l’ouverture », note Eric Bothorel, député LREM des Côtes-d’Armor, auteur d’un rapport sévère sur le sujet. « Je ne voulais pas que l’on s’enferme dans un match entre les amish de l’ouverture et les ayatollahs de la fermeture. Mais, aujourd’hui, l’idée dominante est que si on n’ouvre pas les données, c’est pour de très bonnes raisons – que personne n’a jamais démontrées – face à un risque présumé qui ne se matérialisera jamais », poursuit-il.
Deuxième explication : le millefeuille inextricable des détenteurs de données, comprenant des centaines d’entités administratives qui les protègent sans distinction par rapport à leur sensibilité. Dans le cadre de CoData, Emilie Rannou, senior manager chez Ekimetrics, s’était attaquée à un modèle épidémiologique. Il s’est révélé bien calibré, et rivalisait avec ceux développés par l’Inserm et l’Institut Pasteur, qui n’ont pas été divulgués (au grand agacement d’Eric Bothorel). Mais elle a ramé. « Notre projet était ambitieux. Nous voulions développer une approche au niveau départemental, voire municipal, afin d’offrir aux préfets et aux maires des instruments de compréhension plus fins. Plus tard, on a envisagé de construire un modèle pour mesurer l’impact social. Un labo de Harvard était même intéressé. Mais il nous a manqué trop de jeux de données. »
Les institutions publiques se sont mises à regarder toute cette effervescence d’un oeil torve. En France, la suspicion des milieux académiques envers le privé se résume à une aversion vigilante. Celui-ci
Dans notre recherche, mieux vaut le splendide isolement que se rapprocher d’un Gafam
n’a pas été exemplaire non plus. A l’instar d’Orange, auprès duquel Emilie Rannou a tenté d’obtenir des données de mobilité, les plus précieuses pour suivre la propagation d’un virus – un examen des pratiques étrangères montre pourtant qu’en Scandinavie ou en Allemagne, les opérateurs privés travaillent avec tout le monde… mais pas chez nous. Après de nombreuses demandes, l’opérateur télécoms a consenti à transmettre un jeu de données de… 2015. Autant dire d’aucune utilité. Cela n’a pas empêché Orange de réaliser en février une belle opération de communication grâce à une étude conjointe avec l’Inserm, relayée par Le Monde.
La détestation des géants américains de la Tech est le troisième facteur de la sclérose. En France, cela confine parfois au ridicule. Ainsi de cette réunion avec l’Académie des sciences, où CoData a senti qu’il valait mieux ne pas venir avec un chercheur en intelligence artificielle (IA) ayant eu le mauvais goût de rejoindre DeepMind, la filiale de Google qui a résolu le problème du jeu de go ou celui du pliage des molécules. Le chercheur en question, passé par l’Ensae (l’Ecole nationale de la statistique et de l’administration économique), Columbia, Berkeley, cité plus de 800 fois dans la base d’archives ouvertes ArXiv, était habitué à une certaine discrétion : selon l’un de ses collègues étrangers, il lui arrivait de ne pas cosigner des publications pour ne pas braquer les milieux académiques français. N’importe quel institut de recherche au monde aurait sauté sur l’occasion pour lancer une collaboration avec DeepMind – qui, en outre, travaille étroitement avec le ministère de la Santé britannique. Mais dans la recherche publique française, mieux vaut le splendide isolement que le rapprochement avec un Gafam.
S’il est une personne qui a payé cher sa compromission avec « les forces du mal technologique américain », c’est bien Stéphanie Combes, qui, depuis un an, dirige le Health Data Hub – né du rapport Villani –, supposé centraliser toutes les données médicales françaises. Elle avait le souci d’avancer vite, sous la pression de la pandémie. Après consultation de 12 prestataires (neuf Français et trois Américains), elle a choisi Microsoft Azure pour stocker les informations. Cellesci sont chiffrées, se trouvent sur le territoire français, l’intégrateur du cloud est une société française, et la solution est réversible. Mais peu importe.
A ce stade de l’idéologie anti Gafam, les faits n’ont plus prise, et une cible a été apposée dans le dos de la jeune polytechnicienne par les souverainistes du numérique. En attendant d’être tondue par la twittosphère – ou lâchée politiquement –, Stéphanie Combes ne change pas de cap. Elle continue sa pédagogie. Le comparatif réalisé par son équipe met en exergue le gouffre entre les approches françaises et étrangères sur les données de santé, qu’il s’agisse de la gouvernance, des choix techniques ou des collaborations publicprivé. « En Israël, note le mathématicien et député Cédric Villani, vous avez quatre caisses d’assurancemaladie privées qui sont concurrentes. Leurs données sont très bien ordonnées, un système de passeurs favorise la coopération au bénéfice de la science, des avancées médicales et de la datascience. »
Les pays scandinaves ont des bases de données correspondant aux standards techniques internationaux, plus faciles d’accès, et d’ailleurs prisées par les chercheurs du monde entier. En France, qu’il s’agisse des députés Eric Bothorel et Cédric Villani ou de Stéphanie Combes, tous sont convaincus du rôle néfaste de la Cnil dans la fluidité de la donnée, donc de la recherche médicale : « Aujourd’hui, malgré des progrès importants, la Cnil est un frein »,
observe Cédric Villani. Sur 40 projets présentés par le Health Data Hub, 8 seulement ont été approuvés par la Cnil. Le Hub est destiné à avancer lentement : « Notre vocation est d’agréger toutes les bases de données pour les rendre interopérables, explique sa directrice. Mais leur évolution est soumise à des décrets : chaque fois que nous souhaiterons ajouter une base nouvelle, il faudra en passer par un décret. » Il était difficile de faire plus rigide.
Contre-exemple, dans l’est du continent, l’Estonie est le plus avancé des pays de l’Union européenne dans l’utilisation des données citoyennes. « Notre approche est simple, le patient a accès à toutes ses données et lui seul en détient la propriété et les droits attachés. Il sait aussi et en temps réel à qui elles peuvent être communiquées et pourquoi », explique Toomas Hendrik Ilves, ancien président de la République et initiateur de la révolution numérique en Estonie. L’hébergement des données ? Il est assuré par Microsoft Azure, qui a construit un cloud décentralisé. L’Estonie vise encore plus haut : un passeport vaccinal transfrontalier confié à Guardtime, une start-up locale travaillant avec l’OMS. « C’est un enjeu très important pour l’Europe », ajoute Toomas Ilves, intarissable sur la façon de construire une architecture décentralisée d’authentification vaccinale à l’échelle de l’Union. Comme les épidémiologistes, Ilves est convaincu que la multiplication de pathogènes comparables au Covid-19 rendra essentiels des instruments de certification des campagnes vaccinales.
Finalement, l’accès aux données est un enjeu de compétitivité essentiel qui dépasse de loin le cadre français, avec ses chapelles, ses idéologies, son mesquin comptage de points académiques. Pour les gardiens du temps médico-administratif, l’avenir passe par la collaboration internationale et l’lA, qui nécessite des monceaux de data pour entraîner les algorithmes.
En s’ingéniant à dresser des obstacles, la France pourrait bien rater le train de l’e-santé, comme ça a été le cas pour d’autres sujets technologiques. « On risque de ne pas avoir de solutions aussi performantes qu’ailleurs, s’inquiète Stéphanie Combes. Nous pourrions nous trouver avec, dans nos portables, des applications développées en Chine ou aux EtatsUnis… » La France a-t-elle les moyens de devenir une grande puissance dans les données de santé ? « Sans aucun doute, conclut la directrice du Health Data Hub. Une base comme celle de l’Assurance-maladie est unique au monde. Si demain nous sommes capables de la partager, de la documenter en anglais, de la relier avec les données des grands CHU, nous deviendrons un leader mondial. Mais aujourd’hui elle n’est ni accessible ni aux normes des standards internationaux, et sa documentation est uniquement en français. »
Stéphanie Combes peut remballer ses rêves : la Caisse nationale d’assurance-maladie vient de lui opposer une fin de non-recevoir. Le 19 février, elle a décrété que l’hébergement par Microsoft ne lui permettait pas de collaborer avec le Health Data Hub. ✷