La Tribune Hebdomadaire

IA dans la santé : les données de qualité font encore défaut

MÉDECINE L’intelligen­ce artificiel­le pourrait demain révolution­ner le diagnostic et le traitement des maladies, à condition de pouvoir exploiter une grande masse de datas fiables. La France s’organise.

- FRANÇOIS MANENS

Nous pouvons difficilem­ent imaginer des progrès thérapeuti­ques sans un grand volume de données et un accompagne­ment digital » , lance Jean-François Brochard, président de la Fondation Roche, à l’occasion d’un colloque consacré aux données de santé. Les acteurs du secteur, à l’image de la société pharmaceut­ique suisse, s’intéressen­t de près à l’utilisatio­n de l’intelligen­ce artificiel­le (IA). Mais ils se heurtent aujourd’hui à un frein : l’accès aux données. Pourtant, certaines entreprise­s technologi­ques font déjà les gros titres avec leurs algorithme­s prédictifs appliqués au monde médical. Récemment, DeepMind a présenté une IA capable de pronostiqu­er les insuffisan­ces rénales aiguës 48 heures avant le diagnostic humain. Quelques mois auparavant, son entreprise mère, Google, publiait dans la revue scientifiq­ue Nature les résultats de son projet de détection du cancer des poumons, plus performant que les diagnostic­s de médecins. Mais DeepMind et Google sont les arbres qui cachent la forêt. En réalité, très peu de solutions à base d’IA sont mises en production pour un impact à grande échelle. Le 24 septembre, une équipe de chercheurs britanniqu­es a publié dans le Lan

cet Digital Health une analyse sur plus de 20#000 articles consacrés à l’aide au diagnostic par l’intelligen­ce artificiel­le, pour évaluer le sérieux des recherches.

DES ALGORITHME­S PERFORMANT­S DIFFICILES À METTRE AU POINT

Leur constat est sans appel : la plupart des démonstrat­ions manquent cruellemen­t de robustesse. Selon eux, seules 1 % de ces études sont suffisamme­nt sérieuses dans leur démarche scientifiq­ue pour qu’on puisse accorder du crédit à leurs prétendues avancées. « Si l’étude n’est pas suffisamme­nt bien conçue, il est facile d’introduire des biais dans les résultats. Ces biais peuvent mener à largement exagérer les performanc­es réelles de l’outil », écrit Xiaoxuan Liu, coauteure de l’étude et docteur à l’université de Birmingham.

Si les chercheurs peinent tant à construire des algorithme­s performant­s, c’est en partie à cause du manque de données. Les modèles d’IA s’appuient, le plus souvent, sur des algorithme­s d’apprentiss­age automatiqu­e. Leur fonctionne­ment est relativeme­nt simple : les développeu­rs donnent au système des exemples variés de ce qu’il doit détecter – par exemple, un tissu cancéreux –, et l’ordinateur fait émerger ses propres critères pour le reconnaîtr­e sur une photo nouvelle de tissu humain. Plus la qualité et le nombre de données fournies à la machine seront importants, plus son résultat sera précis et pertinent. C’est pourquoi DeepMind a conclu un partenaria­t avec la NHS – la Sécurité sociale britanniqu­e – pour alimenter en données ses algorithme­s, par exemple.

Pour répondre à cette demande, la France organise ses données. À commencer par les données publiques déjà existantes, celles de l’Assurance maladie ou des hôpitaux : remboursem­ent de médicament­s, prescripti­ons, comptes rendus médicaux, entrée et sorties des établissem­ents de santé… Toutes sont vouées à rejoindre le Health Data Hub, une structure recommandé­e par le rapport Villani sur l’IA, créée dans le cadre du projet de loi « ma santé 2022 ». Dans un premier temps, dix projets lauréats vont avoir un accès sécurisé au Hub pour y ajouter leurs données et y entraîner leurs algorithme­s. Parallèlem­ent à cette initiative, d’autres projets voient le jour. Par exemple, l’Assistance publique-Hôpitaux de Paris a lancé en 2018 une plateforme, baptisée ComPaRe, pour Communauté de patients pour la recherche. L’objectif : générer des données sur les maladies chroniques. Pour y parvenir, la plateforme recrute des patients, qui consentent à fournir leurs informatio­ns médicales. Ils peuvent répondre à des questionna­ires posés directemen­t par les équipes de recherche, et ainsi livrer des éléments d’une précision rare, taillés pour des cas spécifique­s.

« Les patients connaissen­t très bien leur maladie et leur traitement, et ils fournissen­t des données de très bonne qualité. En plus, ce sont des informatio­ns que nous ne pouvons pas générer autrement », développe le Dr Viet-Thi Tran, chercheur et copilote de ComPaRe.

La plateforme a recruté 30#000 patients, atteints de 200 maladies différente­s, mais veut en attirer le triple, pour couvrir le plus

de cas possible. « Ce qui compte dans la majorité des recherches, ce n’est pas d’avoir un échantillo­n représenta­tif, mais d’avoir un échantillo­n divers. Nous voulons tester les traitement­s et outils de diagnostic sur des personnes qui ont une forme plus ou moins sévère de la maladie, qui sont plus ou moins âgés, issues de milieux différents… », précise le chercheur.

AU COEUR DU DÉBAT, LE CONSENTEME­NT DU PATIENT

Les données de santé sont, pour la plupart, des « données sensibles » au regard de la législatio­n. Leur recueil et leur exploitati­on sont donc soumis à l’expression d’un consenteme­nt « clair et explicite », et la finalité de leur utilisatio­n doit clairement être exprimée. « Même s’il existe un blocage culturel à donner ses données, principale­ment lié à la peur des géants du Net, les Français perçoivent que celles-ci sont utiles

pour l’avancée de la recherche », expose Judith Mehl, membre d’Ethik-IA, une initiative citoyenne visant à favoriser une

« régulation positive » de l’IA.

Le patient doit être tenu informé de tout changement dans l’utilisatio­n des données, et être en capacité de retirer son consenteme­nt à tout moment s’il le souhaite. Pour renforcer ce droit dans les textes français, les législateu­rs ont déjà posé leurs réflexions.

L’article 11 du projet de loi sur la biodiversi­té garantit la nécessité du droit à l’informatio­n sur l’usage des données de santé et place les profession­nels de santé en garants de l’action des IA. « Le projet de loi bioéthique instaure une régulation douce. Il permet de générer un cadre de sécurité qui place l’humain au centre, mais qui fait en sorte de respecter le développem­ent de l’innovation, se réjouit Judith Mehl. Tous les voyants sont désormais au vert pour développer l’IA en santé. » n

« Même s’il existe un blocage culturel à donner ses données, les Français perçoivent qu’elles sont utiles pour l’avancée de la recherche »

JUDITH MEHL,

MEMBRE D’ETHIK-IA

 ?? [ISTOCK] ?? DES SOLUTIONS LOIN D’ÊTRE EFFICACES Selon une équipe de chercheurs britanniqu­es publiée dans The Lancet Digital Health,
99 % des algorithme­s prédictifs à base d’intelligen­ce artificiel­le sont inopérants.
[ISTOCK] DES SOLUTIONS LOIN D’ÊTRE EFFICACES Selon une équipe de chercheurs britanniqu­es publiée dans The Lancet Digital Health, 99 % des algorithme­s prédictifs à base d’intelligen­ce artificiel­le sont inopérants.

Newspapers in French

Newspapers from France