Armée du big data, la science traque les virus en temps réel
MÉDECINE La recherche médicale basée sur les mégadonnées existe déjà. L’Institut suisse de bio-informatique, qui organise un colloque cette semaine, a déjà mis au point de tels outils, notamment pour le suivi des épidémies
Age, poids, taille, glycémie, taux de cholestérol ou encore séquence génétique: le corps humain est une mine inépuisable d’informations. Des données qui sont souvent muettes, enfermées dans des silos tels que le dossier médical électronique ou les essais cliniques. Mais traiter et interpréter ce «big data médical» est aujourd’hui possible, grâce à de récents progrès technologiques en informatique, avec l’utilisation d’agents d’intelligence artificielle, et en biologie, avec le développement d’outils de séquençage ultrarapide du génome.
Quelque 300 experts se réunissent du 9 au 11 septembre à Bâle lors de la [BC] 2 Computational Biology Conference, l’un des plus importants rassemblements de cette discipline en Europe aux dires de l’Institut suisse de bio-informatique (SIB), organisateur de l’événement.
Une médecine résolument informatisée reste un lointain objectif. «L’application du big data en médecine est très prometteuse, mais, dans l’ensemble, ces grandes attentes restent à combler. C’est un vrai privilège que d’être en mesure de rassembler les experts mondiaux en Suisse pour faire le point sur la situation et échanger sur les défis qui nous attendent pour concrétiser ces perspectives», déclare dans un communiqué le coprésident de la conférence, Erik van Nimwegen, chef de projet au SIB et bio-informaticien à l’Université de Bâle.
Cartes et arbres généalogiques
Médecine et big data ne sont toutefois pas que de lointaines promesses. Exemple concret qui fait déjà parler des données, «Nextstrain permet de mieux comprendre comment se propagent les virus et de prendre des décisions de santé publique basées sur des faits scientifiques», détaille son co-concepteur Richard Neher, chef de projet SIB à l’Université de Bâle.
Cet outil en ligne qui a vu le jour en 2017 récolte les séquences génétiques d’une dizaine de virus responsables d’épidémies, dont Ebola, Zika et le virus de la grippe. Pour obtenir ces informations, Nextstrain glane les données là où il le peut, chaque virus nécessitant son propre modus operandi: dans la littérature scientifique, dans des bases données ou en collaboration directe avec des équipes de chercheurs.
Ces données en poche, Nextstrain propose des visualisations graphiques pertinentes – cartes géographiques ou encore arbres généalogiques des souches virales – permettant de comprendre comment se propagent et comment évolue chacun de ces agents infectieux.
Cas pratique le plus évident: Ebola, responsable d’une vaste épidémie en Afrique de l’Ouest en 2015. Une carte animée de la région montre où sont survenus les cas au fil du temps et, à chaque fois que c’est possible, quel était le code génétique du virus prélevé chez les malades. En quelques secondes, l’utilisateur peut visualiser comment le virus s’est transmis d’une région à l’autre, mais aussi identifier si des cas d’Ebola sont le fait d’une même souche virale, ou bien si deux ou plusieurs souches génétiquement distinctes sévissent simultanément – ce qui permet d’identifier rapidement les chaînes de transmission.
«Lors d’épidémies, les seules données à disposition sont le nombre de nouveaux cas par semaine, déplore Richard Neher. Nextstrain apporte une couche d’informations supplémentaires sur les transmissions et l’évolution virale, ce qui est en soi un gain considérable dans la connaissance et la compréhension des épidémies.» Autre avantage de son outil, il autorise une mise à jour des données en temps quasi réel, c’est-à-dire en les actualisant tous les quelques jours.
«Imagination et créativité»
La plateforme a également une vocation prédictive: s’agissant du virus de la grippe, elle permet d’identifier la souche virale dominante d’une saison à l’autre et ainsi de savoir celle qui nécessitera un vaccin.
On reste toutefois encore loin de prévoir des épidémies: ce n’est pas parce qu’un virus évolue qu’il va déclencher plus de maladies. Toujours est-il qu’il illustre bien l’apport important d’une maîtrise des outils informatiques dans le monde de la recherche. «Les choses avancent à leur rythme. Les chercheurs commencent à faire preuve d’imagination et de créativité dans ce domaine, c’est toute une culture nouvelle à acquérir», conclut Richard Neher.
▅
Dans le cas de la grippe, Nextstrain permet d’identifier la souche virale dominante d’une saison à l’autre et ainsi de savoir quelle est celle qui nécessitera un vaccin