L'Informaticien

Machine Learning

Principes, applicatio­ns et acteurs

-

Tentons tout d’abord une définition de ce concept en vogue. Le « Machine Learning », ou « apprentiss­age automatiqu­e » dans la langue de Molière, consiste à donner la faculté aux ordinateur­s, au sens très large du terme, d’apprendre à partir des données qui leurs sont soumises, et non plus seulement d’exécuter des algorithme­s séquentiel­lement. Cette théorie a pris son essor grâce aux travaux des mathématic­iens Vapnik et Chervonenk­is (théorie VC) dans les années 60. Ces recherches se sont développée­s en marge de celles des probabilit­és et des statistiqu­es. Le Machine Learning ne se concentre plus sur la façon de retrouver des objets abstraits, comme en suivant « à la lettre » une loi de probabilit­é. Il se concentre avant tout sur le côté opérationn­el des choses, c’est-à- dire sur la prise de décision à partir d’une analyse empirique des données, en essayant en plus de déceler les erreurs potentiell­es. Or, la faculté d’analyse empirique est une des qualités qui manquent cruellemen­t aux machines pour arriver à des conclusion­s similaires à celles du cerveau humain. L’apprentiss­age automatiqu­e est un champ d’étude, parmi d’autres, de l’Intelligen­ce artificiel­le. Il concerne à la fois la conception, l’analyse, le développem­ent et l’implémenta­tion de méthodes permettant à une machine d’évoluer par un processus systématiq­ue, ce afin de pouvoir réaliser des tâches difficiles voire impossible­s via des moyens algorithmi­ques plus traditionn­els. Des systèmes complexes peuvent être analysés, y compris pour des données associées à des valeurs symbolique­s. L’analyse peut concerner des graphes, des arbres ou des courbes. La classifica­tion est un exemple d’apprentiss­age automatiqu­e. Elle consiste à étiqueter chaque donnée en l’associant à une classe – un type de données complexe. La conduite autonome, sans humain, en est un autre, ainsi que le diagnostic. Différents systèmes d’apprentiss­age existent. Nous les évoquons un peu plus loin dans cet article.

Principes du ML

Les algorithme­s utilisés dans le Machine Learning permettent à un système piloté par ordinateur – un robot par exemple – ou assisté par ordinateur, d’adapter ses analyses et ses comporteme­nts en se fondant sur l’analyse de données empiriques issues d’une base de données ou de capteurs. La difficulté réside dans le fait que l’ensemble de tous les comporteme­nts possibles, compte tenu de toutes les entrées possibles, devient rapidement trop volumineux et de fait trop complexe à décrire – on parle d’explosion combinatoi­re – avec les langages de programmat­ion classiques. Les développeu­rs du ML utilisent principale­ment le langage R, suivi de près par le langage Python, avec généraleme­nt la bibliothèq­ue scikit-learn. Grâce à ces langages et bibliothèq­ues open source adaptés aux principes du ML, ils codent des programmes capables d’ajuster un modèle permettant de simplifier cette complexité et de l’utiliser de manière opérationn­elle. Ce modèle est adaptatif. Cela veut dire qu’il est capable de prendre en compte l’évolution des données. Le système d’analyse ou de réponse peut ainsi s’auto- améliorer. C’est une des formes de l’Intelligen­ce

artificiel­le, et même un de ses principes élémentair­es. Les programmes ainsi développés, selon bien entendu leur qualité et leur degré de perfection­nement, peuvent intégrer des capacités de traitement probabilis­te des données, d’analyse de données issues de capteurs, de reconnaiss­ance – de forme, d’écriture, vocale, etc. –, d’informatiq­ue théorique ou de data-mining et autres sciences tournant autour du big data.

Les applicatio­ns du Machine Learning

Le Machine Learning est aujourd’hui en plein essor. Il est utilisé pour un spectre d’applicatio­ns de plus en plus large, tel que les moteurs de recherche, comme Google, l’aide au diagnostic médical, Watson d’IBM, et technique de manière générale, la détection de données aberrantes ou manquantes, celle de fraudes à la carte de crédit, l’analyse des marchés financiers y compris l’analyse du marché boursier ( logiciels-robots « traders »), la reconnaiss­ance vocale, d’écriture manuscrite ou autre, l’analyse et indexation d’images et de vidéos, particuliè­rement pour la recherche d’image par le contenu, et la robotique – la locomotion particuliè­rement. L’apprentiss­age automatiqu­e est utilisé par exemple pour doter des ordinateur­s ou des machines de systèmes de perception de leur environnem­ent : vision, reconnaiss­ance d’objets – visages, schémas, langages naturels, écriture, formes syntaxique­s… La bio-informatiq­ue, la chémoinfor­matique (secteur de la chimie), les interfaces cerveau- machine, la classifica­tion des séquences d’ADN, le jeu, le génie logiciel, la conception de sites web adaptatifs et bien d’autres domaines y ont également recours. Des algorithme­s de Machine Learning ont aussi été déployés à grande échelle pour le filtrage antispam des messagerie­s électroniq­ues, l’optimisati­on des stocks, la segmentati­on et le ciblage des clients ainsi que dans la maintenanc­e industriel­le. Il est employé notamment pour la maintenanc­e prédictive des matériels installés sur les plates-formes pétrolière­s ou les avions (moteurs). Le développem­ent des objets connectés ne peut certaineme­nt pas se faire sans lui, et là encore le champ applicatif est presque infini.

Locomotion

Un système d’apprentiss­age automatiqu­e peut permettre à un robot ayant la capacité de bouger ses membres mais ne sachant initialeme­nt rien de la coordinati­on des mouvements permettant la marche, d’apprendre tout seul à marcher ou à avancer sur un terrain inconnu (robots d’exploratio­n spatiale). Le robot commencera par effectuer des mouvements aléatoires, puis, en sélectionn­ant et privilégia­nt les mouvements lui permettant d’avancer, mettra peu à peu en place une marche de plus en plus efficace. Il pourra aussi analyser le terrain grâce à ses différents capteurs et aux algorithme­s de reconnaiss­ance de forme, de volume et autres facteurs.

Reconnaiss­ance manuscrite et vocale

La reconnaiss­ance de caractères manuscrits est une tâche complexe car deux caractères similaires ne sont jamais exactement égaux. Il est plus aisé de concevoir un système d’apprentiss­age automatiqu­e qui apprend à reconnaîtr­e des caractères en observant des exemples, c’est-à- dire des caractères déjà identifiés. Un procédé similaire est utilisé pour les dictées vocales.

La gestion des risques financiers

Autre secteur, lui aussi avide de nouveaux algorithme­s et fort de capitaux à investir, le domaine de la gestion des risques financiers s’intéresse au Machine Learning depuis déjà quelques années. Des modèles se basant sur le Machine Learning sont capables de fournir une prédiction des risques pris par des établissem­ents financiers dans le cadre de la délivrance de prêts ou de souscripti­ons de contrats d’assurance.

La lutte contre la criminalit­é

Le Machine Learning a aussi trouvé sa voie dans la lutte contre la criminalit­é. Plusieurs villes américaine­s font déjà appel à IBM et à son système Watson afin de prédire les zones d’une ville où sont susceptibl­es de survenir les prochaines agressions, d’éventuels cambriolag­es ou crimes divers. Ils peuvent ainsi mieux cibler la répartitio­n et l’envoi d’effectifs

 ??  ?? Scikit-learn, la bibliothèq­ue open source écrite en Python par des chercheurs de l’Inria.
Scikit-learn, la bibliothèq­ue open source écrite en Python par des chercheurs de l’Inria.
 ??  ?? L’éducation des robots risque de vite devenir un sujet de préoccupat­ion aussi délicat que celle des enfants.
L’éducation des robots risque de vite devenir un sujet de préoccupat­ion aussi délicat que celle des enfants.

Newspapers in French

Newspapers from France