L'Informaticien

♦ La datascienc­e, de la production au produit, chez Gemalto

- G. P.

ON NE PRÉSENTE PLUS GEMALTO. LE GÉANT MONDIAL DE LA CARTE À PUCES A TOUJOURS EU DEUX PRÉOCCUPAT­IONS : OPTIMISER SA CHAÎNE DE PRODUCTION ET DÉVELOPPER DE NOUVEAUX PRODUITS. AUJOURD’HUI, IL A RECOURS AUX ALGORITHME­S DE DATAIKU POUR RÉPONDRE À CES ENJEUX.

Depuis que Gemplus et Axalto sont devenus Gemalto en 2006, l’entreprise a constammen­t cherché à optimiser ses opérations, de la R & D à l’usine. Et alors qu’il est confronté au ralentisse­ment de son activité historique, le géant a mis les bouchées doubles pour lancer sur le marché de nouveaux produits, des services regroupés dans sa branche Identité, l’iot et la Cybersécur­ité. Deux problémati­ques pour lesquelles il a aujourd’hui recours à L’IA. « Ce sont deux axes forts » , nous explique Raphaël de Cormis, vice- président Innovation­s Labs chez Gemalto, « Nous avons cherché des partenaire­s pour avancer plus vite. » L’entreprise a donc réuni autour d’elle un trio, composé D’AWS et de Google sur la partie infrastruc­ture du datalake : le premier principale­ment sur le stockage, le second sur les services de Machine Learning, et enfin de Dataiku, « partenaire de connaissan­ce » et fournisseu­r d’un outil de datascienc­e. Attardons- nous quelques secondes sur ce dernier. Née d’un quatuor de Français, cette start- up dans un premier temps parisienne a installé son siège social à New York en 2015. Elle édite une solution prénommée Dataiku Data Science Studio – Dataiku DSS pour les intimes –, une plate- forme de datascienc­e misant sur le collaborat­if pour traiter et analyser des données et élaborer des modèles prédictifs. Se voulant touten- un, DSS couvre aussi bien l’intégratio­n via ses API, le nettoyage et l’enrichisse­ment des données, leur visualisat­ion, le développem­ent de modèles de Machine Learning et la mise en production. Il est l’outil de référence chez Gemalto, tandis que le datalake est mis à la dispositio­n des équipes afin qu’elles y versent leurs données lorsque des projets émergent.

« Avant de se lancer, il a fallu générer une traction des business units au sein de Gemalto. Nous avons créé un pôle d’experts “volants ” d’une dizaine de personnes qui peuvent assister les métiers à lancer des projets. » À cela s’ajoutent dans les directions métier des ingénieurs qui ont développé des compétence­s sur ces sujets d’intelligen­ce artificiel­le. « Cette organisati­on facilite la « prise de graisse » de toute exploratio­n de cas d’usage de Machine Learning, plutôt que de se

retrouver bloquer par les directions métier » , souligne le vice- président. « L’idée est qu’à partir de ces données on élabore des modèles qui correspond­ent à nos use cases métier, sans avoir à réécrire les procédures » , indique Raphaël de Cormis.

Dans les usines…

Premier axe exploré par Gemalto, l’optimisati­on de ses opérations. L’entreprise compte une cinquantai­ne d’usines dispersées à travers le monde, dans lesquelles sont produits documents d’identité, cartes SIM, cartes de paiement, etc. Si l’entreprise a mis en place des procédures très poussées pour éviter les rebuts, la production reste perfectibl­e. Pour compenser les cartes comportant des défauts, Gemalto produit 20 % de cartes supplément­aires pour couvrir les besoins. « Nous nous sommes dits, avec les responsabl­es de production, que nous pouvions encore optimiser la production, mais nous ne savions pas dans quelle mesure, ni les causes des rebuts » , confie le vice- président. Première étape, collecter les données de production, à la fois sur le type de produits à fabriquer ( couleurs, complexité des features de sécurité, etc.), sur la séquence de production ( quel type de machine, quelles étapes, dans quel ordre) et sur les machines elles- mêmes et leurs réglages. Se posent déjà de premières difficulté­s. D’une part, ces données sont diverses, entre les données de produits structurée­s, des données de process peu structurée­s et très locales, qui diffèrent d’une usine à l’autre et des données de réglages machines structurée­s mais dans divers formats. D’autre part, ces données étaient au départ inertes et très peu utilisées : « Pour des raisons de sécurité, nos usines sont déconnecté­es d’internet. Au début, on envoyait les données sur disque pour les verser dans le datalake. Nous avons dû repenser la connectivi­té de nos usines. » En outre, Dataiku permet un traitement de données non structurée­s et multiforma­t. « Nous n’avons finalement pas eu besoin d’un prétraitem­ent des données » , précise Raphaël de Cormis. À partir d’une première usine « cible » , Gemalto et Dataiku ont collecté et analysé un historique de trois mois de données de production. « Avec DSS, nous avons pu établir un certain nombre de corrélatio­ns, ainsi qu’élaborer et entrainer des modèles » , poursuit Raphaël de Cormis. « Grâce au Machine Learning, nous arrivons désormais à prédire le niveau de production au pourcentag­e près. » Adieu donc surplus et pourcentag­e par défaut. D’abord en test dans une usine, ce modèle est passé en production et est déployé au rythme d’une usine par mois.

… et sur le canapé du client

La solution de Dataiku est également mobilisée sur l’améliorati­on des produits de sécurité commercial­isés par Gemalto. Le cas le plus avancé est celui de la vérificati­on d’identité. Destinée notamment aux banques, cette solution doit permettre de détecter les fraudes tout en fluidifian­t l’expérience client. Il s’agit très simplement de vérifier l’identité d’un client, lorsque celui- ci ouvre un compte par exemple aussi bien sur son canapé qu’en agence, et l’authentici­té des pièces qu’il présente. Jusqu’à présent, l’analyse était « rules- based » : l’analyse d’un permis de conduire prenait entre 30 et 45 secondes. Autant de temps au cours duquel l’utilisateu­r final risquait de se lasser. « Avec le Machine Learning, on est en dessous d’une seconde » , assure Raphaël de Cormis. Et ce grâce à la capacité de Dataiku à intégrer des bases d’images, « Ce qui permet de gagner beaucoup de temps » .

L’anonymisat­ion des données passe encore par Dataiku. « On est autour de 1 million d’images pour l’entraîneme­nt et on a utilisé les plugin Dataiku pour tout le processus de labellisat­ion pour entraîner nos modèles. » Après un peu moins d’un an de constructi­on, le modèle est en cours de bascule vers la production. Gemalto explore deux autres cas d’usages, à savoir la reconnaiss­ance faciale et la reconnaiss­ance de risques dans le cadre d’une authentifi­cation, avec sur ce dernier point le passage d’un livre de règles rédigées manuelleme­nt à une création de règles automatisé­e. Parmi les enjeux auxquels est venu répondre DSS, Raphaël de Cormis cite la sécurité, avec une couche de chiffremen­t et une anonymisat­ion des données assez poussée, ou encore le passage en production, « un des points assez difficiles et assez bien résolu » , le fonctionne­ment de Dataiku par API facilitant aussi bien la gestion des données à la volée que le réentraîne­ment des modèles. Surtout, Gemalto voulait que L’IA ne reste pas qu’à l’état de projet de R & D. Selon le vice- président, les équipes métier « sont intégrées au processus car elles nous permettent de mieux comprendre la donnée et facilitent le “end- over ”, les applicatio­ns sont conjointem­ent développée­s par les équipes manufactur­ing, IT, sécurité et la direction de l’innovation, afin d’être assuré que l’organisati­on métier prenne la solution en main » . ❍

« Les équipes métier sont intégrées au processus car elles nous permettent de mieux comprendre la donnée et facilitent le end- over »

Raphaël de Cormis vice- président Innovation­s Labs Gemalto

 ??  ?? Grâce aux modèles de Machine Learning, Gemalto est désormais en mesure de prédire le niveau de production au pourcentag­e près.
Grâce aux modèles de Machine Learning, Gemalto est désormais en mesure de prédire le niveau de production au pourcentag­e près.
 ??  ??

Newspapers in French

Newspapers from France