♦ La datascience, de la production au produit, chez Gemalto
ON NE PRÉSENTE PLUS GEMALTO. LE GÉANT MONDIAL DE LA CARTE À PUCES A TOUJOURS EU DEUX PRÉOCCUPATIONS : OPTIMISER SA CHAÎNE DE PRODUCTION ET DÉVELOPPER DE NOUVEAUX PRODUITS. AUJOURD’HUI, IL A RECOURS AUX ALGORITHMES DE DATAIKU POUR RÉPONDRE À CES ENJEUX.
Depuis que Gemplus et Axalto sont devenus Gemalto en 2006, l’entreprise a constamment cherché à optimiser ses opérations, de la R & D à l’usine. Et alors qu’il est confronté au ralentissement de son activité historique, le géant a mis les bouchées doubles pour lancer sur le marché de nouveaux produits, des services regroupés dans sa branche Identité, l’iot et la Cybersécurité. Deux problématiques pour lesquelles il a aujourd’hui recours à L’IA. « Ce sont deux axes forts » , nous explique Raphaël de Cormis, vice- président Innovations Labs chez Gemalto, « Nous avons cherché des partenaires pour avancer plus vite. » L’entreprise a donc réuni autour d’elle un trio, composé D’AWS et de Google sur la partie infrastructure du datalake : le premier principalement sur le stockage, le second sur les services de Machine Learning, et enfin de Dataiku, « partenaire de connaissance » et fournisseur d’un outil de datascience. Attardons- nous quelques secondes sur ce dernier. Née d’un quatuor de Français, cette start- up dans un premier temps parisienne a installé son siège social à New York en 2015. Elle édite une solution prénommée Dataiku Data Science Studio – Dataiku DSS pour les intimes –, une plate- forme de datascience misant sur le collaboratif pour traiter et analyser des données et élaborer des modèles prédictifs. Se voulant touten- un, DSS couvre aussi bien l’intégration via ses API, le nettoyage et l’enrichissement des données, leur visualisation, le développement de modèles de Machine Learning et la mise en production. Il est l’outil de référence chez Gemalto, tandis que le datalake est mis à la disposition des équipes afin qu’elles y versent leurs données lorsque des projets émergent.
« Avant de se lancer, il a fallu générer une traction des business units au sein de Gemalto. Nous avons créé un pôle d’experts “volants ” d’une dizaine de personnes qui peuvent assister les métiers à lancer des projets. » À cela s’ajoutent dans les directions métier des ingénieurs qui ont développé des compétences sur ces sujets d’intelligence artificielle. « Cette organisation facilite la « prise de graisse » de toute exploration de cas d’usage de Machine Learning, plutôt que de se
retrouver bloquer par les directions métier » , souligne le vice- président. « L’idée est qu’à partir de ces données on élabore des modèles qui correspondent à nos use cases métier, sans avoir à réécrire les procédures » , indique Raphaël de Cormis.
Dans les usines…
Premier axe exploré par Gemalto, l’optimisation de ses opérations. L’entreprise compte une cinquantaine d’usines dispersées à travers le monde, dans lesquelles sont produits documents d’identité, cartes SIM, cartes de paiement, etc. Si l’entreprise a mis en place des procédures très poussées pour éviter les rebuts, la production reste perfectible. Pour compenser les cartes comportant des défauts, Gemalto produit 20 % de cartes supplémentaires pour couvrir les besoins. « Nous nous sommes dits, avec les responsables de production, que nous pouvions encore optimiser la production, mais nous ne savions pas dans quelle mesure, ni les causes des rebuts » , confie le vice- président. Première étape, collecter les données de production, à la fois sur le type de produits à fabriquer ( couleurs, complexité des features de sécurité, etc.), sur la séquence de production ( quel type de machine, quelles étapes, dans quel ordre) et sur les machines elles- mêmes et leurs réglages. Se posent déjà de premières difficultés. D’une part, ces données sont diverses, entre les données de produits structurées, des données de process peu structurées et très locales, qui diffèrent d’une usine à l’autre et des données de réglages machines structurées mais dans divers formats. D’autre part, ces données étaient au départ inertes et très peu utilisées : « Pour des raisons de sécurité, nos usines sont déconnectées d’internet. Au début, on envoyait les données sur disque pour les verser dans le datalake. Nous avons dû repenser la connectivité de nos usines. » En outre, Dataiku permet un traitement de données non structurées et multiformat. « Nous n’avons finalement pas eu besoin d’un prétraitement des données » , précise Raphaël de Cormis. À partir d’une première usine « cible » , Gemalto et Dataiku ont collecté et analysé un historique de trois mois de données de production. « Avec DSS, nous avons pu établir un certain nombre de corrélations, ainsi qu’élaborer et entrainer des modèles » , poursuit Raphaël de Cormis. « Grâce au Machine Learning, nous arrivons désormais à prédire le niveau de production au pourcentage près. » Adieu donc surplus et pourcentage par défaut. D’abord en test dans une usine, ce modèle est passé en production et est déployé au rythme d’une usine par mois.
… et sur le canapé du client
La solution de Dataiku est également mobilisée sur l’amélioration des produits de sécurité commercialisés par Gemalto. Le cas le plus avancé est celui de la vérification d’identité. Destinée notamment aux banques, cette solution doit permettre de détecter les fraudes tout en fluidifiant l’expérience client. Il s’agit très simplement de vérifier l’identité d’un client, lorsque celui- ci ouvre un compte par exemple aussi bien sur son canapé qu’en agence, et l’authenticité des pièces qu’il présente. Jusqu’à présent, l’analyse était « rules- based » : l’analyse d’un permis de conduire prenait entre 30 et 45 secondes. Autant de temps au cours duquel l’utilisateur final risquait de se lasser. « Avec le Machine Learning, on est en dessous d’une seconde » , assure Raphaël de Cormis. Et ce grâce à la capacité de Dataiku à intégrer des bases d’images, « Ce qui permet de gagner beaucoup de temps » .
L’anonymisation des données passe encore par Dataiku. « On est autour de 1 million d’images pour l’entraînement et on a utilisé les plugin Dataiku pour tout le processus de labellisation pour entraîner nos modèles. » Après un peu moins d’un an de construction, le modèle est en cours de bascule vers la production. Gemalto explore deux autres cas d’usages, à savoir la reconnaissance faciale et la reconnaissance de risques dans le cadre d’une authentification, avec sur ce dernier point le passage d’un livre de règles rédigées manuellement à une création de règles automatisée. Parmi les enjeux auxquels est venu répondre DSS, Raphaël de Cormis cite la sécurité, avec une couche de chiffrement et une anonymisation des données assez poussée, ou encore le passage en production, « un des points assez difficiles et assez bien résolu » , le fonctionnement de Dataiku par API facilitant aussi bien la gestion des données à la volée que le réentraînement des modèles. Surtout, Gemalto voulait que L’IA ne reste pas qu’à l’état de projet de R & D. Selon le vice- président, les équipes métier « sont intégrées au processus car elles nous permettent de mieux comprendre la donnée et facilitent le “end- over ”, les applications sont conjointement développées par les équipes manufacturing, IT, sécurité et la direction de l’innovation, afin d’être assuré que l’organisation métier prenne la solution en main » . ❍
« Les équipes métier sont intégrées au processus car elles nous permettent de mieux comprendre la donnée et facilitent le end- over »
Raphaël de Cormis vice- président Innovations Labs Gemalto