Teradata : passer du prototype à la mise en production
PASSER DU PROTOTYPE À LA MISE EN PRODUCTION
C’est certainement l’une des parties les plus compliquées dans les processus informatiques : passer d’un prototype fonctionnel à une mise en production à plus ou moins grande échelle. Et c’est assez naturellement que plusieurs spécialistes des bases de données se sont spécialisés sur ces aspects. En l’occurrence, Teradata a développé depuis quelques années son savoirfaire en matière d’Intelligence artificielle via sa branche de conseils en analytique. « Du prototype à la production, le gouffre est énorme : seuls 15 % des projets analytiques et de Machine Learning réussissent à passer en pro
duction ! » , constate Stéphane Rion, Director Data Science France chez Teradata. Un projet IA n’est pas différent en soi d’un autre, et les challenges sont les mêmes. Le manque de planification est encore souvent ce qui fait généralement défaut aux entreprises. Mais ce n’est bien entendu pas la seule raison ; le manque criant de compétences, en data science notamment, est également à ajouter à la liste des principaux éléments. Les profils recherchés sont donc naturellement en mathématiques et en statistiques au sens large, mais aussi en développement pur sur des langages comme Python ou R.
« Un prototype au sein de nos équipes, c’est autour de 6 à 8 semaines de développement. Pour une mise en pro
duction, il faut compter 6 à 12 mois » , poursuit encore Stéphane Rion. Par ailleurs, une étude montre que si l’IA est envisagée avec beaucoup d’optimisme, 91 % des entreprises s’attendent à des obstacles en termes d’adoption et de ROI, comme pour presque toutes les technologies émergentes d’ailleurs.
Cas concret : détection de la fraude
Dans certains cas, c’est la branche Think Big Analytics de l’éditeur qui travaille de A à Z avec les clients. C’est le cas à la Danske Bank, qui a mis en place un moteur d’Intelligence artificielle utilisant le Machine Learning pour analyser des dizaines de milliers de caractéristiques latentes, évaluer des millions de transactions bancaires en ligne, en temps réel, afin de fournir des informations exploitables sur les activités frauduleuses. Cela permet de réduire sensiblement le coût d’investigation des faux positifs, d’augmenter l’efficacité globale et de réaliser des économies. Les cas de fraude sont très rares ; ils représentent environ un cas pour 100 000 transactions. L’équipe a réussi à réduire de 50 % les faux positifs des modèles, grâce notamment à une solution quasi temps réel. « La plate- forme anti- fraude basée sur l’IA que nous avons développée en collaboration avec la Danske Bank évalue les transactions entrantes en moins de 300 millisecondes » , explique Mads Ingwar, directeur des services clients de Think Big Analytics. L’avantage des algorithmes d’IA, en Machine Learning et/ ou Deep Learning, est qu’ils peuvent être réutilisés pour plusieurs applications. Au moins, le squelette d’une solution analytique peut l’être à travers plusieurs industries pour obtenir des résultats rapidement. Ces solutions prépackagées permettent effectivement d’aller plus vite. Teradata en compte entre 30 et 40, et propose aussi certaines de ses solutions en Open Source, tout en contribuant aussi à l’amélioration d’autres bibliothèques ; l’éditeur ne se cache pas d’utiliser parfois TensorFlow de Google. « Nous mettons d’ailleurs certains de nos outils en Open Source, comme notre gestionnaire de datalake Kylo » , rappelle Stéphane Rion, qui rapporte aussi que majoritairement, les projets d’IA actuels sont plutôt sur de la donnée structurée.