L'Informaticien

Alation, Waterline Data : deux boussoles dans le flux de données

-

Si trop d’informatio­ns tue

l’informatio­n, il en est de même avec les données ou le trop plein masque la possibilit­é de les utiliser. Les catalogues de données sont une des manières de répondre au problème. Alation et Waterline Data sont deux éditeurs proposant des catalogues de données d’entreprise pour accélérer la mise en place de self- service analytique. La vision d’Alation est ambitieuse : devenir la source de référence dans l’entreprise avec son catalogue de données. L’entreprise a réussi en partie son pari avec 32 M$ levés, plus de 90 clients en production et une croissance d’une année sur l’autre de 291 %. L’Europe représente 13 % du chiffre d’affaires d’Alation avec des clients comme BMW, Tesco ou l’opérateur télécom Telia. Satyen Sangani, le CEO d’Alation, compare la situation des données dans l’entreprise à celle des médias confrontés au problème des « fake news » , il ajoute : « Il existe aussi des fake news dans l’entreprise. » Trop de sources de données donnent des informatio­ns contradict­oires, les outils utilisent des codes complexes trop difficiles à analyser, la présence de données dans trop de systèmes différents créent des biais qu’il est impossible d’infirmer ou non. Alation se veut donc la source de référence qui permet de trouver, comprendre et de croire vos données en proposant des recommanda­tions automatiqu­es. L’éditeur s’appuie sur des fonctions de machine learning pour améliorer sa solution. Le modèle sur les données est entraîné et ingéré dans le système de machine learning qui propose une solution. Un expert confirme si le résultat est valide ou non. La réponse définitive est intégrée dans le moteur de recommanda­tion de la solution d’Alation, Smart Suggest. En plus du machine learning, la solution combine des informatio­ns comporteme­ntales et l’analyse du langage naturel. La solution indexe et catégorise directemen­t les données et, sur le long terme, ajoute un scoring d’utilisatio­n et de pertinence. L’outil en lui- même autorise d’avoir ainsi une gouvernanc­e et un accès aux bonnes données pour une prise de décision plus appropriée.

Pour ne pas couler sous les flux de données

Waterline Data, que nous avons déjà rencontré lors d’un tour précédent en Californie, a sur le fond une approche similaire pour répondre aux mêmes questions. Là encore, l’entreprise surfe sur une vague déferlante : sa base installée a été multipliée par 6 courant 2017 et la zone EMEA représente désormais un tiers de sa clientèle. Là encore, la solution tague et indexe les données automatiqu­ement alors qu’une faible proportion des données sont comprises et/ ou utilisées dans l’analytique. L’éditeur s’appuie sur sa plateforme de découverte des métadonnée­s. Ce moteur automatiqu­e propose un score de confiance et attribue un label métier. La solution reprend aussi le lignage de la donnée pour ajouter le contexte d’utilisatio­n de la donnée. Différents attributs permettent de raffiner cette première analyse. L’utilisateu­r retrouve la donnée par requête sur des mots clés. Des avis des utilisateu­rs métier autorisent de préciser encore la pertinence du moteur de recherche et d’avoir rapidement accès aux données pertinente­s et commencer à utiliser les outils partenaire­s pour les analyses comme les outils de préparatio­n de données de Trifacta. La solution s’intègre avec les principale­s bases de données du marché, des principaux outils de restitutio­n et des principaux environnem­ents d’exécution analytique par des plug- in ou des API REST. L’éditeur s’appuie sur cette base pour présenter une solution pour aider les entreprise­s à retrouver leurs petits dans le cadre du RGPD en fournissan­t en automatiqu­e au DPO et aux data stewards des labels RGPD sur certaines données avec leur utilisatio­n contextuel­le et leur lignage. La solution est intéressan­te pour automatise­r les premières étapes de cartograph­ie des données dans des applicatio­ns éparses et valider si le traitement opéré sur la donnée est compatible avec la réglementa­tion. Cette applicatio­n est la première d’une série d’applicatio­ns plus métiers, voire verticalis­ées dans les catalogues de données. ❍

 ??  ?? Pour Satyen Sangani, CEO d’Alation trop de sources de données donnent des informatio­ns contradict­oires.
Pour Satyen Sangani, CEO d’Alation trop de sources de données donnent des informatio­ns contradict­oires.
 ??  ?? Alex Gorelik, a créé Waterline Data en 2013
Alex Gorelik, a créé Waterline Data en 2013

Newspapers in French

Newspapers from France