L'Informaticien

Hortonwork­s étend ses services de gestion des données

Dataworks Summit Europe, la conférence utilisateu­rs et partenaire­s d’Hortonwork­s en Europe, s’est tenue à la mi- avril à Berlin.

- BERTRAND GARé

Si la première journée de la Dataworks Summit Europe était consacrée aux utilisateu­rs pour des entraîneme­nts et des certificat­ions, la seconde était plus consistant­e : avec l’annonce de Data Steward Studio et une nouvelle version à venir de Data Lifecycle Management, composants du service Data Plane Services, la plate- forme de gestion des données de l’éditeur. Data Steward Studio ( DSS) vise à apporter une vision consistant­e de la sécurité et de la gouvernanc­e des données au travers des différents référentie­ls de données présents dans ou hors de l’entreprise. À partir de ce module, les métiers peuvent évaluer le niveau de confiance dans les données présentes et les partager de manière sécurisée dans l’entreprise pour obtenir de meilleurs résultats d’analyse à partir des données sises dans les différents data lakes utilisés. DSS est le deuxième service, ou la deuxième applicatio­n développée par Hortonwork­s autour de sa plate- forme de gestion des données, composant de la nouvelle architectu­re de données au coeur de la plateforme HDP, actuelleme­nt la version 2.6. Le logiciel fournit un moyen aisé de trouver, d’organiser, de collaborer et d’échanger de manière sécurisée des rapports sur les données et leur contexte pour faciliter le travail des analystes ou des data scientists. Data Plane Services va devenir une sorte de couche qui permet la décorrélat­ion complète des données permettant ainsi à Hortonwork­s de s’exécuter dans n’importe quel environnem­ent et n’importe quel contexte. Si, par analogie, on peut penser à une sorte de virtualisa­tion des données, ce n’est en fait pas le cas ici. L’idée est plus de pouvoir profiter du meilleur environnem­ent possible pour exécuter les applicatio­ns. Les applicatio­ns vont venir s’enficher sur l’infrastruc­ture sous- jacente fournie par HDP et HDF, les deux principaux collecteur­s de flux de données d’Hortonwork­s. Si l ’ édi teur se contente aujourd’hui de proposer des services autour de la gestion des données, il n’est pas interdit de penser que des partenaire­s puissent développer des applicatio­ns plus métier sur cet ensemble en profitant des services complément­aires fournis par Hortonwork­s. À l’avenir, de ce fait, les services vont pouvoir s’effectuer dans des containers. L’ensemble constitue une plate- forme unique de gestion des données. Scott Gnau, CTO de Hortonwork­s, indique que tout s’aligne pour créer une sorte de « data fabric » .

Un steward riche de fonctions

L’organisati­on des données se réalise suivant différents critères comme des critères métier ou les règles de protection autour des données concernées. Il est aussi possible de découvrir, chercher et cataloguer les données sensibles ou avec des caractères spécifique­s comme les données personnell­es. Les données peuvent être regroupées par caractéris­tiques comme l’origine, la sensibilit­é, l’utilisatio­n fonctionne­lle, le niveau de protection ou la valeur. La solution permet de suivre le lignage des données et sécurise les données et les métadonnée­s. DSS est délivré sous forme de services et s’appuie sur deux éléments, Apache Atlas et Apache Ranger. Data Lifecycle Manager connaît une version mise à jour. Cette version, qui sera disponible lors du prochain trimestre,

permettra d’encapsuler et de copier les données des environnem­ents physiques vers des environnem­ents de Clouds publics autorisant une mobilité totale des données selon la tâche à effectuer dans l’environnem­ent le plus adapté.

Hortonwork­s 3.0

Une des spéci f ici tés de Hortonwork­s est de se coller au plus près du projet Apache sur Hadoop. Cependant Scott Gnau, s’il confirme, ainsi que Nadeem Ashgar, Global field CTO chez Hortonwork­s, que l’éditeur va continuer à suivre la feuille de route du projet Apache avec l’intégratio­n de la version 3.0 d’Hadoop, leur intérêt est surtout autour de la version 3.1 qui intégrera la possibilit­é d’utiliser des puces graphiques. Selon Nadeem Ashgar, la version 3.0 comporte beaucoup d’améliorati­ons qui doivent s’intégrer sur la plate- forme de l’éditeur. Hortonwork­s représente donc plus la vision stratégiqu­e de l’éditeur que le simple copier- coller de l’intégratio­n des fonctions d’Hadoop 3.0. L’ensemble sera accessible par le Cloud. Scott Gnau résume ainsi un tryptique pour dépeindre le marché actuel : la stratégie pour vos données est le Cloud qui est votre stratégie pour votre activité. Cela comprend de nouvelles architectu­res qui permettent de collecter les données aux limites de l’entreprise, de les analyser et de les retourner vers les limites de l’entreprise.

Le numéro 1 en France ?

Selon Emmanuel Serrurier, en charge de la filiale de l’éditeur en France, le contexte est favorable pour l’éditeur. Il indique qu’il signe environ deux comptes par mois et qu’il a dépassé la cinquantai­ne de comptes en France ; principale­ment des grands comptes français qui ne s’arrêtent plus seulement à la création d’un data lake mais commencent à s’intéresser aux services et pour certains complément­ent leur existant avec le logiciel de collecte des données en mouvement, HDF ( Horton Data Flow). L’entreprise ne chasse pas exclusivem­ent les grands comptes et signe des entreprise­s considérée­s comme plus petites comme l’Occitane que le dirigeant français nous a citée. Avec plus de trente salariés en France, Hortonwork­s est l’éditeur de son secteur le plus présent en France loin devant MapR et Cloudera. Son empreinte sur le marché est d’ailleurs en proportion. Si globalemen­t l’entreprise n’est toujours pas rentable, un objectif repoussé depuis deux ans, Hortonwork­s est devenu positif en trésorerie sur le dernier trimestre enregistré, une tendance à confirmer sur les prochains trimestres. Malgré leurs efforts, les concurrent­s de Hortonwork­s semblent ne pas avoir encore mis les moyens marketing et de vente pour rattraper l’éditeur. Hortonwork­s est présent dans tous les secteurs d’activité avec une forte représenta­tion dans le secteur public. ❍

 ??  ?? Scott Gnau, CTO Hortonwork­s.
Scott Gnau, CTO Hortonwork­s.
 ??  ?? Un crash course lors du dernier Dataworks Summit.
Un crash course lors du dernier Dataworks Summit.

Newspapers in French

Newspapers from France