RAG et LLM : la protection des données au coeur des modèles D’IA générative

2024-04-01 - Par François- Christophe Jean, Field Technical Director, Cohesity SEMEA.

Après

trois ans de travaux, le Parlement européen a approuvé, mi- mars, le projet de loi de régulation de l’intelligence artificielle ( AI Act) visant à assurer plus de transparence quant au fonctionnement des modèles D’IA générative à usage public.

Le potentiel de cette technologie est, en effet, exponentiel, et les entreprises du monde entier ont déjà commencé à l’exploiter. C’est ce que met en évidence une étude réalisée par Censuswide pour Cohesity, fournisseur mondial de solutions de gestion et de sécurisation des données assistées par L’IA ; si 86 % des 903 entreprises interrogées utilisent déjà des technologies D’IA générative, les risques liés à la conformité et à la protection des données restent les préoccupations principales pour plus d’un tiers des sondés.

La plupart des utilisateurs ne savent pas encore comment interagir de manière optimale avec les moteurs D’IA. Les solutions disponibles sont encore nouvelles et ne sont pas toutes entièrement développées. Les équipes IT, elles, ne pourront pas faire marche arrière, mais lorsqu’elles considèrent l’acquisition de nouvelles solutions, la priorité doit être mise sur le contrôle des données et l’adoption d’une gouvernance de L’IA qui soit responsable.

Les solutions basées sur L’IA comme Cohesity Gaia, sont souvent, par définition, liées à leur propre environnement et fonctionnent de façon transparente, permettant d’évaluer avec précision les risques d’accès aux données. Cohesity Gaia, l’un des premiers assistants de recherche conversationnels du marché, conjugue les technologies de « Retrieval- Augmented Generation » ( RAG) aux grands modèles de langages ( LLMS) pour interroger avec précision les bases de données secondaires de l’entreprise en récupérant des informations provenant de sources multiples, et ainsi, générer des réponses sémantiques, plus complètes et fondées sur un ensemble de données constamment mis à jour, sans besoin de réentrainement du modèle. Pour protéger les informations sensibles et aider les entreprises à se conformer aux exigences réglementaires, l’assistant de recherche s’insère dans l’environnement Cohesity Data Cloud, qui utilise des protocoles d’accès strict et une gestion des privilèges administratifs basée sur les principes de sécurité Zero Trust.

S’il peut être tentant de se laisser séduire par l’apparente facilité de mise en oeuvre des modèles RAG, la réalité est que le déploiement d’un tel système à l’échelle d’une entreprise est un défi aux facettes multiples. Il requiert de naviguer entre la complexité des données, les problèmes d’évolutivité, les protocoles de sécurité et les obstacles à l’intégration, tout en garantissant la qualité et l’explicabilité des résultats de recherche obtenus.

Lorsque les entreprises considèrent les différentes options dont elles disposent, investir dans la création de solutions en interne, ou s’associer à des experts dans ce domaine, leur décision ne doit pas être simplement guidée par la question de la technologie. Il s’agit de comprendre l’orientation stratégique de l’entreprise et d’aligner les outils sur cette vision à long terme, en s’entourant de spécialistes qui comprennent les problématiques de gestion et de protection des données, ainsi que la manière dont les modèles RAG peuvent être utilisés pour tirer le maximum d’information de leurs données tout en respectant les exigences de conformité en vigueur.

RAG et LLM : la protection des données au coeur des modèles D’IA générative

Newspapers in French

Newspapers from France