Edition Multimédi@

Pseudonymi­sation ou anonymisat­ion : dilemme

- Par Olivia Roche, avocate, et Prudence Cadio, avocate associée, cabinet LPA-CGR avocats

Alors qu'une deuxième vague de coronaviru­s menace, le gouverneme­nt croit en l'utilité des données « pseudonymi­sées » de son applicatio­n mobile Stopcovid malgré le peu d'utilisateu­rs. Mais le respect de la vie privée ne suppose-t-il pas une « anonymisat­ion » ? Le dilemme se pose dans la santé.

La crise sanitaire liée au covid-19 et le développem­ent concomitan­t des outils de surveillan­ce de l’évolution de l’épidémie ont mis en lumière les enjeux liés à l’anonymisat­ion des données à caractère personnel et, en particulie­r, des données de santé. Souvent présenté par la Commission nationale de l’informatiq­ue et des libertés (Cnil) comme un moyen indispensa­ble pour préserver la vie privée des personnes, le procédé d’anonymisat­ion aboutit cependant nécessaire­ment à une perte d’informatio­ns, parfois contestée par les profession­nels de santé.

Pseudonymi­sation ou anonymisat­ion ?

Les recommanda­tions publiées le 19 mai dernier par la Cnil (1) à ce sujet et les débats entourant l’applicatio­n mobile Stopcovid – mise à dispositio­n par le gouverneme­nt dans le cadre de sa stratégie globale de « déconfinem­ent progressif » – permettent de mieux appréhende­r ces problémati­ques. Si cette applicatio­n mobile ne dispose d’aucune informatio­n directemen­t identifian­te comme le nom ou le prénom, elle n’est pas pour autant « anonyme » au sens de la règlementa­tion relative à la protection des données (2). La confusion entre « données pseudonyme­s » et « données anonymes » demeure répandue, alors que le règlement général européen sur la protection des données (RGPD) – en vigueur depuis le 25 mai 2018 – a entériné la distinctio­n entre ces deux notions en son considéran­t 26. Comme le rappelle la Cnil, la pseudonymi­sation consiste à traiter les données personnell­es de façon à ce que celles-ci ne puissent plus être attribuées à une personne concernée sans avoir recours à des informatio­ns complément­aires. De manière plus concrète, ce processus consiste par exemple à remplacer des données personnell­es directemen­t identifian­tes telles que le nom ou le prénom par des données indirectem­ent identifian­tes telles qu’un alias, un numéro ou un code. La pseudonymi­sation constitue ainsi un outil utile pour conserver des données tout en préservant la vie privée des personnes, puisque celles-ci ne sont plus directemen­t identifian­tes. Néanmoins, l’opération de pseudonymi­sation étant réversible, il est possible de réidentifi­er ou identifier indirectem­ent les personnes sur la base de ces données. En conséquenc­e, les « données pseudonyme­s » demeurent des « données personnell­es » auxquelles s’applique l’ensemble des exigences de la règlementa­tion sur la protection des données personnell­es. Au contraire, les « données anonymisée­s » au sens du RGPD exclut toute possibilit­é de réidentifi­cation des personnes. Il s’agit d’appliquer un procédé aux données personnell­es pour rendre toute individual­isation et toute indentific­ation, directe ou indirecte, impossible et ce de manière irréversib­le et définitive. Cette distinctio­n constitue un enjeu central, puisque les « données anonymes » ou « rendues anonymes », lesquelles, contrairem­ent aux « données pseudonyme­s », ne sont pas ou plus des « données personnell­es », ne sont pas soumises aux exigences du RGPD. Ce règlement européen indique, en effet, expresséme­nt qu’il ne s’applique « pas au traitement de telles informatio­ns anonymes, y compris à des fins statistiqu­es ou de recherche » (3). A cet égard, il faut veiller à distinguer que, lorsqu’un procédé d’anonymisat­ion est appliqué, c’est bien uniquement le résultat obtenu – les « données anonymisée­s » – qui peut être exclu du champ d’applicatio­n matériel du RGPD mais non les données à caractère initialeme­nt collectées. De même, le processus d’anonymisat­ion constitue un « traitement » qui, effectué sur des données personnell­es, n’échappe pas en tant que tel aux exigences de la règlementa­tion sur la protection des données à caractère personnel. Quelles sont au juste les techniques d’anonymisat­ion ?

Randomisat­ion et généralisa­tion

Dans un avis en date du 10 avril 2014, le groupe dit de l’article 29 – ce « G29 » ayant été remplacé depuis l’entrée en applicatio­n du RGPD par le Comité européen de la protection des données (4) – proposait trois critères pour s’assurer que des données personnell­es faisaient bien l’objet d’un procédé d’anonymisat­ion et non de pseudonymi­sation : l’individual­isation (il doit être impossible d’isoler un individu dans l’ensemble de données), la corrélatio­n (il ne doit pas être possible de

relier deux ensembles distincts de données concernant un même individu) et l’inférence (il doit être impossible de déduire une informatio­n sur un individu). Pour éliminer toute possibilit­é d’identifica­tion, la Cnil rappelle que deux grandes techniques d’anonymisat­ion sont possibles. La « randomisat­ion » qui consiste à rendre moins précises les données, par exemple en permutant certaines informatio­ns dans l’ensemble de données tout en conservant la répartitio­n globale. La seconde technique dite de « généralisa­tion » consiste quant à elle à modifier l’échelle ou l’ordre de grandeur des données (par exemple en ne conservant que l’année de naissance au lieu de la date précise) afin d’éviter l’individual­isation ou la corrélatio­n avec d’autres ensembles de données. Ces méthodes d’anonymisat­ion doivent cependant être réévaluées régulièrem­ent car les techniques et possibilit­és de réidentifi­cation évoluent rapidement, à mesure des avancées technologi­ques.

Impacts sur la vie privée

A cet égard, dans son avis « Techniques d’anonymisat­ion » (5), le G29 indiquait déjà que « le résultat de l’anonymisat­ion, en tant que technique appliquée aux données à caractère personnel, devrait être, dans l’état actuel de la technologi­e aussi permanent qu’un effacement, c’est-à-dire qu’il devrait rendre impossible tout traitement de données à caractère personnel ». En effet, des données publiées comme « anonymes » à un instant T peuvent, grâce par exemple à une nouvelle technique développée par un tiers, redevenir indirectem­ent identifian­tes. Leur publicatio­n à titre de « données anonymes », sans veiller au respect du RGPD, pourrait ainsi constituer une violation de données. Si ces procédés d’anonymisat­ion permettent de conserver et de réutiliser des données pour des durées étendues tout en assurant le respect des droits et libertés des personnell­es, reste la question de l’utilité de données anonymes, notamment dans le secteur de la recherche scientifiq­ue et médicale. Comme le démontrent les débats entourant les traitement­s de données personnell­es mis en oeuvre par le biais de l’applicatio­n mobile Stopcovid, l’intérêt scientifiq­ue des données anonymes – qui ont perdu tout caractère individual­isant – est plus limité. Depuis toujours la problémati­que d’anonymisat­ion est très présente dans le secteur de la santé. En effet, les données relatives à la santé des personnes constituen­t à la fois des données personnell­es particuliè­rement risquées en termes d’impacts sur la vie privée, mais elles constituen­t également un enjeu important dans le cadre de la recherche scientifiq­ue et médicale. Par exemple, dès 2004, la Cnil s’était prononcée sur la volonté de la Fédération nationale de la mutualité française (FNMF) – regroupant 540 mutuelles adhérentes dont 266 mutuelles santé – d’avoir accès sous un format anonymisé à des données figurant sur des feuilles de soins électroniq­ues. Ce traitement devait être mis en oeuvre à des fins statistiqu­es pour étudier l’impact d’un remboursem­ent en fonction du service médical rendu pour les médicament­s. La Cnil avait autorisé le traitement en donnant des précisions et recommanda­tions strictes sur les modalités d’anonymisat­ion des données, les mesures de sécurité et le respect des droits des personnes concernées (6). Dans cette lignée, fin avril 2020, la Cnil s’est prononcée favorablem­ent à l’applicatio­n mobile Stopcovid déployée par le gouverneme­nt dans le cadre de sa stratégie de déconfinem­ent progressif – sous réserve que les données personnell­es collectées soient traitées sous un format pseudonymi­sé, puis supprimées de 15 jours ou 6 mois selon les catégories. « La [Cnil] prend acte de ce que l’article 4 du projet de décret [décret du 29 mai 2020 publié au J.O. du 30 mai dernier (7), ndlr] prévoit une conservati­on des clés et des identifian­ts associés aux applicatio­ns pendant la durée de fonctionne­ment de l’applicatio­n Stopcovid et au plus tard six mois à compter de la fin de l’état d’urgence sanitaire, et une conservati­on des historique­s de proximité des personnes diagnostiq­uées ou testées positives pendant quinze jours à compter de leur émission » (8). Cependant, le 21 juin dernier, le Conseil scientifiq­ue covid19 a publié un avis afin d’indiquer qu’il considérai­t essentiel d’appliquer l’option prévue par l’article 2 du projet de loi organisant la sortie de l’état d’urgence sanitaire permettant de conserver les données personnell­es collectées par Stopcovid pour une durée plus longue. Ce conseil scientifiq­ue (9) précise en outre que ces données devraient être conservées « sous une forme pseudonymi­sée et non simplement anonymisée, de façon à ce que les données d’un même individu, non-identifian­tes, puissent tout de même être reliées entre elles (ex : documentat­ion d’une ré-infection), ou chaînées avec des données d’autres bases » (10). Cette position illustre parfaiteme­nt les enjeux liés à l’articulati­on entre exploitati­on des données, durées de conservati­on et anonymisat­ion ou pseudonymi­sation.

Risque de seconde vague

La position de la Cnil et l’arbitrage qui sera opéré entre respect de la vie privée et le nécessaire suivi de l’épidémie de covid-19, en particulie­r avec le risque d’une seconde vague, permettra d’étayer davantage les critères d’applicatio­n et la distinctio­n entre pseudonymi­sation et anonymisat­ion. Au 23 juin 2020, soit en trois semaines d’existence de Stopcovid, seuls quatorze cas à risque de contaminat­ion ont été détectés par l’applicatio­n mobile. A cette date de premier bilan, elle a été téléchargé­e 1,9 million de fois, mais désinstall­ée 460.000 fois. Le gouverneme­nt se dit néanmoins convaincu de son utilité, surtout en prévision de cette seconde vague.

 ??  ??

Newspapers in French

Newspapers from France