L’IA dans l’identification numérique : le Deep Learning à l’oeuvre
LE DEEP LEARNING À L’ OEUVRE !
La vérification de l’identité en ligne est actuellement encore contraignante, demande des efforts de recherche afin de s’assurer qu’une personne qui prétend être le titulaire d’une carte d’identité est bien la bonne. Par ailleurs, elle se répand à mesure que des services – les banques en ligne par exemple – sont de plus en plus dématérialisés. Et, jusqu’à présent, de nombreuses entreprises font ces vérifications à la main, au cas par cas, tout en étant assistées par des logiciels spécialisés. Mais le spécialiste de l’identité IDnow, basé à Munich, a désormais recours au Deep Learning pour ses processus d’identification par vidéo pour faciliter la vérification automatique des pièces d’identité. Ce faisant, il est capable de détecter efficacement les tentatives de fraude. « Nous utilisons cette méthode pour détecter, classifier et extraire automatiquement les pièces d’identité en temps réel » , nous explique Armin Bauer, CTO et cofondateur d’IDnow. Pour ce faire, « nous avons développé notre propre algorithme et l’avons configuré de façon à ce qu’il soit capable de reconnaître efficacement la photo d’une pièce d’identité, quels que soient la lumière, l’arrière- plan ou la résolution de l’appareil photo, et ceci pratiquement en temps réel » , explique- t- il. Concernant le développement du mécanisme Deep Learning, IDnow s’est appuyé sur deux outils libres : la bibliothèque graphique OpenCV pour la vision par ordinateur, et sur TensorFlow pour l’apprentissage automatique. Dans son fonctionnement, le programme classifie le document et détermine le pays d’émission, s’il s’agit d’une carte d’identité ou d’un passeport, ainsi que la version du document. L’algorithme est également capable de détecter et de vérifier des données sur la pièce d’identité, comme le nom du titulaire ou les clés de contrôle.
Nvidia pour l’accélération matérielle
« Pour la détection et la classification des pièces d’identité à partir d’images, nous sommes actuellement à un niveau de précision de 99,4 % et un taux de rappel de 94,4 %. Le taux de précision permet de calculer le nombre de documents mal identifiés ou mal classifiés. Le taux de rappel correspond au pourcentage d’images ayant donné un résultat » , ajoute Armin Bauer. Ainsi, les algorithmes de détection d’images analysent de grandes quantités de données et apprennent peu à peu à reconnaître les connexions et schémas et à faire les déductions appropriées. Ce processus d’apprentissage est accéléré par des GPU Nvidia. « Nous utilisons Nvidia Cuda de pair avec l’architecture Pascal. Les réseaux neuronaux qui sont activés pour la production consomment environ 4 Go de mémoire vidéo et peuvent traiter une image en environ 100 ms par GPU » , précise- t- il encore. Quel que soit le niveau de fiabilité atteint par le logiciel, IDnow continue d’avoir recours à la vérification humaine. Cela reste une obligation légale dans certains pays, et actuellement « il existe des schémas de fraude que les machines ne sont pas en mesure de détecter, tels que la manipulation sociale, lorsque les utilisateurs ont recours à certaines ruses pour forcer l’identification » . Pour en arriver là, IDnow a travaillé sur son système depuis 2014. « La tâche préparatoire la plus importante était de constituer un ensemble de données suffisamment vaste et de suffisamment bonne qualité pour pouvoir être utilisé pour l’apprentissage automatique » , confie encore Armin Bauer. ❍