LES DIFFÉRENTS TYPES D’APPRENTISSAGE
L’APPRENTISSAGE SUPERVISÉ Un algorithme est entraîné sur une base de données étiquetées, constituée de dizaines de milliers, voire de millions d’exemples annotés par des experts humains. Pour une tâche de reconnaissance visuelle, chaque image X de la base de données est associée à sa catégorie d’appartenance Y. Grâce à ces nombreux exemples annotés, l’algorithme apprend à établir un lien statistique entre les entrées X (l’image) et les sorties Y (la catégorie). Au terme de cet apprentissage, l’algorithme peut prédire avec précision la sortie Y, pour une nouvelle entrée X qu’il n’a jamais vue. L’APPRENTISSAGE NON SUPERVISÉ consiste à entraîner un algorithme sur une base de données non étiquetées. Il doit trouver par lui-même des structures inhérentes à ces données afin d’en extraire un maximum de connaissances. L’APPRENTISSAGE PAR RENFORCEMENT Cette méthode, inspirée du conditionnement de certains animaux, consiste à améliorer la prise de décision d’un système d’apprentissage grâce à des récompenses positives ou négatives. Après chaque décision, le système reçoit de son environnement une récompense et apprend à ajuster ses décisions futures de façon à maximiser le nombre de récompenses positives espérées.