High-Tech : L’IA va-t-elle réinventer la photo ?
Vous n’avez pas pu passer à côté : l’intelligence artificielle est revenue en force avec les coprocesseurs dédiés aux réseaux neuronaux (NPU pour Neural Processing Unit), notamment dans les smartphones d’Apple et de Huawei.
Difficile d’échapper à l’intelligence artificielle en général et à ses déclinaisons dans le monde de l’image et de la photo. Ainsi, les coprocesseurs dédiés aux réseaux neuronaux (NPU pour Neural Processing Unit) ont fait leur apparition dans les derniers smartphones d’Apple et Huawei notamment. Son objectif ? Mettre en avant les applications de l’intelligence artificielle en photo, assurant que les choix de l’appareil face à une scène donnée seront plus efficaces - une promesse déjà faite par Pentax. Mais en quoi cette approche est-elle différente des automatismes classiques ?
LE MODE AUTO INTELLIGENT
Traditionnellement, le principal réglage d’un appareil photo est l’exposition, obtenue en jouant sur différents paramètres (la vitesse d’obturation, la sensibilité ISO, le diaphragme). À un niveau d’illumination donné correspond une valeur d’exposition censée assurer une photo équilibrée. Mais il nous manque ici la prise en compte du sujet : logiquement, vous ne voulez pas qu’un paysage enneigé ressorte avec la même luminosité qu’une photo de spéléologie. De là est né le besoin de modes automatiques “intelligents”, qui tentent de deviner les images. Ce système est algorithmique, avec une logique simple : s’il y a un visage qui occupe plus de 20 % du cadre, alors c’est un portrait, donc on passe en mode portrait. Autre exemple : si le haut est bleu et le bas est jaune, c’est une photo de plage, donc on passe en mode plage avec des réglages qui surexposent un peu pour que le sable reste bien lumineux. À charge pour les programmeurs de définir les modes scènes adaptés et les algorithmes permettant de les reconnaître. Cela fonctionne généralement bien, mais peut manquer de souplesse. Les situations inconnues ou ambiguës donnent des résultats imprévisibles : si aucun cas ne correspond à votre image, l’appareil revient
à un mode automatique classique ou bien passe d’un mode à l’autre et donne des résultats incohérents. D’où l’idée de lui apprendre à photographier, non en se basant sur des cas types définis par les programmeurs, mais comme on enseigne à un enfant : par l’exemple. C’est ici qu’entre en jeu l’intelligence artificielle : l’apprentissage profond par réseau neuronal. Il s’agit ni plus ni moins de simuler le fonctionnement d’un cerveau et en particulier ses mécanismes d’apprentissage et de restitution. L’idée est d’entraîner un réseau neuronal sur une base de données de photos déjà prises par des photographes. En “observant” les images, en regardant dans quelle catégorie elles ont été placées et en étudiant les données EXIF, le réseau va “comprendre” la logique. Huawei, par exemple, a ainsi entraîné les dernières versions de son application photo sur plusieurs milliers d’images, pour reconnaître des scènes qui demandent des réglages très particuliers. Le réseau neuronal a examiné ces photos et tenté de deviner leur structure, leur éclairage, et la façon dont les photographes ont non seulement classé les clichés - ce qui correspond à l’idée du mode scène automatique classique -, mais aussi comment ils ont adapté des paramètres à telle image spécifique. Au bout du compte, l’appareil doit savoir reconnaître un portrait, un paysage, une scène de sport, un portrait nocturne, et comment adapter ces catégories génériques aux cas particuliers. L’expérience est ici importante : plus la base d’images que le réseau observe est grande, plus il peut déterminer avec précision les éléments caractéristiques d’une photo, sans risque de confusion.
DÉPASSER L’ALGORITHME
Un réseau bien entraîné a un avantage majeur sur un algorithme : il peut extrapoler. Pour prendre un exemple cité par Pentax, un réseau neuronal qui a appris à reconnaître des fleurs d’espèces différentes, pour adopter opportunément les réglages adaptés, peut trouver tout seul que ce qu’on lui fait regarder à un moment donné est également une fleur, même s’il n’en a jamais vu de cette espèce, de cette forme ou de cette couleur. On ne sait pas, pour l’heure, déterminer comment il l’aura reconnue, quelle structure exacte aura réalisé cette reconnaissance, tout comme il est difficile de le déterminer pour un esprit humain - l’explication varie d’ailleurs d’une personne à l’autre ! Il est toutefois possible de mesurer l’efficacité de l’identification en fournissant au réseau neuronal des images qu’il ne connaît pas et en voyant comment il les photographierait, sur quel mode il se baserait et quels réglages de prise de vue et de post-traitement il adopterait. Mais soyons honnêtes : les modes auto algorithmiques sont déjà d’une grande efficacité. La reconnaissance de scène, pour intéressante qu’elle soit, n’est sans doute pas le vrai bouleversement à attendre de l’IA en photo. Elle n’est qu’une première étape. Elle pourrait surtout devenir un formidable assistant, capable de développer et retoucher les images aussi bien qu’un photographe lambda, ainsi que de les trier et de les étiqueter pour les retrouver beaucoup plus facilement et précisément que nous. Une nouvelle approche dans l’art de la photographie.