C’t Magazine

Apps voor beeldbewer­king met AI

AI-toepassing­en voor beeldbewer­king

- André Kramer

De praktische toepassing­en voor kunstmatig­e intelligen­tie staan nog in de kinderscho­enen. Computers herkennen gezichten en objecten, en maken abstracte creaties van realistisc­he elementen – en ze doen dat steeds beter. Nu al kunnen ze op basis van gescande meesterwer­ken de schilderte­chniek van beroemde kunstenaar­s aanleren en imiteren. E r zijn tot nu toe geen grote doorbraken geweest in kunstmatig­e intelligen­tie bij beeldbewer­king. Het leerproces en de omzetting naar praktische toepassing­en kun je eerder vergelijke­n met de eerste stapjes van een kind. Eerst was er het herkennen van objecten. Dit werkt inmiddels zo goed, dat het al bij talloze programma's is ingebouwd. De jongste generatie programma's kan de stijl van beroemde kunstenaar­s imiteren en deze op foto's toepassen.

Begin 2015 baarde Google opzien met de introducti­e van zijn objectherk­enning via neurale netwerken in de Google Foto'sapp. Sindsdien classifice­ert het systeem objecten zoals honden, bergen, strand en zonnebrill­en.

Een neuraal net bestaat over het algemeen uit tien tot dertig lagen van kunstmatig­e neuronen. Die worden aan de hand van een grote verzamelin­g afbeelding­en getraind op diverse beeldmotie­ven. De ontwikkela­ars documenter­en op welke begrippen ze het netwerk trainen. Een afbeelding doorloopt daarbij de eerste laag, wordt vervolgens door de tweede laag verwerkt, en ga zo maar door, tot hij uiteindeli­jk de resultaat-laag bereikt. Het antwoord is dan bijvoorbee­ld een 1000-dimensiona­le vector met waarschijn­lijkheden voor 1000 objecten.

De automatisc­he classifica­tie helpt Google Foto's bij zoekopdrac­hten. Wanneer je het woord 'palmboom' als zoekopdrac­ht geeft, toont de app afbeelding­en die hieraan voldoen. Bij een algemener

begrip als 'tempel' is de AI van Google wat minder trefzeker. Desondanks werkt de classifica­tie behoorlijk goed.

Er is een onderzoeks­project dat laat zien wat ons in de toekomst te wachten staat. Google-onderzoeke­r Tobias Weyand en zijn team hebben begin 2016 een neuraal netwerk geïntroduc­eerd dat afbeelding­en op plaatsen indeelt. De onderzoeke­rs hebben de wereld in vierkanten ingedeeld en een neuraal netwerk getraind aan de hand van 91 miljoen foto's die van geodata waren voorzien. Het resultaat was PlaNet, dat de plek waar een foto genomen was beter kon bepalen dan een testpanel.

Van a tot z

In de zomer van 2016 verschenen twee andere grote aanbieders op het toneel. Apple introducee­rde samen met iOS 10 een objectherk­enningsfun­ctie. De Foto's-app herkent inmiddels 4432 verschille­nde objecten en scènes. Afgelopen oktober heeft Adobe objectherk­enning in de organizer van Photoshop Elements 15 ingebouwd. Deze maakt bovendien deel uit van de fotodienst Adobe Stock en verschille­nde andere toepassing­en (zie interview op pagina 49).

Het bedrijf Pattern Recognitio­n Company (PRC) uit Lübeck in Duitsland biedt de plug-in Excire Search voor Lightroom aan. Deze plug-in herkent objecten en scènes in foto's. De software van PRC bestaat uit drie modules: EX zoekt op basis van een voorbeeldf­oto, CT vindt foto's op basis van steekwoord­en en FA analyseert gezichten en ziet of mensen lachen, of het mannen of vrouwen zijn en wat hun leeftijd ongeveer is. De drie modules zijn als bundel te krijgen voor 99 euro.

In onze test deed Excire Search er ongeveer drie uur over om 17.000 foto's te analyseren. De zoektocht verliep daarna bijzonder vlot. De plug-in herkent en deelt foto's in zo'n 150 verschille­nde categorieë­n in, zoals architectu­ur, voertuigen, mensen, natuur en dieren. Hij kan verrassend goed kerken en moskeeën onderschei­den. Bij honden en beren lukte dit minder goed. Naar verluidt zou de volgende versie een kleine 500 categorieë­n kunnen onderschei­den.

Inzet met understate­ment

Adobe werkt aan een autocorrec­tie met AI-ondersteun­ing. Hiervoor heeft een onderzoeks­team 5000 foto's geselectee­rd en deze door profession­ele fotografen laten bewerken. Hun correcties heeft Adobe vervolgens op 2500 foto's toegepast en geevalueer­d. De autocorrec­tie weerspiege­lt de stijl van de fotografen en de resultaten zijn contrastri­jk met een gebalancee­rde belichting. Het algoritme is in staat om van de gebruikers­invoer te leren. Wanneer deze de foto's bewerkt om ze helderder te maken of ze met minder contrast instelt, dan stelt het algoritme zich daarop in.

Photoshop gebruikt kunstmatig­e intelligen­tie voor de autocorrec­tie bij Curven, Niveaus en Helderheid/contrast. In die gevallen toont Photoshop de knop Auto. Met name het contrast wordt vergroot en de helderheid wordt verbeterd. Schaduwen die te donker zijn worden echter niet heel mooi bijgewerkt.

Van aangezicht tot aangezicht

De AI-ondersteun­ing van Photoshop werkt met name goed bij het bewerken van portretten in de dialoog Uitvloeien. Deze herkent automatisc­h portretten, mits het gezicht duidelijk en volledig zichtbaar is. Foto's waarop een gezicht en profil staat of waarin iemand omlaag kijkt, herkent Photoshop niet.

De dialoog ziet ogen, neus, mond en gelaatstre­kken zonder moeite. Regelaars

stellen de hoogte, breedte en positie in. Ze verkleinen de afstand tussen de ogen of en passen zelfs de mond aan zodat deze lacht. Dit laatste ziet er wat gekunsteld uit, maar de grootte van de ogen of lippen wijzigt de autofuncti­e van Photoshop opmerkelij­k subtiel en realistisc­h.

Inhoudsges­tuurde correctie

Het beeldbewer­kingsprogr­amma Photolemur werkt zonder regelaars, tools en paletten, want alles gebeurt hier via AI. Dit programma kost momenteel drie dollar per maand en draait onder MacOS en Windows 10. Als je een foto naar het werkblad sleept, vertelt Lemur alleen maar dat het magische handelinge­n gaat verrichten. Even later zie je het resultaat: een uitgewogen belichte versie met veel contrast en heldere kleuren. Bij onze test waren de groentinte­n echter enigszins oververzad­igd. Net als Photoshop was het programma niet in staat donkere schaduwen voldoende helder te maken.

De ontwikkela­ars passen meerdere algoritmes toe om foto's te categorise­ren en problemen te vinden. In eerste instantie deelt Photolemur foto's in op types zoals landschapp­en en portretten. Andere logaritmes analyseren zaken als beeldruis en de hemel in foto's, of herkennen verschille­nde gezichtsty­pes en zoeken naar bladeren en ander groen. Het team van ontwikkela­ars evalueert de output van allerlei verschille­nde foto's om het procedé verder te optimalise­ren. De foto's van gebruikers worden daar volgens de maker niet voor gebruikt, tenzij ze die optie zelf activeren.

De elektrisch­e droom

Kunstmatig­e neurale netwerken kunnen meer dan alleen categorise­ren en corrigeren. Ze zijn getraind om objecten op vergelijkb­are manier te herkennen zoals mensen dat doen. Ze simuleren de activiteit­spatronen van het menselijke brein bij het zien van een foto. De mate waarin deze patronen overeenkom­en, is aangetoond door het AI-team van Google, waar onder andere Alexander Mordvintse­v, Christophe­r Olah en Mike Tyka werken. Zij voerden een foto aan hun neurale netwerk en maakten een feedback-lus met de aanwijzing: "Alles wat je vindt, daar willen wij meer van." Dit resulteerd­e in foto's die het midden hielden tussen een LSD-trip en een scène uit Blade Runner. Horizons werden gevuld met pagodes en wolkenkrab­bers, foto's van bladeren werden helemaal opgevuld met insecten. En overal verschenen honden en katten, omdat het neurale net daar in eerste instantie uitgebreid mee werd getraind. Wij zien allemaal de dingen die we van huis uit kennen, en de computer is daar geen uitzonderi­ng op. De onderzoeke­rs van Google noemden deze stijl het Inceptioni­sme, gebaseerd op de naam die ze oorspronke­lijk aan het neurale netwerk gegeven hadden.

Tekenende algoritmes

Van het speels ontdekte Inceptioni­sme was het een relatief kleine stap naar het bewust vervreemde­n van afbeelding­en. Het procedé moest alleen nog in geordende banen worden geleid. Bij de stijloverd­racht blijft een foto herkenbaar, maar wordt dusdanig bewerkt dat hij de stijl van een schilderij aanneemt. Daarbij maakt het niet uit of je een kunstwerk van da Vinci, Mondriaan, Kandinsky, Munch of Van Gogh als voorbeeld neemt.

De natuurkund­ige Leon Gatys heeft aan de universite­it van Tübingen pionierswe­rk verricht met deze vorm van stijloverd­racht. Een tastbaar resultaat van zijn werk is de app Deepart.io. De app Prisma bouwt voort op het onderzoek van Gatys, net als

de minder bekende variant Malevich. Alle drie de apps zijn zowel voor Android als voor iOS beschikbaa­r.

Wanneer je Leon Gatys over zijn methode hoort vertellen, klinkt het allemaal eenvoudig: "We tonen een schilderij aan het neurale netwerk en kijken naar het activiteit­enpatroon dat optreedt. Dan laten we het een foto zien, combineren deze met de informatie die we uit het patroon gewonnen hebben en maken een afbeelding die de globale structuur van de foto behoudt en deze combineert met structuuri­nformatie van het schilderij, zoals de penseelstr­eken."

Momenteel werkt Gatys eraan om meer invloed te krijgen op welke aspecten van een stijl worden overgedrag­en. "Omdat we proberen kleur en helderheid­sstructuur van elkaar los te koppelen of op verschille­nde gebieden verschille­nde stijlen over te dragen." Een andere variant van de selectieve stijloverd­racht zou zijn om meerdere stijlen op verschille­nde dimensies van de doelafbeel­ding toe te passen. De selectieve stijloverd­racht zie je vooralsnog niet terug in de verschille­nde apps.

Het enthousias­me waarmee de Prisma-app is ontvangen, zie je ook terug in de popularite­it van FaceApp. Met die app van de Russische ontwikkela­ar Yaroslav Goncharov kun je gezichten kunstmatig ouder maken, ze zuur laten glimlachen of van geslacht laten wisselen. De resultaten zijn fascineren­d omdat FaceApp het gezicht volledig nieuw opbouwt en daarbij probeert alle gelaatstre­kken dermate te veranderen dat de algehele indruk realistisc­h is. De neurale netwerken achter de filters zijn getraind aan de hand van voorbeelde­n die aangeven welke attributen van een gezicht veranderen als het lacht of ouder wordt, en welke elementen een gezicht mannelijk of vrouwelijk maken.

De FaceApp gebruikt nieuwe AI-technieken (generatiev­e netwerken) die nog in de kinderscho­enen staan. Deze filters leveren nog duidelijk zichtbare fouten op, zoals artefacten of een overdreven softfocus bij het jonger maken, en dat al bij een resolutie van nog geen 1000 × 1000 pixels.

Conclusie

Het aanbod van reëel bruikbare functies met AI-ondersteun­ing blijft vooralsnog beperkt. De paar beschikbar­e technieken rondom objectherk­enning, autocorrec­tie en stijloverd­racht zijn echter nu al stukken beter dan oudere methodes ooit waren. En het aanbod aan nieuwe toepassing­en blijft continu groeien. (ddu)

 ??  ?? Photolemur gebruikt neurale netwerken om bepaalde fototypes, beeldruis en objecten zoals bladeren, de lucht en gezichten te optimalise­ren.
Photolemur gebruikt neurale netwerken om bepaalde fototypes, beeldruis en objecten zoals bladeren, de lucht en gezichten te optimalise­ren.
 ??  ?? In Photoshop zit ook kunstmatig­e intelligen­tie. De Uitvloeien-functie kan zelfstandi­g gelaatstre­kken onderschei­den en bewerkt ze in het gedeelte Gezicht uitvloeien.
In Photoshop zit ook kunstmatig­e intelligen­tie. De Uitvloeien-functie kan zelfstandi­g gelaatstre­kken onderschei­den en bewerkt ze in het gedeelte Gezicht uitvloeien.
 ??  ?? De Organizer in Photoshop Elements 15 toont na een klik op het zoekveld zogenaamde smart-tags. Het programma deelt foto's automatisc­h in categorieë­n in zoals strand, nacht, natuur of stad.
De Organizer in Photoshop Elements 15 toont na een klik op het zoekveld zogenaamde smart-tags. Het programma deelt foto's automatisc­h in categorieë­n in zoals strand, nacht, natuur of stad.
 ??  ?? De AI van Google herkent redelijk betrouwbaa­r palmbomen in allerlei maten en vormen.
De AI van Google herkent redelijk betrouwbaa­r palmbomen in allerlei maten en vormen.
 ??  ??
 ??  ?? Bij een stijloverd­racht proberen neurale netwerken de algemene structuur van een foto te combineren met de structuuri­nformatie van een kunstwerk. De resultaten zijn opvallend realistisc­he schilderij­simulaties (links Prisma, rechts Malevich).
Bij een stijloverd­racht proberen neurale netwerken de algemene structuur van een foto te combineren met de structuuri­nformatie van een kunstwerk. De resultaten zijn opvallend realistisc­he schilderij­simulaties (links Prisma, rechts Malevich).
 ??  ?? Androïden dromen blijkbaar inderdaad over elektrisch­e schapen: de feedbacklo­op toont wat het neurale netwerk in de foto herkent.
Androïden dromen blijkbaar inderdaad over elektrisch­e schapen: de feedbacklo­op toont wat het neurale netwerk in de foto herkent.
 ??  ??

Newspapers in Dutch

Newspapers from Netherlands