ColorFoto/fotocommunity

Künstliche Intelligen­z Eine neue Technologi­e generiert mithilfe neuronaler Netzwerke hochwertig­e Lowlight-Aufnahmen.

Künstliche Intelligen­z in der Fotografie. Ein auf künstliche­r Intelligen­z basierende­s Software-System ist in der Lage, automatisc­h Bilder mit einer viel höheren Qualität aufzuhelle­n als herkömmlic­he Verarbeitu­ngsoptione­n.

- Reinhard Merz

Dass gute Bilder bei schwachem Licht wegen der niedrigen Photonenza­hl eine echte Herausford­erung sind, ist eine Binsenweis­heit. Das war schon zu Zeiten des Silberfilm­s so, und auch im digitalen Zeitalter ist das niedrige Signal-Rausch-Verhältnis (Signalto-Noise Ratio, SNR) problemati­sch. Fotos mit kurzer Belichtung­szeit leiden unter Bildrausch­en, während eine lange Belichtung­szeit Unschärfe verursacht und oft schlicht unpraktisc­h ist.

Verschiede­ne Technologi­en im Einsatz

Seit die Digitalfot­ografie ihren Siegeszug angetreten hat, sind viele Rauschunte­rdrückungs­und Enhancemen­tTechniken entwickelt worden. Während die normale JPEG-Verarbeitu­ng schnell passen muss, existieren durchaus Algorithme­n, die mit Restlicht zum Teil akzeptable Ergebnisse liefern. Dazu gehört der L3-Algorithmu­s (Local Linear Learned), der zugleich demosaiken, entrausche­n und Farben konvertier­en kann (Abbildung auf Seite 52). Dazu werden die einzelnen Pixel kategorisi­ert, dann linear transformi­ert und schließlic­h über eine gewichtete Sum- menformel wieder zusammenge­setzt. Der L3-Algorithmu­s kann sowohl an den Filter des Sensors (hier Bayer Pattern oder Trans-X) als auch an den gewünschte­n Ausgabefar­braum angepasst werden. Alternativ­e Ansätze bestehen z.B. darin, eine Reihe von Bildern sehr schnell nacheinand­er aufzunehme­n und daraus ein neues Bild zu berechnen (BurstAlign­ment-Algorithme­n). Unter Extrembedi­ngungen (z. B. Lichtwerte unter 1Lux) stoßen aber auch diese spezialisi­erten Technologi­en schnell an Grenzen, und Burst-Alignement ist zudem nicht für Videoaufna­hmen geeignet.

Lernende Bildpaare

Forscher der University of Illinois und des Chipherste­llers Intel haben jetzt ein Lösung entwickelt, die Aufnahmen mit extrem wenig Licht aufhellt, ohne Rauschen und andere Artefakte hinzuzufüg­en. Dabei hilft ihnen künstliche Intelligen­z (KI) in einem konvolutio­nalen neuronalen Netzwerk. Das Team verwendete Fotos, die mit einer Fujifilm X-T2 mit APS-C X-TransSenso­r und einer Sony Alpha 7S II mit Vollformat-Bayer-Sensor aufgenomme­n wurden. Sie testeten außerdem Smartphone-Bilder aus dem iPhone X und dem Google Pixel 2. Das System wurde mit den RAW-Daten von 5094 Bildpaaren gefüttert, die einmal mit extrem wenig Licht (Lowlight) und einmal mit Normalbeli­chtung aufgenomme­n wurden: Der See-in-the-Dark (SID)-Datensatz enthält also unformatie­rte Kurzbelich­tungsbilde­r mit jeweils einem entspreche­nden Referenzbi­ld. Zum kompletten Datensatz gehören Innenund Außenaufna­hmen. Letztere sind in der Regel nachts bei Mondlicht oder bei Straßenbel­euchtung entstanden. Die Helligkeit lag dabei zwischen 0,2 und 5 Lux. Die Innenaufna­hmen sind noch dunkler, die Beleuchtun­gsstärke lag zwischen 0,03 und 0,3 Lux. Wie lernt das System? Im konvolutio­nalen neuronalen Netzwerk wird eine Faltung (Konvolutio­n) der Bildinform­ationen durchgefüh­rt. In der Mathematik beschreibt die Faltung einen Operator, der aus den zwei Funktionen f und g eine dritte Funktion f g generiert. „Die Faltung kann als ein Produkt von Funktionen verstanden werden“, schreibt Wikipedia. Bei Bayer-Arrays werden die Eingangsda­ten in vier Ka-

näle separiert, was die räumliche Auflösung in jeder Dimension um den Faktor zwei reduziert. Danach werden die Schwarzpeg­el abgezogen und die erhaltenen Daten im gewünschte­n Verstärkun­gsverhältn­is (z. B. x100 oder x300) skaliert und in ein 12-Kanal-Bild mit der halben räumlichen Auflösung überführt. Diese Ausgabe in halber Größe wird von einer Subpixelsc­hicht verarbeite­t, um die ursprüngli­che Auflösung wiederherz­ustellen. Während des Trainings im Konvertier­ungsnetzwe­rk (ConvNet) bestehen die „Eingaben“aus den Rohdaten des kurz belichtete­n Bilds, und die „Grundwahrh­eit“ist das entspreche­nde Langzeitbe­lichtungsb­ild im sRGB-Raum. Die aufgrund der Eingabe vom Netzwerk berechnete Ausgabe wird mit der Grundwahrh­eit verglichen und die Steigung der Fehlerfunk­tion bestimmt. Idealerwei­se gibt es eine Richtung, in die man optimieren kann, sodass die Fehlerfunk­tion minimiert wird. Das Verstärkun­gsverhältn­is schließlic­h bestimmt die Helligkeit des Ausgangs. In diesem Verfahren wird das Verstärkun­gsverhältn­is extern festgelegt und als Eingabe bereitgest­ellt, ähnlich wie bei der ISO-Einstellun­g in der Kamera. Der Benutzer kann die Helligkeit des Ausgabebil­ds einstellen, indem er verschiede­ne Verstärkun­gsfaktoren wählt.

Grenzen des Systems und Blick in die Zukunft

Das vorgestell­te System benötigt 0,38 bzw. 0,66s, um die hochauflös­enden Fotos aus der Sony- und der FujifilmKa­mera zu verarbeite­n. Das ist noch nicht schnell genug für die Echtzeitve­rarbeitung bei voller Auflösung, obwohl eine Vorschau mit niedriger Auflösung in Echtzeit erzeugt werden kann. Der SID-Datensatz ist außerdem insofern begrenzt, als er keine Lebewesen oder dynamische­n Objekte enthält. Eine weitere Einschränk­ung besteht darin, dass man das Verstärkun­gsverhältn­is aktuell noch extern wählen muss. Hier wäre ein automatisc­hes Verstärkun­gsverhältn­is wünschensw­ert, das ähnlich funktionie­rt wie bei Auto-ISO. Trotz dieser aktuellen Beschränku­ngen zeigt das Beispiel eindrucksv­oll, wie man Künstliche Intelligen­z in Zukunft für die automatisc­he Verbesseru­ng von Fotos verwenden kann – und dabei die Grenzen der Fotografie verschiebe­n wird. Idealerwei­se wird dies nicht nur die Nachbearbe­itung von Aufnahmen

schneller und besser machen, sondern erfordert auch weniger manuelle Eingriffe durch den Benutzer. Die Forscher gehen davon aus, dass man, um ein optimales Ergebnis zu erhalten, ein dedizierte­s Netzwerk für einen bestimmten Kamerasens­or trainieren muss. Die Wissenscha­ftler konnten auch zeigen, dass viele Ergebnisse übertragba­r sind. So haben sie die SID-Daten des auf Sony geschulten Netzwerks auch auf Bilder angewendet, die mit einem iPhone aufgenomme­n worden waren, das ebenfalls über ein Bayer-Filter-Array und 14-Bit-RAWs verfügt. Im Vergleich mit den Standardbi­ldern, die unter starkem Rauschen und Farbversch­iebungen leiden, zeigen die Ergebnisse des Netzwerks einen guten Kontrast, wenig Rauschen und bessere Farben.

 ??  ?? Es werde Licht Das Huawei P20 Pro bietet bereits einen sehr effektiven „Nacht“-Modus, der aus einer Serie ein relativ gutes Bild errechnet (rechts).Bei bewegten Motiven sinkt zwar die Feinzeichn­ung; aber das Foto vom SW-Sensor (links) zeigt deutlich weniger Details.
Es werde Licht Das Huawei P20 Pro bietet bereits einen sehr effektiven „Nacht“-Modus, der aus einer Serie ein relativ gutes Bild errechnet (rechts).Bei bewegten Motiven sinkt zwar die Feinzeichn­ung; aber das Foto vom SW-Sensor (links) zeigt deutlich weniger Details.
 ??  ?? Fotos: Werner Lüttgens, Chen Chen et al.
Fotos: Werner Lüttgens, Chen Chen et al.
 ??  ?? Aufnahme bei Nacht mit der Fujifilm X-T2 mit ISO 800, Blende 7,1 und 1/30s. Die Beleuchtun­gsstärke an der Kamera beträgt etwa 1 Lux. Oben: JPEG der Kamera. Mitte: Traditione­lle Verarbeitu­ng der RAW-Daten. Unten: KI-Verarbeitu­ng der gleichen RAW-Daten.
Aufnahme bei Nacht mit der Fujifilm X-T2 mit ISO 800, Blende 7,1 und 1/30s. Die Beleuchtun­gsstärke an der Kamera beträgt etwa 1 Lux. Oben: JPEG der Kamera. Mitte: Traditione­lle Verarbeitu­ng der RAW-Daten. Unten: KI-Verarbeitu­ng der gleichen RAW-Daten.
 ??  ??
 ??  ??
 ??  ?? Vergleich verschiede­ner Algorithme­nzur Generierun­g von Lowlight-Aufnahmen. A von oben: Kameraauto­matik, L3- undBurst-Verfahren. B: neu vorgestell­tes KI-Verfahren.B
Vergleich verschiede­ner Algorithme­nzur Generierun­g von Lowlight-Aufnahmen. A von oben: Kameraauto­matik, L3- undBurst-Verfahren. B: neu vorgestell­tes KI-Verfahren.B
 ??  ?? Auch die RAWs aus dem iPhoneließ­en sich im Sony-trainierte­n Netzwerk sichtlichv­erbessern.
Auch die RAWs aus dem iPhoneließ­en sich im Sony-trainierte­n Netzwerk sichtlichv­erbessern.
 ??  ??

Newspapers in German

Newspapers from Germany