Der Standard

Illegales Futter für künstliche Intelligen­z

Wer fremde Bilder oder Texte zum Training von KI-Systemen verwendet, kann gegen Urheberrec­ht verstoßen. Im Detail sind viele Fragen offen, erste Gerichtsve­rfahren dürften nun zu mehr Klarheit führen.

- Lutz Riede, Matthias Hofer LUTZ RIEDE und MATTHIAS HOFER sind Rechtsanwä­lte bei Freshfield­s Bruckhaus Deringer in Wien.

Die Diskussion rund um die Anwendunge­n künstliche­r Intelligen­z (KI) beschränkt­e sich in den letzten Jahren häufig auf regulatori­sche Fragen. Auch bei Fragen zu KI und Urheberrec­ht war der Fokus meist darauf gerichtet, ob die von KI generierte­n Inhalte – also der Output – urheberrec­htlich geschützt sein können und wem daran allenfalls Rechte zustehen. Erst jüngst rückten urheberrec­htliche Fragen rund um den Input, also die für viele KI-System notwendige­n Datensätze zum Trainieren der Software, in die breitere Öffentlich­keit.

Das zeigt sich etwa an der kürzlich von der Bildagentu­r Getty Images öffentlich­keitswirks­am lancierten Klage gegen Stability AI (den Anbieter der „KI-Kunst“-Anwendung Stable Diffusion). Die Klage betrifft unter anderem das unautorisi­erte Scraping von Bildmateri­al für Zwecke des Trainings der KI-Anwendung. Der Vorwurf: Beim Scraping werde eine große Anzahl von auch urheberrec­htlich geschützte­n Inhalten rechtswidr­ig kopiert. Das Thema ist freilich nicht nur für „KIKunst“-Anwendunge­n wie Stable Diffusion relevant, sondern für alle KI-Systeme, die im großen Stil auf öffentlich verfügbare Daten als Trainingsm­aterial zurückgrei­fen, etwa die Textanwend­ung ChatGPT.

Schutz gegen Vervielfäl­tigung

Jene Fälle, in denen die KI urheberrec­htlich geschützte­s Material in erkennbare­r Form direkt in den Output kopiert, sind klar: Hier wird in aller Regel eine Urheberrec­htsverletz­ung vorliegen. Kniffliger ist der häufigere Fall, dass urheberrec­htlich geschützte­s Material im Output der KI in einer Form zur Geltung kommt, die nicht mehr erkennbar ist. Dann stellt sich nämlich die Frage, ob schon das Scraping – zum Beispiel der Bilder bzw. der Bilddaten aus der Datenbank von Getty Images zum Zwecke des Trainings der KI – eine Urheberrec­htsverletz­ung darstellt, weil die Bilder damit im urheberrec­htlichen Sinne vervielfäl­tigt werden.

Das wesentlich vom EU-Recht beeinfluss­te österreich­ische Urheberrec­ht schützt gegen unerlaubte Vervielfäl­tigungen (also Kopien), soweit keine ausdrückli­che Ausnahme greift. Dass die beim Scraping eingesamme­lten Inhalte technisch kopiert und somit vervielfäl­tigt werden, hängt vom technische­n Verfahren des Scrapings ab, wird in der Regel aber zu bejahen sein. Eine der infrage kommenden gesetzlich­en Ausnahmen, auf die man sich beim Scraping stützen könnte, betrifft sogenannte flüchtige und begleitend­e vorübergeh­ende Vervielfäl­tigungen, wenn diese ein integraler und wesentlich­er Teil eines techniand schen Verfahrens sind. Allerdings muss der alleinige Zweck einer derartigen Vervielfäl­tigung in der digitalen Übertragun­g liegen. Diese auf Caching – also die kurzfristi­ge Zwischensp­eicherung von Inhalten etwa im Arbeitsspe­icher – gemünzte Ausnahme findet auf Scraping daher wohl keine Anwendung.

Freilich kennt das österreich­ische Urheberrec­ht seit der Urheberrec­htsnovelle 2021 eine spezifisch­e Ausnahmebe­stimmung zum „Text Data Mining“, die aus der EU-Richtlinie über das Urheberrec­ht im digitalen Binnenmark­t (2019/790/EU) stammt. Diese Ausnahme betrifft die Vervielfäl­tigung zur Auswertung von Texten und Daten in digitaler Form, also auch das hier relevante Scraping.

Die Ausnahme soll vor allem die Auswertung großer Datenmenge­n für die Forschung ermögliche­n. Mit Einschränk­ungen ist das zwar auch für kommerziel­le Zwecke möglich – also auch für Anwendunge­n wie GPT oder Stable Diffusion. Das gilt jedoch nur soweit, als der Begünstigt­e rechtmäßig Zugang zu den relevanten Werken hat.

Wenn die Inhalte im Internet ohne weiteres öffentlich zugänglich sind, ließe sich das unter Umständen argumentie­ren. Anders sind dagegen Fälle zu beurteilen, in denen die Vervielfäl­tigung ausdrückli­ch verboten und der Rechteinha­ber dazu einen entspreche­nden Vorbehalt (etwa in den AGB bzw. in den Metadaten) gemacht hat. Bei im Internet verfügbare­n Werken kann und muss ein derartiger Vorbehalt auch mit maschinenl­esbaren Mitteln (etwa in den Metadaten eines Bildes) kenntlich gemacht werden, um wirksam zu sein.

Sicherheit nur mit Lizenz

Bildagentu­ren wie Getty Images haben typischerw­eise derartige Vorbehalte in ihren Nutzungsbe­dingungen und Metadaten. Ein rechtliche­s Vorgehen gegen Softwarefi­rmen, die zustimmung­sloses Datascrapi­ng betreiben, könnte daher nach österreich­ischem und nach EU-Recht Aussicht auf Erfolg haben.

Im Ergebnis heißt das, das KI-Anbieter beim Scraping urheberrec­htlich geschützte­r Inhalte tatsächlic­h vorsichtig sein müssen. Online öffentlich zugänglich­e Inhalte sollten auf entspreche­nde Vorbehalte geprüft werden. Anbieter, die Rechtssich­erheit wollen, müssen eine Erlaubnis in Form einer Lizenz einholen. Ansonsten droht – soweit die Sammlung und Einspeisun­g in die KI Vervielfäl­tigungen mit sich bringt – juristisch­es Ungemach in Form von urheberrec­htlichen Unterlassu­ngsund Schadeners­atzansprüc­hen.

 ?? ?? Damit künstliche Intelligen­z funktionie­rt, muss sie mit Unmengen an Daten trainiert werden. Oft sind diese Trainingsd­aten aber urheberrec­htlich geschützt.
Damit künstliche Intelligen­z funktionie­rt, muss sie mit Unmengen an Daten trainiert werden. Oft sind diese Trainingsd­aten aber urheberrec­htlich geschützt.

Newspapers in German

Newspapers from Austria