IBM trainiert neuronale Netze für die Gesichtserkennung mit Porträts aus dem Online-Fotodienst Flickr
Um neuronale Netze für die Gesichtserkennung zu trainieren, brauchen IT-Experten sehr große Mengen an Trainingsdaten. Einem Bericht von NBC News zufolge hat sich IBM rund eine Million Personenfotos von der Foto-Hosting-Seite Flickr gezogen. Ein Rechtsverstoß liegt offenbar nicht vor, die Bilder standen unter der Creative-Commons-Lizenz und können damit – mit wenigen Einschränkungen – frei verwendet werden. Dennoch haben sich Flickr-User gewundert, dass IBM ihre Porträtsammlungen mit Annotationen an einen Kreis von KIExperten weitergegeben hat, ohne dass sie informiert worden waren.
NBC konfrontierte einige der Urheber mit der Tatsache, dass ihre Bil- der im IBM-Datensatz gelandet und mit kennzeichnenden Details wie Gesichtsgeometrie und Hautton kommentiert worden seien. Sie würden nun für die Entwicklung von Algorithmen für die Gesichtserkennung hergenommen. Den IBM-Datensatz hatte der Nachrichtendienst nicht von IBM selbst, sondern aus einer anderen Quelle erhalten, offenbar von einem der Wissenschaftler.
Unfreiwilliges KI-Training
John Smith, der die KI-Forschung bei IBM leitet, sagte gegenüber NBC, dass man den „Schutz der Privatsphäre von Einzelpersonen“ernst nehme und den Flickr-Usern anbiete, ihre Bilder aus dem Trai- nings-Datensatz zu entfernen. Dem Nachrichtendienst zufolge ist das aber nahezu unmöglich, da IBM die Liste der Flickr-Benutzer und der im Datensatz enthaltenen Fotos nicht öffentlich zugänglich gemacht habe. IBM biete also keine einfache Möglichkeit, herauszufinden, wessen Fotos enthalten sind.
NBC zitiert Kritikerin Meredith Whittaker, Co-Direktorin des AI Now Institute, das die sozialen Auswirkungen von KI untersucht: „Die Leute haben zugestimmt, ihre Fotos in einem anderen InternetÖkosystem zu veröffentlichen.“Jetzt würden sie unwissentlich oder unfreiwillig in das Training von Systemen involviert, deren Sinn und Zweck sie nicht kennen.