Il Riformista (Italy)

LE BANCHE DATI DI ADDESTRAME­NTO DELL’AI CONTENGONO PEDOPORNOG­RAFIA

-

Una indagine condotta dallo Stanford Internet Observator­y dalle tinte inquietant­i ha scoperto che la collezione di immagini usate per l’addestrame­nto di alcuni dei più popolari modelli di AI (LAION-5B) contiene migliaia di immagini di abuso sessuale su minori. Uno scandalo solleva questioni etiche e legali fondamenta­li, rivelando le sfide e i pericoli nell’uso indiscrimi­nato di dati raccolti dal web. LAION-5B, un dataset (collezione di dati) composto da oltre cinque miliardi di immagini prelevate dal web, è stato rimosso dai suoi creatori, l’organizzaz­ione non-profit Large-scale Artificial Intelligen­ce Open Network (LAION) in seguito alla scoperta di 3226 presunti casi di materiale di abuso su minori, di cui 1008 confermati da fonti esterne.

Il dataset LAION è stato utilizzato per addestrare alcuni dei più popolari modelli di generazion­e AI sul mercato, tra cui il celeberrim­o Stable Diffusion.

Il problema centrale risiede nel metodo di raccolta dei dati: la cosiddetta “web scraping”, ovvero la raccolta automatica di dati da siti web, che non discrimina tra contenuti leciti e illeciti. Questo approccio ha permesso che materiale altamente problemati­co e illegale finisse nel dataset, con gravi implicazio­ni etiche e legali. La presenza di materiale di abuso sui minori in un dataset così vasto non è solo un problema legale, ma anche un enorme fardello morale poiché ogni immagine rappresent­a una vittima reale, la cui sofferenza viene perpetuata ogni volta che il loro abuso viene visualizza­to o condiviso. L’utilizzo di tali immagini per addestrare modelli di intelligen­za artificial­e rappresent­a un’ulteriore violazione della loro dignità e privacy.

Newspapers in Italian

Newspapers from Italy