Meta si difende: il torrenting di massa per addestrare l’IA non è illegale

Meta è accusata di violazione di copyright per l’addestramento dei suoi modelli di intelligenza artificiale e, di fronte a queste accuse, si sta difendendo sostenendo che l’utilizzo di materiale protetto da copyright per l’addestramento dell’IA rientri nel “fair use” e affermando di non aver ridistribuito i contenuti scaricati a terze parti.

Documenti interni recentemente desecretati hanno rivelato che l’azienda di Mark Zuckerberg ha scaricato illegalmente oltre 80 terabyte di libri piratati da siti come LibGen e Z-Library, utilizzando la tecnologia BitTorrent. Le email trapelate mostrano come i dipendenti di Meta fossero consapevoli della natura illegale di queste azioni, esprimendo preoccupazione per le possibili conseguenze legali: “Scaricare torrent da un laptop aziendale non mi sembra giusto”, scriveva un dipendente aggiungendo persino un’emoji sorridente. L’azienda avrebbe continuato la pratica nonostante gli avvisi, cercando addirittura di nascondere le proprie tracce evitando l’uso dei server proprietari per i download.

Meta ha scaricato libri pirata per scaricare l’IA: ecco come intende difendersi

Un nuovo tassello si è adesso aggiunto alla vicenda, con la società che sta cercando di difendersi sottolineando come lo scopo del “torrenting” fosse esclusivamente quello di addestrare i suoi modelli di IA, prendendo precauzioni per non eseguire il “seeding” dei file scaricati. In altre parole, Meta non avrebbe ridistribuito i libri scaricati illecitamente, non contribuendo quindi alla diffusione di materiale pirata. Tuttavia, secondo quanto riportato da Ars Technica, gli autori che hanno intentato la causa sostengono che Meta abbia effettivamente ridistribuito i file torrent.

La portata dell’operazione rimane in ogni caso impressionante: si parla di almeno 81,7 terabyte di dati scaricati da diverse “biblioteche ombra”, di cui 35,7 terabyte provenienti specificamente da Z-Library e LibGen. Gli avvocati degli autori sottolineano come anche atti di pirateria di dati molto più limitati abbiano portato in passato a indagini penali, mettendo in evidenza la gravità delle azioni di Meta. La causa è destinata ad alimentare il dibattito sul rispetto dei diritti d’autore nell’era dell’intelligenza artificiale, dove una enorme mole di dati è necessaria per allenare i modelli.

Se il tribunale dovesse stabilire che le azioni di Meta sono illegali, potrebbe crearsi un precedente fondamentale che andrebbe inevitabilmente a rallentare l’evoluzione della tecnologia, costringendo le aziende a ripensare le loro pratiche di acquisizione dei dati per l’addestramento dei modelli. Gli autori della denuncia hanno richiesto ulteriori deposizioni dei dipendenti Meta coinvolti nel processo decisionale, mentre l’azienda continua a mantenere la posizione secondo cui le accuse siano esagerate vista la mancanza di prove concrete che la ridistribuzione dei libri protetti da copyright come risultato del torrenting sia effettivamente avvenuta.