Anthropic sotto accusa: uso di libri piratati per addestrare i modelli IA

Anthropic sotto accusa: uso di libri piratati per addestrare i modelli IA

All'interno del dataset utilizzato per addestrare il modello alla base di Claude, vi sarebbe materiale pirtatato che Anthropic avrebbe usato consapevolmente

di pubblicata il , alle 09:31 nel canale Scienza e tecnologia
Anthropic
 

Un gruppo di autori ha lanciato una class action in California contro Anthropic, la startup IA che ha creato il chatbot Claude, accusando l'azienda di aver costruito un giro d'affari "multimiliardario" sull'uso non autorizzato di opere protette da copyright per allenare i suoi modelli IA.

In particolare nel mirino della causa c'è "The Pile", il massiccio set di dati open source utilizzato dalla società per addestrare la sua serie di chatbot Claude AI. All'interno di questo dataset si troverebbe "Books3", una raccolta di ebook piratati che include opere di grandi firme della letteratura come Stephen King e Michael Pollan. Secondo l'accusa, Anthropic avrebbe utilizzato consapevolmente il materiale piratato, sfruttando inoltre contenuti provenienti da siti come Bibliotik, noti per condividere illegalmente materiale protetto da copyright.

Tra gli aderenti alla causa collettiva, vi sono nomi quali Andrea Bartz, Charles Graeber e Kirk Wallace Johnson. Le richieste non si limitano ad un semplice "risarcimento danni", ma anche a imporre ad Anthropic il divieto all'uso futuro di materiali protetti da diritto d'autore.

La causa contro Anthropic non è la prima di questo genere nel settore dell'IA: lo scorso anno un gruppo di autori aveva avviato una battaglia simile contro OpenAI, anch'essa accusata di aver usato copie pirata di opere letterarie per addestrare i modelli di intelligenza artificiale.

L'uso indebito di materiale protetto da copyright per allenare modelli IA è un problema grave nel panorama dell'intelligenza artificiale: da un lato gli autori di opere che non riescono a vedere tutelato il proprio lavoro, dall'altro i grandi colossi dell'IA che non vogliono trovare alternative per allenare e migliorare le prestazioni dei loro modelli. L'ex-CEO di Google, Eric Schmidt, ha (goffamente) ironizzato sul problema, mentre qualcuno prova a proporre una soluzione con una startup che ha già raccolto 25 milioni di dollari e l'interesse dei media.

1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
iavon26 Agosto 2024, 08:34 #1
In base a come funzionano le regole antipirateria, se le applicassero, dovrebbero arrestare tutti e far chiudere l'azienda che ha rubato quei dati illegalmente.
Ma ovviamente finirà tutto a tarallucci e vino.
Che schifo

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^