Meta, sembra tutto vero: l'azienda ha scaricato più di 80TB di dati via torrent per allenare l'IA
Nuovi documenti hanno rivelato che Meta ha scaricato ingenti quantità di dati da biblioteche digitali illegali per addestrare i suoi modelli di intelligenza artificiale. L'azienda si sta difendendo sostenendo che si tratta di "uso corretto", ma gli autori contestano questa creativa interpretazione del copyright.
di Nino Grasso pubblicata il 07 Febbraio 2025, alle 09:41 nel canale WebMeta
Meta è sempre più al centro di accuse su una potenzialmente grave violazione del copyright. Documenti giudiziari recentemente desecretati hanno rivelato che l'azienda avrebbe scaricato oltre 81,7 terabyte di dati, principalmente libri, da varie "biblioteche ombra" online, utilizzando il protocollo BitTorrent.

Questi dati, secondo quanto emerso attraverso e-mail interne dei dipendenti dell'azienda, sarebbero stati impiegati per addestrare i modelli di intelligenza artificiale dell'azienda. La pratica, già nota ma mai quantificata con tale precisione, sta alimentando il dibattito nei tribunali sulla legalità e l'etica dell'acquisizione di contenuti protetti da copyright per lo sviluppo di tecnologie IA.
Meta ha scaricato più di 80TB di dati illegalmente per addestrare la sua IA
Biblioteche illegatli come LibGen e Z-Library sono state le principali fonti dei dati scaricati illegalmente da Meta. Si tratta di piattaforme che offrono accesso gratuito a milioni di libri e articoli accademici spesso protetti da copyright, e che sono da tempo nel mirino delle case editrici e degli autori per violazione della proprietà intellettuale. La vicenda è emersa nell'ambito di una causa collettiva intentata da un gruppo di autori, tra cui Richard Kadrey, Sarah Silverman e Christopher Golden, contro Meta.
Gli scrittori accusano l'azienda di aver utilizzato le loro opere senza autorizzazione per addestrare i modelli di intelligenza artificiale e pare che sia successo davvero. Secondo i documenti legali desecretati, Meta avrebbe scaricato almeno 35,7 terabyte di dati da Z-Library e LibGen attraverso il sito Anna's Archive, un aggregatore di contenuti provenienti da diverse biblioteche digitali. In precedenza, l'azienda aveva già acquisito 80,6 terabyte di dati direttamente da LibGen.
Le comunicazioni interne di Meta rivelano le difficoltà incontrate durante il processo di download: i dipendenti lamentavano la scarsità di "seeder" e le basse velocità di trasferimento, problemi tipici delle reti peer-to-peer come BitTorrent quando i file non sono ampiamente distribuiti. Addirittura, gli stessi dipendenti di Meta hanno espresso nelle comunicazioni interne preoccupazioni sull'utilizzo di materiale "piratato", suggerendo che tale pratica potrebbe superare la "soglia etica" dell'azienda. Inoltre, sono emerse discussioni interne sulla necessità di evitare l'uso dell'infrastruttura di Facebook per il torrenting, al fine di non lasciare tracce che potessero ricondurre l'attività ai server di Meta.
La difesa di Meta si basa sul principio del "fair use" previsto dalla legge sul copyright degli Stati Uniti. L'azienda sostiene che l'utilizzo di questi dati per l'addestramento dei modelli di linguaggio di grandi dimensioni (LLM) rientri in questa categoria. Tuttavia, gli autori contestano questa interpretazione, sostenendo che l'uso massiccio e sistematico di opere protette vada ben oltre i limiti del fair use. Insomma, in attesa di ulteriori sviluppi legali, sembra chiaro che vi sia la necessità di un quadro normativo chiaro che consideri non solo gli interessi dell'innovazione tecnologica, ma anche la necessità di proteggere la proprietà intellettuale di chi possiede i diritti d'autore.










HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata
Motorola edge 70: lo smartphone ultrasottile che non rinuncia a batteria e concretezza
Bentornati nel 2007: le memorie DDR3 rinascono in Cina a causa della crisi
Stellantis aderisce ad AI4I e Fondazione Chips-IT: focus su AI e semiconduttori
ISRO potrebbe lanciare la capsula Gaganyaan a febbraio ma il fallimento di PSLV-C62 potrebbe avere delle conseguenze
Un nuovo leak conferma dimensioni e novità degli iPhone 18 e di Air 2
Steam Machine: requisiti Verified piu' semplici rispetto a Steam Deck, conferma da Valve
NVIDIA GeForce RTX 5070 Ti fuori produzione: arrivano le prime conferme dai partner
Sony ha annunciato i nuovi giochi che entreranno nel catalogo PS Plus Extra e Premium
IBM Sovereign Core: la sovranità verificabile e con pieno controllo operativo
Cerchi un'asciugatrice conveniente su Amazon? Candy Smart Pro da 10 kg costa ora meno di 400€, con pompa di calore e Wi-Fi inclusi
Ayaneo Pocket Play arriverà in ritardo: l'azienda cambia strategia per migliorare la distribuzione
iPad Pro 11'' con chip M4 scende a 949€ su Amazon: potenza estrema e display Ultra Retina XDR
The Sims entra in una nuova era, ma l'acquisizione di EA non minerà i valori della serie
Netflix, Disney o Prime Video: qual è il servizio di streaming più usato in Italia?









9 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoPerché io so io ..(cit)
e voi non siete un c..
Se penso a quanto ho scaricato io nella vita
Se penso a quanto ho scaricato io nella vita
anche io
però MAI dalle biblioteche
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".