GPT Store, molti chatbot personalizzati sono addestrati senza autorizzazione con materiale protetto da copyright

Un editore danese scopre che molti chatbot personalizzati presenti sul negozio di OpenAI fanno uso di materiale protetto da diritto d'autore senza le opportune autorizzazioni o licenze

di Andrea Bai pubblicata il 08 Aprile 2024, alle 15:50 nel canale Web
OpenAI

Morten Blichfeldt Andersen è il direttore di Praxis, un editore danese di libri di testo che si è avvicinato al mondo dell'intelligenza artificiale realizzando i propri chatbot personalizzati con lo scopo di fornire agli studenti strumenti interattivi per facilitare le attività di studio. Negli ultimi mesi Blichfeldt Andersen è stato impegnato a passare al setaccio il GPT Store di OpenAI alla ricerca di chatbot che potrebbero aver utilizzato materiale tratto dai libri di testo di Praxis senza alcuna licenza o autorizzazione. Una ricerca che, come ha raccontato a Wired, lo ha già portato ad effettuare numerose segnalazioni ad OpenAI, delineando la punta dell'iceberg di un problema molto più grosso e che non riguarda solamente Praxis.

GPT Store è un negozio virtuale dove vengono offerti chatbot basati sullo stesso modello di ChatGPT, ma vengono realizzati da sviluppatori terzi per rispondere a funzioni specifiche. La personalizzazione di un bot avviene addestrandolo con informazioni e contenuti aggiuntivi così che possa affinare le proprie capacità di elaborazione su argomenti e temi più verticali. Da quando è stato lanciato, nel mese di gennaio, GPT Store si è riempito di numerosi bot che sembrano sfruttare contenuti protetti da diritto d'autore. Secondo Blichfeldt Andersen il fenomeno è causato principalmente da utenti, per lo più giovani, che caricano materiale tratto direttamente dai libri di testo per creare bot personalizzati da condividere con i compagni di classe.

La stessa cosa accade, però, in maniera più ampia e variegata con altri libri, come testimoniato dalla facilità con cui si possono trovare bot il cui scopo è imitare autori famosi come George R.R. Martin, Margaret Atwood e Stephen King. In generale Blichfeldt Andersen è convinto che il materiale usato per addestrare i vari bot personalizzati sia un vero e proprio "calderone" di contenuti protetti da diritto d'autore e caricati senza alcuna autorizzazione.

I termini di servizio di OpenAI per il GPT Store vietano in maniera esplicita di "utilizzare contenuti di terze parti senza le necessarie autorizzazioni": come sempre però, l'efficacia di una regola che non può essere fatta rispettare è pressoché nulla. Al momento infatti non esiste un modo per verificare autonomamente se un contenuto protetto da copyright sia stato usato dallo sviluppatore di un bot personalizzato.

L'unico modo è procedere come ha fatto Blichfeldt Andersen: armarsi di pazienza e passare manualmente al setaccio lo store di OpenAI. Per fare ciò Blichfeldt Andersen ha usato una serie di parole chiave nelle interazioni con ciascun bot sottoposto a "verifica", per individuare se sia stato addestrato usando contenuti tratti dai libri editi da Praxis. Si tratta di un impegno laborioso, ma che ha avuto modo di mostrare i suoi frutti inducendo alcuni chatbot a riprodurre passaggi integrali dei libri di Praxis.

Sebbene OpenAI abbia rimosso i bot in violazione del copyright, Blichfeldt Andersen osserva come ciò sia avvenuto solo dopo il coinvolgimento dell'Alleanza Danese per i Diritti, che rappresenta gli interessi dei lavoratori creativi in Danimarca. Praxis sta però prendendo in considerazione la possibilità di intraprendere un'azione legale nei confronti di OpenAI se le condizioni del GPT Store non dovessero migliorare.

In particolare l'auspicio è quello di assistere ad una maggiore attenzione da parte di OpenAI nel fornire a sviluppatori, pubblico e detentori di diritti degli strumenti che consentano più facilmente di individuare materiale protetto da copyright per intraprendere le opportune contromisure, similmente a quanto avviene sulle piattaforme social come YouTube e Instagram in ottemperanza alle norme del Digital Millennium Act. Su questa facenda OpenAI afferma di rispondere alle richieste contro i bot che utilizzano contenuti protetti da diritto d'autore e di assumere anzi un ruolo proattivo alla ricerca dei bot potenzialmente problematici impiegando un insieme di sistemi automatizzati, revisori umani e segnalazioni del pubblico.

I problemi di violazione dei diritti d'autore nel GPT Store potrebbero essere oggetto di nuovi contenziosi legali in aggiunta a quelli già esistenti portati avanti dal New York Times e da diversi gruppi di autori di narrativa e saggistica, tra cui il già citato George R.R. Martin. Si tratta di situazioni complesse e delicate, che potrebbero richiedere anni prima di essere risolte poiché OpenAI potrebbe sostenere che il concetto di "fair use" protegge alcuni bot che dipendono da opere protette da copyright, come ad esempio quelli creati appositamente per scopi educativi e di ricerca.

I migliori sconti su Amazon oggi

-23%

Apple Watch SE (2ª gen.) GPS 40 mm Smartwatch con cassa in alluminio Galassia e Cinturino Sport Galassia - S/M. Tracker per il fitness e il sonno, app Battito, Rilevamento incidenti, display Retina

259.00 199.00€ Compra ora

-8%

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

149.99 137.85€ Compra ora

-29%

Apple AirPods Pro 2 Auricolari wireless, Auricolari Bluetooth, Cancellazione attiva del rumore, Funzione Apparecchio acustico, Trasparenza, Audio spaziale personalizzato, Alta fedeltà, Ricarica USB-C

279.00 199.00€ Compra ora

HPE: il mercato ICT è in crescita e nel 2024 arriverà a 90 miliardi di euro. HPE sta realizzando un supercomputer per ENI

Samsung Galaxy S24+ 12/512 GB a meno di 1.000 euro su Amazon con un codice: ecco come fare

silviop08 Aprile 2024, 20:42 #1

Sara' una bella scornata tra editori e AI visto che puoi sempre dire all' AI di non riprodurre mai un testo completo di quelli usati per addestrarla, e' vero che si potrà ingannare e forzarla a farlo, ma suppongo che piano piano evolvendosi sarà sempre più difficile.

noc7708 Aprile 2024, 21:56 #2

Di questo passo un giorno verremo denunciati ogni volta che citiamo qualcosa 🙈

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Sharkoon VK4 ARGB

Nintendo Switch 2

Fujifilm X-E5 con Fujinon XF23mm F2.8: una X100VI ma con ottica intercambiabile

2025 Nikon Comedy Wildlife Awards: i primi scatti del concorso

Nintendo Switch 2

MSI Prestige 13 AI e i portatili business al Computex

Ryzen Threadripper 9980X e 9970X alla prova: AMD Zen 5 al massimo livello AMD ha aggiornato l'offerta di CPU HEDT con i Ryzen Threadripper 9000 basati su architettura Zen 5. In questo articolo vediamo come si comportano i modelli con 64...

BOOX Note Air4 C è uno spettacolo: il tablet E Ink con Android per lettura e scrittura BOOX Note Air4 C rappresenta l'ultima incarnazione della categoria dei tablet E Ink a colori di Onyx, e combina le prestazioni di un dispositivo Android con l'ottima...

The Edge of Fate è Destiny 2.5. E questo è un problema Bungie riesce a costruire una delle campagne più coinvolgenti della serie e introduce cambiamenti profondi al sistema di gioco, tra nuove stat e tier dell’equipaggiamento....

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...

GPT Store, molti chatbot personalizzati sono addestrati senza autorizzazione con materiale protetto da copyright

Apple Watch SE (2ª gen.) GPS 40 mm Smartwatch con cassa in alluminio Galassia e Cinturino Sport Galassia - S/M. Tracker per il fitness e il sonno, app Battito, Rilevamento incidenti, display Retina

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

Apple AirPods Pro 2 Auricolari wireless, Auricolari Bluetooth, Cancellazione attiva del rumore, Funzione Apparecchio acustico, Trasparenza, Audio spaziale personalizzato, Alta fedeltà, Ricarica USB-C

2 Commenti