GPT Store, molti chatbot personalizzati sono addestrati senza autorizzazione con materiale protetto da copyright

GPT Store, molti chatbot personalizzati sono addestrati senza autorizzazione con materiale protetto da copyright

Un editore danese scopre che molti chatbot personalizzati presenti sul negozio di OpenAI fanno uso di materiale protetto da diritto d'autore senza le opportune autorizzazioni o licenze

di pubblicata il , alle 15:50 nel canale Web
OpenAI
 

Morten Blichfeldt Andersen è il direttore di Praxis, un editore danese di libri di testo che si è avvicinato al mondo dell'intelligenza artificiale realizzando i propri chatbot personalizzati con lo scopo di fornire agli studenti strumenti interattivi per facilitare le attività di studio. Negli ultimi mesi Blichfeldt Andersen è stato impegnato a passare al setaccio il GPT Store di OpenAI alla ricerca di chatbot che potrebbero aver utilizzato materiale tratto dai libri di testo di Praxis senza alcuna licenza o autorizzazione. Una ricerca che, come ha raccontato a Wired, lo ha già portato ad effettuare numerose segnalazioni ad OpenAI, delineando la punta dell'iceberg di un problema molto più grosso e che non riguarda solamente Praxis.

GPT Store è un negozio virtuale dove vengono offerti chatbot basati sullo stesso modello di ChatGPT, ma vengono realizzati da sviluppatori terzi per rispondere a funzioni specifiche. La personalizzazione di un bot avviene addestrandolo con informazioni e contenuti aggiuntivi così che possa affinare le proprie capacità di elaborazione su argomenti e temi più verticali.  Da quando è stato lanciato, nel mese di gennaio, GPT Store si è riempito di numerosi bot che sembrano sfruttare contenuti protetti da diritto d'autore. Secondo Blichfeldt Andersen il fenomeno è causato principalmente da utenti, per lo più giovani, che caricano materiale tratto direttamente dai libri di testo per creare bot personalizzati da condividere con i compagni di classe.

La stessa cosa accade, però, in maniera più ampia e variegata con altri libri, come testimoniato dalla facilità con cui si possono trovare bot il cui scopo è imitare autori famosi come George R.R. Martin, Margaret Atwood e Stephen King. In generale Blichfeldt Andersen è convinto che il materiale usato per addestrare i vari bot personalizzati sia un vero e proprio "calderone" di contenuti protetti da diritto d'autore e caricati senza alcuna autorizzazione.

I termini di servizio di OpenAI per il GPT Store vietano in maniera esplicita di "utilizzare contenuti di terze parti senza le necessarie autorizzazioni": come sempre però, l'efficacia di una regola che non può essere fatta rispettare è pressoché nulla. Al momento infatti non esiste un modo per verificare autonomamente se un contenuto protetto da copyright sia stato usato dallo sviluppatore di un bot personalizzato.

L'unico modo è procedere come ha fatto Blichfeldt Andersen: armarsi di pazienza e passare manualmente al setaccio lo store di OpenAI. Per fare ciò Blichfeldt Andersen ha usato una serie di parole chiave nelle interazioni con ciascun bot sottoposto a "verifica", per individuare se sia stato addestrato usando contenuti tratti dai libri editi da Praxis. Si tratta di un impegno laborioso, ma che ha avuto modo di mostrare i suoi frutti inducendo alcuni chatbot a riprodurre passaggi integrali dei libri di Praxis. 

Sebbene OpenAI abbia rimosso i bot in violazione del copyright, Blichfeldt Andersen osserva come ciò sia avvenuto solo dopo il coinvolgimento dell'Alleanza Danese per i Diritti, che rappresenta gli interessi dei lavoratori creativi in Danimarca. Praxis sta però prendendo in considerazione la possibilità di intraprendere un'azione legale nei confronti di OpenAI se le condizioni del GPT Store non dovessero migliorare.

In particolare l'auspicio è quello di assistere ad una maggiore attenzione da parte di OpenAI nel fornire a sviluppatori, pubblico e detentori di diritti degli strumenti che consentano più facilmente di individuare materiale protetto da copyright per intraprendere le opportune contromisure, similmente a quanto avviene sulle piattaforme social come YouTube e Instagram in ottemperanza alle norme del Digital Millennium Act. Su questa facenda OpenAI afferma di rispondere alle richieste contro i bot che utilizzano contenuti protetti da diritto d'autore e di assumere anzi un ruolo proattivo alla ricerca dei bot potenzialmente problematici impiegando un insieme di sistemi automatizzati, revisori umani e segnalazioni del pubblico. 

I problemi di violazione dei diritti d'autore nel GPT Store potrebbero essere oggetto di nuovi contenziosi legali in aggiunta a quelli già esistenti portati avanti dal New York Times e da diversi gruppi di autori di narrativa e saggistica, tra cui il già citato George R.R. Martin. Si tratta di situazioni complesse e delicate, che potrebbero richiedere anni prima di essere risolte poiché OpenAI potrebbe sostenere che il concetto di "fair use" protegge alcuni bot che dipendono da opere protette da copyright, come ad esempio quelli creati appositamente per scopi educativi e di ricerca.

2 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
silviop08 Aprile 2024, 20:42 #1
Sara' una bella scornata tra editori e AI visto che puoi sempre dire all' AI di non riprodurre mai un testo completo di quelli usati per addestrarla, e' vero che si potrà ingannare e forzarla a farlo, ma suppongo che piano piano evolvendosi sarà sempre più difficile.
noc7708 Aprile 2024, 21:56 #2
Di questo passo un giorno verremo denunciati ogni volta che citiamo qualcosa 🙈

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^