Il New York Times respinge le accuse di OpenAI: "nessun imbroglio, ma legittima verifica della violazione"

Il New York Times respinge le accuse di OpenAI: "nessun imbroglio, ma legittima verifica della violazione"

Il quotidiano statunitense rigetta con forza l'accusa di OpenAI: i tentativi di forzare ChatGPT a riprodurre articoli sono stati un modo per verificare l'effettiva portata della violazione del diritto d'autore

di pubblicata il , alle 16:01 nel canale Web
OpenAI
 

Il New York Times ha respinto con forza le affermazioni di OpenAI secondo cui lo stesso quotidiano avrebbe "imbrogliato" ChatGPT per avere il pretesto di avviare un'azione legale contro la società fondata da Sam Altman. In una recente istanza presentata in tribunale, il Times ha ribadito ripetutamente che "OpenAI ha torto" nell'accusare il giornale di aver compiuto atti illeciti nel tentativo di dimostrare che ChatGPT avrebbe prodotto estratti di articoli del NYT.

Il contenzioso, lo ricordiamo, ruota attorno alla presunta violazione del copyright da parte di OpenAI, con il Times che accusa l'azienda di aver copiato illecitamente e inserito centinaia dei suoi articoli nel materiale utilizzato per addestrare i modelli di intelligenza artificiale come ChatGPT. Secondo il Times, OpenAI non ha rivelato pubblicamente la composizione dei dataset utilizzati per addestrare i suoi modelli di IA, lasciando il giornale all'oscuro dell'entità della violazione.

OpenAI aveva precedentemente accusato il NYT di aver effettuato "decine di migliaia di tentativi per generare" risultati anomali, sfruttando presunti bug nei suoi strumenti di sviluppo e in ChatGPT. Il NYT ha cercato di "produrre esempi di memorizzazione richiedendo a GPT-4 le prime parole o frasi degli articoli del Times": questa mossa, secondo il giornale, non costituisce un "hacking" come sostenuto da OpenAI, ma piuttosto un tentativo legittimo di monitorare la portata della presunta violazione del copyright.

Il Times ha respinto le accuse di OpenAI come "irrilevanti e false", sottolineando che gli utenti di ChatGPT hanno spesso utilizzato lo strumento per generare interi articoli con l'obiettivo di aggirare i paywall, contraddicendo quindi la tesi di OpenAI secondo cui i suoi prodotti non sarebbero stati utilizzati per tali fini.

Un elemento che pare minare la linea di difesa di OpenAI contro l'accusa di violazione diretta del copyright è stato il fatto che, prima del lancio del controverso plug-in "Browse By Bing" di ChatGPT, il NYT aveva contattato OpenAI nell'aprile 2023 per informarli che i loro strumenti stavano violando le opere protette da copyright del giornale. Tuttavia, secondo il Times, OpenAI ha scelto di ignorare queste accuse nella sua mozione di archiviazione, sostenendo invece che il NYT aveva solo una "conoscenza generalizzata della possibilità di violazione".

Il NYT ha citato il celebre caso Napster come precedente giuridico a sostegno della sua denuncia per violazione diretta contro OpenAI. Come gli utenti meno giovani ricorderanno, Napster fu allora ritenuta responsabile per le violazioni commesse dai suoi utenti, poiché l'azienda era a conoscenza del materiale in violazione di diritto d'autore circolante sulla sua piattaforma di sharing, senza adottare alcuna misura per rimuoverlo. "Questo è esattamente quello che è successo qui, dove il Times ha informato OpenAI che i suoi modelli stavano generando risultati illeciti dei lavori del Times", ha affermato il NYT nella sua dichiarazione in tribunale.

La controversia tra il NYT e OpenAI si inserisce in un contesto più ampio, che vede la società IA impegnata ad affrontare diverse cause legali che la accusano di violare i diritti d'autore durante l'addestramento degli strumenti di IA e durante la produzione di output tramite ChatGPT, che in realtà è un problema comune a tutto il settore che riguarda le IA generative. OpenAI, tuttavia, è convinta di poter confutare tutte le accuse, apparentemente costruendo la sua difesa in ogni caso successivo su qualsiasi argomento di successo eventualmente ottenuto nei contenziosi precedenti.

In tal senso, ad esempio, OpenAI ha sostenuto che la causa del NYT coinvolge "una serie identica di accuse" a quelle sollevate dagli autori di libri, le cui tesi sono state in gran parte respinte il mese scorso. Tuttavia, il NYT ha controbattuto che il suo caso differisce sostanzialmente da quelli degli autori di libri, che secondo il giudice non disponevano di prove sufficienti per supportare alcune affermazioni.

A differenza degli autori di libri, che sostenevano che ChatGPT avesse rimosso le informazioni sulla gestione del copyright (CMI) senza fornire esempi di output illeciti, il NYT ha fornito un'ampia documentazione a sostegno delle sue affermazioni. Inoltre, mentre gli autori dei libri "hanno concentrato la loro affermazione su come la rimozione di CMI potrebbe indurre terze parti a commettere violazioni", il NYT sostiene che "la rimozione di CMI 'facilita' o 'nasconde' la violazione stessa di OpenAI".

L'auspicio del quotidiano statunitense è la negazione della mozione di rigetto di OpenAI "nella sua interezza" da parte del tribunale, ritenendo come fallaci tutte le argomentazioni addotte dell'azienda di intelligenza artificiale. Ma la posta in gioco in questa battaglia legale è alta: il NYT non solo cerca un risarcimento per i profitti persi a causa della presunta violazione di ChatGPT, ma anche un'ingiunzione permanente per impedire ulteriori episodi di violazione. Se il quotidiano statunitense dovesse riuscire ad ottenere una vittoria in tribunale, gli esiti per OpenAI potrebbero essere particolarmente pesanti e arrivare addirittura alla destituzione di ChatGPT e alla sua riprogettazione: l'azienda potrebbe essere costretta ad architettare un nuovo modello IA basato su contenuti concessi in licenza garantendo in questo modo agli editori come il NYT un corrispettivo economico per la fornitura del materiale di addestramento. A tal proposito vale la pena ricordare che qualche mese fa OpenAI aveva ammesso l'impossibilità di creare modelli IA generativi utili senza l'uso di contenuti protetti da copyright.

Ne consegue che il risultato di questa controversia potrebbe avere implicazioni di ampia portata per tutto il settore dell'intelligenza artificiale e per il modo in cui i diritti d'autore vengono gestiti e rispettati nelle operazioni di addestramento e in quelle di produzione di output.

3 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
sbaffo13 Marzo 2024, 16:18 #1
Come Raddit si fa pagare per allenare l'IA di big G mi sembra giusto che anche MS-OpenAI paghi, e non solo il NYt ma tutti gli editori:
https://www.reuters.com/technology/...say-2024-02-22/
Anche HWUP potrebbe monetizzare così il suo forum, "il più grande d'italia"... https://www.hwmediagroup.it/

Potrebbe essere la fine del far west delle ai, o proprio delle ai generaliste se costasse troppo pagare tutti i siti, e ciò non mi dispiacerebbe.
alfredaino13 Marzo 2024, 18:16 #2
Originariamente inviato da: sbaffo
Potrebbe essere la fine del far west delle ai, o proprio delle ai generaliste se costasse troppo pagare tutti i siti, e ciò non mi dispiacerebbe.


Sarebbe un'ottima cosa.
noc7713 Marzo 2024, 19:22 #3
Credo che il NYT abbia ragione solo fino ad un certo punto... sembra che ragionino come la SIAE contro Meta dove la conclusione è stata che ci ha perso la musica italiana.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^