Automattic come Reddit: i contenuti di Wordpress e Tumblr potranno essere usati per addestrare l'IA

Automattic come Reddit: i contenuti di Wordpress e Tumblr potranno essere usati per addestrare l'IA

La società pronta a chiudere un accordo con OpenAI e Midjourney per sfruttare i contenuti degli utenti come materiale di addestramento per i modelli generativi

di pubblicata il , alle 16:21 nel canale Web
WordPress
 

Automattic, realtà proprietaria dei servizi WordPress e Tumblr, sembra essere pronta a chiudere un accordo con OpenAI e Midjourney per consentire l'uso dei contenuti generati dagli utenti come materiale per l'addestramento dei modelli di intelligenza artificiale delle due società.

Al momento non è chiaro a quali contenuti e informazioni i modelli IA potranno accedere, anche se le indiscrezioni al momento in circolazione riferiscono che tra i primi contatti preliminari tra le parti vi fosse sul tavolo l'accesso anche a post privati sul blog pubblici, blog eliminati o sospesi, domande senza risposta, risposte private, post contrassegnati come espliciti o contenuti di blog di partner premium.

La società intanto ha pubblicato una dichiarazione, "Protecting user choice", in cui spiega le proprie politiche in merito all'uso dei contenuti da parte dei crawler IA, ma ammette di stare lavorando con "aziende selezionate" nel campo dell'intelligenza artificiale:

"L’intelligenza artificiale sta rapidamente trasformando quasi ogni aspetto del nostro mondo, compreso il modo in cui creiamo e consumiamo contenuti. Noi di Automattic abbiamo sempre creduto in un web libero e aperto e in una scelta individuale. Come altre aziende tecnologiche, stiamo seguendo da vicino questi progressi, compreso come collaborare con le aziende di intelligenza artificiale in modo da rispettare le preferenze dei nostri utenti.

Con questo in mente, stiamo facendo una serie di cose su WordPress.com e Tumblr per darti un maggiore controllo sui contenuti che hai creato.

  • Al momento blocchiamo, per impostazione predefinita, i principali crawler di piattaforme AI, compresi quelli delle più grandi aziende tecnologiche, e aggiorniamo i nostri elenchi man mano che ne vengono lanciati di nuovi.
  • Abbiamo un'impostazione per scoraggiare i motori di ricerca dall'indicizzare un sito su WordPress.com e Tumblr. Ciò segnala ai motori di ricerca di non eseguire la scansione di quel contenuto o di includerlo nei risultati di ricerca.
  • Abbiamo aggiunto impostazioni simili a WordPress.com e Tumblr per scoraggiare la scansione da parte delle società di intelligenza artificiale. Se già scoraggi l'indicizzazione nei motori di ricerca, questa viene abilitata automaticamente.
  • Condivideremo solo i contenuti pubblici ospitati su WordPress.com e Tumblr da siti che non hanno rinunciato.

Attualmente non esiste alcuna legge che imponga ai crawler di seguire queste preferenze, anche se ciò potrebbe cambiare presto con la legislazione in sospeso nell’Unione Europea. Indipendentemente dalla posizione geografica, vogliamo fornirti strumenti che garantiscano il massimo controllo possibile. Poiché le aziende rispettabili seguono queste impostazioni, rappresentano il metodo migliore per imporre il modo in cui i contenuti vengono sottoposti a scansione sul Web.

Stiamo anche lavorando direttamente con aziende selezionate di intelligenza artificiale purché i loro piani siano in linea con ciò che interessa alla nostra comunità: attribuzione, rinuncia e controllo. Le nostre partnership rispetteranno tutte le impostazioni di rinuncia. Intendiamo inoltre fare un ulteriore passo avanti e aggiornare regolarmente tutti i partner sulle persone che hanno recentemente rinunciato e chiedere che i loro contenuti vengano rimossi dalle fonti passate e dalla formazione futura."

Gli accordi per la formazione dei modelli IA stanno diventando un'opportunità redditizia per varie realtà che fino ad ora hanno avuto difficoltà a trovare una strada parallela e alternativa alla pubblicità per monetizzare i contenuti degli utenti. Pochi giorni fa avevamo parlato di Reddit e del suo accordo con Google del valore di 60 milioni di dollari all'anno, e verosimilmente nel corso del futuro immediato continueremo sempre di più ad assistere a collaborazioni di questo genere. Questo nuovo paradigma nasconde, però, qualche incognita: fino a che punto gli utenti saranno inclini allo sfruttamento dei loro contenuti senza che venga corrisposta loro alcuna ricompensa?

1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
inited28 Febbraio 2024, 17:27 #1
Sempre più fetenti, questi soggetti giuridici.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^