Automattic come Reddit: i contenuti di Wordpress e Tumblr potranno essere usati per addestrare l'IA

La società pronta a chiudere un accordo con OpenAI e Midjourney per sfruttare i contenuti degli utenti come materiale di addestramento per i modelli generativi
di Andrea Bai pubblicata il 28 Febbraio 2024, alle 16:21 nel canale WebWordPress
Automattic, realtà proprietaria dei servizi WordPress e Tumblr, sembra essere pronta a chiudere un accordo con OpenAI e Midjourney per consentire l'uso dei contenuti generati dagli utenti come materiale per l'addestramento dei modelli di intelligenza artificiale delle due società.
Al momento non è chiaro a quali contenuti e informazioni i modelli IA potranno accedere, anche se le indiscrezioni al momento in circolazione riferiscono che tra i primi contatti preliminari tra le parti vi fosse sul tavolo l'accesso anche a post privati sul blog pubblici, blog eliminati o sospesi, domande senza risposta, risposte private, post contrassegnati come espliciti o contenuti di blog di partner premium.
La società intanto ha pubblicato una dichiarazione, "Protecting user choice", in cui spiega le proprie politiche in merito all'uso dei contenuti da parte dei crawler IA, ma ammette di stare lavorando con "aziende selezionate" nel campo dell'intelligenza artificiale:
"L’intelligenza artificiale sta rapidamente
trasformando quasi ogni aspetto del nostro mondo, compreso il modo in
cui creiamo e consumiamo contenuti. Noi di Automattic abbiamo sempre
creduto in un web libero e aperto e in una scelta individuale. Come
altre aziende tecnologiche, stiamo seguendo da vicino questi progressi,
compreso come collaborare con le aziende di intelligenza artificiale in
modo da rispettare le preferenze dei nostri utenti.
Con questo in mente, stiamo facendo una serie di cose su WordPress.com e
Tumblr per darti un maggiore controllo sui contenuti che hai
creato.
- Al momento blocchiamo, per impostazione predefinita, i principali crawler di piattaforme AI, compresi quelli delle più grandi aziende tecnologiche, e aggiorniamo i nostri elenchi man mano che ne vengono lanciati di nuovi.
- Abbiamo un'impostazione per scoraggiare i motori di ricerca dall'indicizzare un sito su WordPress.com e Tumblr. Ciò segnala ai motori di ricerca di non eseguire la scansione di quel contenuto o di includerlo nei risultati di ricerca.
- Abbiamo aggiunto impostazioni simili a WordPress.com e Tumblr per scoraggiare la scansione da parte delle società di intelligenza artificiale. Se già scoraggi l'indicizzazione nei motori di ricerca, questa viene abilitata automaticamente.
- Condivideremo solo i contenuti pubblici ospitati su WordPress.com e Tumblr da siti che non hanno rinunciato.
Attualmente non esiste alcuna legge che
imponga ai crawler di seguire queste preferenze, anche se ciò potrebbe
cambiare presto con la legislazione in sospeso nell’Unione Europea.
Indipendentemente dalla posizione geografica, vogliamo fornirti
strumenti che garantiscano il massimo controllo possibile. Poiché le
aziende rispettabili seguono queste impostazioni, rappresentano il
metodo migliore per imporre il modo in cui i contenuti vengono
sottoposti a scansione sul Web.
Stiamo anche lavorando direttamente con aziende selezionate di
intelligenza artificiale purché i loro piani siano in linea con ciò che
interessa alla nostra comunità: attribuzione, rinuncia e controllo. Le
nostre partnership rispetteranno tutte le impostazioni di rinuncia.
Intendiamo inoltre fare un ulteriore passo avanti e aggiornare
regolarmente tutti i partner sulle persone che hanno recentemente
rinunciato e chiedere che i loro contenuti vengano rimossi dalle fonti
passate e dalla formazione futura."
Gli accordi per la formazione dei modelli IA stanno diventando un'opportunità redditizia per varie realtà che fino ad ora hanno avuto difficoltà a trovare una strada parallela e alternativa alla pubblicità per monetizzare i contenuti degli utenti. Pochi giorni fa avevamo parlato di Reddit e del suo accordo con Google del valore di 60 milioni di dollari all'anno, e verosimilmente nel corso del futuro immediato continueremo sempre di più ad assistere a collaborazioni di questo genere. Questo nuovo paradigma nasconde, però, qualche incognita: fino a che punto gli utenti saranno inclini allo sfruttamento dei loro contenuti senza che venga corrisposta loro alcuna ricompensa?
1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".