Basta IA allenate con i dati di Reddit: l'azienda blocca l'accesso al servizio a tutti i motori di ricerca tranne Google
Il CEO di Reddit Steve Huffman ha chiesto esplicitamente a Microsoft, Anthropic e Perplexity di pagare per l'accesso ai dati del sito, accusandoli di utilizzarli senza autorizzazione per addestrare i loro sistemi di intelligenza artificiale. E, nel frattempo, la piattaforma non è stata più resa disponibile ai motori di ricerca ad eccezione di Google
di Nino Grasso pubblicata il 01 Agosto 2024, alle 13:31 nel canale WebReddit, una delle piattaforme social più popolari al mondo, sta lottando per cambiare le regole del gioco nel settore dei dati utilizzati per il training delle IA. Steve Huffman, CEO della piattaforma, ha recentemente lanciato un ultimatum a diverse aziende tech, tra cui Microsoft: pagare per accedere ai contenuti di Reddit o perdere il diritto di utilizzarli.

La richiesta di Huffman arriva dopo che Reddit ha già stretto accordi con Google e OpenAI per l'utilizzo dei suoi dati. Ora, il CEO punta il dito contro Microsoft, Anthropic e Perplexity, accusandoli di aver raccolto i dati del sito senza autorizzazione per addestrare i loro sistemi di intelligenza artificiale o alimentare i risultati delle ricerche: "Senza questi accordi, non abbiamo voce in capitolo su come vengono utilizzati i nostri dati", ha dichiarato Huffman in un'intervista sottolineando come sia difficile bloccare l'accesso a queste aziende, ma al contempo necessario per proteggere gli interessi di Reddit.
Reddit lancia l'ultimatum a Microsoft: pagare per sfruttare i dati della piattaforma
La tensione tra Reddit e Microsoft è particolarmente evidente. Huffman accusa il gigante di Redmond di aver utilizzato i dati di Reddit per addestrare la sua IA e riassumere i contenuti nei risultati di Bing senza un esplicito consenso da parte dell'azienda e dei suoi utenti. Inoltre, sostiene che Microsoft abbia venduto i dati di Reddit ad altri motori di ricerca attraverso l'API di Bing.
La posizione di Reddit si inserisce all'interno di un cambiamento più ampio nel settore: gli editori tradizionali e le piattaforme online stanno cercando di monetizzare i loro contenuti di fronte all'ascesa dell'intelligenza artificiale generativa e Huffman ritiene che "il tradizionale scambio di valore dai motori di ricerca sia cambiato" e che la distinzione tra ricerca, riassunto e formazione dell'IA stia diventando sempre più sfumata.
La risposta di Microsoft non si è fatta attendere. Jordi Ribas, responsabile della divisione Search dell'azienda, ha dichiarato su X che "Reddit ha impedito a Bing di eseguire la scansione del proprio sito per la ricerca, favorendo un altro motore di ricerca" e quindi impedendo una competizione leale fra i player del settore. Microsoft ha anche affermato di rispettare le indicazioni dei siti web che non desiderano che i loro contenuti vengano utilizzati per l'addestramento dell'IA.
All'inizio del mese di luglio, Reddit aveva iniziato a limitare drasticamente l'accesso ai suoi contenuti, concedendoli esclusivamente a Google. La piattaforma aveva modificato il file robots.txt, un documento che indica ai motori di ricerca quali parti del sito possono essere indicizzate, per bloccare l'accesso a tutti tranne Google. Attraverso questa modifica è stato impedito a motori di ricerca come Bing, DuckDuckGo e altri di mostrare risultati recenti (e non) provenienti da Reddit.
Huffman ha spiegato che la decisione è stata presa in risposta all'uso non autorizzato dei dati di Reddit da parte delle aziende che abbiamo citato poco sopra, accusandole di aver utilizzato i contenuti di Reddit senza permesso e senza offrire alcuna compensazione. Cosa dovranno fare, quindi, Microsoft e gli altri player del settore per far sì che Reddit ritorni ad apparire fra i risultati di ricerca? Lo stesso Huffman ha fornito una soluzione, indicando il recente accordo con OpenAI per SearchGPT come modello da replicare. Il nuovo servizio potrà mostrare risultati di Reddit grazie a un accordo di licenza stipulato all'inizio dell'anno anche perché - come sottolineato dallo stesso Huffman - nessuno degli accordi di licenza firmati da Reddit fino ad ora prevede l'uso esclusivo dei dati della piattaforma.










Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Renault Twingo E-Tech Electric: che prezzo!
Lo compri una volta, lo giochi dove vuoi: PlayStation intende seguire l'esempio di Xbox Play Anywhere?
Qiantinuum annuncia Helios, "il computer quantistico più potente al mondo"
Samsung Galaxy S26 Ultra: una sola novità tra i sensori delle fotocamere
Google prepara Gemini 3 Pro e Nano Banana 2: arrivo previsto entro fine anno
TVS non è solo moto e scooter: ecco la e-bike Cilo Tanay HC1 in carbonio
Alexa+ arriva su BMW: gli automobilisti potranno conversare in maniera naturale con l'auto
Gemini Deep Research arriva su Google Finance: la nuova IA proverà ad anticipare il mercato
Rinvii a catena, Marvel 1943: Rise of Hydra slitta oltre il 2026 a data da destinarsi
Xiaomi inaugura uno spazio dedicato ai fan durante le Nitto ATP Finals 2025
Rilasciate le specifiche di Bluetooth 6.2: mai più dongle USB dedicati per tastiere e mouse?
L'obiettivo che mette tutto a fuoco: la rivoluzione ottica arriva dalla Carnegie Mellon
Meta avrebbe raccolto fino al 10% dei ricavi 2024 da inserzioni fraudolente. L’azienda respinge: quadro distorto
NVIDIA DGX Spark e videogiochi? Una pessima idea, anche se funziona
Serie Oppo Reno15 confermata: arriva il 10 novembre in Cina con fotocamera da 200 MP









4 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoè come studiare per la scuola su wikipedia.
come ci si fa a fidare della bontà di ciò che scrivono persone di tutto il mondo e tutte le età/esperienze?
Io ci vado e spesso ho trovato risposte interessantissime e complete a dubbi su prodotti informatici ecc..
Però se un gruppo di persone si organizzano per fare disinfomazione?
Non è stato proprio reddit il sito dove si sono organizzati per fare la speculazione di gamestop (o una cosa simile)?
Ovviamente immaginazione, ma la vedo piu' probabile HAHAHA
se lo magnano... lol
Perché i modelli linguistici non sono banche dati, riproducono il linguaggio in termini probabilistici, ed affinché si possa dialogare con essi in maniera naturale è necessario che siano addestrati con grandi quantità di conversazioni reali negli ambiti più disparati, ed in media Reddit checché se ne dica è migliore come fonte di dati rispetto al web in generale (composto principalmente da spam, siti ottimizzati per i motori di ricerca, porno).
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".