Reddit dice basta all’Internet Archive: ecco perché non troverai più i vecchi thread

 Reddit dice basta all’Internet Archive: ecco perché non troverai più i vecchi thread

Reddit mette fine all’archiviazione globale dei suoi thread da parte dell’Internet Archive, permettendo il salvataggio sulla Wayback Machine solo della propria homepage. Una decisione dettata da privacy, AI e nuove strategie di monetizzazione

di pubblicata il , alle 07:38 nel canale Web
Reddit
 

Reddit ha ufficialmente deciso di bloccare l’Internet Archive (IA), impedendo alla piattaforma di archiviare la maggior parte dei contenuti pubblici come thread, commenti e profili. La motivazione riguarda ancora una volta le attività di scraping dei bot per l'addestramento AI: alcune aziende, non potendo più accedere a Reddit direttamente a causa di nuove restrizioni, hanno iniziato a raccogliere dati sfruttando la storica Wayback Machine dell’Internet Archive.

Reddit ha fatto sapere che finché l’Internet Archive non sarà in grado di tutelare adeguatamente i dati degli utenti e di rispettare le policy di cancellazione dei contenuti rimossi, la possibilità di archiviare il sito resterà circoscritta a una semplice istantanea della homepage, rendendo di fatto quasi nullo il valore documentale dell’archivio digitale per tutto quanto riguarda la piattaforma.

Come ha precisato il portavoce Tim Rathschmidt, Reddit è venuta a conoscenza di diversi casi in cui aziende AI hanno violato le policy e sfruttato la Wayback Machine per scavalcare i blocchi, raccogliendo così dati sensibili, compresi contenuti cancellati dagli utenti. In particolare, la preoccupazione riguarda proprio la tutela della privacy e la possibilità che post e commenti eliminati possano restare accessibili tramite l’archivio. Reddit continuerà pertanto a rafforzare le proprie restrizioni, valutando un allentamento solo in caso di soluzioni reali da parte della IA contro lo scraping illegittimo e il salvataggio non autorizzato di contenuti rimossi. 

Internet Archive è comunque uno strumento complesso da usare per recuperare post cancellati, sostituito spesso da piattaforme specializzate. Eppure, la Wayback Machine è stata negli anni preziosa per documentare thread cancellati soprattutto in occasione dei recenti cambiamenti API di Reddit (ad esempio nel 2023), che avevano portato alla rimozione di numerosi subreddit e conversazioni.

Va inoltre ricordato che fin dall'approdo in borsa, Reddit ha sempre cercato di tutelare la possibilità di monetizzare i propri dati, come testimoniato anche dai recenti accordi per la concessione di licenze a colossi dell’AI: quello con Google, ad esempio, ha fruttato alla società circa 60 milioni di dollari, e Reddit conta di superare i 200 milioni nei prossimi tre anni grazie a simili licenze, incluso un accordo mantenuto riservato con OpenAI.

Per quanto riguarda l’Internet Archive, il direttore Mark Graham ha dichiarato che i rapporti con Reddit sono “di lunga data” e che sono in corso confronti per cercare una soluzione che possa eventualmente ripristinare un accesso più ampio.

4 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
AntisocialNTwo12 Agosto 2025, 08:30 #1
Praticamente Reddit ha negato l'accesso a Internet Archive solo perchè non riusciva a monetizzare questo tipo di condivisione dati, come ha fatto con le altre aziende a cui Reddit ha venduto i dati per addestrare le IA
Silent Bob12 Agosto 2025, 09:44 #2
Originariamente inviato da: AntisocialNTwo
Praticamente Reddit ha negato l'accesso a Internet Archive solo perchè non riusciva a monetizzare questo tipo di condivisione dati, come ha fatto con le altre aziende a cui Reddit ha venduto i dati per addestrare le IA

E credo sia proprio così.

dato il funzionamento di Archive, e della Wayback machine. Poi c'è da vedere come si evolverà la cosa.
Già su quel sito ci son archivi di vecchi siti totalmente incompleti, mi domando cosa rimarrà di Reddit da qui al giorno che , in futuro, sarà in disuso.

Son tempi differenti sicuramente.
djfix1312 Agosto 2025, 10:16 #3
ho sempre pensato che Archive avesse un senso se la piattaforma chiude o un sito storico smette di aggiornarsi e quindi il dominio viene chiuso. Se Reddit esiste e i dati sono suoi non vanno da nessuna parte, che senso ha farne una copia adesso?
WarSide12 Agosto 2025, 11:25 #4
Originariamente inviato da: djfix13
ho sempre pensato che Archive avesse un senso se la piattaforma chiude o un sito storico smette di aggiornarsi e quindi il dominio viene chiuso. Se Reddit esiste e i dati sono suoi non vanno da nessuna parte, che senso ha farne una copia adesso?


Perché ogni tanto c'è qualche nazista che compra aziende e decide di fare piazza pulita dello storico e si perdono discussioni ad alto valore. La memoria storica è importante e dovrebbe essere previsto per legge che se una cosa è di pubblico dominio (ovvero accessibile senza registrazioni o paywall) deve poter essere salvata ed archiviata se c'è un ente che vuol metterci soldi per farlo.

Questi signori vogliono la botte piena e la moglie ubriaca: i dati non li mettono in un walled garden (alla facebook) perché senza il traffico dei motori di ricerca perderebbero il 70% del valore in borsa e, allo stesso tempo, non vogliono che altri crawler indicizzino il loro contenuto pubblico ed accessibile a tutti.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^