Amazon: scoperto un elevato volume di materiale pedopornografico nei dati di addestramento dell'AI

Amazon: scoperto un elevato volume di materiale pedopornografico nei dati di addestramento dell'AI

Amazon ha segnalato oltre un milione di casi di CSAM (Child sexual abuse material) nei propri dati di addestramento dell'AI, senza però chiarirne l'origine. Il NCMEC critica la mancanza di informazioni utili alle indagini. Il caso evidenzia i crescenti rischi per la sicurezza dei minori nello sviluppo dell'IA

di Francesco Messina pubblicata il 30 Gennaio 2026, alle 10:11 nel canale Web
Amazon

Amazon ha scoperto un "alto volume" di materiale pedopornografico, noto come CSAM (Child Sexual Abuse Material), all'interno dei dati utilizzati per addestrare i propri modelli di intelligenza artificiale. La notizia emerge da un'indagine di Bloomberg e ha acceso un forte dibattito sulla sicurezza dei dati e sulle responsabilità delle aziende tecnologiche nello sviluppo dell'AI.

Secondo il National Center for Missing and Exploited Children (NCMEC), nel solo 2025 l'organizzazione ha ricevuto oltre 1 milione di segnalazioni di CSAM legate all'intelligenza artificiale. La "stragrande maggioranza" di queste segnalazioni proviene proprio da Amazon, che avrebbe individuato il materiale illecito nei dataset di training dei suoi servizi AI.

Tuttavia, l'azienda non ha fornito informazioni precise sull'origine dei contenuti, limitandosi a dichiarare che provenivano da fonti esterne utilizzate per l'addestramento.

La mancanza di trasparenza di Amazon sta sollevando forti critiche

Questa mancanza di trasparenza ha sollevato forti critiche. Fallon McNulty, direttrice esecutiva della CyberTipline di NCMEC, ha definito il caso Amazon un'anomalia. Secondo McNulty, ricevere un numero così elevato di segnalazioni da un'unica azienda "solleva molte domande" sulla provenienza dei dati e sulle misure di sicurezza adottate. A differenza di altre aziende, le segnalazioni di Amazon sono risultate "inapplicabili", ovvero inutilizzabili per le forze dell'ordine, proprio perché prive di dettagli sulle fonti originali del materiale.

Amazon, dal canto suo, ha dichiarato di adottare un approccio "deliberatamente prudente" nello scannerizzare i dati di addestramento, inclusi quelli provenienti dal web pubblico, per identificare e rimuovere CSAM noto. Un portavoce ha inoltre spiegato che l'azienda tende a sovrasegnalare i casi al NCMEC per ridurre al minimo il rischio di omissioni e ha assicurato che i contenuti sospetti vengono rimossi prima di essere utilizzati per l'addestramento dei modelli.

Il caso si inserisce in un contesto più ampio di crescente preoccupazione per la sicurezza dei minori nell'era dell'AI. I numeri del NCMEC mostrano un'impennata impressionante: dalle 4.700 segnalazioni del 2023 si è passati a 67.000 nel 2024, fino a superare il milione nel 2025.

I migliori sconti su Amazon oggi

-22%

TCL 55T6C 55'' QLED TV 4K HDR, FireTV (SmartTV con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

449.00 349.00€ Compra ora

-21%

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

329.00 259.00€ Compra ora

-35%

FRITZ!Repeater 1200 AX Edition International, Ripetitore - Wi-Fi 6 extender Dual Band con 2.400 Mbit/s (5 GHz) & 600 Mbit/s (2,4 GHz), Mesh, Access Point, 1x Gigabit LAN, Interfaccia in italiano

95.99 61.99€ Compra ora

Windows 11 verso una nuova dock: Microsoft sperimenta una taskbar avanzata

Open Gaming Collective: nasce la maxi alleanza per rendere Linux la piattaforma di gioco definitiva

Hiei360030 Gennaio 2026, 11:35 #1

Parliamo di "Vero" CSAM o di cartoni animati che certi geni considerano allo stesso livello?

Se si trattasse di "Vero" materiale, Amazon dovrebbe essere legalmente obbligata a fornire le fonti alla polizia

h.rorschach30 Gennaio 2026, 13:53 #2

E zero conseguenze come con l'uso di centinaia di terabyte di materiale protetto da copyright

Saturn30 Gennaio 2026, 14:00 #3

Sarò molto ignorante ma onestamente non capisco come possa succedere.

Come si arrivi a fornire alle AI materiale CSAM.

Chi controlla le fonti e soprattutto come ?

Ribadisco però la mia ignoranza sull'argomento.

Attendo lumi.

randorama30 Gennaio 2026, 14:16 #4

Originariamente inviato da: Saturn

Sarò molto ignorante ma onestamente non capisco come possa succedere.

Come si arrivi a fornire alle AI materiale CSAM.

Chi controlla le fonti e soprattutto come ?

Ribadisco però la mia ignoranza sull'argomento.

Attendo lumi.

bof avranno fatto scarichi palla de emule/torrent/repository vari e gli hanno ammollato il pacchetto completo, non filtrato.

Darkon30 Gennaio 2026, 14:33 #5

Originariamente inviato da: Saturn

Sarò molto ignorante ma onestamente non capisco come possa succedere.

Come si arrivi a fornire alle AI materiale CSAM.

Chi controlla le fonti e soprattutto come ?

Ribadisco però la mia ignoranza sull'argomento.

Attendo lumi.

Gran parte del materiale di addestramento per AI viene rastrellato tramite bot o sistemi automatizzati che contano sul fatto che se raccogli una mole sufficiente di dati statisticamente i dati "veri" hanno un certo sopravvento.

Ci sono poi dei controlli che ad esempio escludono fonti palesemente fake come siti di terrapiattisti e simili ma che io sappia è un controllo che prevalentemente avviene attraverso key words in quanto la mole di dati è talmente enorme che sarebbe impossibile farlo a mano.

Detto ciò a secondo di come hai raccolto i dati ci sta che raccogli anche CSAM, non è così insolito, per il semplice fatto che purtroppo sono cose molto diffuse online e spesso anche nascoste con nomi, siti ecc... che non sono evidenti e subito individuabili.

Amazon ha tirato fuori la cosa ma se dovessi scommettere direi che la maggior parte delle AI se si scavasse nei dati di addestramento ha anche materiale illecito più o meno grave per il semplice fatto che pure chiunque di noi se naviga per abbastanza ore anche non volendo prima o poi apre un link a un sito con materiale più o meno illecito certo non per forza roba CSAM ma violare un copyright per esempio è un attimo.

Saturn30 Gennaio 2026, 14:37 #6

Originariamente inviato da: randorama

bof avranno fatto scarichi palla de emule/torrent/repository vari e gli hanno ammollato il pacchetto completo, non filtrato.

Se usano emule e torrent praticamente è come avergli aperto l'arca di Indiana Jones...

Originariamente inviato da: Darkon

Gran parte del materiale di addestramento per AI viene rastrellato tramite bot o sistemi automatizzati che contano sul fatto che se raccogli una mole sufficiente di dati statisticamente i dati "veri" hanno un certo sopravvento.

Ci sono poi dei controlli che ad esempio escludono fonti palesemente fake come siti di terrapiattisti e simili ma che io sappia è un controllo che prevalentemente avviene attraverso key words in quanto la mole di dati è talmente enorme che sarebbe impossibile farlo a mano.

Detto ciò a secondo di come hai raccolto i dati ci sta che raccogli anche CSAM, non è così insolito, per il semplice fatto che purtroppo sono cose molto diffuse online e spesso anche nascoste con nomi, siti ecc... che non sono evidenti e subito individuabili.

Amazon ha tirato fuori la cosa ma se dovessi scommettere direi che la maggior parte delle AI se si scavasse nei dati di addestramento ha anche materiale illecito più o meno grave.

Capisco...

Bah, d'altronde il mondo "è quello che è" e la rete non è che una fedele rappresentazione dello stesso. Schifo compreso.

randorama30 Gennaio 2026, 14:57 #7

Originariamente inviato da: Saturn

Se usano emule e torrent praticamente è come avergli aperto l'arca di Indiana Jones...

embeh, se non stai attento li tiri giù anche senza volerlo...

Darkon30 Gennaio 2026, 15:09 #8

Originariamente inviato da: randorama

embeh, se non stai attento li tiri giù anche senza volerlo...

Vecchio trucco da gran maestro:

Usa un cliente torrent che ti permetta di dare priorità diverse a singoli pacchetti (non file eh... pacchetti) in questo modo se di un file .mp4 scarichi subito la testa (primi 5 pacchetti) e la coda (idem) puoi anche se il download non è finito visualizzarne dei fotogrammi (anche in mezzo a seconda dei pacchetti successivi che scarichi) e capire se è quello che cercavi o no prima di aspettare la fine.

Con le connessioni di oggi non è più una tecnica così importante ma al tempo del 56k evitare errori e ore di download inutile era la chiave di tutto.

randorama30 Gennaio 2026, 15:19 #9

Originariamente inviato da: Darkon

Vecchio trucco da gran maestro:

Usa un cliente torrent che ti permetta di dare priorità diverse a singoli pacchetti (non file eh... pacchetti) in questo modo se di un file .mp4 scarichi subito la testa (primi 5 pacchetti) e la coda (idem) puoi anche se il download non è finito visualizzarne dei fotogrammi (anche in mezzo a seconda dei pacchetti successivi che scarichi) e capire se è quello che cercavi o no prima di aspettare la fine.

Con le connessioni di oggi non è più una tecnica così importante ma al tempo del 56k evitare errori e ore di download inutile era la chiave di tutto.

oddio... basta guardare i commenti.
di solito lo faccio, ma se sono file piccolini, tipo ebook, vado al bersaglio grosso, e poi li guardo con calma. a qual punto capitano le sorprese

aqua8430 Gennaio 2026, 17:11 #10

Sono entrati nei server del Vaticano

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Nuova Opel Astra Electric, stile rinnovato

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Lucid Gravity Touring, nuovo allestimento più equilibrato

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Formula E Gen4 - La monoposto

Formula E Gen4 - La monoposto

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

^

Passa alla versione
Desktop | Mobile

© 1997 - 2026 - Hardware Upgrade S.r.l. P.iva: 02560740124
Hardware Upgrade, testata giornalistica con registrazione tribunale di Varese, n. 879 del 30/07/2005. Iscrizione ROC n. 13366 - Ulteriori informazioni.
Per eventuali segnalazioni, inviare una mail all'indirizzo [email protected]

Membro della European Hardware Association