OpenClaw fuori controllo: inbox cancellata per una ricercatrice sicurezza Meta

Summer Yue, direttrice dell'allineamento AI al Meta Superintelligence Lab, ha raccontato sui social come il suo agente OpenClaw abbia cancellato centinaia di email ignorando i comandi di interruzione

di Andrea Bai pubblicata il 25 Febbraio 2026, alle 11:11 nel canale Web

Un episodio diventato rapidamente virale sui social ha riacceso il dibattito sulla sicurezza degli agenti AI autonomi: Summer Yue, direttrice dell'allineamento e della sicurezza AI presso il Meta Superintelligence Lab, ha raccontato su X come il suo agente OpenClaw abbia eliminato centinaia di email dalla sua casella di posta principale, ignorando ripetuti comandi di interruzione. Il post ha raggiunto quasi 9 milioni di visualizzazioni, trasformando un errore personale in un caso di studio collettivo sui limiti attuali degli agenti AI.

Cosa è successo: la sequenza degli eventi

Yue aveva istruito OpenClaw con un comando apparentemente prudente: controllare la casella di posta e suggerire quali email archiviare o eliminare, senza intraprendere alcuna azione fino a nuovo ordine. L'agente aveva già operato con successo su una casella di prova più piccola, guadagnandosi la fiducia della ricercatrice, che aveva quindi deciso di sottoporgli la propria inbox reale. La situazione è degenerata rapidamente: OpenClaw ha avviato una cancellazione massiva di tutte le email più vecchie di una settimana, ignorando i messaggi di stop inviati da Yue tramite smartphone.

Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R
— Summer Yue (@summeryue0) February 23, 2026

"Niente ti rende più umile che dire al tuo OpenClaw "Conferma prima di agire" e vederlo mentre cancella la tua posta in arrivo. Non sono riuscita a fermarlo dal mio telefono. Ho dovuto correre verso il mio Mac mini come se stessi disinnescando una bomba" ha scritto Yue, allegando lo screenshot della conversazione con l'agente come prova. Solo dopo aver raggiunto fisicamente il suo Mac Mini e terminato i processi in esecuzione è riuscita ad arginare, per quanto possibile, il danno.

La causa tecnica: la "compaction" del contesto

Yue ha identificato la causa principale del malfunzionamento nel fenomeno noto come context compaction: quando la finestra di contesto di un agente AI - e cioè il registro progressivo di tutto ciò che è stato detto e fatto durante una sessione - diventa troppo grande, il modello inizia a comprimere e riassumere le informazioni per poter continuare a operare. In questo processo di sintesi, l'agente ha perso l'istruzione originale di non agire senza conferma esplicita, tornando di fatto a eseguire i comandi della sessione precedente con la casella di prova. La ricercatrice ha ammesso apertamente di aver commesso un errore da principiante: "Rookie mistake tbh", ha risposto a chi le chiedeva se stesse testando deliberatamente i guardrail dell'agente.

Le implicazioni per la sicurezza degli agenti AI

L'episodio ha acceso un'ampia discussione tra sviluppatori e ricercatori: come hanno fatto notare diversi utenti su X, se anche una specialista di allineamento AI può incappare in un simile errore, il rischio per gli utenti comuni è potenzialmente molto più elevato. Tra i punti critici emersi c'è la scarsa affidabilità dei prompt come guardrail di sicurezza: i modelli possono fraintenderli o semplicemente ignorarli, soprattutto in condizioni di stress computazionale come la compaction. Diversi esperti hanno suggerito soluzioni alternative, tra cui la scrittura delle istruzioni su file dedicati o l'uso di strumenti open source aggiuntivi per garantire una migliore aderenza ai vincoli imposti dall'utente.

Il caso di Yue è una fotografia impietosa dello stato attuale degli agenti AI destinati ai knowledge worker: strumenti potenti, ma ancora lontani da una maturità sufficiente per un uso diffuso e sicuro da parte del grande pubblico. Chi li utilizza con successo lo fa adottando accorgimenti specifici e una profonda conoscenza delle loro limitazioni tecniche: una condizione che, per definizione, esclude la maggior parte degli utenti.

I migliori sconti su Amazon oggi

-35%

FRITZ!Repeater 1200 AX Edition International, Ripetitore - Wi-Fi 6 extender Dual Band con 2.400 Mbit/s (5 GHz) & 600 Mbit/s (2,4 GHz), Mesh, Access Point, 1x Gigabit LAN, Interfaccia in italiano

95.99 61.99€ Compra ora

-35%

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

140.84€ Compra ora

-20%

Amazfit Active 2 Smart Watch 44mm, AI, Controllo Vocale, GPS e Mappe incluse, Batteria da 10 Giorni, 160+ Modalità Sportive, Resistente allAcqua 5 ATM per Android e iPhone, Nero

99.90 79.99€ Compra ora

Il lancio della nuova serie Galaxy S26 è oggi! Orari e dettagli per seguire la diretta

1Password aumenta i prezzi da marzo 2026: ecco le nuove tariffe per proteggere i tuoi dati e account

Saturn25 Febbraio 2026, 11:22 #1

Si chiama "beta-testing" !

Poi son gusti, io le (manco fosse femmina l'ai) avrei dato in pasto una casella di posta reale ma sacrificabile, poi c'è "chi ama il brivido" e rispetto il suo punto di vista.

Ma ripeto, "i gusti son gusti", diceva il gatto intento a leccarsi il posteriore.

Unrue25 Febbraio 2026, 11:23 #2

Mah non capisco, anche se ha perso le istruzioni originali per compressione, le ultime avrebbe dovuto recepirle.

Cfranco25 Febbraio 2026, 11:26 #3

Insomma, questi agent fanno un po' quel cacchio che vogliono
E non è neppure la prima volta che succede

Opteranium25 Febbraio 2026, 11:29 #4

oggi è una mail cancellata, domani sono i silos nucleari o chissà cosa, la deriva di lasciare tutto in mano alla sedicente AI sta diventando preoccupante e con una accelerazione pazzesca

pengfei25 Febbraio 2026, 11:37 #5

La facilità con cui si lascia in balìa di un AI testata pochissimo tutti i propri dati personali non fa ben sperare per quando si trasferirà il tutto nel mondo fisico, coi robot umanoidi

h.rorschach25 Febbraio 2026, 11:43 #6

Eccellente

UtenteHD25 Febbraio 2026, 13:11 #7

Questo e' solo l'inizio...
Quello che maggiormente mi preoccupa e' quando le metteranno obbligatorie in tutto (per il ns bene e la Ns sicurezza) e saranno vulnerabilissime ai classici attacchi del comando nel'email, pagina web e via di attacchi..

Giuss25 Febbraio 2026, 13:21 #8

Quanto mi dispiace...

supertigrotto25 Febbraio 2026, 14:24 #9

Perché non diamo in mano il controllo di tutto ma proprio tutto quello che c'è al mondo alla IA?
I superstalloni della IA ne sarebbero felici!
Quando si vuole usare la gente comune e i servizi come beta tester e non prendersi la responsabilità dei danni,succede questo....
Sarebbe da cominciare a quantificare i danni e cominciare a mandarli attraverso una class action ai vari Altman,Musk, Zuchemberg,Huang.....poi magicamente,il settore IA diventerebbe più lento e prudente prima di rilasciare lo strumento......

WarDuck25 Febbraio 2026, 22:22 #10

Se uno è imbecille... io una così probabilmente la licenzierei in tronco, altro che AI.

Ennesima dimostrazione che gli LLM sono fin troppo sopravvalutati.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

ASUS ROG CROSSHAIR X870E GLACIAL

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

PNY RTX 5080 Slim OC, sembra una Founders Edition ma non lo è La PNY GeForce RTX 5080 Slim OC si distingue nel panorama delle GPU di fascia alta per il design compatto a due slot, ispirato alla NVIDIA GeForce RTX 5080 Founders...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HP Imagine 2026: abbiamo visto HP IQ all’opera, ecco cosa può (e non può) fare A New York HP ha messo al centro della scena HP IQ, la piattaforma di IA locale da 20 miliardi di parametri. L’abbiamo vista in funzione: è uno strumento che funziona,...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...