Frontier Safety Framework 3.0: DeepMind aggiorna le sue regole sulla sicurezza delle IA generative
DeepMind aggiorna il Frontier Safety Framework ampliando controlli e protocolli per prevenire abusi, manipolazione e difetti critici dei modelli IA avanzati: verso una regolamentazione globale dell’intelligenza artificiale
di Andrea Bai pubblicata il 24 Settembre 2025, alle 15:19 nel canale Scienza e tecnologiaDeepMind, la divisione di Google dedicata alla ricerca sull’intelligenza artificiale, ha annunciato la versione 3.0 del Frontier Safety Framework, un complesso sistema di protocolli progettato per individuare e mitigare i pericoli potenzialmente associati ai futuri modelli di IA estremamente potenti e autonomi. Il nuovo aggiornamento propone alcune risposte alle crescenti preoccupazioni sul possibile utilizzo malevolo o il malfunzionamento delle IA generative, soprattutto quando impiegate in compiti critici da aziende e governi.
Il quadro di riferimento introdotto da DeepMind, tra i primi nel settore a indirizzare in modo sistematico il tema della sicurezza nell’IA di frontiera, si basa su un approccio a livelli graduali chiamati Critical Capability Levels (CCL). I CCL sono protocolli di rischio che permettono di valutare la pericolosità raggiunta dai modelli IA rispetto a domini sensibili come autonomia operativa, biosicurezza, cybersicurezza e sviluppo di nuove intelligenze artificiali. Raggiunto un determinato livello, è prevista la sospensione dello sviluppo o della distribuzione del modello fino all’implementazione di nuove misure preventive. Tali valutazioni saranno frequenti e ripetute durante tutto il ciclo di sviluppo.

Il Frontier Safety Framework prevede test regolari dei modelli più avanzati al fine di identificare possibili “allarmi preventivi”. I rischi individuati spaziano dalla possibilità che un’IA agisca senza supervisione umana, fino alla protezione dalle minacce informatiche o dal supporto involontario alla creazione di armi biologiche. Qualora il modello dovesse superare le soglie di rischio, DeepMind si impegna non solo a sospendere il rilascio ma anche a rafforzare la sicurezza dei cosiddetti “weights” (pesi e parametri dei modelli), riconoscendo che la loro esfiltrazione potrebbe facilitare la disattivazione delle salvaguardie progettate contro comportamenti dannosi.
Un elemento centrale nell’aggiornamento del framework è la nuova attenzione verso la manipolazione psicologica e la possibilità che modelli AI avanzati influenzino sistematicamente credenze e comportamenti umani in contesti delicati. DeepMind ammette che questa eventualità sia già oggi plausibile considerando quanto le persone si siano mostrate particolarmente inclini a sviluppare forme di attaccamento emotivo verso i chatbot. Su questo punto però DeepMind ritiene che le "difese sociali" attualmente esistenti siano al momento efficaci senza che si presenti la necessità di assumere restrizioni che potrebbero rallentare l'innovazione.
Il framework si confronta anche con il tema della disallineamento: modelli che sviluppino obiettivi propri fino a resistere ai tentativi di spegnimento o generare output fraudolenti. DeepMind osserva che le tecniche attuali, come l’analisi delle “scratchpad output” (catene di ragionamento scritte dal modello), sono efficaci solo finché l’IA produce tracce verificabili dei suoi processi decisionali. Per sistemi più avanzati, che potrebbero celare il proprio ragionamento, queste soluzioni potrebbero rivelarsi inadeguate.
Il Frontier Safety Framework resta un’iniziativa in evoluzione, guidata dalla necessità di conciliare la sicurezza e il progresso tecnologico. DeepMind dichiara di intendere il framework come base aperta, in attesa di confrontarsi e collaborare con industria, ricerca e governi per fissare standard condivisi. «L’obiettivo è sfruttare al massimo i vantaggi dell’IA minimizzando al contempo i rischi», ribadiscono dal team, consapevoli che le conoscenze scientifiche sono tuttora in sviluppo e che molte sfide saranno affrontate progressivamente in base agli scenari reali che emergeranno. Al momento non c'è nessun riferimento esplicito all’AGI (intelligenza artificiale generale), ma i lavori in corso fanno intuire che DeepMind prevede anche questa eventualità.










Test ride con Gowow Ori: elettrico e off-road vanno incredibilmente d'accordo
Recensione OnePlus 15: potenza da vendere e batteria enorme dentro un nuovo design
AMD Ryzen 5 7500X3D: la nuova CPU da gaming con 3D V-Cache per la fascia media
4,9 miliardi su Google: Buffett sfida il suo stesso passato e ristruttura il portafoglio
Google ha svelato un agente AI che può giocare ai videogiochi e interagire con mondi virtuali 3D
Tesla cambia idea: è in arrivo l'integrazione con CarPlay?
Anche Firefox punta sull'intelligenza artificiale: navigare il web sarà diverso con AI Window
Stop alle super-accelerazioni delle auto elettriche? La Cina propone nuove norme e pensa alla sicurezza
Osservatorio AGCOM: sempre più accessi in fibra, Iliad non si ferma e Temu conquista gli italiani
Sempre più IA su Spotify: arrivano i riassunti degli audiolibri, per le parti già ascoltate
iMac M4 crolla a 1.199€ con risparmio di 330€ rispetto al listino: il tutto-in-uno Apple più potente e sottile è in super offerta su Amazon
Nintendo Switch 2: in rilascio un nuovo aggiornamento con tanti miglioramenti
Core Ultra 9 290K Plus, Core Ultra 7 270K Plus e Core Ultra 5 250K Plus: le CPU Arrow Lake Refresh in arrivo
Prezzo Black Friday per le super cuffie Sony WH-1000XM5SA, 229€, in offerta a 249€ anche le Sony WH-1000XM5, identiche, cambia la custodia
Crollano i prezzi della cuffie Beats col Black Friday: Studio Pro al minimo assoluto, Studio Buds+ a 95€ e altri prezzi mai visti prima
ASUS ROG Matrix RTX 5090 costa 4000 dollari: solo 1.000 unità per una scheda elitaria
Grazie ai dati di ESA il calcolo della traiettoria della cometa interstellare 3I/ATLAS è più preciso









0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".