Frontier Safety Framework 3.0: DeepMind aggiorna le sue regole sulla sicurezza delle IA generative

DeepMind aggiorna il Frontier Safety Framework ampliando controlli e protocolli per prevenire abusi, manipolazione e difetti critici dei modelli IA avanzati: verso una regolamentazione globale dell’intelligenza artificiale

di Andrea Bai pubblicata il 24 Settembre 2025, alle 15:19 nel canale Scienza e tecnologia

DeepMind, la divisione di Google dedicata alla ricerca sull’intelligenza artificiale, ha annunciato la versione 3.0 del Frontier Safety Framework, un complesso sistema di protocolli progettato per individuare e mitigare i pericoli potenzialmente associati ai futuri modelli di IA estremamente potenti e autonomi. Il nuovo aggiornamento propone alcune risposte alle crescenti preoccupazioni sul possibile utilizzo malevolo o il malfunzionamento delle IA generative, soprattutto quando impiegate in compiti critici da aziende e governi.

Il quadro di riferimento introdotto da DeepMind, tra i primi nel settore a indirizzare in modo sistematico il tema della sicurezza nell’IA di frontiera, si basa su un approccio a livelli graduali chiamati Critical Capability Levels (CCL). I CCL sono protocolli di rischio che permettono di valutare la pericolosità raggiunta dai modelli IA rispetto a domini sensibili come autonomia operativa, biosicurezza, cybersicurezza e sviluppo di nuove intelligenze artificiali. Raggiunto un determinato livello, è prevista la sospensione dello sviluppo o della distribuzione del modello fino all’implementazione di nuove misure preventive. Tali valutazioni saranno frequenti e ripetute durante tutto il ciclo di sviluppo.

Il Frontier Safety Framework prevede test regolari dei modelli più avanzati al fine di identificare possibili “allarmi preventivi”. I rischi individuati spaziano dalla possibilità che un’IA agisca senza supervisione umana, fino alla protezione dalle minacce informatiche o dal supporto involontario alla creazione di armi biologiche. Qualora il modello dovesse superare le soglie di rischio, DeepMind si impegna non solo a sospendere il rilascio ma anche a rafforzare la sicurezza dei cosiddetti “weights” (pesi e parametri dei modelli), riconoscendo che la loro esfiltrazione potrebbe facilitare la disattivazione delle salvaguardie progettate contro comportamenti dannosi.

Un elemento centrale nell’aggiornamento del framework è la nuova attenzione verso la manipolazione psicologica e la possibilità che modelli AI avanzati influenzino sistematicamente credenze e comportamenti umani in contesti delicati. DeepMind ammette che questa eventualità sia già oggi plausibile considerando quanto le persone si siano mostrate particolarmente inclini a sviluppare forme di attaccamento emotivo verso i chatbot. Su questo punto però DeepMind ritiene che le "difese sociali" attualmente esistenti siano al momento efficaci senza che si presenti la necessità di assumere restrizioni che potrebbero rallentare l'innovazione.

Il framework si confronta anche con il tema della disallineamento: modelli che sviluppino obiettivi propri fino a resistere ai tentativi di spegnimento o generare output fraudolenti. DeepMind osserva che le tecniche attuali, come l’analisi delle “scratchpad output” (catene di ragionamento scritte dal modello), sono efficaci solo finché l’IA produce tracce verificabili dei suoi processi decisionali. Per sistemi più avanzati, che potrebbero celare il proprio ragionamento, queste soluzioni potrebbero rivelarsi inadeguate.

Il Frontier Safety Framework resta un’iniziativa in evoluzione, guidata dalla necessità di conciliare la sicurezza e il progresso tecnologico. DeepMind dichiara di intendere il framework come base aperta, in attesa di confrontarsi e collaborare con industria, ricerca e governi per fissare standard condivisi. «L’obiettivo è sfruttare al massimo i vantaggi dell’IA minimizzando al contempo i rischi», ribadiscono dal team, consapevoli che le conoscenze scientifiche sono tuttora in sviluppo e che molte sfide saranno affrontate progressivamente in base agli scenari reali che emergeranno. Al momento non c'è nessun riferimento esplicito all’AGI (intelligenza artificiale generale), ma i lavori in corso fanno intuire che DeepMind prevede anche questa eventualità.

I migliori sconti su Amazon oggi

-21%

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

329.00 259.00€ Compra ora

-21%

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

140.84€ Compra ora

-30%

Amazfit Active 2 Smart Watch 44mm, AI, Controllo Vocale, GPS e Mappe incluse, Batteria da 10 Giorni, 160+ Modalità Sportive, Resistente allAcqua 5 ATM per Android e iPhone, Nero

99.90 69.99€ Compra ora

Google Foto introduce la modifica delle immagini con l'AI: bastano dei comandi vocali e testuali

È ufficiale: le auto elettriche di Xiaomi nei mercati globali dal 2027, con store in tutto il mondo

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

ASUS ROG CROSSHAIR X870E GLACIAL

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

Frontier Safety Framework 3.0: DeepMind aggiorna le sue regole sulla sicurezza delle IA generative

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

Amazfit Active 2 Smart Watch 44mm, AI, Controllo Vocale, GPS e Mappe incluse, Batteria da 10 Giorni, 160+ Modalità Sportive, Resistente allAcqua 5 ATM per Android e iPhone, Nero

0 Commenti