VaultGemma di Google è il primo LLM per un’IA più rispettosa della privacy

Un team di Google Research introduce VaultGemma, un modello open-weight basato su privacy differenziale per ridurre la memorizzazione di dati sensibili. Lo studio definisce nuove leggi di scalabilità per bilanciare precisione, risorse di calcolo e tutela della privacy e del copyright

di Andrea Bai pubblicata il 16 Settembre 2025, alle 14:41 nel canale Scienza e tecnologia
Google

Le aziende che sviluppano modelli di intelligenza artificiale sempre più grandi si scontrano con un problema che già avevamo evidenziato tempo addietro, ovvero la scarsità di dati di qualità per l'addestramento. I modelli linguistici di grandi dimensioni passano al setaccio il web, raccogliendo tutto ciò che trovano, compresi contenuti sensibili o materiale coperto da diritto d'autore: esiste quindi il rischio che i modelli possano in maniera occasionale rigenerare parti del dataset su cui sono stati addestrati, producendo un risultato capace di violare la privacy degli utenti o i diritti d'autore.

Partendo da questo problema, Google Research ha provato a porre una possibile soluzione con la tecnica della "privacy differenziale", che si basa sull'introduzione di una quantità precisa e controllata di "rumore" nei dati di addestramento così da ridurre la probabilità di memorizzare e riprodurre pedissequamente informazioni personali o coperte da copyright.

C'è tuttavia un rovescio della medaglia, come può essere facilmente intuibile: l'introduzione di un rumore nei dati di addestramento, per quanto controllato, ne riduce l'accuratezza e aumenta le richieste in termini di potenza di calcolo. Il team di Google ha dimostrato, in maniera precisa per la prima volta nel campo dell'intelligenza artificiale, che le prestazioni di un LLM addestrato con privacy differenziale dipende in larga misura dal rapporto tra la quantità di rumore e la dimensione del dataset utilizzato per l'addestramento.

A partire da questi esperimenti e analisi, Google ha potuto identificare nuove leggi di scalabilità per i modelli, bilanciando tre fattori: la potenza di calcolo disponibile, la necessità di privacy e la quantità di dati. Un esempio della relazione tra questi fattori? Un incremento del rumore (quindi l'aumento della necessità di privacy) porta a output meno accurati, che però possono essere compensati aumentando la potenza di calcolo o usando dataset più grandi (o ambedue le cose).

Le ricerche di Google hanno portato alla realizzazione di VaultGemma, il primo LLM con privacy differenziale. VaultGemma è un modello open-weight, basato sulla serie Gemma 2 e dunque di una generazione precedente rispetto ai Gemma 3 più recenti. Con una dimensione di 1 miliardo di parametri, VaultGemma non è particolarmente esteso rispetto ai modelli generalisti di ultima generazione, ma secondo Google raggiunge prestazioni paragonabili a quelle di modelli non privati della stessa scala.

Questo progetto rappresenta ancora un esperimento, ma con la chiara direzione di integrare la privacy differenziale nell’architettura degli agenti intelligenti di Google. Inoltre, le leggi di scalabilità messe a punto aiuteranno altri sviluppatori a ottimizzare l’uso delle risorse, mostrando che la privacy differenziale è particolarmente adatta ai modelli di dimensioni contenute e con scopi specifici, piuttosto che ai sistemi di intelligenza artificiale più ampi e generici.

VaultGemma è disponibile per il download su Hugging Face e Kaggle. Come gli altri modelli della serie Gemma, è rilasciato con pesi aperti, ma non è realmente open source: per poterlo usare, modificare e distribuire è necessario accettare la licenza Gemma, che impone restrizioni in merito a utilizzi dannosi e richiede la condivisione della licenza con ogni versione derivata.

I migliori sconti su Amazon oggi

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

29.49€ Compra ora

-30%

Amazfit Active 2 Smart Watch 44mm, AI, Controllo Vocale, GPS e Mappe incluse, Batteria da 10 Giorni, 160+ Modalità Sportive, Resistente allAcqua 5 ATM per Android e iPhone, Nero

99.90 69.99€ Compra ora

-35%

FRITZ!Repeater 1200 AX Edition International, Ripetitore - Wi-Fi 6 extender Dual Band con 2.400 Mbit/s (5 GHz) & 600 Mbit/s (2,4 GHz), Mesh, Access Point, 1x Gigabit LAN, Interfaccia in italiano

95.99 61.99€ Compra ora

Uno studio svela come usiamo ChatGPT, il risultato vi sorprenderà

Microsoft termina il supporto per Office 2016 e 2019: cosa fare per evitare virus e bug

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Formula E Gen4 - La monoposto

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

VaultGemma di Google è il primo LLM per un’IA più rispettosa della privacy

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

Amazfit Active 2 Smart Watch 44mm, AI, Controllo Vocale, GPS e Mappe incluse, Batteria da 10 Giorni, 160+ Modalità Sportive, Resistente allAcqua 5 ATM per Android e iPhone, Nero

FRITZ!Repeater 1200 AX Edition International, Ripetitore - Wi-Fi 6 extender Dual Band con 2.400 Mbit/s (5 GHz) & 600 Mbit/s (2,4 GHz), Mesh, Access Point, 1x Gigabit LAN, Interfaccia in italiano

0 Commenti