Blackwell Ultra: fino al 45% di prestazioni in più rispetto a Blackwell nei test MLPerf
NVIDIA debutta con l'architettura Blackwell Ultra nei benchmark MLPerf Inference v5.1, stabilendo nuovi record di prestazioni su modelli di ultima generazione come DeepSeek-R1 e Llama 3.1.
di Manolo De Agostini pubblicata il 10 Settembre 2025, alle 15:21 nel canale Server e WorkstationBlackwellNVIDIA
L'architettura NVIDIA Blackwell Ultra debutta ufficialmente nei benchmark MLPerf Inference v5.1, stabilendo record di prestazioni su una gamma di modelli che spaziano dal riconoscimento vocale all'elaborazione di grandi modelli linguistici (LLM) con centinaia di miliardi di parametri.
Il nuovo sistema rack-scale GB300 NVL72, alimentato da GPU Blackwell Ultra, ha fatto segnare un incremento fino al 45% di throughput per GPU rispetto ai sistemi basati su Blackwell GB200 NVL72, confermandosi come riferimento per i carichi di lavoro di inferenza in data center. Ancora più significativo è il confronto con la precedente generazione Hopper: nel benchmark DeepSeek-R1 l'aumento prestazionale arriva a oltre 5 volte per GPU.

Oltre ai miglioramenti dell'architettura Blackwell Ultra, grazie al formato numerico NVFP4, sviluppato da NVIDIA, e agli strumenti software come TensorRT Model Optimizer e TensorRT-LLM, è stato possibile quantizzare modelli come DeepSeek-R1 e Llama 3.1 mantenendo l'accuratezza richiesta, ma con un notevole risparmio di memoria e maggior efficienza computazionale.
Un altro fattore determinante è stata l'adozione del disaggregated serving, che separa le fasi di context e generation dei LLM su GPU differenti, evitando inefficienze tipiche dei deployment tradizionali. Questa strategia si è rivelata cruciale nel nuovo scenario interattivo per Llama 3.1 405B, dove sono stati raggiunti throughput e latenze significativamente migliori rispetto all'approccio convenzionale.
La piattaforma ha inoltre beneficiato del framework NVIDIA Dynamo, che aggiunge funzioni come autoscaling basato su SLA, osservabilità in tempo reale e tolleranza ai guasti, facilitando la gestione di infrastrutture AI su larga scala.
Oltre ai risultati diretti di NVIDIA, diversi partner - tra cui Azure, Dell, HPE, Lenovo, Oracle e Supermicro - hanno presentato benchmark basati su Blackwell e Hopper, dimostrando la diffusione della piattaforma nel mercato enterprise.
Secondo NVIDIA, le prestazioni record di Blackwell Ultra non si limitano a migliorare i numeri di benchmark, ma incidono direttamente sull'economia delle AI factory: maggiore throughput significa più token generati a parità di tempo, minori costi operativi e ritorno sull'investimento più elevato per le organizzazioni che sviluppano e distribuiscono applicazioni basate su AI avanzata.










Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei
Core Ultra 7 270K Plus e Core Ultra 7 250K Plus: Intel cerca il riscatto ma ci riesce in parte
PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu
Google risolve il problema della memoria negli LLM: TurboQuant fa girare gli stessi modelli con cinque volte meno RAM
Un altro colpo alle auto elettriche: Panasonic taglia le batterie EV in favore di quelle per data center IA
Core Ultra 9 290K Plus: Intel conferma che non arriverà sul mercato
Addio connettori fusi? MSI promette di fermare tutto prima del disastro con GPU Safeguard+
Basta brani fake su Spotify: la nuova funzione dà controllo totale agli artisti
OPPO Find X9 Ultra: come funziona il rivoluzionario zoom 10x Hasselblad
Prezzo diverso per giochi digitali e fisici: la nuova politica Nintendo divide i giocatori
DDR5 32GB a meno di 340€: le Corsair Vengeance 6000MHz hanno buoni prezzi (visto il periodo) su Amazon
Harry Potter: HBO pubblica il primo trailer della serie TV e svela il nuovo volto di Hogwarts
Android 17 Beta 2 si allarga: la lista completa dei modelli (non solo Pixel) compatibili
RDNA 4m: AMD evolve RDNA 3.5 con AI e FSR 4 per le prossime APU Ryzen?
Sunseeker ha un mostro per i Pro e un'intera gamma domestica: punta ai prati italiani
Storica sentenza negli USA: Meta e Google ritenute responsabili della dipendenza da social e dei danni psicologici ai giovani
Musica generativa, arriva Lyria 3 Pro: ora Gemini compone brani completi









2 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoè da 10 anni che scrivi di questi fantomatici progetti interessanti e fantomatici concorrenti sotto OGNI news, e ad ogni trimestre nVidia stacca sempre di piu' gli avversari
li vedi solo tu.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".