NVIDIA Rubin CPX con 128 GB GDDR7: 30 PetaFLOPS di potenza per l'inferenza a milioni di token
NVIDIA ha presentato Rubin CPX, una nuova GPU ottimizzata per l'elaborazione di contesti AI estesi fino a milioni di token. Con 30 PetaFLOPS, 128 GB di GDDR7 e un'integrazione nella piattaforma Vera Rubin NVL144 CPX da 8 ExaFLOPS, il chip punta a rivoluzionare inferenza, coding avanzato e generazione video su larga scala.
di Manolo De Agostini pubblicata il 10 Settembre 2025, alle 11:01 nel canale Server e WorkstationRubinNVIDIA
Durante l'AI Infra Summit, NVIDIA ha annunciato Rubin CPX, una nuova GPU progettata appositamente per affrontare i carichi di lavoro legati all'inferenza contestuale massiva. L'acceleratore, parte della futura famiglia Rubin, nasce per supportare modelli capaci di elaborare contesti da centinaia di migliaia fino a milioni di token, con applicazioni che spaziano dall'analisi completa di repository software alla generazione e ricerca di contenuti video di lunga durata.

Rubin CPX adotta un design monolitico - in controtendenza rispetto ai package multi-GPU delle architetture Blackwell – accanto a 128 GB di memoria GDDR7 e prestazioni pari a 30 PetaFLOPS di calcolo NVFP4. L'architettura è ottimizzata per la fase di contesto dell'inferenza, quella più intensiva in termini di calcolo, dove modelli avanzati analizzano enormi quantità di input prima della generazione token per token.
Il chip integra, inoltre, quattro unità NVENC e quattro NVDEC per la codifica e decodifica video, rendendolo particolarmente adatto a flussi di lavoro multimediali senza dipendere da componenti esterni. NVIDIA dichiara prestazioni fino a tre volte superiori rispetto ai sistemi basati su GB300 Blackwell Ultra, con un incremento significativo nella velocità dell'attenzione nei modelli AI.

Vera Rubin CPX sarà affiancabile ai rack NVIDIA Vera Rubin NVL144. Il sistema raggiungerà 8 ExaFLOPS di potenza di calcolo, oltre a 100 TB di memoria ad alta velocità e 1,7 PB/s di banda passante. La connettività sarà garantita da ConnectX-9 SuperNICs e Spectrum-X Ethernet, orchestrati dal framework NVIDIA Dynamo, che ottimizza la gestione dei carichi di inferenza disaggregata.
Secondo NVIDIA, la nuova piattaforma può offrire ritorni fino a 30-50 volte superiori all'investimento, con una proiezione di 5 miliardi di dollari di ricavi ogni 100 milioni investiti, grazie alla monetizzazione delle applicazioni basate su contesti lunghi.

Rubin CPX sarà supportata dall'intero stack software NVIDIA, inclusi CUDA-X, le librerie AI enterprise e i microservizi NIM, oltre al motore di orchestrazione Dynamo. Il chip potrà eseguire i modelli multimodali Nemotron, pensati per agenti AI con capacità di ragionamento avanzato e memoria persistente.
Diverse realtà stanno già esplorando il potenziale della GPU. Cursor mira a incrementare la produttività degli sviluppatori con strumenti di code generation su vasta scala; Runway intende sfruttare Rubin CPX per accelerare la creazione di contenuti video generativi; Magic lavora invece a foundation model per agenti software capaci di comprendere codebase intere da 100 milioni di token.
NVIDIA prevede il debutto della GPU Rubin CPX e della piattaforma Vera Rubin NVL144 CPX verso la fine 2026, dopo il lancio della serie Rubin standard previsto all'inizio dello stesso anno.










AMD Ryzen 5 7500X3D: la nuova CPU da gaming con 3D V-Cache per la fascia media
SONY BRAVIA 8 II e BRAVIA Theatre System 6: il cinema a casa in formato compatto
KTC H27E6 a 300Hz e 1ms: come i rivali ma a metà prezzo
Offerta a tempo Amazon: PlayStation 5 a 399€ e PS5 Pro a 769,99€ — scorte limitate, corri!
Google allenta le norme di sicurezza su Android: sarà possibile installare app non verificate, ma a proprio rischio
Offerta lampo su Amazon: Samsung Galaxy A56 5G a soli 299,90€ con scorte limitate, un prezzo speciale per essere un Galaxy
Rockstar accusata di licenziamenti illegali: il sindacato IWGB avvia un'azione legale nel Regno Unito
Steam Frame ponte tra Windows e Android: giochi PC e mobile in un'unica libreria
Apple Watch SE (2ª gen.) 44 mm: lo smartwatch ideale per fitness e salute ora a soli 199€ su Amazon
Nuovo Nothing Phone (3): design trasparente, fotocamera da 50 MP e batteria al silicio-carbonio — lo smartphone più cool del momento è già in offerta a 599€
Aqara FP300 fa poker: PIR, mmWave, luce, temperatura e umidità con Thread, Zigbee e Matter. A batteria!
Windows 10: patch disponibile per gli avvisi di fine supporto sbagliati
iPhone 18 Pro Max sarà l'iPhone pesante di sempre: potrebbe superare i 240 grammi
Super offerta per il nuovo LG QNED AI 65'': il TV 4K con processore α7 Gen8 e colori QNED scende a soli 599€ su Amazon
Black Friday anticipato: super sconti sui migliori robot aspirapolvere premium con lavaggio a caldo, risparmi fino a centinaia di euro
OpenOffice 4.1.16 in distribuzione: la suite gratuita di produttività diventa più sicura
I siti porno esteri hanno tre mesi per adeguarsi: ecco perché non c'è ancora la verifica dell'età in Italia









10 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoL'ultima volta ha dovuto saltare la presentazione delle GPU per l'imbarazzo dopo aver visto cosa ha mostrato la concorrenza.
Questa volta ha tempo di inventarsi qualche nuovo test in cui la futura MI400X batte l'H200 del 5% in un test appositamente costruito per limitare la potenza computazionale del chip della concorrenza. Ovviamente senza applicare le ottimizzazioni.
Link ad immagine (click per visualizzarla)
Non hai mica torto !
Però è un argomento che si presta troppo a "tale pratica". Se torni indietro ai tempi delle 3Dfx e della loro vita "post mortem" del marchio....ah....a confronto questi post sono roba da educande...
Non hai mica torto !
Però è un argomento che si presta troppo a "tale pratica". Se torni indietro ai tempi delle 3Dfx e della loro vita "post mortem" del marchio....ah....a confronto questi post sono roba da educande...
Mica solo qua. E' pratica comune degli utenti di HU.
Pochi parlano di tecnologia o di esperienza.
Continuate a dare per spacciata AMD ,come ai tempi di bulldozer,sembra che gufare AMD gli porti fortuna,leggevo su questo forum che AMD sarebbe sparita,che doveva andare in fallimento etc ed effettivamente vedo che ormai è un ricordo del passato.
Per ora Nvidia è in vantaggio ma ci sono progetti interessanti che potrebbero rivoluzionare questo settore,qualcuno ha detto memristori?
Anche blockbuster sembrava incrollabile......
Continuate a dare per spacciata AMD ,come ai tempi di bulldozer,sembra che gufare AMD gli porti fortuna,leggevo su questo forum che AMD sarebbe sparita,che doveva andare in fallimento etc ed effettivamente vedo che ormai è un ricordo del passato.
Per ora Nvidia è in vantaggio ma ci sono progetti interessanti che potrebbero rivoluzionare questo settore,qualcuno ha detto memristori?
Anche blockbuster sembrava incrollabile......
Eccoli, quelli che se la prendono a male se si punzecchia AMD e le sue slide con i benchmark fasulli. Se alle parole corrispondessero fatti, allora sarebbe diverso, ma per ora AMD ha solo fatto un sacco di proclami mostrando millantati vantaggi rispetto a Nvidia usando test fatti ad hoc che non usano tutte le tecnologie e disposizione della concorrenza e soprattutto si fermano sempre ad un massimo di 8 GPU, cioè ciò che sta in una sola unità rack, che è il supporto massimo che AMD riesce a garantire prima che le sue prestazioni cadano a picco per la mancanza di interconnessione veloce tra le schede.
Infatti con quei numeri farlocchi fa bella figura verso chi non capisce nulla, cioè investitori e fanboy, mentre chi deve acquistare per lavorarci investendo un sacco di soldi sa cosa sta realmente comprando e sceglie altro.
Per quanto riguarda il fallimento di AMD, sì, era ormai in fallimento prima dell'arrivo di Zen. Fosse andato male anche quell'architettura oggi non avremmo AMD come la conosciamo ora.
Ora AMD naviga benino, ma non è che le trimestrali facciano gridare al miracolo nonostante tutto il market share che ha guadagnato in questi anni. Infatti il titolo è sostenuto più dalle promesse di vendita nel mercato AI che dai fatti reali. Se non dimostra che è in grado di fare soldi in questo mercato tornerà presto dove era partita prima della corsa agli armamenti del mercato AI.
Il mercato edge... scusa puoi elencare i prodotti che AMD propone per questo mercato e che tipo di vantaggi ha rispetto a ciò che propone la concorrenza?
Anche blockbuster sembrava incrollabile......
Cioè prima ti lamenti che qualcuno punzecchia le presentazioni farlocche di AMD perché è male gufare, quando non è stato espresso nessun pensiero a riguardo della sua sorte, poi concludi con la speranza o comunque mostri di sperare nella remota idea che il colosso Nvidia fallisca.
Non ho davvero capito chi è il gufo qui. Per quale motivo poi speri che Nvidia fallisca? A me sembra che si stia mantenendo molto bene perché ha i prodotti migliori sul mercato. Farla fallire significa semplicemente andare poi a usare prodotti di qualità inferiore. Sperare in questa cosa a favore della propria azienda preferita (e non si capisce neanche il motivo per cui debba esserlo) significa essere un fanboy con l'accezione peggiore possibile. Ciò che conta è poter usare sempre gli strumenti migliori che la tecnologia può produrre. SI chiama progredire. A oggi nel campo delle GPU AMD è due passi indietro e non è un vantaggio per nessuno che la concorrenza fallisca e in massa si adotti tecnologia ormai superata.
Siete noiosi e vuoti.
Ma a chi ? Solo a te, perchè con l'avanzare delle velocità di connessioni internet ed i primi servizi streaming era chiaro da tempo che avrebbe fatto una brutta fine.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".