NVIDIA Rubin CPX con 128 GB GDDR7: 30 PetaFLOPS di potenza per l'inferenza a milioni di token

NVIDIA Rubin CPX con 128 GB GDDR7: 30 PetaFLOPS di potenza per l'inferenza a milioni di token

NVIDIA ha presentato Rubin CPX, una nuova GPU ottimizzata per l'elaborazione di contesti AI estesi fino a milioni di token. Con 30 PetaFLOPS, 128 GB di GDDR7 e un'integrazione nella piattaforma Vera Rubin NVL144 CPX da 8 ExaFLOPS, il chip punta a rivoluzionare inferenza, coding avanzato e generazione video su larga scala.

di pubblicata il , alle 11:01 nel canale Server e Workstation
RubinNVIDIA
 

Durante l'AI Infra Summit, NVIDIA ha annunciato Rubin CPX, una nuova GPU progettata appositamente per affrontare i carichi di lavoro legati all'inferenza contestuale massiva. L'acceleratore, parte della futura famiglia Rubin, nasce per supportare modelli capaci di elaborare contesti da centinaia di migliaia fino a milioni di token, con applicazioni che spaziano dall'analisi completa di repository software alla generazione e ricerca di contenuti video di lunga durata.

Rubin CPX adotta un design monolitico - in controtendenza rispetto ai package multi-GPU delle architetture Blackwell – accanto a 128 GB di memoria GDDR7 e prestazioni pari a 30 PetaFLOPS di calcolo NVFP4. L'architettura è ottimizzata per la fase di contesto dell'inferenza, quella più intensiva in termini di calcolo, dove modelli avanzati analizzano enormi quantità di input prima della generazione token per token.

Il chip integra, inoltre, quattro unità NVENC e quattro NVDEC per la codifica e decodifica video, rendendolo particolarmente adatto a flussi di lavoro multimediali senza dipendere da componenti esterni. NVIDIA dichiara prestazioni fino a tre volte superiori rispetto ai sistemi basati su GB300 Blackwell Ultra, con un incremento significativo nella velocità dell'attenzione nei modelli AI.

Vera Rubin CPX sarà affiancabile ai rack NVIDIA Vera Rubin NVL144. Il sistema raggiungerà 8 ExaFLOPS di potenza di calcolo, oltre a 100 TB di memoria ad alta velocità e 1,7 PB/s di banda passante. La connettività sarà garantita da ConnectX-9 SuperNICs e Spectrum-X Ethernet, orchestrati dal framework NVIDIA Dynamo, che ottimizza la gestione dei carichi di inferenza disaggregata.

Secondo NVIDIA, la nuova piattaforma può offrire ritorni fino a 30-50 volte superiori all'investimento, con una proiezione di 5 miliardi di dollari di ricavi ogni 100 milioni investiti, grazie alla monetizzazione delle applicazioni basate su contesti lunghi.

Rubin CPX sarà supportata dall'intero stack software NVIDIA, inclusi CUDA-X, le librerie AI enterprise e i microservizi NIM, oltre al motore di orchestrazione Dynamo. Il chip potrà eseguire i modelli multimodali Nemotron, pensati per agenti AI con capacità di ragionamento avanzato e memoria persistente.

Diverse realtà stanno già esplorando il potenziale della GPU. Cursor mira a incrementare la produttività degli sviluppatori con strumenti di code generation su vasta scala; Runway intende sfruttare Rubin CPX per accelerare la creazione di contenuti video generativi; Magic lavora invece a foundation model per agenti software capaci di comprendere codebase intere da 100 milioni di token.

NVIDIA prevede il debutto della GPU Rubin CPX e della piattaforma Vera Rubin NVL144 CPX verso la fine 2026, dopo il lancio della serie Rubin standard previsto all'inizio dello stesso anno.

10 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
CrapaDiLegno10 Settembre 2025, 11:42 #1
E dai, sono stati bravi, questa volta hanno dato tempo a Lisa Su di pensare a cosa dire durante il keynote di gennaio per non fare brutta figura.
L'ultima volta ha dovuto saltare la presentazione delle GPU per l'imbarazzo dopo aver visto cosa ha mostrato la concorrenza.
Questa volta ha tempo di inventarsi qualche nuovo test in cui la futura MI400X batte l'H200 del 5% in un test appositamente costruito per limitare la potenza computazionale del chip della concorrenza. Ovviamente senza applicare le ottimizzazioni.
Ripper8910 Settembre 2025, 12:12 #2
AMD è appena stata totalmente sconfitta sul piano dell'AI.
Alodesign10 Settembre 2025, 13:48 #3
Su HU al posto di parlare di tecnologia si parla di come smerdare il concorrente.
Saturn10 Settembre 2025, 13:56 #4
Originariamente inviato da: Alodesign
Su HU al posto di parlare di tecnologia si parla di come smerdare il concorrente.


Link ad immagine (click per visualizzarla)



Non hai mica torto !

Però è un argomento che si presta troppo a "tale pratica". Se torni indietro ai tempi delle 3Dfx e della loro vita "post mortem" del marchio....ah....a confronto questi post sono roba da educande...
Alodesign10 Settembre 2025, 14:00 #5
Originariamente inviato da: Saturn
Link ad immagine (click per visualizzarla)



Non hai mica torto !

Però è un argomento che si presta troppo a "tale pratica". Se torni indietro ai tempi delle 3Dfx e della loro vita "post mortem" del marchio....ah....a confronto questi post sono roba da educande...


Mica solo qua. E' pratica comune degli utenti di HU.
Pochi parlano di tecnologia o di esperienza.
supertigrotto10 Settembre 2025, 17:41 #6
Allora,il futuro è la IA in locale,Nvidia sta sviluppando e ha sviluppato Soc anche in collaborazione con Mediatek come ha già fatto AMD nei suoi soc, può essere che AMD sia indietro ma non di molto negli acceleratori per datacenter ma per quanto riguarda l'elaborazione in locale,mi sa che è messa meglio di Nvidia.
Continuate a dare per spacciata AMD ,come ai tempi di bulldozer,sembra che gufare AMD gli porti fortuna,leggevo su questo forum che AMD sarebbe sparita,che doveva andare in fallimento etc ed effettivamente vedo che ormai è un ricordo del passato.
Per ora Nvidia è in vantaggio ma ci sono progetti interessanti che potrebbero rivoluzionare questo settore,qualcuno ha detto memristori?
Anche blockbuster sembrava incrollabile......
CrapaDiLegno11 Settembre 2025, 11:09 #7
Originariamente inviato da: Alodesign
Su HU al posto di parlare di tecnologia si parla di come smerdare il concorrente.


Originariamente inviato da: supertigrotto
Allora,il futuro è la IA in locale,Nvidia sta sviluppando e ha sviluppato Soc anche in collaborazione con Mediatek come ha già fatto AMD nei suoi soc, può essere che AMD sia indietro ma non di molto negli acceleratori per datacenter ma per quanto riguarda l'elaborazione in locale,mi sa che è messa meglio di Nvidia.
Continuate a dare per spacciata AMD ,come ai tempi di bulldozer,sembra che gufare AMD gli porti fortuna,leggevo su questo forum che AMD sarebbe sparita,che doveva andare in fallimento etc ed effettivamente vedo che ormai è un ricordo del passato.
Per ora Nvidia è in vantaggio ma ci sono progetti interessanti che potrebbero rivoluzionare questo settore,qualcuno ha detto memristori?
Anche blockbuster sembrava incrollabile......


Eccoli, quelli che se la prendono a male se si punzecchia AMD e le sue slide con i benchmark fasulli. Se alle parole corrispondessero fatti, allora sarebbe diverso, ma per ora AMD ha solo fatto un sacco di proclami mostrando millantati vantaggi rispetto a Nvidia usando test fatti ad hoc che non usano tutte le tecnologie e disposizione della concorrenza e soprattutto si fermano sempre ad un massimo di 8 GPU, cioè ciò che sta in una sola unità rack, che è il supporto massimo che AMD riesce a garantire prima che le sue prestazioni cadano a picco per la mancanza di interconnessione veloce tra le schede.
Infatti con quei numeri farlocchi fa bella figura verso chi non capisce nulla, cioè investitori e fanboy, mentre chi deve acquistare per lavorarci investendo un sacco di soldi sa cosa sta realmente comprando e sceglie altro.
Per quanto riguarda il fallimento di AMD, sì, era ormai in fallimento prima dell'arrivo di Zen. Fosse andato male anche quell'architettura oggi non avremmo AMD come la conosciamo ora.
Ora AMD naviga benino, ma non è che le trimestrali facciano gridare al miracolo nonostante tutto il market share che ha guadagnato in questi anni. Infatti il titolo è sostenuto più dalle promesse di vendita nel mercato AI che dai fatti reali. Se non dimostra che è in grado di fare soldi in questo mercato tornerà presto dove era partita prima della corsa agli armamenti del mercato AI.

Il mercato edge... scusa puoi elencare i prodotti che AMD propone per questo mercato e che tipo di vantaggi ha rispetto a ciò che propone la concorrenza?

sembra che gufare AMD gli porti fortuna...
Anche blockbuster sembrava incrollabile......

Cioè prima ti lamenti che qualcuno punzecchia le presentazioni farlocche di AMD perché è male gufare, quando non è stato espresso nessun pensiero a riguardo della sua sorte, poi concludi con la speranza o comunque mostri di sperare nella remota idea che il colosso Nvidia fallisca.
Non ho davvero capito chi è il gufo qui. Per quale motivo poi speri che Nvidia fallisca? A me sembra che si stia mantenendo molto bene perché ha i prodotti migliori sul mercato. Farla fallire significa semplicemente andare poi a usare prodotti di qualità inferiore. Sperare in questa cosa a favore della propria azienda preferita (e non si capisce neanche il motivo per cui debba esserlo) significa essere un fanboy con l'accezione peggiore possibile. Ciò che conta è poter usare sempre gli strumenti migliori che la tecnologia può produrre. SI chiama progredire. A oggi nel campo delle GPU AMD è due passi indietro e non è un vantaggio per nessuno che la concorrenza fallisca e in massa si adotti tecnologia ormai superata.
Alodesign11 Settembre 2025, 15:46 #8
Non posso parlare di supertigrotto, ma il mio era un discorso generale.

Siete noiosi e vuoti.
ninja75011 Settembre 2025, 16:26 #9
brava nvidia
Ripper8911 Settembre 2025, 23:42 #10
Originariamente inviato da: supertigrotto
Anche blockbuster sembrava incrollabile......

Ma a chi ? Solo a te, perchè con l'avanzare delle velocità di connessioni internet ed i primi servizi streaming era chiaro da tempo che avrebbe fatto una brutta fine.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^