NVIDIA, nel futuro c'è la GPU Feynman con die stacking e HBM custom, ma anche la CPU Rosa

NVIDIA, nel futuro c'è la GPU Feynman con die stacking e HBM custom, ma anche la CPU Rosa

NVIDIA ha aggiornato la roadmap AI: dopo Rubin Ultra assisteremo al debutto di Feynman, con architettura die stacking e una nuova HBM personalizzata. Accanto alla nuova avanzatissima GPU ci sarà anche una CPU, Rosa, insieme a tante altre innovazioni.

di pubblicata il , alle 10:51 nel canale Server e Workstation
NVIDIARosaFeynman
 

Nel corso della GTC 2026, NVIDIA ha fatto nuovamente il punto sulla propria roadmap tecnologica nell'ambito dei datacenter per l'intelligenza artificiale. Dopo Blackwell, attualmente in piena produzione insieme alla variante Ultra, il prossimo step sarà rappresentato da Rubin, GPU attesa verso la fine del 2026. Questa generazione introdurrà un design con due GPU per package e memoria HBM4 (288 GB) e sarà accompagnata dalla CPU Vera, DPU BlueField-4 e interconnessioni NVLink 6 e ConnectX-8.

Il vero salto dimensionale arriverà però con Rubin Ultra. NVIDIA prevede di raddoppiare il numero di die per package, passando da due a quattro GPU integrate nello stesso modulo. Questo approccio le consentirà di raggiungere configurazioni con fino a 1 TB di memoria HBM4e per package e una potenza dichiarata nell'ordine dei 100 PFLOPS (FP4).

Contestualmente debutterà anche una nuova generazione di LPU sviluppata con Groq, denominata LP35, con supporto al formato NVFP4 oltre all'FP8. Sul fronte networking, Rubin Ultra porterà NVLink 7 e ConnectX-9.

Clicca per ingrandire

Un aspetto centrale della roadmap riguarda l'evoluzione del concetto di scaling. L'attuale architettura di riferimento, denominata Oberon, utilizza una dorsale in rame per collegare GPU e switch NVLink all'interno del rack, supportando configurazioni fino a NVL72 (72 GPU package).

Con l'introduzione di collegamenti ottici, NVIDIA punta a superare i limiti fisici del rame. I prototipi mostrati indicano la possibilità di aggregare fino a 576 GPU (NVL576) in un unico dominio logico, anche distribuendo le GPU su più rack. Questa transizione sarà inizialmente sperimentata proprio su Oberon, che fungerà da piattaforma di validazione per le interconnessioni ottiche.

Parallelamente, NVIDIA introdurrà una nuova architettura rack denominata Kyber (nota anche come evoluzione del concetto CPX), che affiancherà e non sostituirà completamente Oberon. Kyber prevede un layout interno radicalmente differente con blade disposti verticalmente, come in una libreria, switch NVLink separati e collegati tramite una midplane. Inoltre, la connessione avverrà attraverso un PCB centrale anziché cablaggi posteriori.

Questo design consentirà una maggiore densità, arrivando a configurazioni NVL144, ovvero 144 GPU package (fino a 576 die nel caso di Rubin Ultra). In una fase iniziale, Kyber utilizzerà ancora connessioni in rame per lo scale-up interno, mentre l'ottica sarà introdotta in una fase successiva.

Il 2028 segnerà l'arrivo dell'architettura Feynman, che introdurrà cambiamenti più radicali. Tra questi spicca il passaggio al GPU die stacking, ovvero l'impilamento verticale dei chip, superando l'approccio affiancato utilizzato fino a Rubin Ultra. I dettagli implementativi non sono ancora stati resi noti, ma è evidente che questa scelta implicherà nuove sfide in termini di packaging, dissipazione e alimentazione.

Feynman segnerà inoltre il passaggio a una memoria "Custom HBM", evoluzione delle attuali HBM4 e HBM4E, e sarà accompagnata da una nuova generazione di acceleratori Groq (LP40) con interconnessione NVLink.

Tra le novità figura anche una nuova CPU, denominata Rosa, il cui nome è ispirato a Rosalyn Sussman Yalow, biofisica statunitense, premio Nobel per la medicina nel 1977. Questa soluzione prenderà il posto della Vera all'interno della piattaforma Feynman e dovrebbe continuare a basarsi su core ARM custom con supporto SMT, anche se NVIDIA non ha ancora fornito dettagli tecnici.

Dal punto di vista infrastrutturale, NVIDIA manterrà la compatibilità con l'architettura Oberon anche per le generazioni future, consentendo aggiornamenti incrementali. Tuttavia, alcune funzionalità avanzate, come lo scale-up ottico, saranno progressivamente riservate ai sistemi Kyber più evoluti, che potranno arrivare fino a configurazioni NVL1152 (1152 GPU in un unico dominio).

Nel complesso, la roadmap aggiornata evidenzia come NVIDIA stia spostando sempre più il focus dal singolo acceleratore al sistema completo: packaging multi-die, memoria ad altissima capacità, interconnessioni avanzate e nuovi form factor rack sono tutti elementi che contribuiranno alla realizzazione di piattaforme AI sempre più integrate e scalabili.

2 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
supertigrotto17 Marzo 2026, 11:38 #1
Eh niente,Nvidia è la nuova Nokia o Nintendo, all' inizio facevano carte,una igienica, l'altra da gioco ma poi sono divenuti un impero.
Mi sa che,buona pace per i fanboy,Nvidia un giorno smetterà di produrre schede video,non le conviene.
AtaruGolan17 Marzo 2026, 14:26 #2
Originariamente inviato da: supertigrotto
Eh niente,Nvidia è la nuova Nokia o Nintendo, all' inizio facevano carte,una igienica, l'altra da gioco ma poi sono divenuti un impero.
Mi sa che,buona pace per i fanboy,Nvidia un giorno smetterà di produrre schede video,non le conviene.


Prima o poi crollano tutti, che sia per propria mano o altre mani, il problema sta sempre, quanti primi verranno distrutti?

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^