NVIDIA mette Rubin CPX in un angolo: punta forte su Groq per l'inferenza
NVIDIA ha aggiornato la propria strategia sugli acceleratori per l’intelligenza artificiale alla GTC 2026 con l'introduzione della LPU Groq 3 per migliorare l’inferenza su modelli di grandi dimensioni. L'azienda ha confermato che la già annunciata piattaforma Rubin CPX passa in secondo piano, con l'obiettivo di riproporla con la generazione Feynman.
di Manolo De Agostini pubblicata il 19 Marzo 2026, alle 09:31 nel canale Server e WorkstationGroqRubinNVIDIA
In occasione della GTC 2026, NVIDIA ha delineato nel dettaglio la piattaforma Vera Rubin, e in particolare si è concentrata sulla LPU Groq 3, sviluppata da Groq e ottenuta in licenza dalla società guidata da Jensen Huang. NVIDIA punta sulle LPU (Language Processing Unit) per migliorare l'efficienza dell'inferenza, soprattutto in presenza di modelli di grandi dimensioni e ampie finestre di contesto.
Per questa generazione, NVIDIA ha previsto l'adozione del chip LP30, basato sull'architettura Groq 3, mentre un'evoluzione successiva è già pianificata per la generazione Rubin Ultra. Quest'ultima integrerà il chip LP35, progettato per sfruttare il formato numerico NVFP4, una scelta che evidenzia la crescente attenzione verso l'efficienza computazionale e il contenimento dei consumi nelle applicazioni AI su larga scala.

Durante l'AI Infra Summit, NVIDIA aveva presentato Rubin CPX come un acceleratore dedicato all'inferenza, ma con caratteristiche differenti dalla soluzione di Groq. La soluzione prevedeva una GPU Rubin dotata di interfaccia di memoria GDDR7 e fino a 128 GB di VRAM.
Tuttavia, nel corso dell'evento delle scorse ore, Rubin CPX non è stata menzionata affatto, sollevando interrogativi sul suo futuro. Secondo quanto emerso da discussioni con i rappresentanti NVIDIA, l'azienda ha deciso di ridurre temporaneamente la priorità di questa soluzione, spostando il focus sulle LPU sviluppate con Groq.
Ian Buck, vicepresidente per l'Hyperscale e l'HPC, ha comunque chiarito che Rubin CPX non è stata cancellata. Il progetto dovrebbe riemergere con la futura generazione Feynman, anche se non è ancora chiaro se manterrà la denominazione attuale o verrà integrato in una nuova linea di prodotti.

Guardando avanti, NVIDIA ha già delineato ulteriori sviluppi con la generazione Feynman, che dovrebbe includere un nuovo chip Groq LP40. Questo componente sarà caratterizzato dall'integrazione con NVLink, in modo da offrire un livello superiore di interconnessione tra acceleratori e sistemi.
Nel complesso, la strategia NVIDIA evidenzia una progressiva diversificazione delle architetture dedicate all'AI, con un approccio destinato a combinare GPU tradizionali e acceleratori specializzati per l'inferenza. Una direzione che riflette l'evoluzione dei carichi di lavoro e la necessità di bilanciare prestazioni, efficienza e scalabilità nei datacenter di nuova generazione.










HP Imagine 2026: abbiamo visto HP IQ all’opera, ecco cosa può (e non può) fare
PNY RTX 5080 Slim OC, sembra una Founders Edition ma non lo è
Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei
Il dodicesimo lancio del razzo spaziale SpaceX Starship è atteso per aprile, Super Heavy Booster 19 ha completato nuovi test
Blue Origin sta assemblando il secondo lander lunare Blue Moon MK1
Meta moltiplica gli investimenti in data center IA: le nuove cifre previste dal bilancio sono folli
Addio riflessi fastidiosi? Samsung presenta una nuova pellicola per i display OLED
PlayStation 5, doccia fredda da Sony: i prezzi aumentano ancora fino a 899 euro
Super Meat Boy 3D: annunciata la data d'uscita su PC e Xbox Series X/S, manca davvero poco
XT View Matrix, il mid-tower Phanteks che punta su estetica e funzionalità moderne
David Sacks lascia il ruolo di 'Crypto Czar' alla Casa Bianca mentre le riforme su Bitcoin e stablecoin restano ancora incomplete
LG All Stars 2026: quando l'installatore diventa il vero protagonista della transizione
Addio ad Anna's Archive? Ecco la mossa legale di Spotify che potrebbe chiudere il sito
Addio al Mac Pro, Apple mette fine a un progetto che non è mai decollato
Panasonic a MCE 2026: la rivoluzione silenziosa (e green) passa per i refrigeranti naturali
Netflix alza la posta: il piano Premium verso quota 25 dollari, l'Europa trema
Nimbus Innovation Awards – Cloud Edition 2026: ecco tutti i vincitori









0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".