NVIDIA mette Rubin CPX in un angolo: punta forte su Groq per l'inferenza

NVIDIA mette Rubin CPX in un angolo: punta forte su Groq per l'inferenza

NVIDIA ha aggiornato la propria strategia sugli acceleratori per l’intelligenza artificiale alla GTC 2026 con l'introduzione della LPU Groq 3 per migliorare l’inferenza su modelli di grandi dimensioni. L'azienda ha confermato che la già annunciata piattaforma Rubin CPX passa in secondo piano, con l'obiettivo di riproporla con la generazione Feynman.

di pubblicata il , alle 09:31 nel canale Server e Workstation
GroqRubinNVIDIA
 

In occasione della GTC 2026, NVIDIA ha delineato nel dettaglio la piattaforma Vera Rubin, e in particolare si è concentrata sulla LPU Groq 3, sviluppata da Groq e ottenuta in licenza dalla società guidata da Jensen Huang. NVIDIA punta sulle LPU (Language Processing Unit) per migliorare l'efficienza dell'inferenza, soprattutto in presenza di modelli di grandi dimensioni e ampie finestre di contesto.

Per questa generazione, NVIDIA ha previsto l'adozione del chip LP30, basato sull'architettura Groq 3, mentre un'evoluzione successiva è già pianificata per la generazione Rubin Ultra. Quest'ultima integrerà il chip LP35, progettato per sfruttare il formato numerico NVFP4, una scelta che evidenzia la crescente attenzione verso l'efficienza computazionale e il contenimento dei consumi nelle applicazioni AI su larga scala.

Durante l'AI Infra Summit, NVIDIA aveva presentato Rubin CPX come un acceleratore dedicato all'inferenza, ma con caratteristiche differenti dalla soluzione di Groq. La soluzione prevedeva una GPU Rubin dotata di interfaccia di memoria GDDR7 e fino a 128 GB di VRAM.

Tuttavia, nel corso dell'evento delle scorse ore, Rubin CPX non è stata menzionata affatto, sollevando interrogativi sul suo futuro. Secondo quanto emerso da discussioni con i rappresentanti NVIDIA, l'azienda ha deciso di ridurre temporaneamente la priorità di questa soluzione, spostando il focus sulle LPU sviluppate con Groq.

Ian Buck, vicepresidente per l'Hyperscale e l'HPC, ha comunque chiarito che Rubin CPX non è stata cancellata. Il progetto dovrebbe riemergere con la futura generazione Feynman, anche se non è ancora chiaro se manterrà la denominazione attuale o verrà integrato in una nuova linea di prodotti.

Guardando avanti, NVIDIA ha già delineato ulteriori sviluppi con la generazione Feynman, che dovrebbe includere un nuovo chip Groq LP40. Questo componente sarà caratterizzato dall'integrazione con NVLink, in modo da offrire un livello superiore di interconnessione tra acceleratori e sistemi.

Nel complesso, la strategia NVIDIA evidenzia una progressiva diversificazione delle architetture dedicate all'AI, con un approccio destinato a combinare GPU tradizionali e acceleratori specializzati per l'inferenza. Una direzione che riflette l'evoluzione dei carichi di lavoro e la necessità di bilanciare prestazioni, efficienza e scalabilità nei datacenter di nuova generazione.

0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^