HGX H20, L20 e L2: la risposta di NVIDIA alle nuove restrizioni USA contro la Cina?

HGX H20, L20 e L2: la risposta di NVIDIA alle nuove restrizioni USA contro la Cina?

NVIDIA avrebbe messo a punto tre soluzioni chiamate HGX H20, L20 e L2 per aggirare le nuove restrizioni USA nel commercio tecnologico verso la Cina.

di pubblicata il , alle 09:51 nel canale Mercato
NVIDIA
 

Le sempre più stringenti restrizioni commerciali statunitensi stanno complicando non poco la vita a NVIDIA e alle altre società che operano nel campo dell'IA nel fare affari con la Cina.

Se la prima ondata di limitazioni ha imposto a NVIDIA di creare A800 e H800 per aggirare il blocco alla commercializzazione di soluzioni A100 e H100, andando a limitare la velocità dell'interconnessione NVLink, i nuovi parametri introdotti mettono fuorigioco anche quelle soluzioni. Si parla infatti di vincoli come la potenza di calcolo per area del chip.

Per questo motivo NVIDIA sta lavorando rapidamente per trovare una soluzione e la sua risposta, stando alle indiscrezioni, sembra si basi su tre proposte chiamate HGX H20, L20 e L2. Laddove il primo acceleratore dovrebbe essere basato su una versione migliorata dell'architettura Hopper, L20 e L2 si baserebbero sull'architettura Ada Lovelace usata sulle GPU GeForce RTX 4000.

Stando alle indiscrezioni, H20 potrebbe essere più veloce di un H100 in alcune aree in quanto conterrebbe già innovazioni che NVIDIA introdurrà su larga scala solo nella prossima generazione attesa il prossimo anno, e che consentiranno all'H20 di lavorare oltre il 20% più velocemente nelle attività di inferenza LLM rispetto ad H100.

L'annuncio di queste soluzioni per la Cina dovrebbe avvenire il 16 novembre, quando le restrizioni entreranno in vigore e NVIDIA aprirà la possibilità di fare ordini.

3 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Saturn10 Novembre 2023, 10:26 #1
Fa bene nVidia.

Loro vendono (e guadagnano), non giocano a Risiko !
dav1deser10 Novembre 2023, 10:58 #2
Fossi in Nvidia, farei delle schede pesantemente downcloccate per stare all'interno delle restrizioni, poi, per errore, metterei nei driver di queste schede uno slider che permette di portarle alle frequenze dei modelli venduti nel resto del mondo. O magari potrebbe leakare misteriosamente in Cina un BIOS che sblocca le frequenze, o qualche escamotage simile.
joe4th11 Novembre 2023, 10:13 #3
Comunque a occhio sembrerebbe una H100 ben depotenziata:

H100: FP64 -> 26 TFLOPS, H20: FP64: 1 TFLOPS
H100: FP32 -> 51 TFLOPS, H20: FP32: 44 TFLOPS
H100: INT8 -> 3000 TOPS, H20: INT8: 296 TOPS
...

L'unica differenza è che hanno 96GB di RAM contro gli 80 tipici delle A100/H100.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^