NVIDIA H100 NVL è l'acceleratore pensato esclusivamente per ChatGPT

Alla GTC 2023 NVIDIA ha annunciato H100 NVL, una variante di H100 che unisce due schede ed è progettata specificamente per uno scopo, potenziare i modelli di linguaggio AI come ChatGPT.

di Manolo De Agostini pubblicata il 22 Marzo 2023, alle 08:01 nel canale Schede Video
ChatGPT NVIDIA Hopper

Qualcuno si è azzardato a chiamarla dual GPU, ma ci troviamo davanti a due schede separate collegate tra loro tramite tre collegamenti NVLink. Stiamo parlando di H100 NVL (NVL sta per NVLink), una nuova soluzione presentata da NVIDIA alla GTC 2023 destinata alla gestione di grandi modelli linguistici come ChatGPT.

In base a quanto diffuso dalla società, H100 NVL (H100 NVLink) prevede connettori NVLink nella parte superiore che consentono di collegare due schede adiacenti, inserite però in slot PCI Express 5.0 separati.

H100 NVL è dotata di un chip identico nelle caratteristiche alla versione H100 SXM5, ma troviamo 94 GB di memoria HBM3 per GPU al posto di 80 GB, per un totale di 188 GB. In virtù della maggiore memoria, il bus sale a 6144 bit (1024 bit per ogni stack HBM3) per una bandwidth di 7,8 GB/s.

Sebbene le due schede operino in tandem, parlare di dual GPU appare un attimo forzato: non ci sono due GPU sullo stesso PCB né il progetto ricorda la GeForce 7950 GX2, la scheda gaming a "panino" con due GPU e altrettanti PCB ma un singolo connettore PCIe.

NVIDIA afferma che diverse H100 NVL possono essere usate in parallelo nei server, tanto che i partner stanno mettendo a punto sistemi capaci di ospitare da due a quattro coppie. Ogni H100 NVL viene vista dal sistema operativo come due GPU, ma il carico viene distribuito automaticamente tra i chip senza richiedere modifiche o intervento umano.

Oltre alla H100 NVL, NVIDIA ha presentato NVIDIA L4, una proposta basata su architettura Ada Lovelace che prende il posto della T4 basata sul progetto Turing. Anche in questo caso, la scheda è destinata alla decodifica e transcodifica di flussi video e audio nel cloud (qui ulteriori dettagli).

Google Cloud prevede di usarla in nuove macchine virtuali di classe G2 per accelerare soluzioni basate sull'intelligenza artificiale come Descript. Nella gestione di calcoli di intelligenza artificiale nei video, la nuova NVIDIA L4 raggiunge prestazioni 120 volte superiori e un'efficienza migliore del 99% rispetto a un sistema basato su CPU. La scheda può anche essere usata per decodificare fino a 1.040 flussi video in parallelo. NVIDIA L4 è disponibile in un fattore di forma a basso profilo ed è alimentata solamente tramite lo slot PCIe.

Infine, NVIDIA ha creato anche NVIDIA L40 per la generazione di immagini (maggiori informazioni qui). "È ottimizzata per grafica e generazione di immagini 3D, 2D e video con l'IA. La piattaforma L40 serve come motore di NVIDIA Omniverse e offre prestazioni fino a 7 volte maggiori nell'inferenza per Stable Diffusion e 12 volte le prestazioni per Omniverse rispetto alla generazione precedente".

I migliori sconti su Amazon oggi

-29%

Apple AirPods Pro 2 Auricolari wireless, Auricolari Bluetooth, Cancellazione attiva del rumore, Funzione Apparecchio acustico, Trasparenza, Audio spaziale personalizzato, Alta fedeltà, Ricarica USB-C

279.00 198.99€ Compra ora

-46%

LG OLED evo 55'', Serie G4 2024, OLED55G45LW, Smart TV 4K, Design One Wall, Processore

2399.00 1298.00€ Compra ora

-17%

Amazfit Bip 5 Smartwatch, 46 mm, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

89.90 74.44€ Compra ora

Tablet imbattibile nel prezzo: Blackview Tab 7 Pro con display 10" Full HD, 10GB+128GB, Android 12, LTE dual SIM costa solo 139€!

HONOR annuncia HONOR 70 Lite ad un prezzo incredibile di 269,90€. Eccolo

igiolo22 Marzo 2023, 08:46 #1

"Oltre alla H100 NVL, NVIDIA ha presentato NVIDIA L4, una proposta basata su architettura Ada Lovelace che prende il posto della T4 basata sul progetto Turing."

mi pare prenda piuttosto il posto delle A40 o sbaglio?

Gyammy8522 Marzo 2023, 09:25 #2

Stiamo quindi tornando agli anni 70?

"IBM voglio un robo che fa 20000"

"IBM presenta robo 7000, il robo che fa 20000"

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

MSI Prestige 13 AI e i portatili business al Computex

NVIDIA GeForce RTX 5060: le schede video di ogni partner dal Computex

MSI Maestro 9000 al Computex 2025: un case che stupisce

Phanteks al Computex 2025

Corsair al Computex 2025

Fujifilm GFX100RF: la 'compatta' medio formato

Meglio un MacBook o un PC portatile con Windows, oggi? Scenari, dubbi e qualche certezza Passano gli anni, anzi i decenni, ma la domanda puntualmente riemerge fra le mail degli utenti meno esperti, alla ricerca di consigli e mossi dai più svariati motivi....

realme GT7: un "flaghsip killer" concreto! La recensione Abbiamo provato l'ultimo smartphone di realme, il nuovo GT7. Si tratta di un device che si colloca in una fascia di mercato delicata, ovvero quella che possiamo...

Recensione DOOM: The Dark Ages, proiettili e heavy metal nel Medioevo Abbiamo indossato la corazza dello Slayer per tornare nell'universo di DOOM ed esplorare un'ambientazione inedita per l'FPS di id Software. Questa volta veniamo...

DJI Osmo Mobile 7P: ti segue anche con la fotocamera nativa dello smartphone! Grande novità per il nuovo gimbal DJI Osmo Mobile 7P: grazie al modulo multifunzione incluso, dotato di telecamera, ora l'inseguimento del soggetto è possibile anche...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

La rivoluzione dei dati in tempo reale è in arrivo. Un assaggio a Confluent Current 2025 Siamo andati a Londra per partecipare a Current 2025, la conferenza annuale di Confluent. Il tema al centro dell'evento era l'elaborazione dei dati in tempo reale...

Tutto sulla nuova Tesla Model Y: autonomia in autostrada, prova bagagliaio e dettagli Abbiamo guidato per diversi giorni la nuova Tesla Model Y, in versione di lancio dual motor e con batteria long range. Ecco tutto quello che c'è da sapere sull'erede...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss

NVIDIA H100 NVL è l'acceleratore pensato esclusivamente per ChatGPT

Apple AirPods Pro 2 Auricolari wireless, Auricolari Bluetooth, Cancellazione attiva del rumore, Funzione Apparecchio acustico, Trasparenza, Audio spaziale personalizzato, Alta fedeltà, Ricarica USB-C

LG OLED evo 55'', Serie G4 2024, OLED55G45LW, Smart TV 4K, Design One Wall, Processore

Amazfit Bip 5 Smartwatch, 46 mm, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

2 Commenti