La Legge di Huang ha preso il posto della Legge di Moore secondo NVIDIA
NVIDIA ha parlato di quella che ha definito "Legge di Huang": nell'ultimo decennio le prestazioni nell'intelligenza artificiale delle GPU NVIDIA sono cresciute di 1000 volte, di cui solo una piccola parte si deve ai dettami della Legge di Moore.
di Manolo De Agostini pubblicata il 02 Ottobre 2023, alle 09:21 nel canale ProcessoriNVIDIA
Da anni si dibatte della validità della Legge di Moore (secondo cui il numero di transistor nei chip raddoppia ogni 1,5-2 anni), tra chi la giudica moribonda, morta o in piena salute a fronte di una miniaturizzazione dei transistor che sta incontrando sempre più ostacoli. In qualunque modo la si veda, il mondo dell'informatica e della progettazione di chip è al principio di una stagione di forti cambiamenti (pensate alla progettazione "disaggregata", basata su chiplet) e forse inquadrarlo con i modelli del passato è semplicemente sbagliato.
Il Chief Scientist di NVIDIA, Bill Dally, ha provato a descrivere il cambiamento epocale che sta vivendo il settore durante un recente keynote. Un discorso che sul blog di NVIDIA è stato ribattezzato "Legge di Huang", rifacendosi non solo al cofondatore e CEO della società, ma anche a un appellativo coniato da IEEE Spectrum nel 2018 e poi fatto proprio dal Wall Street Journal.

Secondo Dally, "ogni nuovo processore richiede ingegnosità e impegno per inventare e convalidare ingredienti freschi": parole che non vogliono dire altro che è la progettazione (non solo dell'hardware, ma anche di ciò che lo guida) a portare allo sviluppo di chip sempre più innovativi e potenti, diversamente da quanto avvenuto in passato, quando gli ingegneri si affidavano essenzialmente alla miniaturizzazione.
Dally è al comando di un team di oltre 300 persone all'interno di NVIDIA Research che in 10 anni è riuscito a migliorare di 1000 volte le prestazioni di una singola GPU nell'inferenza dell'intelligenza artificiale. Si tratta di un progresso in risposta all'altrettanto fenomenale boom dei grandi modelli linguistici usati per l'intelligenza artificiale generativa. Secondo Dally è stato proprio il nuovo mercato a scandire il ritmo di sviluppo dell'hardware perché "riteniamo di dover soddisfare questa domanda".
Dally ha elencato alcuni degli elementi che hanno portato al progresso prestazionale di 1000 volte. Il più grande di tutti, stimato in 16 volte, si lega alla scoperta di modi più semplici per rappresentare i numeri utilizzati dai computer per svolgere i loro calcoli.
L'architettura Hopper con il suo Transformer Engine usa un mix dinamico di calcoli in virgola mobile e interi a 8 e 16 bit, in modo da adattarsi alle esigenze degli odierni modelli di IA generativa. Nel suo discorso Dally ha illustrato sia i miglioramenti prestazionali che i risparmi energetici offerti dal nuovo modo di svolgere calcoli.
A questo si affianca il lavoro del suo team, che è riuscito a ottenere un miglioramento di 12,5 volte creando istruzioni avanzate che dicono alla GPU come organizzare il lavoro. Questi comandi complessi aiutano a eseguire più lavoro con meno energia. Di conseguenza, i computer possono essere "efficienti quanto gli acceleratori dedicati, ma mantenere tutta la programmabilità delle GPU", ha dichiarato.

L'aggiunta della "Structural Sparsity", a partire dall'architettura Ampere, permette di non compromettere la precisione del modello IA andando parallelamente ad accelerare i carichi di lavoro di inferenza. La tecnica, secondo Dally, ha portato un ulteriore aumento delle prestazioni di 2 volte e promette ulteriori progressi in futuro.
Nel frattempo NVIDIA è passata, nel corso degli ultimi 10 anni, dalla produzione a 28 nanometri a quella 5 nanometri, ma Dally ha spiegato che il boost ottenuto da questo miglioramento è pari solo a 2,5 volte il totale.
Il Chief Scientist di NVIDIA ritiene che la Legge di Huang continuerà a offrire grandi incrementi prestazionali nonostante i minori vantaggi derivanti dalla Legge di Moore.
Ad esempio, Dally vede diverse opportunità per semplificare ulteriormente il modo in cui i numeri vengono rappresentati, creando una maggiore sparsità nei modelli di intelligenza artificiale e progettando migliori circuiti di memoria e comunicazione. Poiché ogni nuova generazione di chip e sistemi richiede nuove innovazioni, "è un momento divertente per essere un ingegnere informatico", ha concluso lo scienziato.











HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata
Motorola edge 70: lo smartphone ultrasottile che non rinuncia a batteria e concretezza
Il telescopio spaziale James Webb ha catturato un'immagine del buco nero al centro della Galassia del Compasso
Il razzo spaziale europeo Ariane 6 lancerà i primi satelliti Amazon Leo il 12 febbraio
Il lander lunare Blue Origin Blue Moon MK1 ha superato la prova da 138 dB, ora si passerà ad altri test
Gli LLM riescono a risolvere problemi matematici complessi: cosa significa e perché è importante
Smettila con quei cioccolatini. Per San Valentino regala un mouse di Steelseries
Il secondo lancio del razzo spaziale europeo Spectrum di Isar Aerospace potrebbe avvenire il 21 gennaio
MaiaSpace ed Eutelsat stringono un accordo per lanciare satelliti OneWeb a partire dal 2027
Motorola edge 60 neo sorprende: compatto, costa il giusto e la batteria dura tantissimo
Zeekr 007 e 007GT si aggiornano: piattaforma a 900 volt e nuovo chip NVIDIA Thor-U da 700 TOPS
ASUS ROG Swift OLED PG27AQWP-W: 720 Hz e 0,02 ms bastano per il gaming competitivo?
È super il prezzo del robot rasaerba Bosch Indego S+ 500: ora è al minimo storico su Amazon
MediaTek aggiorna la gamma di Dimensity: tra le novità c'è il 9500s a 3 nm
Foto intime sottratte dai telefoni in riparazione e finite su Telegram: a Rovigo nuovo caso dopo 'Mia Moglie'
In Cina approvate nuove regole per il riciclaggio delle batterie per auto elettriche









21 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoche marchetta ragazzi
na roba tipo l'ego di huang cresce in maniera direttamente proporzionale al costo delle schede?
Ma poi 1000 volte rispetto a 10 anni fa? Ma dove? Le prestazioni non mi sembrano migliorate di 1000 volte…
Sta cosa dell’ IA é l’ennesima bolla speculativa che segue quella del metaverso/nft e tra qualche anno farà la stessa identica fine…
Nel frattempo AMD sta raddoppiando i frame per tutti con FSR3, anche per le schede di 5 anni fa…
Ma poi 1000 volte rispetto a 10 anni fa? Ma dove? Le prestazioni non mi sembrano migliorate di 1000 volte…
Sta cosa dell’ IA é l’ennesima bolla speculativa che segue quella del metaverso/nft e tra qualche anno farà la stessa identica fine…
Nel frattempo AMD sta raddoppiando i frame per tutti con FSR3, anche per le schede di 5 anni fa…
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".