ChipNeMo, l'asso nella manica di NVIDIA per progettare GPU più velocemente

Nel corso di un evento e un'intervista il Chief Scientist di NVIDIA, Bill Dally, ha parlato di ChipNeMo, un LLM che la società sta sperimentando internamente per accorciare i tempi di sviluppo delle sviluppo delle GPU.

di Manolo De Agostini pubblicata il 03 Novembre 2023, alle 10:11 nel canale Schede Video
NVIDIA

NVIDIA ha recentemente svelato una roadmap aggressiva nella progettazione delle sue GPU per datacenter al fine di preservare la sua quota dominante nel settore dell'intelligenza artificiale. E, come in un circolo virtuoso, quelle GPU potrebbero consentirle di progettare GPU sempre migliori mantenendo fede alle tempistiche prefissate.

Già, perché NVIDIA sta usando le proprie GPU per mettere a punto soluzioni di IA e grandi modelli linguistici (LLM) in grado di supportare gli ingegneri nello sviluppo dei chip grafici, facilitandone il lavoro e velocizzandone i compiti.

Non è la prima volta che ne parliamo, seppur da una sfaccettatura diversa, ma il Chief Scientist della società Bill Dally è tornato a illustrarne i vantaggi alla International Conference on Computer-Aided Design, entrando nel dettaglio di cosa fa ChipNeMo, un LLM che accorcia i tempi di sviluppo di una GPU rispetto al passato.

NVIDIA ha allenato il suo LLM NeMo con dati interni affinché aiuti i progettisti in compiti lunghi e laboriosi relativi alla progettazione dei chip, tra cui rispondere a domande generali sul design della GPU, riassumere la documentazione dei bug e scrivere script per il tool EDA.

ChipNeMo ha l'obiettivo di rendere i designer più produttivi. "Se ottenessimo anche solo un paio di punti percentuali di miglioramento nella produttività, ne varrebbe la pena. E i nostri obiettivi sono in realtà fare un po' meglio di così", ha dichiarato Dally intervistato da EETimes.

NVIDIA ha pre-addestrato ChipNeMo utilizzando un singolo set di dati estratto da repository interni di codice e testo, inclusi documenti sulle architetture, documenti di progettazione e codice base. Dopodiché NVIDIA ha confezionato un sottoinsieme di quei dati.

"Il pre-addestramento sui nostri dati di design consente a un modello più piccolo di funzionare come un modello più grande", ha spiegato Dally. "Alla fine, vogliamo eseguirlo su modelli molto grandi. Per il caso sperimentale, stiamo cercando di imparare molto molto rapidamente. Utilizziamo i modelli piccoli perché possiamo addestrarli più rapidamente, ma l'obiettivo è eseguirlo su alcuni dei nostri modelli più grandi e quindi pensiamo che diventerà ancora più utile perché i risultati miglioreranno".

ChipNeMo conta 43 miliardi di parametri e funziona su una singola GPU Nvidia A100 in "pochi secondi", rispondendo alle domande sulla progettazione dei chip, in particolare da parte dei progettisti junior. "Abbiamo visto che i nostri designer senior trascorrono molto tempo a rispondere alle domande dei designer junior", ha affermato Dally. "Se la prima cosa che il progettista junior può fare è andare su ChipNeMo e chiedere: 'Cosa fa questo segnale che esce dall'unità di memoria?' - e se ottiene una possibile risposta che fa risparmiare tempo al progettista senior, realizzare lo strumento ne è valsa la pena".

Per evitare allucinazioni, cioè interpretazioni errate o percezioni distorte che un modello può avere quando elabora determinate informazioni, NVIDIA ha utilizzato una tecnica chiamata retrieval augmented generation (RAG). "Utilizziamo il prompt iniziale per interrogare un database e recuperare una serie di documenti di origine rilevanti per la particolare query", ha affermato Dally. "Possiamo aggiungerlo al prompt e trasmetterlo a ChipNeMo in modo da poter radicare quella risposta a particolari documenti di origine, il che riduce la tendenza alle allucinazioni e rende le cose più spiegabili".

ChipNeMo può anche riassumere i bug già documentati, operazione davvero lunga sia per chi la fa sia per chi deve informarsi sul problema. "Il riepilogo dei bug è probabilmente la cosa più a portata di mano per ottenere produttività", ha affermato Dally. "Quando viene segnalato un bug, le persone inseriscono ogni genere di cose nel [nostro sistema di bug]... lo strumento è abbastanza efficace nel riassumere un bug in un paragrafo conciso e poi dire: ecco chi dovrebbe provare a risolverlo".

ChipNeMo può anche scrivere brevi script (tipicamente circa 20 righe di codice, ha detto Dally) in Tcl, il linguaggio di scripting standard del settore utilizzato per gli strumenti EDA.

ChipNeMo è destinato al solo uso interno e non sarà commercializzato. "ChipNeMo è abbastanza specializzato nel modo in cui NVIDIA fa le cose", ha detto Dally. "Ad esempio, abbiamo un modo particolare di scrivere gli script e tutti gli script visualizzati sono script NVIDIA, ma è quello che vogliamo, è per uso interno".

La tecnologia è ancora da ritenersi un progetto di ricerca, ma è in fase di test per raccogliere feedback dai designer di NVIDIA e sarà probabilmente applicata in futuro a più casi d'uso nella fase di progettazione dei chip. "Ciò che ci limita nella progettazione di chip sono le risorse umane: vogliamo dare ai nostri progettisti dei superpoteri in modo che possiamo progettare chip migliori e più numerosi con gli stessi progettisti, e questo deve applicarsi a tutte le fasi del processo di progettazione".

I migliori sconti su Amazon oggi

TCL 85T8B, TV QLED 85”, 4K Ultra HD, Google TV (Dolby Vision, Audio ONKYO 2.1 con Dolby Atmos, Controllo vocale hands-free, compatibile con Google assistant & Alexa, AirPlay2)

899.90€ Compra ora

-22%

Samsung Galaxy S25 Ultra Smartphone AI, 3 anni di Garanzia del produttore, Display 6.9'' QHD+ Dynamic AMOLED 2X, Fotocamera 200MP, RAM 12GB, 256GB, 5.000 mAh, Titanium Black [Versione italiana]

1499.00 1163.03€ Compra ora

BMW inizia la produzione della iX2. Via al turno notturno per una fabbrica unica nel suo genere

Offerte anticipate Black Friday: 2x1 su Echo Show 5 ed Echo Pop, ma anche di meglio e meno cervellotico

MosfetMan03 Novembre 2023, 10:52 #1

Bravi,Bravi....ma i prezzi? Ci riesci ad abbassarli giacchetta? Almeno per Blackwell.

roccia123403 Novembre 2023, 11:08 #2

Originariamente inviato da: MosfetMan

Bravi,Bravi....ma i prezzi? Ci riesci ad abbassarli giacchetta? Almeno per Blackwell.

Finché continueranno a vendere, vendere e vendere a scatafasci, i prezzi non potranno che rimanere gli attuali o, più realisticamente, aumentare.

Saturn03 Novembre 2023, 12:15 #3

Originariamente inviato da: MosfetMan

Bravi,Bravi....ma i prezzi? Ci riesci ad abbassarli giacchetta? Almeno per Blackwell.

Hanno detto che progetteranno GPU più velocemente non che venderanno a meno prezzo !

supertigrotto03 Novembre 2023, 14:46 #4

E io ho già inserito nel database della IA un po' di SkyNet senza che giacchetto lo sappia.....così il T800 sarà uguale a lui e il T1000 per par condicio ,a Lisa Su.
Con la diffusione monopolistica dell'hardware Nvidia , SkyNet sarà on line al più presto......

Rubberick03 Novembre 2023, 15:03 #5

ma in tutto ciò non sono così aggiornato... amd sta tanto indietro sulle vga ?

Nurabsa04 Novembre 2023, 08:30 #6

prezzi stratosferici per un pcb reference di merda

speriamo che nemo risolva l arcano

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

MSI Prestige 13 AI e i portatili business al Computex

NVIDIA GeForce RTX 5060: le schede video di ogni partner dal Computex

MSI Maestro 9000 al Computex 2025: un case che stupisce

Phanteks al Computex 2025

Corsair al Computex 2025

Fujifilm GFX100RF: la 'compatta' medio formato

Meglio un MacBook o un PC portatile con Windows, oggi? Scenari, dubbi e qualche certezza Passano gli anni, anzi i decenni, ma la domanda puntualmente riemerge fra le mail degli utenti meno esperti, alla ricerca di consigli e mossi dai più svariati motivi....

realme GT7: un "flaghsip killer" concreto! La recensione Abbiamo provato l'ultimo smartphone di realme, il nuovo GT7. Si tratta di un device che si colloca in una fascia di mercato delicata, ovvero quella che possiamo...

Recensione DOOM: The Dark Ages, proiettili e heavy metal nel Medioevo Abbiamo indossato la corazza dello Slayer per tornare nell'universo di DOOM ed esplorare un'ambientazione inedita per l'FPS di id Software. Questa volta veniamo...

DJI Osmo Mobile 7P: ti segue anche con la fotocamera nativa dello smartphone! Grande novità per il nuovo gimbal DJI Osmo Mobile 7P: grazie al modulo multifunzione incluso, dotato di telecamera, ora l'inseguimento del soggetto è possibile anche...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

La rivoluzione dei dati in tempo reale è in arrivo. Un assaggio a Confluent Current 2025 Siamo andati a Londra per partecipare a Current 2025, la conferenza annuale di Confluent. Il tema al centro dell'evento era l'elaborazione dei dati in tempo reale...

Tutto sulla nuova Tesla Model Y: autonomia in autostrada, prova bagagliaio e dettagli Abbiamo guidato per diversi giorni la nuova Tesla Model Y, in versione di lancio dual motor e con batteria long range. Ecco tutto quello che c'è da sapere sull'erede...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss

ChipNeMo, l'asso nella manica di NVIDIA per progettare GPU più velocemente

TCL 85T8B, TV QLED 85”, 4K Ultra HD, Google TV (Dolby Vision, Audio ONKYO 2.1 con Dolby Atmos, Controllo vocale hands-free, compatibile con Google assistant & Alexa, AirPlay2)

Samsung Galaxy S25 Ultra Smartphone AI, 3 anni di Garanzia del produttore, Display 6.9'' QHD+ Dynamic AMOLED 2X, Fotocamera 200MP, RAM 12GB, 256GB, 5.000 mAh, Titanium Black [Versione italiana]

6 Commenti