Raja Koduri: le GPU, per ora, non lasceranno il posto a chip dedicati nel settore dell'intelligenza artificiale
Raja Koduri, un veterano del settore delle schede video, ritiene che i chip dedicati all'IA non potranno sostituire le GPU nel breve termine. Piuttosto, si aspetta che nuove architetture più flessibili arrivino in futuro.
di Vittorio Rienzo pubblicata il 27 Novembre 2023, alle 13:56 nel canale Schede VideoCon l'avvento dell'intelligenza artificiale, sono molte le aziende che investono nello sviluppo di chip dedicati all'addestramento dell'IA. Tuttavia, Raja Koduri, ritiene che le GPU siano ancora un punto di riferimento e, almeno nel breve periodo, non potranno essere sostituite da chip ad hoc.
A dirlo non è certo un ragazzo alle prime armi: Raja Koduri ha sviluppato GPU per alcune tra le più grandi aziende di settore tra cui: AMD, Apple, ATI, S3 Graphics e Intel. Fu proprio lui a presentare al mondo le GPU Arc di Intel, portando un terzo competitor nel settore delle GPU discrete.
We have heard this statement since 2016..but GPUs still rule..why? I'm still learning..but my observations so far
— Raja Koduri (@RajaXg) November 25, 2023
- the "purpose" of purpose built silicon is not stable. AI is not as static as some people imagined and triviliaze.."it's just a bunch of matrix multiplies"
- the…
"Sentiamo questa previsione dal 2016, ma le GPU continuano a dominare" ha scritto Koduri su X (Twitter) in risposta a Bryan Beal, ingegnere di Amazon Web Servicese che sostiene l'esatto contrario. "La ragione? Sto ancora raccogliendo informazioni, ma ecco le mie osservazioni al momento".
"Lo 'scopo' dei chip dedicati non è stabile. L'IA non è statica come credono in molti". In sostanza, secondo l'ingegnere è impensabile che un chip dedicato ad un singolo scopo riesca a soddisfare le esigenze di qualcosa, che al contrario, si evolve costantemente.
Inoltre, secondo Koduri, le GPU hanno un vantaggio attualmente insormontabile: oltre due decadi di evoluzione alle spalle. Nello specifico, le GPU hanno subito un processo di sviluppo e ottimizzazione negli anni utile a supportare gli stack software. Un nuovo chip invece, per quanto dedicato a un singolo scopo, non può contare sullo stesso processo, "il che rende il chip inefficiente e fa ricadere un'enorme responsabilità sugli sviluppatori".

Allo stesso tempo, però, non vi sono molti giovani impegnati nello sviluppo dei software di sistema pronti a integrarsi nel mondo del lavoro secondo Koduri. Questo costringerebbe le aziende a concorrere per il piccolo pool di talenti affermati che "sta invecchiando".
Dichiarazioni che giungono quantomeno curiose, se si considera che attualmente Koduri è un membro del CdA di Tenstorrent, una società che paradossalmente produce proprio chip AI e HPC personalizzati basati su architettura RISC-V.
Tuttavia, ha anche ammesso che secondo la sua esperienza non è da escludere la realizzazione di nuove architetture che riescano a colmare il gap che permane attualmente con le GPU, naturalmente basate sui progressi ottenuti finora con queste ultime.










DLSS 4.5: con Dynamic Frame Generation e MFG 6X NVIDIA alza la posta
Plaud NotePin S, il registratore IA si fa indossabile (ma è facile da perdere)
Redmi Watch 6 in prova: lo smartwatch con ampio display da 2000 nit a meno di 100 euro
WWDC 26: Il Digital Markets Act dell'Unione Europea frena l'arrivo del nuovo Siri AI su iOS 27 e iPadOS 27
WWDC 26: Apple Intelligence rivoluziona Image Playground con immagini fotorealistiche e cloud privato
Siri AI arriva alla WWDC 2026: nuove capacità conversazionali su tutti i dispositivi, visual intelligence, scrittura assistita
Alla WWDC 2026 arriva la nuova architettura per Apple Intelligence: modelli co-sviluppati con Google
Tra schede madri, schede video e IA le novità Sapphire al Computex 2026
Nintendo,multa da 35 milioni di euro in Francia per via dei Joy-Con difettosi
L'amministrazione Trump valuta una partecipazione in OpenAI: l'obiettivo è rafforzare il controllo sull'IA
WWDC 26: Apple rinnova il controllo parentale con Ask to Browse, nuovi limiti di tempo e Screen Time ridisegnato
Apple al WWDC 26 presenta iOS 27: Liquid Glass personalizzabile con slider, AirDrop all'80% più rapido e iCloud condiviso con Android
Xbox, alla fine, dà ragione a PlayStation: si ritorna alle esclusive, solo i live-service multipiattaforma
Minecraft Dungeons 2: Microsoft ha annunciato la data dell'action RPG accessibile a tutti
Synology al Computex 2026: nuova generazione DSM con IA agentica e cloud privato Bee Series
Quobly raccoglie 115 milioni di euro per finanziare lo sviluppo dei computer quantistici
BYD batte sul tempo Tesla Roadster: avvistata la Denza Z, lancio tra poche settimane









6 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoSeconda cosa, e' vero che i chip dedicati hanno meno versatilita' come dice, ma a questo servira' l'intelligenza delle future IA, i CHIP dedicati daranno capacita' di potenza per il "ragionamento" (quando lo faranno), poi al come fare ci penseranno le future IA e quindi bastera' il CHIP a sopperire alla maggioranza di richieste.
Mio punto di vista ovviamente.
Anche pensare costa fatica e la new gen la fatica e il sacrificio è il nemico N1!
Poi ci sono i casi rari,giovani con talento e voglia di fare ma è una nicchia purtroppo.
Faggin passò notti insonni per arrivare a fare quello che ha fatto,adesso non penso che un ragazzetto abbia voglia di percorrere la stessa strada, anzi,la IA è il futuro,così non devono nemmeno far fatica a studiare,ci pensa la IA a fare tutto.
Sono sarcastico.
Comunque sia,quello che dice Raja è il totale opposto di IBM,che dice che sono le GPU ad essere inefficienti,a chi dare la ragione?
Raja dice che per ora le GPU sono l'opzione migliore, non che sono l'opzione più efficiente.
Questo per il vantaggio che hanno in termini di pool consolidato di progettisti e sviluppatori esperti, stack software maturo e costi di progettazione (che possono essere ammmortizzati più facilmente, visto che le GPU sono usate in altre applicazioni oltre all'IA).
Comunque sia,quello che dice Raja è il totale opposto di IBM,che dice che sono le GPU ad essere inefficienti,a chi dare la ragione?
Magari ad entrambi.
Prima o poi arriveranno chip dedicati , ma per adesso le gpu fanno da sovrane visto anche i cinesi che se le prendono a palanche di contrabbando.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".