Nvidia: architettura Ampere cuore delle future GeForce, ma con una configurazione diversa

Nvidia: architettura Ampere cuore delle future GeForce, ma con una configurazione diversa

Il CEO di Nvidia, Jen-Hsun Huang, ha confermato che l'architettura Ampere presentata nelle scorse sarà la base anche delle future schede video GeForce e Quadro. La configurazione delle GPU sarà però diversa dal nuovo GA100 in modo da rispondere alle necessità dei singoli mercati.

di pubblicata il , alle 09:01 nel canale Schede Video
NVIDIAAmpereGeForceQuadro
 

Nvidia ha presentato nelle scorse ore la prima GPU basata su architettura Ampere, il GA100, a bordo dell'acceleratore Nvidia A100. Un chip decisamente fuori dal comune, con ben 54 miliardi di transistor, ma anche molto potenziale inespresso, che fa pensare all'architettura Ampere come un progetto di cui vedremo innumerevoli evoluzioni e che potrebbe anche essere di lungo respiro, seppur a questo riguardo incomba l'ombra di Hopper, vociferato progetto di prossima generazione.

L'unica cosa sicura è che l'architettura Ampere rappresenterà le fondamenta anche delle proposte consumer e professionali, almeno in buona parte. Il CEO di Nvidia Huang ha infatti affermato - come riportato da Marketwatch - che assisteremo "una grande sovrapposizione nell'architettura, ma non nella configurazione". Con queste parole Huang fa intendere che per mettere a punto le GPU Ampere destinate alle prossime RTX Nvidia userà parte dei fondamentali dell'architettura, ma vedremo chip con meno CUDA core e Tensor core, ma al tempo stesso spunteranno le unità RT core per accelerare il ray tracing, assenti su questo GA100. Ci aspettiamo inoltre la conferma dell'interfaccia PCIe 4.0 e l'uso di memoria GDDR6 al posto della HBM2.

Insomma, ci saranno un bel po' di differenze tra questa Nvidia A100 e le schede video gaming, quindi non è semplice ipotizzare le specifiche delle future GPU a bordo delle RTX 3000. Basta prendere le specifiche del TU102 e metterle a confronto con il GA100 per rendersene conto che malgrado elementi in comune, ci saranno importanti differenze.

Il TU102, base della RTX 2080 Ti, nella sua forma completa offre 6 Graphics Processing Cluster (GPC) formati da un Raster Engine e sei Texture Processing Cluster (TPC). Ogni TPC integra un PolyMorph Engine e due Streaming Multiprocessor (SM). All'interno di ogni SM ci sono 64 CUDA core, 8 Tensor core, un RT core e quattro unità texture. Il computo totale è di 72 SM, 4608 CUDA core, 576 Tensor core, 72 RT core, 288 unità texture e 36 PolyMorph engine.

Il GA100 completo ha 8 GPC, al cui interno ci sono 8 TPC che contengono ciascuno 2 SM. Abbiamo quindi 16 SM per TPC, per un totale di 128 SM. Con 64 CUDA core per SM, si arriva quindi a 8192 CUDA core. In ogni SM sono però presenti 4 Tensor core, per un totale di 512 unità. Anche le unità texture dovrebbero essere 512. In tutto questo mancano un sacco di altre unità funzionali al rendering, nonché gli RT core.

Le indiscrezioni dei giorni scorsi indicavano una GPU GA102 completa con 5376 CUDA core che potrebbero essere ottenuti tramite un chip dotato di 7 GPC, con al loro interno 6 TPC. Nel TPC troverebbero spazio 12 SM, di conseguenza si avrebbero 84 SM sull'intera GPU. I Tensor core potrebbero essere perciò 336 o 672 (se saranno 4 o 8 per SM come GA100 o TU102), lo stesso le unità texture, e gli RT core potrebbero essere 84 (ammesso il rapporto di uno per SM). Ovviamente si tratta di mera speculazione, non possiamo escludere sorprese.

GA100, 1280 CUDA core dormienti

Dicevamo che il GA100 ha ancora molto potenziale inespresso, ed è così perché nella sua forma completa si presenta con 128 Streaming Multiprocessor (SM) per un totale di 8192 CUDA core, 512 Tensor core e 48 GB di memoria HBM2, contro una configurazione che a bordo di Nvidia A100 prevede 6912 CUDA core all'interno di 108 SM, affiancati da 432 Tensor core, e 40 GB di memoria HBM2. Nvidia ha quindi altri 20 SM, ossia 1280 CUDA core, da sbloccare in futuro nel caso sia necessaria un'ulteriore iniezione di prestazioni.

L'azienda non ha spiegato il motivo per cui il chip sul nuovo acceleratore non è sfruttato al massimo delle potenzialità, tuttavia si può ipotizzarlo: rese produttive (è un chip da 826 mm2) in primis, ma non si possono escludere altre teorie, come quella del costo dei wafer. A ogni modo, il chip ha il 18,5% CUDA core disattivati e un bandwidth / capacità di memoria strozzati del 20%.

Nvidia ha quindi la possibilità in futuro di sbloccare ulteriormente il chip per rispondere alle "necessità di mercato", che potrebbero essere quello di "difendersi" dalla concorrenza di AMD, Intel e dei vari produttori di ASIC per l'intelligenza artificiale, oppure semplicemente accontentare le necessità di qualche specifico cliente.

Resta aggiornato sulle ultime offerte

Ricevi comodamente via email le segnalazioni della redazione di Hardware Upgrade sui prodotti tecnologici in offerta più interessanti per te

Quando invii il modulo, controlla la tua inbox per confermare l'iscrizione.
Leggi la Privacy Policy per maggiori informazioni sulla gestione dei dati personali

117 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
al13515 Maggio 2020, 10:30 #1
la vedo brutta per amd se non tira fuori velocemente qualcosa.
cmq... 3080ti + oled 120hz, muoviti ad uscire
Gyammy8515 Maggio 2020, 11:01 #2
Originariamente inviato da: al135
la vedo brutta per amd se non tira fuori velocemente qualcosa.
cmq... 3080ti + oled 120hz, muoviti ad uscire


Finora l'unica cosa che si è vista è un chip da 826 mm2(!) da 400w di tdp(!) e 19 tf, sul nodo nuovo, a 1400 mhz
Ora immagino che sulla gaming tolgano roba "inutile" (ma anche no) e che la farciscano di rt cores, alla fine verrà fuori una roba da 770 mm2 (volta è 815 e tu102 754), e probabilmente clockerà più bassa di turing (a meno che non vogliano metterci 500 watt di tdp), sempre sul nodo "nuovo"
Hype a mille, per una cosa che è praticamente un pachiderma peggio di turing, ma sul nodo "nuovo"...
RaZoR9315 Maggio 2020, 11:20 #3
Originariamente inviato da: Gyammy85
Finora l'unica cosa che si è vista è un chip da 826 mm2(!) da 400w di tdp(!) e 19 tf, sul nodo nuovo, a 1400 mhz
Ora immagino che sulla gaming tolgano roba "inutile" (ma anche no) e che la farciscano di rt cores, alla fine verrà fuori una roba da 770 mm2 (volta è 815 e tu102 754), e probabilmente clockerà più bassa di turing (a meno che non vogliano metterci 500 watt di tdp), sempre sul nodo "nuovo"
Hype a mille, per una cosa che è praticamente un pachiderma peggio di turing, ma sul nodo "nuovo"...
Non è un problema se ci sono le performance.
Gyammy8515 Maggio 2020, 11:23 #4
Originariamente inviato da: RaZoR93
Non è un problema se ci sono le performance.


Certo ci mancherebbe, sai com'è, qualche tempo fa si disquisiva sul costo in bolletta della 580 sulla 1060 su questo forum, pagine e pagine
ninja75015 Maggio 2020, 11:29 #5
Originariamente inviato da: Gyammy85
Certo ci mancherebbe, sai com'è, qualche tempo fa si disquisiva sul costo in bolletta della 580 sulla 1060 su questo forum, pagine e pagine


bei tempi

nei conti c'erano tipo 4 o 5 ore di game al giorno, tutti i giorni, festivi compresi

adesso che consumano grossomodo uguale "eh ma c'è il PP diverso"

domani che consumeranno di più "non è un problema se ci sono le perf"
lucusta15 Maggio 2020, 11:41 #6
Originariamente inviato da: RaZoR93
Non è un problema se ci sono le performance.


sarebbe meglio, a questo punto, spendere un po' di tempo per fare una tecnologia driver con un layer che faccia apparire 2 schede grafiche come una sola.
d'altra parte sopra le 2080 Ti hai ancora un NVlink da 100GB/s; perchè non sfruttarla a dovere?

in questo modo raddoppi la potenza ed alla fine non consumerebbe tanto di più.
questa genera 20TF per 400W, ne otteni già oggi da 25 a 30TF con la vecchia ed inefficiente tecnologia SLI per "soli" 560W...
Acme15 Maggio 2020, 13:19 #7
Originariamente inviato da: Gyammy85
Finora l'unica cosa che si è vista è un chip da 826 mm2(!) da 400w di tdp(!) e 19 tf, sul nodo nuovo, a 1400 mhz
Ora immagino che sulla gaming tolgano roba "inutile" (ma anche no) e che la farciscano di rt cores, alla fine verrà fuori una roba da 770 mm2 (volta è 815 e tu102 754), e probabilmente clockerà più bassa di turing (a meno che non vogliano metterci 500 watt di tdp), sempre sul nodo "nuovo"
Hype a mille, per una cosa che è praticamente un pachiderma peggio di turing, ma sul nodo "nuovo"...


Originariamente inviato da: Gyammy85
Certo ci mancherebbe, sai com'è, qualche tempo fa si disquisiva sul costo in bolletta della 580 sulla 1060 su questo forum, pagine e pagine


Originariamente inviato da: ninja750
bei tempi

nei conti c'erano tipo 4 o 5 ore di game al giorno, tutti i giorni, festivi compresi

adesso che consumano grossomodo uguale "eh ma c'è il PP diverso"

domani che consumeranno di più "non è un problema se ci sono le perf"


Originariamente inviato da: lucusta
sarebbe meglio, a questo punto, spendere un po' di tempo per fare una tecnologia driver con un layer che faccia apparire 2 schede grafiche come una sola.
d'altra parte sopra le 2080 Ti hai ancora un NVlink da 100GB/s; perchè non sfruttarla a dovere?

in questo modo raddoppi la potenza ed alla fine non consumerebbe tanto di più.
questa genera 20TF per 400W, ne otteni già oggi da 25 a 30TF con la vecchia ed inefficiente tecnologia SLI per "soli" 560W...


Ma vi rendete conto che la controparte ha 1/5 dei transitor e consuma oltre i 200w con lo stesso nodo.
In quei 400w ci sono nvilink le memorie con un bus spaventoso fp64 40mb l1 e altro, tutte cose che nelle quadro non ci saranno.
I consumi probabilmente resteranno nei 300 w nel segmento consumer come è giusto che sia.

IMHO
Ale55andr015 Maggio 2020, 13:23 #8
Originariamente inviato da: Gyammy85
Certo ci mancherebbe, sai com'è, qualche tempo fa si disquisiva sul costo in bolletta della 580 sulla 1060 su questo forum, pagine e pagine


esattamente, quale parte della parola "perfomance" ti sei perso? Perchè un conto è consumare tanto e andare meno o uguale, un'altro consumare tanto ma andare di più. Ovvio che "per consumare tanto e andare di più" non si intende bere 75w e più extra per andare qualche punto percentuale in più eh, no perchè avere il tdp di una top/quasi top rivale con prestazioni da fascia media è ridicolo...e con un nodo di vantaggio eh (chissà a chi mi riferisco :asd

Comunque mi chiedo ancora perchè ci perdo pure tempo. A ogni modo due domande, ogni tanto, fattele.
ninja75015 Maggio 2020, 14:15 #9
ai tempi si disquisiva tra 1060 e 580 quando la seconda andava poco di più per consumare poco di più, adesso la top amd è 5700xt che (reference) va più o meno come 2070s consumando più o meno uguale, parliamo di due coppie di vga stessa fascia e coetanee tra loro, che siano su due nodi diversi gli occhi degli utenti e i loro alimentatori non lo vedono *

se poi vogliamo parlare della vga in oggetto al topic aspettiamo che esca (?) per vedere prestazioni e consumi con quello che offrirà (se offrirà la controparte in quel periodo

* tralasciando il particolare portafoglio
nickname8815 Maggio 2020, 14:34 #10
Originariamente inviato da: Gyammy85
Certo ci mancherebbe, sai com'è, qualche tempo fa si disquisiva sul costo in bolletta della 580 sulla 1060 su questo forum, pagine e pagine

Capisco che il QI di certi individui sia più basso della media tanto da non essere capaci ci comprendere cosa sia il performance /watt, ma la 580 andava uguale o poco più di una 1060 ma consumando oltre una 1080.
La 590 ancora peggio.

Originariamente inviato da: ninja750
ai tempi si disquisiva tra 1060 e 580 quando la seconda andava poco di più per consumare poco di più
La 580 consumava poco di più di una 1060 ?
Diciamo quasi il doppio

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^