AD102, AD103 e AD104: transistor, numero di core e altro sulle GPU delle prime GeForce RTX 4000
Volete sapere quanti transistor e quanti core ci sono nelle GPU alla base delle GeForce RTX 4090 e 4080? Finalmente lo sappiamo e possiamo svelarvi le principali caratteristiche di AD102, AD103 e AD104, i chip di NVIDIA basati su architettura Ada Lovelace.
di Manolo De Agostini pubblicata il 23 Settembre 2022, alle 11:01 nel canale Schede Videoschede video top di gammaGeForceNVIDIALovelace
NVIDIA ha reso noto fin da subito che le prime tre schede video dell'era GeForce RTX 4000 sono basate su tre distinte GPU: AD102 per quanto riguarda la RTX 4090, AD103 nel caso della RTX 4080 16 GB e AD104 in quello della RTX 4080 12 GB.
La società non aveva però condiviso molti dettagli tecnici, soprattutto per quanto concerne AD103 e AD104, lasciandoci con un quadro tecnico poco definito. Ora, grazie alla condivisione di un whitepaper, abbiamo una visione completa delle caratteristiche delle GPU e della loro implementazione nelle nuove schede. Andiamo con ordine.
La GPU AD102 è il cuore della GeForce RTX 4090 e, come abbiamo appreso già nelle scorse ore, si tratta di un chip da 76,3 miliardi di transistor stipati in un'area di 608,5 mm2. La GPU ha 144 Streaming Multiprocessor, 18432 CUDA core, 144 RT core e 576 Tensor core. A bordo anche 192 ROPs e ben 98 MB di cache L2. L'interfaccia di memoria è a 192 bit.
La GeForce RTX 4090 non implementa però la GPU in forma completa, come abbiamo avuto modo di spiegare in una notizia in cui ipotizzavamo il futuro arrivo di una 4090 Ti. La RTX 4090 prevede 16384 CUDA core attivi per effetto di 128 SM funzionanti, 128 RT core e 512 Tensor core. Il dato delle ROPs è pari a 176 unità, mentre il bus rimane a 384 bit. La cache L2 scende a 73,7 MB.
La GPU AD103 integra invece 45,9 miliardi di transistor in un'area di 378,6 mm2. Il chip mette a disposizione 80 Streaming Multi processor per un totale di 10240 CUDA core, 80 RT core e 320 Tensor core. Il chip prevede 112 ROPs e offre 65,5 MB di cache L2. L'interfaccia di memoria è a 256 bit.
A bordo della GeForce RTX 4080 16 GB non c'è un AD103 totalmente attivo, infatti il numero degli SM scende a 76 portando alle seguenti specifiche: 9728 CUDA core, 76 RT core e 304 Tensor core. Le ROPs sono presenti in un numero pari a 112 e la cache L2 rimane invariata.
Infine, arriviamo ad AD104, GPU che stando a quanto apprendiamo è nella GeForce RTX 4080 12 GB nella sua forma completa. Il chip ha un'area di 294,5 mm2 e integra 35,8 miliardi di transistor. A bordo ci sono 60 SM per 7680 CUDA core, 60 RT core e 240 Tensor core. La cache L2 è pari a 65,5 MB, mentre le ROPs sono 80. L'interfaccia di memoria è a 192 bit. Ricapitoliamo nella seguente tabella le specifiche delle GPU Ada Lovelace, insieme al GA102 per riferimento:
AD102 | AD103 | AD104 | GA102 | |
Architettura | Ada Lovelace | Ada Lovelace | Ada Lovelace | Ampere |
Processo produttivo | TSMC 4N | TSMC 4N | TSMC 4N | Samsung 8N |
Transistor | 76,3 miliardi | 45,9 miliardi | 35,8 miliardi | 28,3 miliardi |
Dimensione die | 608,5 mm² | 378,6 mm² | 294,5 mm² | 628,4 mm² |
Streaming Multiprocessor | 144 | 80 | 60 | 84 |
CUDA Core | 18432 | 10240 | 7680 | 10752 |
Tensor Core | 576 | 320 | 240 | 336 |
RT Core | 144 | 80 | 60 | 84 |
ROPs | 192 | 112 | 80 | 112 |
Cache L2 | 98,3 MB | 65,5 MB | 49,1 MB | 6,1 MB |
Bus | 384 bit | 256 bit | 192 bit | 384 bit |
Mettendo da parte il numero dei core, è evidente che NVIDIA ha deciso di seguire AMD in merito all'ampliamento della cache all'interno dei chip. AMD con RDNA 2 ha implementato una Infinity Cache fino a 128 MB, una memoria che le ha permesso di mantenere un'interfaccia di memoria ridotta ma garantire comunque una bandwidth complessiva elevata.
NVIDIA fa la stessa cosa con Ada Lovelace, anche se in modo diverso, con un massimo di 96 MB di cache L2 che svettano rispetto ai 6 MB di cache L2 presenti nella GPU top di gamma GA102 della serie RTX 3000. Per implementare più risorse e cache L2 NVIDIA ha deciso di sacrificare l'interconnessione NVLink.
In ultimo, è bene ricordare che tutte queste GPU sono prodotte presso TSMC con un processo chiamato 4N che non deve essere confuso con l'N4 della stessa TSMC. 4N è da vedersi come un'ottimizzazione per NVIDIA del processo N5 (5 nm) della società taiwanese.
1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoLink ad immagine (click per visualizzarla)
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".