NVIDIA GeForce RTX 4090 e RTX 4080 ufficiali: Ada Lovelace e DLSS 3 per prestazioni da urlo

NVIDIA ha annunciato le schede video NVIDIA GeForce RTX 4090 e RTX 4080 basate su architettura Ada Lovelace. La nuova architettura, insieme alla tecnologia di upscaling DLSS 3, promette un grande balzo in avanti delle prestazioni rispetto al progetto Ampere delle GeForce RTX 3000. Scopriamo insieme le novità, le specifiche delle schede e i prezzi.

di Manolo De Agostini pubblicato il 20 Settembre 2022 nel canale Schede Video
NVIDIA gaming hardware schede video top di gamma RTX Lovelace GeForce

NVIDIA ha annunciato le prime schede video della serie GeForce RTX 4000. Nel corso dell'evento GeForce Beyond il CEO della società, Jensen Huang, ha presentato la nuova architettura Ada Lovelace e introdotto i modelli di prossimo arrivo sul mercato: GeForce RTX 4090 il 12 ottobre e due GeForce RTX 4080 che accoglieremo a novembre.

Nessuna parola per quanto riguarda la GeForce RTX 4070 o soluzioni di fascia inferiore, mentre alcune GeForce RTX 3000 continueranno a restare sul mercato: GeForce RTX 3060, 3070 e 3080, con le altre proposte che usciranno gradualmente di scena, lasciando poi spazio alle future GeForce RTX 4000 che NVIDIA ha in cantiere.

L'architettura Ada Lovelace rappresenta un netto passo avanti rispetto al progetto Ampere che spinge le schede video della famiglia GeForce RTX 3000. Secondo NVIDIA, infatti, è grado di restituire prestazioni dalle 2 alle 4 volte superiori a seconda del tipo di carico e dell'uso o meno del DLSS.

Nel grafico più in basso vediamo che nei giochi senza DLSS di alcun tipo, come AC Valhalla e The Division 2, la RTX 4080 12 GB è leggermente sotto o alla pari della RTX 3090 Ti, ammiraglia della generazione precedente. La RTX 4080 16 GB sembra essere circa il 20-25% più veloce della RTX 3090 Ti nei due titoli, mentre la RTX 4090 è sopra del 50% in Valhalla e persino oltre in The Division 2.

NVIDIA parla in genere di un balzo dalle 2 alle 4 volte, ma tiene conto del DLSS. Inoltre, quando parla di 4 volte, si rifà al fatto che i giochi futuri avranno un ray tracing ancora più spinto e pesante, cosa che renderà il DLSS indispensabile o quasi. Sarà lì che la tecnologia di upscaling farà una marcata differenza in termini prestazionali grazie alle innovazioni della terza generazione, che tratteremo a breve.

Clicca per ingrandire

La GPU di punta della serie, nome in codice AD102, integra 76,3 miliardi di transistor in un'area di 608,5 mm2 ed è realizzata con processo 4N di TSMC. All'interno c'è un rinnovato Streaming Multiprocessor in grado di offrire una potenza di calcolo nella gestione degli shader fino a 90 TFLOPs (circa 83 TFLOPs nel caso della RTX 4090, castrata in termini di risorse rispetto alla GPU completa), con un miglioramento di 2 volte sul fronte dell'efficienza energetica rispetto ad Ampere.

Accanto ai CUDA core troviamo le unità RT core di 3a generazione, capaci non solo di prestazioni fino a 200 TFLOPs (191 sulla RTX 4090) ma anche di gestire 2 volte le intersezioni raggio-triangolo rispetto alla precedente architettura. Questo si deve alle nuove unità hardware chiamate Opacity Micro-Maps e Displaced Micro-Meshes (DMM).

La prima ottimizza il ray-tracing "codificando anticipatamente i dati sui dettagli del gioco direttamente sugli oggetti nel motore di gioco". Gli oggetti complessi, come il fogliame, sono particolarmente difficili da tracciare a causa dei molti modi in cui i raggi possono influenzare il loro aspetto in base all'illuminazione della scena e le innumerevoli direzioni che i raggi possono prendere rimbalzando tra foglie e rami. Le unità RT core di 3a generazione presenti nelle GPU Ada Lovelace usano maschere di opacità per assegnare lo stato di opacità di questi elementi, che può essere opaco, trasparente o sconosciuto.

Inserendo le caratteristiche di ray tracing degli oggetti di forma irregolare e traslucidi in una maschera di opacità, gli RT core di 3a generazione renderizzano questi oggetti complessi più velocemente, migliorando le prestazioni.

Le Displaced Micro-Meshes (DMM) sono generate dagli RT core di 3a generazione, i quali creano le BVH (Bounding Volume Hierarchies) del ray tracing fino a 10 volte più velocemente, usando 20 volte meno VRAM. Le DMM sono nuove primitive che rappresentano una rete strutturata di microtriangoli che gli RT di 3a generazione processano nativamente, riducendo i requisiti di storage ed elaborazione rispetto alle generazioni precedenti, durante il rendering di geometrie complesse usano solo triangoli di base.

"Le DMM", spiega NVIDIA, "sono particolarmente vantaggiose in giochi e scene con ray-tracing altamente dettagliate e offrono agli sviluppatori le prestazioni per creare giochi ed esperienze fotorealistiche che sfruttano la fotogrammetria e oggetti e superfici super dettagliati". Queste novità erano assolutamente necessarie tenendo conto che da Battlefield V in cui venivano gestite 39 operazioni ray tracing per pixel si è arrivati a Cyberpunk 2077 che ne presenta 635. Un incremento di 16 volte in quattro anni.

Infine, Ada Lovelace introduce i Tensor core di 4a generazione per la gestione dei calcoli di IA. Rispetto ad Ampere, i Tensor Core di 4a generazione offrono più del doppio FP16, BF16, TF32, INT8 e INT4 Tensor TFLOPS e includono anche il Transformer Engine FP8 visto su Hopper, in grado di oltre restituire 1300 Tensor TFLOPS sulla RTX 4090.

Alla base di queste prestazioni ci sono alcune innovazioni che il CEO di NVIDIA ha toccato durante il keynote, come Shader Execution Reordering (SER). Come fa intendere il nome, si tratta di migliorare l'efficienza nell'esecuzione dei processi, rischedulando al volo i carichi legati allo shading per fare un uso migliore delle risorse della GPU.

Secondo NVIDIA, ci troviamo a che fare con un'innovazione così rilevante da paragonarla all'introduzione dell'esecuzione "out of order" nelle CPU. Grazie a SER, Ada Lovelace può offrire prestazioni in ray tracing fino a 2 volte superiori rispetto ad Ampere e garantire frame rate fino al 25% migliori.

La nuova architettura offre due NVIDIA Encoders (NVENC) per ridurre fino alla metà i tempi di esportazione; presente inoltre il supporto alla codifica e decodifica AV1, implementati a breve supportata da OBS, Blackmagic Design DaVinci Resolve, Discord e altri.

DLSS 3, la tecnologia di upscaling si migliora enormemente

L'altra novità della serata si chiama DLSS 3, la nuova versione del Deep Learning Super Sampling che tanto è migliorato nel corso di questi anni. Non paga dei progressi, NVIDIA ha deciso di fare un ulteriore passo avanti sia sul fronte della qualità dell'immagine che, soprattutto, su quello delle prestazioni. DLSS 3 è supportato solo dalle nuove RTX 4000, anche se NVIDIA ha lasciato una porta aperta per la compatibilità con le versioni precedenti. Secondo Bryan Catanzaro, VP per l'Applied Deep Learning Research della società, è teoricamente possibile far funzionare DLSS 3 su schede GeForce di generazione precedente, come le RTX 3000 (Ampere) o le RTX 2000 (Turing), ma non offrirà molti vantaggi ai possessori di tali soluzioni perché la tecnologia si affida all'Optical Flow Accelerator (OFA), componente enormemente migliorato con l'architettura Ada Lovelace, anche se era già presente nei progetti precedenti.

DLSS 3 punta a migliorare le prestazioni fino a 4 volte rispetto al rendering "a forza bruta", ovvero quello fatto tramite shader e unità hardware dedicate, senza appoggiarsi alla tecnologia basata sull'intelligenza artificiale.

DLSS 3 aggiunge quello che NVIDIA chiama Optical Multi Frame Generation per generare immagini (frame) interamente nuovi, inoltre integra la tecnologia NVIDIA Reflex per la riduzione della latenza per garantire una reattività ottimale: si parla di una riduzione della latenza rispetto a quella nativa fino a due volte.

DLSS 3 è spinto dalla quarta generazione dei Tensor Core e da Optical Flow Accelerator. Quest'ultimo analizza due frame sequenziali in-game e calcola un campo di flusso ottico, tramite il quale cattura la direzione e la velocità alla quale i pixel si spostano dal frame 1 al frame 2.

Optical Flow Accelerator può catturare informazioni a livello pixel come particelle, riflessi, ombre e illuminazioni che non sono inclusi nei calcoli sui vettori di movimento dell'engine di gioco. E mentre Optical Flow Accelerator traccia gli effetti a livello pixel, DLSS 3 si avvale dei vettori di movimento dell'engine di gioco per tracciare il movimento della geometria nella scena. In questo modo si evita di riprodurre artefatti visivi come lo stuttering.

L'autoencoder convoluzionale DLSS Frame Generation di NVIDIA, ovvero la nuova rete di IA della società, prende quindi 4 input in totale: il frame precedente e attuale del gioco, un campo di flusso ottico generato dall'Optical Flow Accelerator e i dati del motore di gioco come i vettori di movimento e la profondità.

La rete IA decide poi come usare le informazioni per creare le immagini intermedie e ricostruire geometria ed effetti. "Con DLSS 3 abilitato, l'IA sta ricostruendo tre quarti del primo frame con DLSS Super Resolution e l'intero secondo frame utilizzando DLSS Frame Generation. In totale, DLSS 3 ricostruisce sette ottavi dei pixel totali visualizzati, aumentando notevolmente le prestazioni".

DLSS Frame Generation è un carico post processing per la GPU, che permette alla rete IA di aumentare il frame rate quando il gioco è frenato dalla CPU. In tali scenari, DLSS 3 permette alle GPU GeForce RTX 4000 di renderizzare fino al doppio del frame rate rispetto a quello che la CPU è in grado di calcolare. In Microsoft Flight Simulator, ad esempio, DLSS 3 aumenta gli FPS fino a 2 volte.

DLSS 3 arriverà in ottobre, insieme alla RTX 4090, nei seguenti titoli e motori di gioco:

A Plague Tale: Requiem
Atomic Heart
Black Myth: Wukong
Bright Memory: Infinite
Chernobylite
Conqueror's Blade
Cyberpunk 2077
Dakar Rally
Deliver Us Mars
Destroy All Humans! 2 - Reprobed
Dying Light 2 Stay Human
F1 22
F.I.S.T.: Forged In Shadow Torch
Frostbite Engine
HITMAN 3
Hogwarts Legacy
ICARUS
Jurassic World Evolution 2
Justice
Loopmancer
Marauders
Marvel's Spider-Man Remastered
Microsoft Flight Simulator
Midnight Ghost Hunt
Mount & Blade II: Bannerlord
Naraka Bladepoint
NVIDIA Omniverse
NVIDIA Racer RTX
PERISH
Portal With RTX
Ripout
S.T.A.L.K.E.R 2: Heart of Chornobyl
Scathe
Sword and Fairy 7
SYNCED
The Lord of the Rings: Gollum
The Witcher 3: Wild Hunt
THRONE AND LIBERTY
Tower of Fantasy
Unity
Unreal Engine 4 & 5
Warhammer 40,000: Darktide

Particolare attenzione va al rifacimento di Portal con ray tracine e DLSS 3. Disponibile gratuitamente da novembre, in tempo per l'anniversario dei 15 anni, sarà scaricabile da chi possiede il titolo Valve.

GeForce RTX 4090 e RTX 4080: le specifiche tecniche

Veniamo al pezzo forte, le schede video. La GeForce RTX 4090 è basata su una GPU AD102 con 16384 CUDA core attivi, ed è capace di prestazioni dalle due alle quattro volte maggiori a seconda delle scenario rispetto alla RTX 3090 Ti, nonostante lo stesso TGP di 450W. Di seguito potete vedere il diagramma della composizione della GPU e quello di uno Streaming Multiprocessor (SM):

Accanto alla GPU troviamo 24 GB di memoria GDDR6X a 21 Gbps per una bandwidth pari a circa 1 TB/s per mezzo del bus a 384 bit. La scheda sarà disponibile dal 12 ottobre a un prezzo di 1599 dollari esentasse, 1979 euro IVA inclusa in Italia. Per gli appassionati della progettazione, di seguito l'immagine del PCB della scheda RTX 4090, dove si scorgono 23 fasi, 20 per la GPU e 3 per la memoria. NVIDIA dice che la gestione dell'alimentazione è stata migliorata in modo da non avere forti picchi di corrente e tensione.

Il dissipatore delle schede video Founders Edition è stato rivisto e si avvale di ventole più grandi che aumentano il flusso d'aria del 20%, migliorando il raffreddamento. Inoltre, secondo NVIDIA, la memoria GDDR6X di Micron usata per le nuove RTX (chip da 16 Gbit tutti su una faccia del PCB) consuma meno grazie a un nuovo processo produttivo che consente di avere temperature inferiori di 10 °C.

La GeForce RTX 4080, invece, arriva in due versioni (qui la spiegazione di NVIDIA). Il modello più potente è basato su una GPU AD103 con 9728 CUDA core e 16 GB di memoria GDDR6X a 22,4 Gbps su bus a 256 bit, per una bandwidth di 716,8 GB/s. Il TGP, invece, è pari a 320W. La scheda, secondo NVIDIA, offre due volte le prestazioni della 3080 Ti facendo leva su DLSS 3 ed è più potente della RTX 3090 Ti pur consumando meno. Disponibile da novembre al prezzo di partenza di 1199 dollari esentasse, 1479 euro IVA inclusa in Italia.

L'altra GeForce RTX 4080 ha invece una GPU AD104 con 7680 CUDA core e 12 GB di memoria GDDR6X a 21 Gbps, con un bus a 192 bit che porta la bandwidth a 504 GB/s. Quanto al TGP, il valore indicato è 285W. La scheda, secondo NVIDIA, è più veloce di una RTX 3090 Ti. La scheda debutterà a novembre a 899 dollari esentasse, 1109 euro IVA inclusa in Italia.

	GeForce RTX 4090	GeForce RTX 4080 16 GB	GeForce RTX 4080 12 GB
CUDA core	16384	9728	7680
RT core	128	76	60
Tensor core	512	304	240
ROPs	176	112	80
Boost Clock (GHz)	2,52	2,51	2,61
Base Clock (GHz)	2,23	2,21	2,31
Memoria	24 GB GDDR6X 21 Gbps	16 GB GDDR6X 22,4 Gbps	12 GB GDDR6X 21 Gbps
Bandwidth	1008 GB/s	716,8 GB/s	504 GB/s
Bus	384-bit	256-bit	192-bit
TGP	450W	320W	285W
Porte	HDMI 2.1a, 3 DisplayPort 1.4a	HDMI 2.1a, 3 DisplayPort 1.4a	HDMI 2.1a, 3 DisplayPort 1.4a
Interfaccia	PCI Express Gen 4.0	PCI Express Gen 4.0	PCI Express Gen 4.0
NVIDIA NVLink (SLI-Ready)	No	No	No
Codifica e decodifica AV1	Sì	Sì	Sì
Alimentazione	3 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore	3 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore	2 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore
Prezzo	1599 dollari esentasse, 1979 euro IVA inclusa	1199 dollari esentasse, 1479 euro IVA inclusa	899 dollari esentasse, 1109 euro IVA inclusa

Nella tabella di seguito potete vedere un riepilogo delle principali caratteristiche delle GPU annunciate da NVIDIA a confronto con il GA102, top di gamma della precedente generazione. Badate bene, le specifiche sono relative alle capacità massime del chip, ma come si può vedere confrontando le due tabelle, solo la RTX 4080 12 GB adotta un chip con tutte le unità completamente attive.

	AD102	AD103	AD104	GA102
Architettura	Ada Lovelace	Ada Lovelace	Ada Lovelace	Ampere
Processo produttivo	TSMC 4N	TSMC 4N	TSMC 4N	Samsung 8N
Transistor	76,3 miliardi	45,9 miliardi	35,8 miliardi	28,3 miliardi
Dimensione die	608,5 mm²	378,6 mm²	294,5 mm²	628,4 mm²
Streaming Multiprocessor	144	80	60	84
CUDA Core	18432	10240	7680	10752
Tensor Core	576	320	240	336
RT Core	144	80	60	84
ROPs	192	112	80	112
Cache L2	98,3 MB	65,5 MB	49,1 MB	6,1 MB
Bus	384 bit	256 bit	192 bit	384 bit

GeForce RTX 4090 e RTX 4080 16 GB saranno prodotte da NVIDIA in quantità limitate in versione Founders Edition. Queste schede, e il modello della RTX 4080 da 12GB, saranno disponibili anche in versione custom con frequenze stock e overcloccate dai partner come ASUS, Colorful, Gainward, Galaxy, GIGABYTE, Innovision 3D, MSI, Palit, PNY e Zotac (ahinoi, non più EVGA). A proposito di overclock, Jensen Huang ha dichiarato che in laboratorio NVIDIA è riuscita a portare un chip Ada Lovelace "oltre i 3 GHz". Inoltre, le schede arriveranno sui sistemi preassemblati di Acer, Alienware, ASUS, Dell, HP, Lenovo, MSI e molti altri.

le_mie_parole20 Settembre 2022, 20:18 #1

in bocca al lupo con la bolletta, ma son sicuro che c'è chi problemi di soldi non ha... questi sono fuori dal mondo, al pari di amd e intel, si intenda... avessero un tdp di 80W alla si potrebbe parlare di efficienza, qui invece, è solo "ingrassare" il core per aver più performance e senza badar minimamente ai consumi

paolo cavallo20 Settembre 2022, 20:22 #2

Non vedo questi consumi esagerati che tu dici.. guarda quantio ti consuma la PS5... o il tv .. o il frigo ... o la lavatrice.... o il clima, poi ne parliamo

Max Power20 Settembre 2022, 20:31 #3

Urlo

Marckus8720 Settembre 2022, 20:34 #4

pensavo male a questa mandata ma non così male.

ciolla200520 Settembre 2022, 20:35 #5

Vedremo 🤣

sminatore20 Settembre 2022, 20:40 #6

Ah, e io che pensavo le schede costassero tanto per via delle cripto e degli scalpers

flesciato8320 Settembre 2022, 20:42 #7

Io nn giustifico questi consumi o prezzi abnormi, ma nel 21mo secolo xon gpu così performantnti Co e cazzo si fa a pensare che una gpu di fascia alta posso co sumare 80 fottuti wat!!!!

Final5020 Settembre 2022, 20:43 #8

Originariamente inviato da: paolo cavallo

Non vedo questi consumi esagerati che tu dici.. guarda quantio ti consuma la PS5... o il tv .. o il frigo ... o la lavatrice.... o il clima, poi ne parliamo

una ps5 consuma 200w in gaming per l'intero sistema... un frigo considerando che alterna momenti di accensione e momenti in cui è "spento" fa 150-200w, un tv da 42pollici 200w per un sistema con una 4090 devi avere almeno un ali da 1kw, tra cpu gpu e annessi in gaming spinto consumi almeno 6-700w... alcuni modelli di 4090 custom potrebbero anche superare il consumo di un frigo, un televisiore e una ps5 contemporaneamente...

kellone20 Settembre 2022, 20:46 #9

C'è modo di prenotare al day one una di queste schede?

La piccolina 4080 mi garberebbe...

StylezZz`20 Settembre 2022, 21:16 #10

Al momento ''da urlo'' (in senso negativo) vedo solo i prezzi e la 4070 rinominata 4080 a 899$.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Canon EOS R5 Mark II: ecco i primi scatti

379

Canon EOS R1: ecco i primi scatti

Sony Xperia 1 VI: una macchina fotografica tascabile

Cosmoleap: la società cinese che vuole copiare la torre di lancio Mechazilla di SpaceX Starship

Hyundai Inster

Primi screenshot di Assetto Corsa EVO: livello di dettaglio altissimo!

Aorus CO49DQ, la declinazione Gigabyte dei monitor OLED ultrawide Uno schermo di elevata qualità, che può essere utilizzato non solo per sessioni videoludiche coinvolgenti, ma anche per attività di produzione creativa. Ci ricorda...

Samsung Galaxy Z Flip6: è più premium e sfrutta Galaxy AI. Recensione Il Galaxy Z Flip6 è il pieghevole a conchiglia per eccellenza di Samsung. Un device che rimane fedele al passato ma che migliora sotto diversi punti di vista divenendo...

Senua's Saga: Hellblade II è una delle migliori esperienze audiovisive del 2024 Con Senua's Saga: Hellblade II, Ninja Theory torna a raccontarci la storia della guerriera pitta che dà il nome a quest'opera e lo fa attraverso elementi sonori...

Nikon Z6 III, arriva il sensore "quasi" stacked Con la terza generazione, la Nikon Z6 III acquista grandi performance e migliora efficacia e usabilità del sistema AF. Significativo passo avanti rispetto alla generazione...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover: il keynote più spettacolare della storia. E anche uno dei più importanti Nei giorni in cui NVIDIA era diventata la prima azienda al mondo per capitalizzazione in borsa, il CEO Jensen Huang è apparso sul palco di HPE Discover per annunciare,...

Peugeot E-5008, la 7 posti tutta elettrica Arriverà sul mercato il prossimo autunno Peugeot E-5008, l'ultima evoluzione del popolare SUV di grandi dimensioni dell'azienda francese ora in grado di ospitare...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss

NVIDIA GeForce RTX 4090 e RTX 4080 ufficiali: Ada Lovelace e DLSS 3 per prestazioni da urlo

DLSS 3, la tecnologia di upscaling si migliora enormemente

GeForce RTX 4090 e RTX 4080: le specifiche tecniche

190 Commenti