NVIDIA GeForce RTX 4090 e RTX 4080 ufficiali: Ada Lovelace e DLSS 3 per prestazioni da urlo

NVIDIA GeForce RTX 4090 e RTX 4080 ufficiali: Ada Lovelace e DLSS 3 per prestazioni da urlo

NVIDIA ha annunciato le schede video NVIDIA GeForce RTX 4090 e RTX 4080 basate su architettura Ada Lovelace. La nuova architettura, insieme alla tecnologia di upscaling DLSS 3, promette un grande balzo in avanti delle prestazioni rispetto al progetto Ampere delle GeForce RTX 3000. Scopriamo insieme le novità, le specifiche delle schede e i prezzi.

di pubblicato il nel canale Schede Video
NVIDIAgaming hardwareschede video top di gammaRTXLovelaceGeForce
 

NVIDIA ha annunciato le prime schede video della serie GeForce RTX 4000. Nel corso dell'evento GeForce Beyond il CEO della società, Jensen Huang, ha presentato la nuova architettura Ada Lovelace e introdotto i modelli di prossimo arrivo sul mercato: GeForce RTX 4090 il 12 ottobre e due GeForce RTX 4080 che accoglieremo a novembre.

Nessuna parola per quanto riguarda la GeForce RTX 4070 o soluzioni di fascia inferiore, mentre alcune GeForce RTX 3000 continueranno a restare sul mercato: GeForce RTX 3060, 3070 e 3080, con le altre proposte che usciranno gradualmente di scena, lasciando poi spazio alle future GeForce RTX 4000 che NVIDIA ha in cantiere.

L'architettura Ada Lovelace rappresenta un netto passo avanti rispetto al progetto Ampere che spinge le schede video della famiglia GeForce RTX 3000. Secondo NVIDIA, infatti, è grado di restituire prestazioni dalle 2 alle 4 volte superiori a seconda del tipo di carico e dell'uso o meno del DLSS.

Nel grafico più in basso vediamo che nei giochi senza DLSS di alcun tipo, come AC Valhalla e The Division 2, la RTX 4080 12 GB è leggermente sotto o alla pari della RTX 3090 Ti, ammiraglia della generazione precedente. La RTX 4080 16 GB sembra essere circa il 20-25% più veloce della RTX 3090 Ti nei due titoli, mentre la RTX 4090 è sopra del 50% in Valhalla e persino oltre in The Division 2.

NVIDIA parla in genere di un balzo dalle 2 alle 4 volte, ma tiene conto del DLSS. Inoltre, quando parla di 4 volte, si rifà al fatto che i giochi futuri avranno un ray tracing ancora più spinto e pesante, cosa che renderà il DLSS indispensabile o quasi. Sarà lì che la tecnologia di upscaling farà una marcata differenza in termini prestazionali grazie alle innovazioni della terza generazione, che tratteremo a breve.


Clicca per ingrandire

La GPU di punta della serie, nome in codice AD102, integra 76,3 miliardi di transistor in un'area di 608,5 mm2 ed è realizzata con processo 4N di TSMC. All'interno c'è un rinnovato Streaming Multiprocessor in grado di offrire una potenza di calcolo nella gestione degli shader fino a 90 TFLOPs (circa 83 TFLOPs nel caso della RTX 4090, castrata in termini di risorse rispetto alla GPU completa), con un miglioramento di 2 volte sul fronte dell'efficienza energetica rispetto ad Ampere.

Accanto ai CUDA core troviamo le unità RT core di 3a generazione, capaci non solo di prestazioni fino a 200 TFLOPs (191 sulla RTX 4090) ma anche di gestire 2 volte le intersezioni raggio-triangolo rispetto alla precedente architettura. Questo si deve alle nuove unità hardware chiamate Opacity Micro-Maps Displaced Micro-Meshes (DMM).

La prima ottimizza il ray-tracing "codificando anticipatamente i dati sui dettagli del gioco direttamente sugli oggetti nel motore di gioco". Gli oggetti complessi, come il fogliame, sono particolarmente difficili da tracciare a causa dei molti modi in cui i raggi possono influenzare il loro aspetto in base all'illuminazione della scena e le innumerevoli direzioni che i raggi possono prendere rimbalzando tra foglie e rami. Le unità RT core di 3a generazione presenti nelle GPU Ada Lovelace usano maschere di opacità per assegnare lo stato di opacità di questi elementi, che può essere opaco, trasparente o sconosciuto.

Inserendo le caratteristiche di ray tracing degli oggetti di forma irregolare e traslucidi in una maschera di opacità, gli RT core di 3a generazione renderizzano questi oggetti complessi più velocemente, migliorando le prestazioni.

Le Displaced Micro-Meshes (DMM) sono generate dagli RT core di 3a generazione, i quali creano le BVH (Bounding Volume Hierarchies) del ray tracing fino a 10 volte più velocemente, usando 20 volte meno VRAM. Le DMM sono nuove primitive che rappresentano una rete strutturata di microtriangoli che gli RT di 3a generazione processano nativamente, riducendo i requisiti di storage ed elaborazione rispetto alle generazioni precedenti, durante il rendering di geometrie complesse usano solo triangoli di base.

"Le DMM", spiega NVIDIA, "sono particolarmente vantaggiose in giochi e scene con ray-tracing altamente dettagliate e offrono agli sviluppatori le prestazioni per creare giochi ed esperienze fotorealistiche che sfruttano la fotogrammetria e oggetti e superfici super dettagliati". Queste novità erano assolutamente necessarie tenendo conto che da Battlefield V in cui venivano gestite 39 operazioni ray tracing per pixel si è arrivati a Cyberpunk 2077 che ne presenta 635. Un incremento di 16 volte in quattro anni.

Infine, Ada Lovelace introduce i Tensor core di 4a generazione per la gestione dei calcoli di IA. Rispetto ad Ampere, i Tensor Core di 4a generazione offrono più del doppio FP16, BF16, TF32, INT8 e INT4 Tensor TFLOPS e includono anche il Transformer Engine FP8 visto su Hopper, in grado di oltre restituire 1300 Tensor TFLOPS sulla RTX 4090.

Alla base di queste prestazioni ci sono alcune innovazioni che il CEO di NVIDIA ha toccato durante il keynote, come Shader Execution Reordering (SER). Come fa intendere il nome, si tratta di migliorare l'efficienza nell'esecuzione dei processi, rischedulando al volo i carichi legati allo shading per fare un uso migliore delle risorse della GPU.

Secondo NVIDIA, ci troviamo a che fare con un'innovazione così rilevante da paragonarla all'introduzione dell'esecuzione "out of order" nelle CPU. Grazie a SER, Ada Lovelace può offrire prestazioni in ray tracing fino a 2 volte superiori rispetto ad Ampere e garantire frame rate fino al 25% migliori.

La nuova architettura offre due NVIDIA Encoders (NVENC) per ridurre fino alla metà i tempi di esportazione; presente inoltre il supporto alla codifica e decodifica AV1, implementati a breve supportata da OBS, Blackmagic Design DaVinci Resolve, Discord e altri.

DLSS 3, la tecnologia di upscaling si migliora enormemente

L'altra novità della serata si chiama DLSS 3, la nuova versione del Deep Learning Super Sampling che tanto è migliorato nel corso di questi anni. Non paga dei progressi, NVIDIA ha deciso di fare un ulteriore passo avanti sia sul fronte della qualità dell'immagine che, soprattutto, su quello delle prestazioni. DLSS 3 è supportato solo dalle nuove RTX 4000, anche se NVIDIA ha lasciato una porta aperta per la compatibilità con le versioni precedenti. Secondo Bryan Catanzaro, VP per l'Applied Deep Learning Research della società, è teoricamente possibile far funzionare DLSS 3 su schede GeForce di generazione precedente, come le RTX 3000 (Ampere) o le RTX 2000 (Turing), ma non offrirà molti vantaggi ai possessori di tali soluzioni perché la tecnologia si affida all'Optical Flow Accelerator (OFA), componente enormemente migliorato con l'architettura Ada Lovelace, anche se era già presente nei progetti precedenti.

DLSS 3 punta a migliorare le prestazioni fino a 4 volte rispetto al rendering "a forza bruta", ovvero quello fatto tramite shader e unità hardware dedicate, senza appoggiarsi alla tecnologia basata sull'intelligenza artificiale.

DLSS 3 aggiunge quello che NVIDIA chiama Optical Multi Frame Generation per generare immagini (frame) interamente nuovi, inoltre integra la tecnologia NVIDIA Reflex per la riduzione della latenza per garantire una reattività ottimale: si parla di una riduzione della latenza rispetto a quella nativa fino a due volte.

DLSS 3 è spinto dalla quarta generazione dei Tensor Core e da Optical Flow Accelerator. Quest'ultimo analizza due frame sequenziali in-game e calcola un campo di flusso ottico, tramite il quale cattura la direzione e la velocità alla quale i pixel si spostano dal frame 1 al frame 2.

Optical Flow Accelerator può catturare informazioni a livello pixel come particelle, riflessi, ombre e illuminazioni che non sono inclusi nei calcoli sui vettori di movimento dell'engine di gioco. E mentre Optical Flow Accelerator traccia gli effetti a livello pixel, DLSS 3 si avvale dei vettori di movimento dell'engine di gioco per tracciare il movimento della geometria nella scena. In questo modo si evita di riprodurre artefatti visivi come lo stuttering.

L'autoencoder convoluzionale DLSS Frame Generation di NVIDIA, ovvero la nuova rete di IA della società, prende quindi 4 input in totale: il frame precedente e attuale del gioco, un campo di flusso ottico generato dall'Optical Flow Accelerator e i dati del motore di gioco come i vettori di movimento e la profondità.

La rete IA decide poi come usare le informazioni per creare le immagini intermedie e ricostruire geometria ed effetti. "Con DLSS 3 abilitato, l'IA sta ricostruendo tre quarti del primo frame con DLSS Super Resolution e l'intero secondo frame utilizzando DLSS Frame Generation. In totale, DLSS 3 ricostruisce sette ottavi dei pixel totali visualizzati, aumentando notevolmente le prestazioni".

DLSS Frame Generation è un carico post processing per la GPU, che permette alla rete IA di aumentare il frame rate quando il gioco è frenato dalla CPU. In tali scenari, DLSS 3 permette alle GPU GeForce RTX 4000 di renderizzare fino al doppio del frame rate rispetto a quello che la CPU è in grado di calcolare. In Microsoft Flight Simulator, ad esempio, DLSS 3 aumenta gli FPS fino a 2 volte.

DLSS 3 arriverà in ottobre, insieme alla RTX 4090, nei seguenti titoli e motori di gioco:

  • A Plague Tale: Requiem
  • Atomic Heart
  • Black Myth: Wukong
  • Bright Memory: Infinite
  • Chernobylite
  • Conqueror's Blade
  • Cyberpunk 2077
  • Dakar Rally
  • Deliver Us Mars
  • Destroy All Humans! 2 - Reprobed
  • Dying Light 2 Stay Human
  • F1 22
  • F.I.S.T.: Forged In Shadow Torch
  • Frostbite Engine
  • HITMAN 3
  • Hogwarts Legacy
  • ICARUS
  • Jurassic World Evolution 2
  • Justice
  • Loopmancer
  • Marauders
  • Marvel's Spider-Man Remastered
  • Microsoft Flight Simulator
  • Midnight Ghost Hunt
  • Mount & Blade II: Bannerlord
  • Naraka Bladepoint
  • NVIDIA Omniverse
  • NVIDIA Racer RTX
  • PERISH
  • Portal With RTX
  • Ripout
  • S.T.A.L.K.E.R 2: Heart of Chornobyl
  • Scathe
  • Sword and Fairy 7
  • SYNCED
  • The Lord of the Rings: Gollum
  • The Witcher 3: Wild Hunt
  • THRONE AND LIBERTY
  • Tower of Fantasy
  • Unity
  • Unreal Engine 4 & 5
  • Warhammer 40,000: Darktide

Particolare attenzione va al rifacimento di Portal con ray tracine e DLSS 3. Disponibile gratuitamente da novembre, in tempo per l'anniversario dei 15 anni, sarà scaricabile da chi possiede il titolo Valve.

GeForce RTX 4090 e RTX 4080: le specifiche tecniche

Veniamo al pezzo forte, le schede video. La GeForce RTX 4090 è basata su una GPU AD102 con 16384 CUDA core attivi, ed è capace di prestazioni dalle due alle quattro volte maggiori a seconda delle scenario rispetto alla RTX 3090 Ti, nonostante lo stesso TGP di 450W. Di seguito potete vedere il diagramma della composizione della GPU e quello di uno Streaming Multiprocessor (SM):

Accanto alla GPU troviamo 24 GB di memoria GDDR6X a 21 Gbps per una bandwidth pari a circa 1 TB/s per mezzo del bus a 384 bit. La scheda sarà disponibile dal 12 ottobre a un prezzo di 1599 dollari esentasse, 1979 euro IVA inclusa in Italia. Per gli appassionati della progettazione, di seguito l'immagine del PCB della scheda RTX 4090, dove si scorgono 23 fasi, 20 per la GPU e 3 per la memoria. NVIDIA dice che la gestione dell'alimentazione è stata migliorata in modo da non avere forti picchi di corrente e tensione.

Il dissipatore delle schede video Founders Edition è stato rivisto e si avvale di ventole più grandi che aumentano il flusso d'aria del 20%, migliorando il raffreddamento. Inoltre, secondo NVIDIA, la memoria GDDR6X di Micron usata per le nuove RTX (chip da 16 Gbit tutti su una faccia del PCB) consuma meno grazie a un nuovo processo produttivo che consente di avere temperature inferiori di 10 °C.

La GeForce RTX 4080, invece, arriva in due versioni (qui la spiegazione di NVIDIA). Il modello più potente è basato su una GPU AD103 con 9728 CUDA core e 16 GB di memoria GDDR6X a 22,4 Gbps su bus a 256 bit, per una bandwidth di 716,8 GB/s. Il TGP, invece, è pari a 320W. La scheda, secondo NVIDIA, offre due volte le prestazioni della 3080 Ti facendo leva su DLSS 3 ed è più potente della RTX 3090 Ti pur consumando meno. Disponibile da novembre al prezzo di partenza di 1199 dollari esentasse, 1479 euro IVA inclusa in Italia.

L'altra GeForce RTX 4080 ha invece una GPU AD104 con 7680 CUDA core e 12 GB di memoria GDDR6X a 21 Gbps, con un bus a 192 bit che porta la bandwidth a 504 GB/s. Quanto al TGP, il valore indicato è 285W. La scheda, secondo NVIDIA, è più veloce di una RTX 3090 Ti. La scheda debutterà a novembre a 899 dollari esentasse, 1109 euro IVA inclusa in Italia.

  GeForce RTX 4090 GeForce RTX 4080 16 GB GeForce RTX 4080 12 GB
CUDA core 16384 9728 7680
RT core 128 76 60
Tensor core 512 304 240
ROPs 176 112 80
Boost Clock (GHz) 2,52 2,51 2,61
Base Clock (GHz) 2,23 2,21 2,31
Memoria 24 GB GDDR6X
21 Gbps
16 GB GDDR6X
22,4 Gbps
12 GB GDDR6X
21 Gbps
Bandwidth 1008 GB/s  716,8 GB/s  504 GB/s
Bus 384-bit 256-bit 192-bit
TGP 450W 320W 285W
Porte HDMI 2.1a, 3 DisplayPort 1.4a HDMI 2.1a, 3 DisplayPort 1.4a HDMI 2.1a, 3 DisplayPort 1.4a
Interfaccia PCI Express Gen 4.0 PCI Express Gen 4.0 PCI Express Gen 4.0
NVIDIA NVLink (SLI-Ready) No No No
Codifica e decodifica AV1
Alimentazione 3 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore 3 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore 2 cavi PCIe 8 pin o 1 cavo PCIe Gen 5 da 450 W o superiore
Prezzo 1599 dollari esentasse, 1979 euro IVA inclusa 1199 dollari esentasse, 1479 euro IVA inclusa 899 dollari esentasse, 1109 euro IVA inclusa

Nella tabella di seguito potete vedere un riepilogo delle principali caratteristiche delle GPU annunciate da NVIDIA a confronto con il GA102, top di gamma della precedente generazione. Badate bene, le specifiche sono relative alle capacità massime del chip, ma come si può vedere confrontando le due tabelle, solo la RTX 4080 12 GB adotta un chip con tutte le unità completamente attive.

  AD102 AD103 AD104 GA102
Architettura Ada Lovelace Ada Lovelace Ada Lovelace Ampere
Processo produttivo TSMC 4N TSMC 4N TSMC 4N Samsung 8N
Transistor 76,3 miliardi 45,9 miliardi 35,8 miliardi  28,3 miliardi
Dimensione die 608,5 mm² 378,6 mm² 294,5 mm² 628,4 mm²
Streaming Multiprocessor 144 80 60 84 
CUDA Core 18432 10240 7680 10752 
Tensor Core 576 320 240  336
RT Core 144 80 60 84 
ROPs 192 112 80 112 
Cache L2 98,3 MB 65,5 MB 49,1 MB 6,1 MB 
Bus 384 bit 256 bit 192 bit 384 bit 

GeForce RTX 4090 e RTX 4080 16 GB saranno prodotte da NVIDIA in quantità limitate in versione Founders Edition. Queste schede, e il modello della RTX 4080 da 12GB, saranno disponibili anche in versione custom con frequenze stock e overcloccate dai partner come ASUS, Colorful, Gainward, Galaxy, GIGABYTE, Innovision 3D, MSI, Palit, PNY e Zotac (ahinoi, non più EVGA). A proposito di overclock, Jensen Huang ha dichiarato che in laboratorio NVIDIA è riuscita a portare un chip Ada Lovelace "oltre i 3 GHz". Inoltre, le schede arriveranno sui sistemi preassemblati di Acer, Alienware, ASUS, Dell, HP, Lenovo, MSI e molti altri.

190 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
le_mie_parole20 Settembre 2022, 20:18 #1
in bocca al lupo con la bolletta, ma son sicuro che c'è chi problemi di soldi non ha... questi sono fuori dal mondo, al pari di amd e intel, si intenda... avessero un tdp di 80W alla si potrebbe parlare di efficienza, qui invece, è solo "ingrassare" il core per aver più performance e senza badar minimamente ai consumi
paolo cavallo20 Settembre 2022, 20:22 #2
Non vedo questi consumi esagerati che tu dici.. guarda quantio ti consuma la PS5... o il tv .. o il frigo ... o la lavatrice.... o il clima, poi ne parliamo
Max Power20 Settembre 2022, 20:31 #3
Urlo
Marckus8720 Settembre 2022, 20:34 #4
pensavo male a questa mandata ma non così male.
ciolla200520 Settembre 2022, 20:35 #5
Vedremo 🤣
sminatore20 Settembre 2022, 20:40 #6
Ah, e io che pensavo le schede costassero tanto per via delle cripto e degli scalpers
flesciato8320 Settembre 2022, 20:42 #7
Io nn giustifico questi consumi o prezzi abnormi, ma nel 21mo secolo xon gpu così performantnti Co e cazzo si fa a pensare che una gpu di fascia alta posso co sumare 80 fottuti wat!!!!
Final5020 Settembre 2022, 20:43 #8
Originariamente inviato da: paolo cavallo
Non vedo questi consumi esagerati che tu dici.. guarda quantio ti consuma la PS5... o il tv .. o il frigo ... o la lavatrice.... o il clima, poi ne parliamo


una ps5 consuma 200w in gaming per l'intero sistema... un frigo considerando che alterna momenti di accensione e momenti in cui è "spento" fa 150-200w, un tv da 42pollici 200w per un sistema con una 4090 devi avere almeno un ali da 1kw, tra cpu gpu e annessi in gaming spinto consumi almeno 6-700w... alcuni modelli di 4090 custom potrebbero anche superare il consumo di un frigo, un televisiore e una ps5 contemporaneamente...
kellone20 Settembre 2022, 20:46 #9
C'è modo di prenotare al day one una di queste schede?

La piccolina 4080 mi garberebbe...
StylezZz`20 Settembre 2022, 21:16 #10
Al momento ''da urlo'' (in senso negativo) vedo solo i prezzi e la 4070 rinominata 4080 a 899$.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^