NVIDIA GeForce RTX 5090 recensione: potenza estrema e prezzo alle stelle

NVIDIA GeForce RTX 5090 recensione: potenza estrema e prezzo alle stelle

Abbiamo provato la GeForce RTX 5090 di NVIDIA, la top di gamma della generazione Blackwell. Una scheda tecnicamente all'avanguardia e prestazionalmente sublime, in gaming ma non solo. Il DLSS 4 con Multi Frame Generation moltiplica le prestazioni e permette di gestire il path tracing con un frame rate inimmaginabile fino a poco tempo fa. Il prezzo dell'innovazione, però, è salatissimo.

di pubblicato il nel canale Schede Video
BlackwellNVIDIAGeForce
 

La settimana scorsa abbiamo trattato le novità dell'architettura Blackwell e delle GeForce RTX 5000, mentre adesso è giunto il momento di prendere contatto con la top di gamma della nuova serie di GPU desktop NVIDIA, modello GeForce RTX 5090.

L'ammiraglia di casa NVIDIA si presenta con specifiche tecniche senza eguali, ma anche con un prezzo a partire da 2389€ IVA inclusa che la rende ancor meno avvicinabile della GeForce RTX 4090 che l'ha preceduta.

La nuova GeForce RTX 5090 è spinta da una GPU GB202, un chip da ben 750 mm2 e 92,2 miliardi di transistor. Il processo produttivo non ha subito grandi miglioramenti, trattandosi del 4NP di TSMC (una versione ottimizzata per NVIDIA di N4P), rispetto al 4N usato per le GPU Ada Lovelace. La tecnologia N4P, secondo TSMC, garantisce prestazioni il 6% superiori rispetto al processo N4.

Una GPU GB202 completa prevede 192 SM e un totale di 24756 CUDA core, con 768 Tensor core e 192 RT core. La GPU ha la stessa cache L1 per SM di AD102, ovvero 128 KB per SM, per un totale di 24,5 MB di cache L1. La cache L2 totale, invece, è pari a 128 MB, superiore ai 98 MB di un AD102 completo, il precedente chip al vertice dell'offerta RTX 4000.

  GeForce RTX 5090 GeForce RTX 4090
GPU GB202 AD102
Processo 4NP 4N
Dimensione die 750 mm2 609 mm2
Transistor 92,2 miliardi 76,3 miliardi
Architettura Blackwell Ada Lovelace
SM attivi 170 128
Cache L1  21,7 MB 16,3 MB
Cache L2 98,3 MB 73,7 MB
CUDA Core 21760 16384
Base Clock 2010 MHz 2235 MHz
Boost Clock 2410 MHz 2520 MHz
Bus 512 Bit 384 bit 
VRAM e velocità GDDR7 (28 Gbps) GDDR6X (21 Gbps) 
Quantità di VRAM 32 GB 24 GB
Bandwidth 1,792 TB/s 1,01 TB/s
TGP 575 W 450 W

La GPU a bordo della GeForce RTX 5090 non è un GB202 completo, ma prevede 170 SM attivi, per un totale di 21760 CUDA core, 680 Tensor core e 170 RT core. La GPU ha 21,7 MB di cache L1 e 98,3 MB di cache L2, dati in crescita dai 16,3 e 73,7 MB della RTX 4090. Le specifiche tecniche base della GPU prevedono un Base Clock di 2010 MHz e un Boost Clock di 2410 MHz. Si tratta di valori in calo rispetto alla RTX 4090 (2235 / 2520 MHz).

Accanto a queste specifiche troviamo un bus a 512 bit e 32 GB di memoria GDDR7 a 28 Gbps per una bandwidth di 1,792 TB/s. La precedente top di gamma prevedeva 24 GB di memoria GDDR6X a 21 Gbps su bus a 384 bit, per una bandwidth di 1,01 TB/s. La scheda, alimentata da un connettore a 16 pin, è accompagnata da un TGP di 575 Watt, ben 125 watt in più rispetto al predecessore GeForce RTX 4090.

NVIDIA ha aggiornato la parte di encoder e decoder, rispettivamente giunti alla nona e alla sesta generazione. Oltre al supporto ai formati AV1 UHQ e MV-HEVC, l'architettura Blackwell implementa l'encode / decode 4:2:2 per i video H.264/H.265 4:2:2 a 8 e 10 bit. È importante notare che la GeForce RTX 5090 integra tre encoder e due decoder, con un incremento di un'unità rispetto alla RTX 4090

Come visibile dalle foto, la scheda NVIDIA GeForce RTX 5090 Founders Edition oggetto di recensione si presenta in un insolito design dual slot. Abituati alle dimensioni imponenti delle precedenti RTX 3090 e 4090, quasi si fatica ad accettare un design così snello ed elegante.

Il sistema di raffreddamento, rinnovato, è denominato "Double Flow Through". Le GeForce RTX 4000 Founders Edition precedenti avevano un PCB principale a forma di V, mentre questa volta NVIDIA ha realizzato un design quadrato, che si colloca al centro del dissipatore.

Questo ha dato modo a NVIDIA di creare un nuovo sistema di raffreddamento in cui le ventole assiali sono sullo stesso lato della scheda e pescano entrambe aria fresca dalla parte inferiore ed espellono aria calda da quella superiore, essendo sparita la griglia posteriore vicina alle porte.

Per quanto riguarda le porte posteriori, le GeForce RTX 5000 includono una porta HDMI 2.1b con supporto fino a 4K a 480 Hz o 8K a 120 Hz con DSC, oltre a tre DisplayPort 2.1b con supporto UHBR20 fino a 4K a 480 Hz o 8K a 165 Hz con DSC. Sopra la GPU c'è una camera di vapore 3D, e troviamo anche cinque heatpipe che trasportano il calore lungo due heatsink, con un terzo dissipatore posto sotto il PCB.

GeForce RTX 5090 FE e RTX 4090 FE: lo spessore del dissipatore è decisamente più contenuto

Secondo NVIDIA, questo design non solo è altamente efficiente nel dissipare il calore prodotto, ma offre anche un profilo di rumorosità significativamente migliore rispetto ai progetti precedenti. Lo vedremo sul campo.

Configurazione di prova

La GeForce RTX 5090 è stata provata su un sistema ASUS ROG Crosshair X870E Hero, con un processore Ryzen 9 9950X, 32 GB di memoria RAM G.Skill Trident Z5 Neo ARGB DDR5-6400 CL32 e un SSD Netac NV7000 da 2 TB, il tutto alimentato da un FSP Hydro Ti Pro da 1000W con certificazione 80 PLUS Titanium.

Abbiamo aggiornato il BIOS alla versione 0706 ed eseguito le prove usando i driver GeForce GameReady 571.86 compatibili con la nuova arrivata.

La GeForce RTX 5090 è stata messa a confronto con le schede GeForce RTX 4090, GeForce RTX 4080, GeForce RTX 3090 e GeForce RTX 2080 Ti per quanto riguarda NVIDIA, includendo il modello Radeon RX 7900 XTX per alcuni test sul fronte AMD. Dato il livello della scheda abbiamo deciso di provarla solamente con risoluzione 4K.

GeForce RTX 5090: prestazioni gaming

Il ray tracing è sempre più diffuso e questa scheda è progettata per gestire tali carichi, con l'ambizioso obiettivo di supportare anche il path tracing. Per farlo è necessario affidarsi alle tecnologie di upscaling e Frame Generation, per questo motivo è su quel fronte che sono andati gli sforzi di NVIDIA. Non possiamo però esimerci dallo svolgere alcuni test in rasterizzazione, per confrontare le prestazioni della GeForce RTX 5090 con quelle della RTX 4090 e delle altre soluzioni in scenari privi di ray tracing e tecnologie IA.

Prestazioni in rasterizzazione

Abbiamo svolto test con Cyberpunk 2077, Shadow of the Tomb Raider, F1 2024, Borderlands 3, Hitman 3 e Starfield. La GeForce RTX 5090 si è dimostrata il 30% circa più veloce di media in questa serie di prove rispetto alla GeForce RTX 4090.

Abbiamo ravvisato un incremento prestazionale del 29% in Shadow of the Tomb Raider e del 48% in Cyberpunk 2077, mentre il boost in F1 2024 è stato del 25%. Incremento del 28% in Borderlands 3, del 45% in Hitman 3 e del 21% in Starfield. Insomma, non meno del 20%, con picchi anche molto più alti a seconda del gioco e della sua complessità.

A nostro parere, il boost medio è molto buono, anche se non raggiunge il +50% registrato tra la RTX 3090 e la RTX 4090. La RTX 3090 contava su un inefficiente processo produttivo Samsung a 8 nanometri, mentre la RTX 4090 sul 4N di TSMC, che ha decisamente aiutato NVIDIA a salire di frequenza e realizzare una GPU molto più efficiente e potente. La GeForce RTX 5090 non può contare su quel miglioramento tecnologico, avendo un processo produttivo simile e clock inferiori; per questo motivo un balzo medio del 30% è più che apprezzabile.

Rispetto alla RTX 3090, ammiraglia al lancio della famiglia Ampere, la GeForce RTX 5090 ha mostrato un incremento prestazionale di quasi il 100% in rasterizzazione. Rispetto alla prima top di gamma dell'era RTX, la GeForce RTX 2080 Ti, osserviamo un boost del 260% circa. Per quanto riguarda il confronto con l'attuale top di gamma di casa AMD, la Radeon RX 7900 XTX, riscontriamo un gap del 66% in favore della nuova arrivata di casa NVIDIA.

Questo confronto non tiene conto della novità introdotta da NVIDIA con l'architettura Blackwell: gli RTX Neural Shader. Pertanto, nei futuri titoli che sfrutteranno l'IA negli shader programmabili, è probabile che il divario si ampli ulteriormente rispetto alle schede delle generazioni precedenti.

DLSS 4 con Multi Frame Generation, quanto incide sulle prestazioni?

La principale novità delle GeForce RTX 5000 è il DLSS 4 con Multi Frame Generation, una tecnologia che, come spiegato nel precedente articolo, consente all'IA di generare fino a tre frame per ogni frame renderizzato. Un'evoluzione della Frame Generation del DLSS 3, implementata sulle GPU GeForce RTX 5000, che si preannuncia come un formidabile moltiplicatore prestazionale.

DLSS 4 4X e modello Transformer nelle impostazioni di Cyberpunk 2077 - Clicca per ingrandire

L'impostazione 2X equivale alla Frame Generation, inoltre è possibile impostare il vecchio modello CNN per la qualità d'immagine - Clicca per ingrandire

Prima di occuparci dei test è necessario fare un preambolo per spiegare cosa vedranno i videogiocatori con una RTX 5000 nei giochi che implementano nativamente il DLSS 4. La voce DLSS Multi Frame Generation può essere impostata su 2X, 3X o 4X: nel primo caso viene renderizzato un solo frame con l'IA, il che equivale al DLSS 3/3.5, nel secondo 2 frame con l'IA e nel terzo 3 frame con l'IA. È anche possibile impostare il tipo di modello, se CNN o Transformer. Quest'ultimo è quello nuovo e che abbiamo scelto per la prova.

NVIDIA afferma che vedremo in totale 75 giochi e applicazioni con Multi Frame Generation al debutto della serie RTX 5000. Oltre alle integrazioni native, infatti, NVIDIA offre la possibilità di forzare Multi Frame Generation tramite NVIDIA App, il nuovo centro di controllo delle GPU GeForce lanciato ufficialmente verso la fine dello scorso anno, in quei titoli che supportano la Frame Generation. Ciò è possibile solo con le GPU della serie RTX 5000, ma senza dubbio è un'opzione che facilita la diffusione della Multi Frame Generation, non dovendo necessariamente attendere l'integrazione nei giochi ma solo che NVIDIA sblocchi il supporto su NVIDIA App.

Abbiamo avuto la possibilità di provare a una versione ad hoc di Cyberpunk 2077 dotata del supporto al DLSS 4. I test sono stati svolti in 4K con impostazione RT Overdrive, meglio noto anche come path tracing o full ray tracing.

Usando il benchmark integrato, con il DLSS 3, la GeForce RTX 5000 ha raggiunto 135 fps, sicuramente un buon dato, ma il DLSS 4 ha sbloccato molte più prestazioni: con il DLSS 4 3X abbiamo registrato 195 fps, con quello 4X ben 248 fps. Il confronto tra la migliore prestazione della RTX 4090 e quella della GeForce RTX 5090 ci mostra un boost del 136%.

Il test è stato svolto con l'impostazione del DLSS "Bilanciato", il che significa che le modalità Performance e Ultra Performance sono in grado di restituire prestazioni persino superiori. Abbiamo effettuato alcune prove esplorative con tali impostazioni, registrando 287 fps in Performance e 371 fps in Ultra Performance, con opzione 4X in entrambi i casi. L'importanza delle tecnologie di Frame Generation si vede nel confronto con la modalità nativa. Nel mentre, l'attuale ammiraglia di AMD si dimostra in grandissima difficoltà con Path Tracing di Cyberpunk 2007, incapace di raggiungere i 60 fps in 4K, anche con l'attivazione di FSR 3 (impostazione Bilanciata).

La seconda prova ha coinvolto Alan Wake 2, anche in questo caso testato con una versione di prova a cui Remedy e NVIDIA ci hanno dato accesso. La build implementa anche RTX Mega Geometry, soluzione di cui abbiamo parlato nel precedente articolo e che aiuta a ridurre il carico su CPU e GPU, e l'uso della VRAM in contesti ray tracing. Non solo, migliora la qualità dell'immagine in quanto tutti i dettagli ray tracing sono aggiornati ogni frame, restituendo meno artefatti. La tecnologia RTX Mega Geometry è compatibile con tutte le GPU NVIDIA GeForce RTX.

Abbiamo usato le massime impostazioni possibili, tra cui la nuova impostazione Ultra del ray tracing e il nuovo modello Transformer per DLSS Super Resolution e DLSS Ray Reconstruction. Il nuovo livello qualitativo Ultra del ray tracing è compatibile solo con le GPU RTX con DLSS Super Resolution attivato; quindi, è per questo motivo che non vedete la Radeon RX 7900 XTX in questo grafico.

Poiché il DLSS non è disattivabile in Alan Wake 2, abbiamo svolto prove in modalità DLSS 2, DLSS 3 e DLSS 4 con la GeForce RTX 5090 e la RTX 4090. Si può vedere come il DLSS 4 in modalità Bilanciata e impostazioni 3X e 4X permetta alla nuova ammiraglia di superare agevolmente i 100 fps, mentre la RTX 4090 si fermi a 75 fps con il DLSS 3. Il solo upscaling (DLSS 2 o Super Resolution) non basta ad avere un frame rate adeguato nel titolo di Remedy alle impostazioni massime. Anche in questo caso il gap tra la RTX 4090 con DLSS 3 e la GeForce RTX 5090 con DLSS 4 4X si avvicina al 150%.

Abbiamo provato anche una build riservata di Star Wars Outlaws con supporto al DLSS 4. Nella scena che abbiamo testato è emerso un vantaggio per la GeForce RTX 5090 del 19% circa rispetto alla RTX 4090 nella configurazione DLSS 3. Attivando il DLSS 4, la GeForce RTX 5090 ha totalizzato 228 fps medi, il che significa un +113% rispetto alla migliore prestazione della RTX 4090.

Stalker 2 prevede un'implementazione software del ray tracing, tramite la tecnologia Lumen di Unreal Engine 5. In pratica, la GPU gestisce il ray tracing attraverso gli asynchronous compute shader e non sfruttando le unità RT core. In questo gioco la GeForce RTX 5090 non può contare sul DLSS 4, di conseguenza con il DLSS 3 ottiene 176 fps medi, segnando un +22% rispetto alla RTX 4090. Il passo avanti in modalità nativa, ovvero senza upscaling o Frame Generation, è del 30%.

Latenze, l'impatto del DLSS 4

NVIDIA ha annunciato l'arrivo di Reflex 2, ma al momento non è possibile testarlo. Reflex è una tecnologia imprescindibile per un frame rate fluido e latenze sotto controllo, specie con le tecnologie di Frame Generation. Abbiamo fatto qualche prova per vedere l'impatto della Multi Frame Gen sulla latenza utilizzando Cyberpunk 2077 con impostazione RT Overdive, ovvero con path tracing attivo, a risoluzione 4K.

Giocare in 4K nativo con path tracing restituisce un frame rate intorno ai 34 fps, piuttosto basso, con una latenza senza Reflex di ben 134 millisecondi, decisamente elevata e sintomatica di un'esperienza di gioco non fluida. Attivando Reflex si osserva un netto miglioramento, con la latenza che praticamente si dimezza a 59 millisecondi, pur con lo stesso frame rate.

Attivando il DLSS 2 (DLSS Super Resolution), e mantenendo Reflex on, la latenza si mantiene intorno a 30 millisecondi, ma il frame rate sale a circa 88 fps. L'esperienza è nettamente più piacevole. Aggiungendo al mix anche la Frame Generation (DLSS 3/3.5) la latenza si attesta a 34 millisecondi, con un frame rate che nella scena provata (differente dal benchmark integrato usato per i test prestazionali) sale a 155 fps.

Attivando il DLSS 4, ovvero la Multi Frame Generation a impostazioni 3X e 4X, la latenza si è attestata rispettivamente a 37 e 40 millisecondi, con un frame rate medio di 219 e 270 fps. Secondo NVIDIA, è possibile moltiplicare le prestazioni mantenendo una latenza quasi dimezzata rispetto al rendering nativo senza DLSS. Tuttavia, nel nostro caso abbiamo osservato una riduzione leggermente inferiore.

In attesa di Reflex 2, le tecnologie di DLSS mantengono la latenza intorno ai 30-40 millisecondi moltiplicando il frame rate, a fronte invece di un'esperienza non accettabile in modalità nativa.

NVIDIA passa da CNN a Transformer: come cambia la qualità dell'immagine?

Il DLSS 4 di NVIDIA introduce un'importante evoluzione architetturale per DLSS Ray Reconstruction, DLSS Super Resolution e DLAA, segnando il primo utilizzo in tempo reale di un modello Transformer nel settore della grafica.

Finora, il DLSS si è basato su reti neurali convoluzionali (CNN) per generare nuovi pixel, analizzando il contesto locale e monitorando i cambiamenti in aree specifiche attraverso fotogrammi successivi. Dopo sei anni di continui progressi, l'architettura CNN ha raggiunto i suoi limiti.

Clicca per ingrandire

Il nuovo modello che debutta con il DLSS 4 adotta un Transformer di visione, che utilizza operazioni di autoattenzione per valutare l'importanza relativa di ciascun pixel sull'intero fotogramma e su più fotogrammi. Grazie al doppio dei parametri rispetto al modello CNN, il nuovo modello Transformer offre una comprensione più approfondita delle scene, generando pixel con maggiore stabilità, una riduzione significativa del ghosting, dettagli più definiti in movimento e bordi più omogenei.

In contenuti con ray tracing intensivo, il nuovo modello per Ray Reconstruction garantisce un miglioramento della qualità dell'immagine, in particolare in scene con condizioni di illuminazione complesse.

Il trasformatore per Super Resolution, anch'esso parte del nuovo approccio, sarà inizialmente rilasciato in versione beta per consentire agli utenti di testare i miglioramenti e fornire feedback. I benefici indicati dall'azienda includono una migliore stabilità temporale, una riduzione del ghosting e un maggiore dettaglio nelle scene in movimento.

NVIDIA è sicura che siamo solo all'inizio e la nuova architettura Transformer consentirà anni di miglioramenti continui nella qualità dell'immagine, come è stato per l'architettura CNN negli ultimi sei anni.

Clicca per ingrandire

Una buona notizia è che i modelli Transformer, come mostrato nella tabella sopra, sono compatibili anche con le schede GeForce RTX delle serie 2000, 3000, 4000 e 5000. Al fine di verificare le dichiarazioni di NVIDIA abbiamo preso qualche screenshot da Cyberpunk 2077 e Alan Wake 2.

CNN a sinistra, Transformer a destra

Nel primo confronto emerge come il nuovo modello Transformer assicuri ombre e illuminazioni più precise ed efficaci. L'ombra proiettata da questa inferriata in Cyberpunk 2077, nello specifico, è più marcata e decisa, oltre che più definita, e l'immagine complessiva appare più luminosa, con una Ray Reconstruction più efficace e raggi di luce più realistici. Al netto, ovviamente, del fatto che abbiamo ingrandito notevolmente le immagini (del 300%, partendo dalla risoluzione nativa in 4K) e che parliamo pur sempre di fermo immagine, mentre in movimento è molto più difficile rinvenire le differenze.

CNN a sinistra, Transformer a destra

In Alan Wake 2, invece, vediamo come con Transformer il volto di questo personaggio secondario sia più realistico e definito, mentre il logo sulla sua divisa è più facilmente leggibile. Sottolineiamo il fatto che stiamo usando le tecnologie CNN e Transformer nelle due impostazioni migliori dal punto di vista della qualità, con il preset di DLSS Performance e Frame Generation impostata su 4X. In altri termini, nelle condizioni ideali sia CNN che il modello Transformer raggiungono risultati ormai pressoché impeccabili. Abbiamo poi notato che il vantaggio qualitativo non è appannaggio di una tecnica piuttosto che l'altra in maniera uniforme, visto che potrebbero esserci aree dell'immagine in cui prevale l'una e aree della stessa immagine in cui prevale l'altra. Ciò avviene perché gli algoritmi di upscaling analizzano dati da diversi punti delle immagini per applicare le tecniche di miglioramento della qualità.

CNN a sinistra, Transformer a destra

Torniamo in Cyberpunk 2077, per verificare come in condizioni di scarsa illuminazione (l'ambientazione è notturna) e con tante fonti di luce in gioco contemporaneamente il modello Transformer faccia un lavoro migliore per aumentare la definizione degli oggetti particolarmente distanti dal punto di osservazione. Si notino, in particolare le linee orizzontali e gli ideogrammi sulle lanterne per scorgere le differenze in definizione.

A primo impatto, il passaggio da CNN a Transformer mostra del potenziale, ma riteniamo ci sia margine per ulteriori migliorie. Siamo all'inizio di un cambiamento, e già il fatto che non ci siano grandi pecche è importante. NVIDIA sta andando a limare proprio i dettagli su cui finora ha faticato a intervenire. Durante il gameplay è difficile osservare i cambiamenti, specie ad alta risoluzione, e dipende anche dal tipo di gioco e da cosa si osserva.

Riteniamo fondamentale che NVIDIA continui a focalizzarsi sia sugli aspetti prestazionali che qualitativi. Non vediamo l'ora di scoprire i progressi che l'architettura Transformer potrà raggiungere nei prossimi sei anni.

GeForce RTX 5090, prestazioni con i software per la creazione dei contenuti

Abbiamo eseguito alcuni test con software dedicati alla creazione di contenuti. Siamo partiti da Open Data Blender Benchmark 4.3.0, i cui punteggi si riferiscono alla capacità dell'hardware di elaborare i sample durante il rendering di Cycles. In pratica, la quantità di sample al minuto che una GPU può elaborare: più alto è il numero, meglio è.

In questo test la GeForce RTX 5090 si è dimostrata mediamente più veloce della RTX 4090 del 37% e del 170% rispetto alla GeForce RTX 3090. Un balzo del 416%, sempre di media, rispetto alla prima top di gamma della generazione GeForce RTX: un risultato assolutamente incredibile e che dà l'idea di quanto NVIDIA abbia riposto attenzione su questo settore negli ultimi anni.

Il secondo test è V-Ray 6 GPU, nell'accezione RTX. Non abbiamo selezionato CUDA perché NVIDIA ci ha avvisati dell'esistenza di un bug con questa modalità di test che avrebbe compromesso le prestazioni della GeForce RTX 5090. Il test RTX utilizza gli RT core delle GPU NVIDIA e non è compatibile con i chip di altri produttori.

In questo contesto osserviamo un boost sulla RTX 4090 del 37% per la GeForce RTX 5090. Inoltre, la nuova top di gamma stacca del 191% la RTX 3090.

Procediamo con DaVinci Resolve Studio 19, utilizzando la versione estesa del benchmark di settore PugetBench Workstations for Creators. Quest'ultimo svolge 49 test che vanno dall'encoding al rendering, dall'applicazione di effetti sfruttando la GPU all'uso dell'IA. Insomma, una gamma completa ed estesa che permette di avere un quadro completo di come una GPU si comporta in produttività.

In tale contesto la GeForce RTX 5090 ha totalizzato un punteggio del 21% maggiore rispetto alla RTX 4090, del 36% rispetto alla RTX 3090 e del 77% rispetto alla RTX 2080 Ti. A questi test si aggiunge l'implementazione della Frame Generation / Multi Frame Generation in software come D5 Render, che consentirà di accelerare la viewport sia su schede RTX 4000 che 5000.

Infine, abbiamo effettuato Procyon AI Text Generation di UL. Il test offre un modo semplice per testare le prestazioni delle GPU con più modelli di IA LLM.

In questo scenario la GeForce RTX 5090 stacca la GeForce RTX 4090 del 17% nel test con Phi 3.5 mini, del 27% con Mistral 7B, del 32% con il modello Llama 3.1 8B e, infine, del 36% con Llama 2 13B. Rispetto alla RTX 3090 il vantaggio della RTX 5090 va dal 60 al 100%, mentre nel confronto con AMD, la GeForce RTX 4090 è dal 166 al 188% più veloce. Da non dimenticare, parlando di IA, che le nuove unità Tensor core di Blackwell sono le prime a supportare il formato FP4, fondamentale per incrementare le prestazioni nella generazione di immagini per modelli come FLUX - fino a 2 volte. Questo è possibile perché il nuovo formato dati permette ai modelli di usare meno VRAM e quindi alla GPU di gestire anche quelli di cui prima non poteva occuparsi.

Consumi e temperature

La GeForce RTX 5090 Founders Edition ha un dissipatore molto più compatto e un TGP molto più alto della GeForce RTX 4090 FE. Il dissipatore dual slot e il TGP di 575 Watt sorprendono se confrontati con l'imponenza della GeForce RTX 4090 FE e al suo TGP di 450 Watt, quindi non resta che fare alcune prove per vedere come si comporta il rinnovato sistema di raffreddamento e quanto richiede la GPU sotto carico.

Per quanto riguarda il consumo in idle, ovvero in stato di non attività, la scheda di NVIDIA si è collocata intorno ai 20-30 watt in media. La GPU e la memoria tendono a scendere rispettivamente fino a 180 MHz e 50 MHz in assenza di carico, ma basta una leggera attività per registrare picchi di consumo e cambiamenti di frequenza immediati.

Un comportamento che NVIDIA aveva anticipato parlandoci dell'architettura Blackwell e che è votato a una risposta rapida sia all'entrata nei carichi che all'uscita dagli stessi per risparmiare energia. Pertanto, i 20-30 W non sono un valore fisso, ma possono variare.

Passando invece al gaming, abbiamo giocato per diversi minuti a Cyberpunk 2077 in 4K con path tracing e DLSS 4 4X, in path tracing con DLSS 3 e infine in 4K nativo, con impostazione ray tracing Ultra.

Nel caso "DLSS 4 4X", la GPU della GeForce RTX 5090 si è spinta fino a circa 2700 MHz, raggiungendo una temperatura massima di 74 °C su banchetto di prova. Le ventole, operando a quasi 1500 RPM, si sono fatte sentire ma non eccessivamente; la rumorosità la definiremmo nella media. Per quanto riguarda il consumo, abbiamo rilevato un valore medio in-game di circa 460 Watt.

Impostando il DLSS 3, sempre con path tracing, abbiamo rilevato un comportamento del tutto simile a quanto descritto poc'anzi, segno che la Multi Frame Generation non incide più della Frame Generation nel contenere i consumi. Questo, almeno, vale per la GeForce RTX 5090, vedremo se con altre schede della nuova gamma vi saranno differenze. La GeForce RTX 4090 si ferma a 380 watt circa di media.

Impostando il ray tracing su Ultra in 4K, senza tecnologie di upscaling attive, il consumo medio è balzato a 544 Watt. La GeForce RTX 4090, invece, si è fermata a 415 watt di media. La GPU Blackwell si è spinta fino a frequenze intorno ai 2600 MHz, una temperatura di 75 °C e ventole fino a 1600 RPM. In sintesi, il DLSS si dimostra fondamentale per ridurre i consumi, incrementare le prestazioni e diminuire la rumorosità, seppur lievemente.

Chi acquista una GeForce RTX 5090 non può prescindere da un buon alimentatore da almeno 1000 Watt. D'altronde, con una media intorno ai 550 Watt in alcuni scenari, si raggiungono facilmente picchi vicini o superiori ai 600 Watt.

Conclusioni

La GeForce RTX 5090 è la scheda video più veloce del pianeta. Si tratta di un'affermazione prevedibile, già nota prima del debutto, considerando che AMD ha scelto di non competere direttamente. La vera domanda è: il salto tra la RTX 4090 e la RTX 5090 è stato all'altezza delle aspettative? In virtù di diverse considerazioni, possiamo dire di sì.

Dal punto di vista delle risorse, la GeForce RTX 5090 offre il 33% in più di CUDA core, RT core e Tensor core. Incremento simile per il bus e la capacità di memoria. In rasterizzazione, dove non entrano in gioco upscaling e Frame Generation, il boost prestazionale è del 30% circa. Il prezzo della RTX 5090 è superiore del 20% rispetto a quello di lancio della RTX 4090 (1979€) e il TGP è il 27% superiore, anche se i consumi effettivi mostrano un gap minore.

Tutto questo è stato ottenuto con un processo produttivo praticamente identico a quello precedente. D'altronde il costo dei wafer di GPU è sempre più alto e NVIDIA, se deve scegliere di puntare su un processo migliore e più costoso, lo fa nell'ambito degli acceleratori per datacenter dove margina decisamente di più.


Verrebbe da pensare che l'architettura non abbia compiuto grandi passi avanti, ma bisogna essere consci di due aspetti. Il primo è che non abbiamo potuto testare le prestazioni della scheda con un'importante novità che segnerà i giochi del futuro, i neural shader. Il secondo è che il focus di NVIDIA non è più sulla rasterizzazione, ma sul ray / path tracing e sull'IA. Non è con la forza bruta, o almeno solo in minima parte, che l'azienda punta a rendere gestibili mondi complessi ad altissima risoluzione con path tracing.

In poche parole, tutto passa per il nuovo DLSS 4. Giocare a 4K in path tracing a Cyberpunk 2077 o Star Wars Outlaws con centinaia di fps è una gioia per gli occhi e il gameplay. La Multi Frame Generation apre una nuova dimensione di gioco prima preclusa, moltiplicando le performance della scheda garantendo un'ottima qualità grafica. Questo quantomeno in 4K o superiore, naturale territorio d'azione della GeForce RTX 5090.

L'IA è qualcosa che per molti è intangibile, quasi esoterica, ma che l'industria - non solo NVIDIA - ha abbracciato con forza perché permette miglioramenti che tramite il mero silicio, oggi, non sono raggiungibili. Occorre accettare che la diatriba sui 'fake frame' – erano forse reali in passato? – rappresenta ormai una battaglia di retroguardia priva di senso. Quel che conta è l'esperienza finale, e la RTX 5090 colpisce ampiamente nel segno.

La consiglieremmo? Ci sono delle puntualizzazioni da fare. La Founders Edition è venduta a poco più di 2300€, ma le versioni custom arriveranno sul mercato spesso a prezzi ben superiori.

Il prezzo è esagerato e non ci sentiamo, in tutta coscienza, di consigliare la scheda a un mero appassionato di videogiochi, pur rimanendo entusiasti delle prestazioni complessive.

Anche perché per giocarci al meglio è necessario abbinarci un sistema, monitor incluso, di pari livello per un esborso di svariate migliaia di euro. Certo, fermo restando che chi ha denaro in abbondanza è libero di fare ciò che vuole, a ognuno piena libertà di usare i soldi come vuole. Attendiamo di testare la GeForce RTX 5080 (a partire da 1199€), il cui prezzo, seppur elevato, rientra in un range accettabile per un videogiocatore.

Diverso invece è l'investimento per chi lavora con il PC, ossia chi usa la GPU per velocizzare e migliorare la creazione di progetti. Le capacità velocistiche e l'integrazione del DLSS 4 in diversi software per migliorare la viewport, nonché le funzionalità di IA, potrebbero rendere la GeForce RTX 5090 un acquisto costoso ma in grado di ripagarsi con il tempo.

La GeForce RTX 5090 rappresenta il meglio del settore, e l'eccellenza si paga sempre cara. NVIDIA può permettersi di imporre questi prezzi, vista l'assenza di concorrenza in quella fascia di mercato. Non è un caso che abbia deciso di focalizzare lì l'unico aumento di prezzo per questa generazione, mantenendo invece prezzi più adeguati negli altri segmenti. Insomma, prendere o lasciare.

  • Articoli Correlati
  • NVIDIA Blackwell: tutto quello che devi sapere sulle GeForce RTX 5000 NVIDIA Blackwell: tutto quello che devi sapere sulle GeForce RTX 5000 DLSS4, Transformer, Neural Shader e molto altro. Sono queste le parole chiave per comprendere le novità delle nuove GeForce RTX 5000 di NVIDIA, basate su architettura Blackwell. Al CES 2025 si è tenuto un Editor's Day a cui abbiamo partecipato: ecco tutto quello che NVIDIA ha condiviso con noi e che dovete sapere per prepararvi al debutto delle nuove GPU.
84 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
al13523 Gennaio 2025, 15:22 #1
LO SENTITE QUESTO RUMORE? E' LA SCIMMIA RAGAZZI
Mars9523 Gennaio 2025, 15:25 #2
Mi sembra però che al di la delle innovazioni software e della GPU più grossa come architettura non porti alcun vantaggio in performance.
Cioè va di più esattamente quanto consuma di più.
StylezZz`23 Gennaio 2025, 15:28 #3
Originariamente inviato da: al135
LO SENTITE QUESTO RUMORE? E' LA SCIMMIA RAGAZZI


No, sono le ventole
Max Power23 Gennaio 2025, 15:28 #4
Prezzo
leddlazarus23 Gennaio 2025, 15:30 #5
si sta scavando nel fondo del barile per quanto riguarda le prestazioni pure.
l'unica cosa che aumentano sensibilmente sono i prezzi ed i consumi.

solo per pochi.
al13523 Gennaio 2025, 15:33 #6
credo che per l'utente finale avranno senso solo le 5070 e 5080.. 5090 è proprio un'altra categoria/fascia di prezzo
pengfei23 Gennaio 2025, 15:39 #7
Inizia ad essere ENORME la differenza tra DLSS e nativo, non sono contrario a prescindere, lo considero un'ottima idea se il risultato finale non presenta artefatti o problemi di latenza come sembra
bobby1023 Gennaio 2025, 15:41 #8
Originariamente inviato da: leddlazarus
si sta scavando nel fondo del barile per quanto riguarda le prestazioni pure.
l'unica cosa che aumentano sensibilmente sono i prezzi ed i consumi.

solo per pochi.


Per me tutti i possessori di 4090 faranno il passaggio perchè dubito fortemente resteranno per 4 anni con la stessa vga inoltre nell 'usato valgono ancora parecchio.
Il passaggio ad una FE non sarebbe così costoso.. no comment invece per i prezzi dei modelli che usciranno più avanti
carloUba23 Gennaio 2025, 15:42 #9
Per la cronaca, la rumorosità è la stessa IDENTICA della 4090FE.
Se poi ci sono state delle 4090 più silenziose della FE ok, ma il confronto posso farlo solo tra FE.
jepessen23 Gennaio 2025, 15:44 #10
Possiamo dire che allo stato attuale e' una scheda totalmente inutile?

E' piu' performante in posti dove non e' assolutamente rilevante, i miglioramenti grafici si fanno fatica a notare se non mettiamo gli screenshot direttamente a confronto, e costa uno sproposito.

Puo' avere senso in ambito professionale/GPUComputing (manco per 3D dove altre schede bastano e avanzano), per il resto la potenza in piu' e totalmente inifluente allo stato attuale e nel breve futuro...

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^