NVIDIA Blackwell: tutto quello che devi sapere sulle GeForce RTX 5000

DLSS4, Transformer, Neural Shader e molto altro. Sono queste le parole chiave per comprendere le novità delle nuove GeForce RTX 5000 di NVIDIA, basate su architettura Blackwell. Al CES 2025 si è tenuto un Editor's Day a cui abbiamo partecipato: ecco tutto quello che NVIDIA ha condiviso con noi e che dovete sapere per prepararvi al debutto delle nuove GPU.
di Manolo De Agostini pubblicato il 15 Gennaio 2025 nel canale Schede VideoBlackwellGeForceNVIDIA
NVIDIA ha annunciato nei giorni scorsi le prime schede video della famiglia GeForce RTX 5000, nome in codice Blackwell, durante il CES 2025 di Las Vegas. Sono molte le novità della nuova gamma di GPU, capitanata dalla GeForce RTX 5090, che dimostrano come il futuro sia sempre più votato verso l'uso intensivo dell'IA, in una commistione tra hardware e software che rende il rendering a "potenza bruta" sempre più marginale, con il fine ultimo di raggiungere il fotorealismo a colpi di ray / path tracing e geometrie sempre più complesse.
In questo articolo vi diamo conto delle novità di queste nuove GPU di NVIDIA, alcune pronte all'uso, altre in divenire, ma la cui presenza in Blackwell rappresenta un necessario punto di partenza per continuare a innovare e offrire un'esperienza di gioco sempre più evoluta.
Blackwell, la nuova architettura di NVIDIA introduce i neural shader
Da un punto di vista dell'architettura, Blackwell introduce miglioramenti a ogni livello destinati a fare anche da fondamenta alle prossime generazioni delle GPU di NVIDIA. La prima grande novità prende il nome di RTX Neural Shader. Per spiegare questo termine è utile fare un breve preambolo.
Le tappe che ci hanno portato ai Neural Shader - Clicca per ingrandire
Gli shader programmabili sono nati nel 2001 con le GPU della famiglia GeForce 3, dopodiché il settore ha visto varie evoluzioni che ci hanno portato all'attuale stato dell'arte: nel 2003, con le DirectX 9, l'industria ha introdotto HLSL, High Level Shading Language, il linguaggio C-like ad alto livello dedicato agli shader programmabili in DirectX; poi, nel 2006 con le DX10, sono arrivati i Geometry Shader per una gestione più evoluta e unificata della pipeline grafica rispetto a pixel e vertex shader separati.
Nel 2009 è stata la volta dei Compute Shader, necessari per permette alle GPU di gestire compiti general purpose (DirectX 11). Le DirectX 12 hanno poi introdotto la programmazione a basso livello, permettendo sfruttare in modo più diretto le risorse di GPU e le CPU, con un conseguente incremento delle prestazioni. Infine, nel 2018, abbiamo assistito all'ultimo atto, almeno fino a oggi, chiamato DirectX Raytracing (DXR), con l'arrivo del rendering ibrido.
A distanza di sette anni NVIDIA è pronta al prossimo balzo evolutivo con gli RTX Neural Shader. L'IA entra negli shader programmabili, per mezzo di piccole reti neurali, andando sostanzialmente a reinventare come gli shader vengono programmati.
L'IA entra negli shader programmabili - Clicca per ingrandire
L'impatto di questa innovazione coinvolge i vari aspetti del rendering dell'immagine, dalla compressione delle texture a una riproduzione fedele dei materiali che compongono le diverse superfici. Gli RTX Neural Shader rappresentano il prossimo passo nell'evoluzione grafica e, tramite appositi SDK e l'implementazione dei Cooperative Vectors nelle DirectX di Microsoft, gli sviluppatori potranno accedervi per sviluppare titoli graficamente più belli, ma soprattutto facendo un miglior uso delle risorse, sia di calcolo che di memoria.
RTX Neural Shader, con il rendering neurale innovazioni a tutto campo
NVIDIA ha spiegato che sono tre le applicazioni principali di RTX Neural Shader: RTX Neural Texture Compression, RTX Neural Materials e Neural Radiance Cache (NRC).
RTX Neural Texture Compression si avvale dell'intelligenza artificiale per comprimere migliaia di texture il più rapidamente possibile, consentendo - a parità di qualità visiva - di risparmiare fino a 7 volte più VRAM o RAM rispetto alle tradizionali texture compresse a blocchi.
Con RTX Neural Materials texture migliori che occupano meno VRAM - Clicca per ingrandire
Con RTX Neural Materials, l'intelligenza artificiale viene applicata alla compressione del codice shader tipicamente legato ai materiali complessi, composti da più strati, come la porcellana o la seta. NVIDIA ha ravvisato che l'elaborazione dei materiali con RTX Neural Materials è fino a 5 volte più veloce, un miglioramento che rende possibile il rendering in qualità cinematografica mantenendo un frame rate in tempo reale adeguato al gaming. In un esempio mostrato all'Editor's Day, la compressione neurale ha permesso di avere texture di altissima qualità con un'occupazione della memoria pari a soli 16 MB, in netto calo ai 47 MB richiesti dai metodi standard.
RTX Neural Radiance Cache per una gestione efficiente del ray tracing - Clicca per ingrandire
Infine, con RTX Neural Radiance Cache, l'IA viene applicata per apprendere l'illuminazione indiretta a rimbalzo multiplo e dedurre una quantità infinita di rimbalzi dopo i primi due rimbalzi. Il risultato è una migliore illuminazione in termini di qualità e, soprattutto, prestazioni.
All'interno del cosiddetto RTX Kit, NVIDIA offre anche altre soluzioni, a partire da RTX Neural Faces. La nuova tecnologia neurale nasce dall'esigenza di migliorare la riproduzione dei volti, un punto dirimente dell'evoluzione grafica, in quanto l'essere umano è naturalmente incline a notare le più piccole differenze rispetto alla realtà. L'IA generativa è, secondo NVIDIA, il modo per consentirci di interagire con personaggi con volti sempre più reali.
Generare i volti con l'IA generativa consente risultati più reali - Clicca per ingrandire
Anziché puntare sul tradizionale rendering "a forza bruta", RTX Neural Faces raccoglie input da un semplice volto rasterizzato e i dati di posa 3D, applicando un modello di IA generativa in tempo reale per dedurre un volto più naturale. Il volto generato viene addestrato sulla base di migliaia di immagini generate offline di quel volto da ogni angolazione, in diverse condizioni di illuminazione, emotività e occlusione. L'addestramento può avvenire mediante immagini reali o generate, con varianti create usando un modello diffuso. Il modello addestrato viene poi ottimizzato da NVIDIA TensorRT per dedurre il volto in tempo reale.
RTX Skin, la pelle ha un aspetto più naturale a contatto con la luce - Clicca per ingrandire
Vi sono poi, all'interno dell'SDK RTX Character Rendering, soluzioni per una riproduzione migliore e più realistica di pelle e capelli. I metodi di rendering tradizionali non simulano accuratamente il modo in cui la luce interagisce con la pelle umana, dando origine a un aspetto "plasticoso". Il Subsurface Scattering (SSS) simula il modo in cui la luce penetra sotto la superficie dei materiali traslucidi e si disperde internamente, creando un aspetto più morbido e naturale.
Allo stesso modo, anche l'aspetto e la simulazione accurata dei capelli ha rappresentato una sfida finora. Le tecniche di capelli più avanzate richiedono fino a 30 triangoli per ciocca di capelli e 4 milioni di triangoli per un'intera chioma, il che rende le costruzioni di BVH ray-tracing deleterie dal punto di vista prestazionale.
Capelli e pellicce riprodotte più fedelmente, usando meno memoria - Clicca per ingrandire
Per prendere di petto il problema NVIDIA ha creato la nuova primitiva Linear-Swept Spheres (LSS) accelerata dalla GPU che riduce la quantità di geometria necessaria per il rendering delle ciocche di capelli, usando sfere invece di triangoli per ottenere un adattamento più accurato delle forme dei capelli. In estrema sintesi, LSS permette di realizzare capelli in ray-tracing con prestazioni migliori e un'occupazione della memoria ridotta. Tutto quello di cui abbiamo parlato è stato condensato da NVIDIA nella tech demo Zorah, di cui potete vedere il video:
RTX Mega Geometry per ambienti open world vasti e dettagliati
La complessità dei videogiochi è incredibilmente aumentata nel corso degli ultimi decenni: Half-Life 2 contava da 50.000 a 1 milione di triangoli per scena, mentre Cyberpunk 2077 va da 10 a 50 milioni di triangoli. L'evoluzione futura ci porterà ad avere oltre 500 milioni di triangoli per scena, ma le tecnologie odierne non permettono di gestire così tanta complessità in ray / path tracing. La risposta di NVIDIA a questo problema prende il nome di RTX Mega Geometry.
Videogiochi sempre più complessi, con Cyberpunk 2077 non abbiamo visto ancora niente - Clicca per ingrandire
L'aumento della complessità geometrica impone un costo elevato per la costruzione dei BVH per ogni frame e livello di dettaglio, con il serio rischio di restituire prestazioni inadeguate al gaming in tempo reale.
RTX Mega Geometry aggiorna in modo intelligente i cluster di triangoli in batch sulla GPU, riducendo l'overhead della CPU e aumentando le prestazioni e la qualità dell'immagine nelle scene in ray-tracing. Accelerando la costruzione dei BVH, RTX Mega Geometry consente di applicare il ray-tracing a un numero di triangoli fino a 100 volte superiore rispetto allo standard attuale.
Blackwell: Streaming Multiprocessor, Tensor core di 5a generazione e RT core di 4a generazione
Nelle GPU Ada Lovelace ogni SM ospita quattro sub-core, ciascuno dotato di 128 unità FP32 e 64 unità INT32, quest'ultime separate in un secondo blocco come si vede nella slide. Ogni SM, di conseguenza, ha un totale di 512 unità FP32 e 256 unità INT32 per un totale di 768 unità. Poiché le GPU Ada prevedono 24 unità SM (2 per GPC), si tratta di 12288 unità FP32 e 6144 unità INT32 per un totale di 18432 core in AD102.
Per quanto riguarda Blackwell, vediamo che è scomparsa questa separazione tra core FP32 e INT32. Una GPU GB202 completa, quella a bordo della RTX 5090 per intenderci (dove però è leggermente castrata), abbiamo quindi 128 unità FP32 e altrettante INT32. Dato che la GPU prevede al suo massimo 192 SM, otteniamo un totale di 24576 CUDA core, superiori ai 18432 CUDA core del precedente AD102.
Novità all'interno dello Streaming Multiprocesor - Clicca per ingrandire
I Tensor core di quinta generazione, centrali per un funzionamento ottimale del DLSS 4 con Multi Frame Generation e l'IA generativa in generale, hanno subito un aggiornamento che secondo NVIDIA restituisce prestazioni 2,5 volte superiori rispetto alla quarta generazione integrata a bordo delle GPU Ada Lovelace. Un update necessario, in quanto la GPU deve gestire cinque modelli di IA in tempo reale con il DLSS 4 per ogni frame renderizzato in pochissimi millisecondi.
Il nuovo Tensor core supporta il formato FP4 per gestire modelli con meno memoria - Clicca per ingrandire
Clicca per ingrandire
Clicca per ingrandire
Le nuove unità Tensor core sono le prime a supportare il formato FP4, fondamentale per incrementare le prestazioni nella generazione di immagini per modelli come FLUX fino a 2 volte. Questo è possibile perché il nuovo formato dati permette ai modelli di usare meno VRAM e quindi alla GPU di gestire anche quelli di cui prima non poteva occuparsi. FP4 potrebbe avere un impatto in termini di fedeltà grafica, almeno inizialmente, rispetto ai formati FP8 / FP16, ma NVIDIA lo considera un compromesso più che accettabile.
Novità anche per l'RT core, aggiornato per una gestione efficiente del ray tracing - Clicca per ingrandire
Clicca per ingrandire
Per quanto riguarda gli RT core, NVIDIA li ha aggiornati per garantire la possibilità di gestire al meglio la RTX Mega Geometry di cui abbiamo parlato pocanzi. In questo modo NVIDIA conta di ottenere non solo prestazioni nettamente più elevate rispetto ad Ada Lovelace, ma anche una minore occupazione di memoria.
Clicca per ingrandire
Clicca per ingrandire
Con Blackwell, NVIDIA ha anche rinnovato la tecnologia di riordino dei thread, nota come SER (Shader Execution Reordering), migliorandone le prestazioni di due volte. SER migliora l'efficienza nell'esecuzione dei processi, rischedulando al volo i carichi legati allo shading per fare un uso migliore delle risorse della GPU. Inoltre, i progettisti hanno implementato un processore RISC-V chiamato AMP, AI Management Processor, per la gestione efficiente e simultanea di grafica e IA.
DLSS 4 con Multi Frame Generation è la novità delle GeForce RTX 5000
Il DLSS 4, l'ultima versione della tecnologia introdotta da NVIDIA nel 2018, introduce la Multi Frame Generation. Sebbene questa tecnologia sia esclusiva della nuova gamma di GPU Blackwell, ci sono buone notizie anche per i possessori di schede GeForce RTX precedenti.
Multi Frame Generation permette di generare fino a 3 frame - Clicca per ingrandire
DLSS Multi Frame Generation, come lascia intuire il nome stesso, è un'evoluzione della Frame Generation che ha caratterizzato il DLSS 3 e la serie GeForce RTX 4000: laddove il DLSS 3 con Frame Generation è in grado di generare interamente un frame grazie all'IA partendo da un frame renderizzato in modo tradizionale (in realtà di quel frame reale solo un quarto è renderizzato, i tre quarti sono generati dall'IA con DLSS Super Resolution), il nuovo Multi Frame Generation permette di generare interamente fino a tre frame per ogni frame renderizzato in modo tradizionale (anche qui vale quanto detto nella parentesi precedente). In sintesi, di quattro frame, fino a tre sono totalmente creati dall'IA.
Generando tre frame è possibile incrementare le prestazioni in modo netto rispetto alla FG del DLSS 3 - Clicca per ingrandire
Secondo NVIDIA, rispetto al tradizionale rendering "a forza bruta", dove non entra in gioco l'IA e ogni pixel viene calcolato, la Multi Frame Generation e le altre tecnologie sotto il cappello del DLSS permettono di moltiplicare il frame rate fino a 8 volte, consentendo a una GeForce RTX 5090 di gestire giochi come Cyberpunk 2077 o Alan Wake 2 in path tracing (anche detto "full ray tracing") in 4K a ben 240 fps. Inoltre, il frame rate sale del 70% passando da Frame Generation a Multi Frame Generation.
Non solo, il DLSS 4 con Multi Frame Generation permette anche di dimezzare la latenza rispetto al rendering "a forza bruta", garantendo al contempo un'immagine di alta qualità e prestazioni elevate.
Multi Frame Generation: cosa c'è dietro
Per offrire la Frame Generation del DLSS 3, esclusiva delle GeForce RTX 4000, NVIDIA aveva aggiunto alle proprie GPU un Optical Flow Accelerator in hardware, necessario per generare interamente un frame senza stalli.
Clicca per ingrandire
Con il DLSS 4 dotato di Multi Frame Generation NVIDIA è stata costretta a cambiare un po' le cose. Generare più fotogrammi con il metodo precedente, infatti, sarebbe diventato proibitivo dal punto di vista prestazionale, poiché ogni nuovo frame generato avrebbe richiesto l'azione dell'Optical Flow Accelerator e di un modello di intelligenza artificiale.
Così NVIDIA non ha solo migliorato le prestazioni dei Tensor core di quinta generazione di 2,5 volte rispetto a quelli precedenti, ma ha anche operato alcuni cambiamenti fondamentali.
Clicca per ingrandire
NVIDIA ha rimpiazzato l'Optical Flow Accelerator con un modello di IA molto più efficiente, capace di ridurre significativamente i costi legati alla generazione di frame aggiuntivi. Il tutto, lavorando di concerto, permette al DLSS 4 di generare 15 pixel su 16.
Inoltre, il passaggio a un nuovo modello IA per la Frame Generation ha permesso di ottenere il 40% di prestazioni in più con un uso della VRAM del 30% inferiore, e deve essere eseguito solo una volta per ogni frame renderizzato per generare più fotogrammi.
Flip Metering in Blackwell permette di avere un frame time uniforme - Clicca per ingrandire
L'architettura Blackwell prevede, inoltre, una soluzione hardware chiamata Flip Metering che sgrava la CPU dal gestire la cadenza con cui i frame vengono visualizzati. Il cosiddetto "frame pacing" passa quindi al display engine della GPU, che può così occuparsi in modo più preciso delle tempistiche di visualizzazione delle immagini generate rispetto alla CPU, senza far esplodere il frame time. Tutto questo permette alla GPU di far girare 5 modelli di intelligenza artificiale per Super Resolution, Ray Reconstruction e Multi Frame Generation per ogni fotogramma renderizzato, il tutto in pochi millisecondi.
Transformer, il nuovo modello migliora la qualità dell'immagini per tutti i giocatori con GeForce RTX
DLSS 4 segna un importante aggiornamento dell'architettura legata a DLSS Ray Reconstruction, DLSS Super Resolution e DLAA con il primo impiego in tempo reale di un modello Transformer nel settore della grafica.
Il passaggio ai modelli Transformer per incrementare la qualità dell'immagine - Clicca per ingrandire
Le precedenti incarnazioni del DLSS sfruttavano reti neurali convoluzionali (CNN) per generare nuovi pixel, analizzando il contesto localizzato e tracciando i cambiamenti in quelle regioni nel corso di frame successivi. Dopo sei anni di continui miglioramenti, NVIDIA ritiene di aver raggiunto il limite di tale implementazione.
Il nuovo modello Transformer utilizza un trasformatore di visione, consentendo alle operazioni di autoattenzione di valutare l'importanza relativa di ciascun pixel nell'intero frame e su più frame. Impiegando il doppio dei parametri del modello CNN per ottenere una comprensione più approfondita delle scene, il nuovo modello genera pixel che offrono una maggiore stabilità, meno ghosting, maggiori dettagli in movimento e bordi più uniformi.
Clicca per ingrandire
Nei contenuti in cui l'uso del ray tracing è elevato, il nuovo modello Transformer per la ricostruzione dei raggi offre un notevole aumento della qualità dell'immagine, soprattutto nelle scene con difficili condizioni di illuminazione.
Clicca per ingrandire
Anche il modello Transformer per Super Resolution mostra risultati promettenti e sarà rilasciato come beta per consentire agli utenti di esplorare i miglioramenti e fornire feedback prima del rilascio ufficiale. Il modello ha dimostrato una migliore stabilità temporale, un minore ghosting e un maggiore dettaglio in movimento.
Il passaggio a Transformer, secondo NVIDIA, fornirà anni di miglioramenti continui nella qualità dell'immagine, andando a limare sempre di più gli artefatti incontrati con le precedenti incarnazioni del DLSS.
Il nuovo modello anche per gli utenti di GeForce RTX precedenti - Clicca per ingrandire
L'aspetto fondamentale di questo passaggio al modello Transformer è che questo miglioramento qualitativo è fruibile da tutti i possessori delle GPU GeForce RTX, dalla serie 2000 in poi, almeno per quanto riguarda Super Resolution, Ray Recostruction e DLAA - ovviamente l'applicazione alle tecnologie di Frame Gen rimane a vantaggio delle ultime due serie, con la RTX 4000 che oltre alla qualità beneficerà anche di un boost prestazionale e una riduzione nell'uso della VRAM.
Clicca per ingrandire
NVIDIA afferma che vedremo in totale 75 giochi e applicazioni con Multi Frame Generation al debutto della serie RTX 5000. Questo non solo per le implementazioni native, legate all'update dei giochi da parte degli sviluppatori, ma per la possibilità di forzare Multi Frame Generation tramite NVIDIA App, il nuovo centro di controllo delle GPU GeForce lanciato ufficialmente verso la fine dello scorso anno. NVIDIA App verrà aggiornato per offrire alcune opzioni di "Override". In particolare, NVIDIA ha previsto tre opzioni:
- DLSS Override per Frame Generation: abilita Multi Frame Generation sulle GPU GeForce RTX 5000 quando la Frame Generation è attivata nel gioco
- DLSS Override per Modello: abilita l'ultimo modello di Frame Generation per gli utenti di GeForce RTX 5000 e 4000 e il modello Transformer per Super Resolution e Ray Reconstruction per tutti gli utenti GeForce RTX, quando DLSS è attivato nel gioco
- DLSS Override per Super Resolution: imposta la risoluzione di rendering interna per Super Resolution, abilitando la modalità DLAA o Ultra Performance quando la Super Resolution è attivato nel gioco.
Reflex 2, abbattere la latenza nell'epoca del DLSS 4
L'introduzione del DLSS 4 è accompagnata anche da un aggiornamento della tecnologia Reflex, che diventa Reflex 2. Nei giochi competitivi, pochi millisecondi di input lag possono fare la differenza tra una vittoria e una sconfitta, ma le tecnologie di upscaling e Frame Generation applicano un inevitabile penalty sul fronte della latenza.
Frame Warp per tagliare ulteriormente la latenza - Clicca per ingrandire
Così nel 2020 NVIDIA ha risposto alle necessità dei gamer con Reflex, tecnologia capace mediamente di ridurre la latenza del 50% sincronizzando il lavoro di CPU e GPU. Con Reflex 2 la latenza complessiva del PC può essere ridotta fino al 75% rispetto allo scenario in cui Reflex è disabilitato e del 50% rispetto a Reflex 1.
Questo è possibile perché, accanto alla modalità Reflex Low Latency precedentemente introdotta, NVIDIA ha integrato una tecnologia chiamata Frame Warp, capace di ridurre ulteriormente la latenza aggiornando il frame renderizzato in base all'ultimo update utile dell'input del mouse prima che l'immagine venga inviata al display per essere mostrata.
Più in dettaglio, quando un frame viene renderizzato dalla GPU, la CPU calcola la posizione della videocamera per il frame successivo nella pipeline sulla base dell'ultimo input rilevato dal mouse.
La tecnologia Frame Warp campiona una nuova posizione della videocamera dalla CPU e impone al frame di essere renderizzato dalla GPU usando la nuova posizione della videocamera. Questo campionamento, in base al frame rate, può avvenire centinaia di volte al secondo.
L'operazione viene condotta il più tardi possibile, praticamente all'ultimo momento utile prima che il frame renderizzato venga inviato al display, assicurando che l'input più recente del mouse venga riflesso dall'azione a schermo.
Clicca per ingrandire
Frame Warp, in questo processo, sposta molti pixel dell'immagine, creando dei vuoti che vengono colmati da un algoritmo di rendering predittivo che usa dati legati alla videocamera, al colore e alla profondità basati sui frame precedenti per colmare quei vuoti. In pratica avviene il cosiddetto "inpainting", una tecnica nota per l'elaborazione digitale delle immagini che ne ricostruisce le parti.
Secondo NVIDIA, Reflex 2 restituisce anche significativi cali della latenza nei titoli legati alle prestazioni della CPU (CPU-bound). Reflex 2 sarà supportato anzitutto su Valorant e The Finals, per poi arrivare in altri giochi in futuro.
GDDR7, un nuovo standard di memoria al debutto su GeForce RTX 5000
Oltre alle novità dell'architettura Blackwell, le GeForce RTX 5000 segnano il debutto delle memorie GDDR7 (Graphics Double Data Rate 7). Le nuove memorie si distinguono dalle GDDR6 perché adottano l'interfaccia Pulse Amplitude Modulation (PAM) PAM3 anziché PAM4, ossia la modulazione dell'ampiezza dell'impulso passa da quattro a tre livelli per migliorare il rapporto segnale-rumore.
Clicca per ingrandire
PAM3 consente di gestire una maggiore quantità di dati per ciclo di clock e quindi garantire prestazioni più alte, migliorando l'efficienza energetica. Le GeForce RTX 5000 si presentano con memorie GDDR7 fino a 30 Gbps (da più produttori), offrendo il doppio del data rate e dell'efficienza energetica rispetto alle GDDR6.
Blackwell con supporto alla codifica e decodifica 4:2:2
Il Display Engine di Blackwell è stato aggiornato con il supporto DisplayPort 2.1 UHBR20 a 20 Gbps. Inoltre, NVIDIA ha aggiornato la parte di encoder e decoder, rispettivamente giunti alla nona e alla sesta generazione.
Clicca per ingrandire
Oltre al supporto ai formati AV1 UHQ e MV-HEVC, l'architettura Blackwell implementa l'encode / decode 4:2:2 per i video H.264/H.265 4:2:2 a 8 e 10 bit. Concentriamoci su questo aspetto, di particolare interesse per i creator, ma non solo.
Clicca per ingrandire
NVIDIA ha ravvisato un costante aumento delle fotocamere con supporto al sottocampionamento della crominanza 4:2:2 e per questo ha deciso di supportarla sulle nuove GPU, ritenendolo il giusto compromesso tra la dimensione dei file e la preservazione dell'informazione sul colore rispetto a 4:4:4 o 4:2:0.
Nel video YUV 4:2:2, infatti, viene mantenuto l'intero valore di luminanza e metà delle informazioni cromatiche originali. Un frame video compresso 4:2:2 richiede solo 2/3 dei dati di un frame video 4:4:4 non compresso, ma offre una risoluzione cromatica doppia rispetto a un fotogramma 4:2:0 compresso.
Clicca per ingrandire
Le informazioni cromatiche aggiuntive mantenute da 4:2:2 rispetto a 4:2:0 possono essere particolarmente utili per i contenuti HDR e per mantenere i dettagli fini come il testo o le linee sottili o per i flussi di lavoro in cui la sorgente viene corretta più volte, come nel caso del color grading.
Clicca per ingrandire
Tuttavia, la decodifica 4:2:2 basata su software può comportare un carico elevato sulle CPU di sistema, rendendo il video 4:2:2 difficile da lavorare. Il supporto della decodifica 4:2:2 per i formati video H.264 e H.265 consente agli editor video di lavorare con contenuti 4:2:2 nativi senza dover generare video proxy.
Clicca per ingrandire
In poche parole, mentre in precedenza l'output di H.264/H.265 4:2:2 era limitato alle opzioni di codifica basate su software come Voukoder Pro, i creator possono ora produrre video 4:2:2 fino a 11 volte più velocemente rispetto alle soluzioni di codifica basate su CPU.
Da rilevare che la GeForce RTX 5090 prevede tre encoder e due decoder, un incremento rispettivamente di un'unità rispetto alla RTX 4090. Il raffronto tra RTX 5080 e 4080 vede lo stesso numero di encoder, due, mentre la nuova arrivata arrivata guadagna un decoder, salendo a due. La stessa configurazione della RTX 5080 la troviamo sulla RTX 5070 Ti, identica alla RTX 4070 Ti, mentre la RTX 5070 ha un encoder e un decoder, come la RTX 4070.
Blackwell ed efficienza: le novità dell'architettura per un uso attento dell'energia
NVIDIA ha implementato una serie di tecnologie di gating che permettono alla GPU di operare in modo efficiente, con un occhio soprattutto all'incarnazione di Blackwell sui notebook. Queste soluzioni si aggiungono al DLSS 4, che al pari del DLSS 3 generando i frame abbassa i consumi, nonché ad altri aspetti, come l'uso delle GDDR7, più efficienti dei precedenti standard di memoria.
Clicca per ingrandire
Con Clock Gating, Power Gating e Rail Gating il produttore di GPU statunitense indica la capacità delle GPU Blackwell di controllare non solo la frequenza, riducendola ai minimi termini quando non non è necessario operare a massimo regime, ma anche di spegnere e attivare rapidissimamente intere aree della GPU al fine di risparmiare energia e, sui notebook, prolungare l'attività.
Clicca per ingrandire
Particolarmente interessante è la seguente slide, che mostra come le migliorate capacità di gestione di Blackwell favoriscano un risparmio energetico del 50%. Le maggiori prestazioni dell'architettura facilitano un ingresso anticipato in stato di basso consumo, con le tecnologie di gating che permettono alla GPU di entrare con molto anticipo in stato di "deep sleep".
Clicca per ingrandire
Infine, un migliorato controller di clock garantisce secondo NVIDIA una reattività 1000 volte superiore nella gestione degli incrementi di frequenza, permettendo al chip di rispondere prontamente e in modo efficiente alle variazioni di carico.
Clicca per ingrandire
GeForce RTX 5090, 5080, 5070 Ti e 5070: le specifiche delle prime GPU Blackwell
L'ammiraglia della famiglia Blackwell è la GeForce RTX 5090, un mostro di potenza con 21760 CUDA core, bus a 512 bit e 32 GB di memoria GDDR7 a 28 Gbps per una bandwidth di 1792 GB/s. Non mancano gli RT core di 4a generazione (170) e i Tensor core di 5a generazione (680), più evoluti rispetto ai quelli presenti nelle GPU GeForce RTX 4000.
Clicca per ingrandire
La scheda, alimentata da un connettore a 16 pin, è accompagnata da un TGP di 575 Watt, ben 125 watt in più rispetto al predecessore GeForce RTX 4090. La GPU a bordo è indicata come GB202, opera tra 2,01 e 2,41 GHz, e conta su 92,2 miliardi di transistor. Il die occupa 750 mm2.
Clicca per ingrandire
Interessanti le dimensioni della scheda: è lunga circa 30 cm, come la RTX 4090 Founders Edition, ma occupa due slot anziché tre. Sul retro della scheda spazio a una HDMI 2.1b con supporto fino a 4K 480Hz o 8K 120Hz con DSC e tre Displayport 2.1b con supporto UHBR20 fino a 4K 480Hz o 8K 165Hz con DSC.
Clicca per ingrandire
La gamma prosegue con la GeForce RTX 5080, basata su GPU GB203 (378 mm2, 45,6 miliardi di transistor) impostata a 2,3 / 2,62 GHz. A bordo 10752 CUDA core, 84 RT core e 336 Tensor core, collegati tramite un bus a 256 bit a 16 GB di memoria GDDR7 a 30 Gbps, per una bandwidth che sfiora il terabyte, fermandosi a 960 GB/s. Anche in questo caso l'alimentazione prevede un connettore a 16 pin, per un TGP di 360 Watt. Il design della Founders Edition è identico a quello della RTX 5090 per dimensioni.
Clicca per ingrandire
Le schede della famiglia '70 sono due, la GeForce RTX 5070 Ti e la RTX 5070. La prima adotta la GPU GB203 della RTX 5080, opportunamente castrata: si scende a 8960 CUDA core, 70 RT core e 280 Tensor core, mentre il bus e la quantità di memoria rimangono invariati (256 bit, 16 GB GDDR7), con la differenza che la VRAM è impostata a 28 Gbps, per una bandwidth di 896 GB/s. La GPU opera a 2,3 / 2,45 GHz. Il TGP è pari a 300 Watt, ancora una volta forniti tramite il connettore a 16 pin.
La GeForce RTX 5070 si basa invece sulla GPU GB205 (263 mm2 e 31 miliardi di transistor) con 6144 CUDA core (2,16 / 2,51 GHz), 50 RT core e 200 Tensor core, bus a 192 bit e 12 GB di memoria GDDR7 a 28 Gbps. La bandwidth scende a 672 GB/s, mentre il TGP si è pari a 250 Watt. Tutte le GPU si presentano con interfaccia PCIe 5.0.
Clicca per ingrandire
Da segnalare che la GeForce RTX 5070 Ti non sarà disponibile in versione Founders Edition, ma solo nei modelli custom offerti dai partner AIB. La la GeForce RTX 5070, invece, sarà disponibile in versione FE con design dual slot e dimensioni di 242 mm di lunghezza e 112 mm di ampiezza.
GeForce RTX 5090 | GeForce RTX 5080 | GeForce RTX 5070 Ti | GeForce RTX 5070 | |
GPU | GB202-300-A1 | GB203-400-A1 | GB203-300 | GB205-300 |
Dimensione die | 750 mm2 | 378 mm2 | 378 mm2 | 263 mm2 |
Transistor | 92,2 miliardi | 45,6 miliardi | 45,6 miliardi | 31 miliardi |
Architettura | Blackwell | Blackwell | Blackwell | Blackwell |
SM attivi | 170 | 84 | 70 | 48 |
CUDA Core | 21760 | 10752 | 8960 | 6144 |
Base Clock | 2010 MHz | 2300 MHz | 2300 MHz | 2160 MHz |
Boost Clock | 2410 MHz | 2620 MHz | 2450 MHz | 2510 MHz |
Bus | 512 Bit | 256 Bit | 256 Bit | 192 Bit |
VRAM e velocità | GDDR7 (28 Gbps) | GDDR7 (30 Gbps) | GDDR7 (28 Gbps) | GDDR7 (28 Gbps) |
Quantità di VRAM | 32 GB | 16 GB | 16 GB | 12 GB |
Bandwidth | 1792 GB/s | 960 GB/s | 896 GB/s | 672 GB/s |
TGP | 575 W | 360 W | 300 W | 250 W |
Le prestazioni delle nuove GeForce RTX 5000 secondo NVIDIA
NVIDIA sostiene che il DLSS 4 permette alla RTX 5090 di offrire prestazioni fino a 2 volte maggiori rispetto alla RTX 4090, limitata al DLSS 3. In pratica, è possibile giocare in 4K a 240 fps e full ray tracing attivo in giochi come Cyberpunk 2077, Alan Wake 2 e Black Myth: Wukong.
Clicca per ingrandire
Inoltre, nelle applicazioni di IA generativa, la generazione di immagini è 2 volte più rapida pur usando metà della memoria, grazie al supporto FP4 su GeForce RTX 5090 rispetto a quello FP8 su GeForce RTX 4090.
Clicca per ingrandire
NVIDIA sostiene che la GeForce RTX 5080 è il doppio più veloce della RTX 4080 grazie al DLSS 4 nei titoli più esigenti, come quelli in path tracing, e così anche la RTX 5070 Ti rispetto alla GeForce RTX 4070 Ti e la RTX 5070 rispetto alla RTX 4070. In una slide durante il keynote, NVIDIA ha affermato che in tali scenari la RTX 5070 offre prestazioni simili alla RTX 4090, a un prezzo di gran lunga inferiore.
Clicca per ingrandire
Clicca per ingrandire
Osservando i grafici per quanto concerne la prestazioni che non contemplano il DLSS 4, le prestazioni delle GeForce RTX 5000 dovrebbero essere superiori alla serie 4000 nell'ambito del 15-20% di media, a seconda del confronto: al momento non conosciamo le prestazioni esatte, è una pura stima dedotta dai test RT e DLSS + RT mostrati nelle slide, che sembrano andare dal +15 al +30% circa.
Un nuovo dissipatore per le GeForce RTX 5090 e 5080 Founders Edition
Le nuove GeForce RTX 5000 FE prevedono un design rinnovato, e non solo per quanto concerne il dissipatore di calore. Al di sotto c'è infatti un complesso sistema che prevede sostanzialmente tre parti: il PCB principale, al centro della scheda, dove risiedono GPU, fasi e memoria. Ci sono poi altri due PCB, a cui quello principale è collegato, che riguardano la connessione PCIe alla motherboard e le uscite posteriori.
Clicca per ingrandire
Clicca per ingrandire
Con le GeForce RTX 4000 Founders Edition precedenti avevamo un PCB principale a forma di V, mentre questa volta appare quadrato. Questa forma ha permesso di collocarlo al centro del dissipatore, affinché NVIDIA potesse implementare un dissipatore con design "Double Flow Through", in cui le ventole assiali sono sulla stessa "faccia" e pescano entrambe aria fresca dalla parte inferiore ed espellono aria calda da quella superiore, essendo sparita la griglia posteriore vicina alle porte. Sopra la GPU c'è una camera di vapore 3D, e troviamo anche cinque heatpipe che trasportano il calore lungo due heatsink, con un terzo posto sotto il PCB.
Clicca per ingrandire
L'efficienza di questo design, sostiene NVIDIA, le ha permesso di progettare soluzioni Founders Edition in formato dual slot, pur mantenendo un profilo di rumorosità di gran lunga inferiore a quello dei precedenti progetti.
Non solo desktop, GeForce RTX 5000 anche su mobile: specifiche prestazioni
Oltre alle schede video desktop, NVIDIA ha messo a punto anche una nuova gamma di GPU mobile basate su architettura Blackwell. Le nuove proposte sono quattro e prendono il nome di GeForce RTX 5090 Laptop, GeForce RTX 5080 Laptop, GeForce RTX 5070 Ti Laptop e GeForce RTX 5070 Laptop.
Clicca per ingrandire
Come già visto nella scorsa generazione, le specifiche sono differenti da quelle controparti desktop, per ovvie ragioni. La GeForce RTX 5090 Laptop prevede 10496 CUDA core, supportati da 24 GB di memoria GDDR7 su un bus a 256 bit. A seconda dell'impostazione di frequenza, legata al design in cui la GPU verrà implementa, il TGP della soluzione ricade tra 95 e 150 W di potenza.
La GeForce RTX 5080 Laptop integra 7680 CUDA core accompagnati da 16 GB di memoria GDDR7 su un bus a 256 bit. In questo caso, NVIDIA indica un "GPU Subsystem Power" compreso tra 80 e 150 W.
Clicca per ingrandire
La GeForce RTX 5070 Ti offre 5888 CUDA Core e 12 GB di memoria GDDR7 su un bus a 192 bit, con un TGP variabile da 60 a 115 W. Chiude il quadro la GeForce RTX 5070, dotata di 4608 CUDA Core e 8 GB di memoria GDDR7 su un bus a 128 bit. Per questa proposta NVIDIA indica un TGP tra 50 e 100 watt a seconda della frequenza di lavoro.
Anche in questo caso NVIDIA ha condiviso alcuni dati prestazionali di massima, in cui raffronta la RTX 5080 Laptop con la RTX 4080 Laptop. Anche in questo caso si vede come il DLSS 4 faccia una grande differenza, sia in gaming che in produttività, dove incide in particolar modo il supporto FP4.
Clicca per ingrandire
In virtù delle novità architetturali e altre ottimizzazioni, come ad esempio la capacità risparmiare energia in presenza di minimi aggiornamenti del contenuto a schermo, le GPU Blackwell dovrebbero garantire il 40% di autonomia di gioco in più su batteria e una durata del 30% superiore nella visione di contenuti web e video. Il tutto con capacità prestazionali superiori, sia in gaming che in video editing.
Clicca per ingrandire
Clicca per ingrandire
I primi notebook arriveranno a marzo, in design a partire da uno spessore di 14,9 millimetri. NVIDIA ha dichiarato prezzi a partire da 1299 dollari prima delle tasse per le soluzioni RTX 5070, per arrivare a un MSRP di partenza di 2899 dollari prima delle tasse per le proposte con RTX 5090.
Modello | Core | Memoria | Bus | TGP |
GeForce RTX 5090 Laptop | 10496 | 24 GB GDDR7 | 256 Bit | 95 - 150 W |
GeForce RTX 5080 Laptop | 7680 | 16 GB GDDR7 | 256 Bit | 60 - 150 W |
GeForce RTX 5070 Ti Laptop | 5888 | 12 GB GDDR7 | 192 Bit | 60 - 115 W |
GeForce RTX 5070 Laptop | 4608 | 8 GB GDDR7 | 128 Bit | 50 - 100 W |
I prezzi e la disponibilità delle GeForce RTX 5000 desktop
NVIDIA ha già comunicato i prezzi di lancio delle nuove GPU GeForce RTX 5000 per PC desktop. La GeForce RTX 5090 parte da 2389€ IVA inclusa, mentre la RTX 5080 è stata collocata a partire da 1199€ IVA inclusa. Se guardiamo la top di gamma, NVIDIA ha aumentato il prezzo di 410€ rispetto all'MSRP della RTX 4090 al lancio, il che rende il modello '90 ancora più elitario.
Buone notizie arrivano però dalla vera soluzione top di gamma per i gamer più appassionati, la RTX 5080, che costa 280€ in meno dei 1479€ richiesti da NVIDIA per la precedente RTX 4080.
Clicca per ingrandire
NVIDIA ha posizionato la GeForce RTX 5070 Ti a partire da 899€ e la RTX 5070 a partire da 659€. La precedente RTX 4070 Ti partiva al lancio da 919€, mentre la RTX 4070 partiva al debutto 669€.
Salvo la GeForce RTX 5090, ci troviamo di fronte quindi a cali di prezzo a fronte di un miglioramento prestazionale, il che non può che essere una buona notizia. Tutto questo sulla carta, bisognerà chiaramente vedere lo street price reale quando le GPU saranno disponibili, anche se le prime soffiate dai partner AIB non sono del tutto positive.
NVIDIA ha comunicato una data di disponibilità per la GeForce RTX 5090 e la RTX 5080 fissata al 30 gennaio, mentre i modelli RTX 5070 Ti e RTX 5070 arriveranno sul mercato nel corso di febbraio.
29 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoche dire?
Sono solo io a trovarla una baggianata e diversi livelli??
Intendevo il calcolo a potenza bruta, senza tecnologie IA di supporto, ho sbagliato termine... articolo lungo, lapsus...
Oculista mi toglie gli occhiali e mi chiede:
O: "Quali di queste due scritte leggi meglio?"
Io: "non leggo nessuna scritta"
O: "Osservi qui, quanti riquadri rossi vede?"
Io: "Vedo un'unico quadrato marrone, o forse rosa, chi lo sà"
O: "E in questa immagine che numero vede?"
Io: "Non vedo nessun numero, per favore prenda i miei soldi e mi prescriva il solito binocolo"
Nuovi tensor core, transformer, RTX neural rendering per 3 gestioni dedicate agli shader,.compressione texture, material etc, più qualità (???) ma meno VRAM, il doppio quasi dei CUDA corea rispetto alla 4090, gestione di 500M+ poligoni rispetto ai massimo 50M di CP2077 (10 volte?), IA ovunque per migliorare qualità (Blabla, la qualità degrada del tutto, sempre), e latenza inferiore (inferiore rispetto al doppio di latenza che le tech fanno, forse, non inferiore rispetto ad un rendering in real time... Come chi fa testing conferma)...
Ma alla fine? In game nativo 4K in Path tracing senza upscaling e assolutamente senza frame generator, che chi spende 2500 euro non deve assolutamente usare per un hardware next gen così markettizzata con le cose di cui sopra ,(tutto super pompato?) e la 4090 fa 21 FPS e la 5090 con tutto sto Wall of text alla fine fa 29 FPS....
Ci prendono per il culo o cosa? L'olderriko CP2077 di 4 anni fa devi usare DLSS4 performance (1080P to 2160P) e frame generation per stare sempre sopra o 60FPS anche con la 5090... Con qualità degradata e latenze estreme... E ora ci mettiamo pure l'ennesima cazzata che le ennesime tech aumentano la qualità quando abbiamo degradato fino allo schifo ogni gioco usando DLSS e frame generation ma con la narrativa che si aumentava la qualità visiva, e chi non ne capisce o non sa vedere la differenza ci crede pure .. come chi è convinto che con frame generation il gioco sia più reattivo ..
Fino a quando queste tech non saranno mature e non vedrò veramente next gen non comprerò più nulla
Vi ricordo che ora hanno presentato questa demo grafica e ad oggi in UE5 di 5 anni fa presentato non riusciamo neanche lontanamente ad avere in game la grafica di quella demo e tutti i giochi UE5 girano su 4090 in modo nativo con Path tracing sotto i 30 FPS con enormi stuttering
Ce li vedo già i fanatici a preordinare la 5090 per buttarla fra 2 anni
che è un salto ridicolo visto che ci passa solo un 6% perf @ iso-power
non so nemmeno se ci sia un guadagno dimensionale dei transistor e i chip sono gia grandi; fin quando TSMC non avrà i 3N disponibili per i chip delle GPU difficile fare un salto
nVidia ha presentato questo, AMD si fermerà alla fascia media e Intel alla fascia bassa...
si chiama realtà
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".