NVIDIA GeForce GTX 1080 Founders Edition: la nuova top di gamma

Presto in vendita la nuova scheda video NVIDIA per i videogiocatori più esigenti, basata su architettura Pascal. Potenza di calcolo elevatissima che si abbina a un funzionamento silenzioso e con consumo contenuto, merito sia del chip GP104 sia del design della scheda curato da NVIDIA

di Rosario Grasso , Paolo Corsini pubblicato il 17 Maggio 2016 nel canale Schede Video
NVIDIA GeForce Pascal

Asynchronous Compute

Questo passaggio è fondamentale per le prestazioni dei giochi in DirectX 12 e dei giochi su Windows 10. GTX 1080 supporta in maniera esaustiva Asynchronous Compute e gestisce il bilanciamento di carichi di lavoro (ovvero il concetto alla base delle API di nuova generazione, Vulkan e Mantle compresi) in hardware, così come la preemption (prelazione di risorse) a livello dei pixel e delle istruzioni.

NVIDIA GeForce GTX 1080

Unità di questo tipo in hardware sono ormai cruciali per gli hardware di ultima generazione dedicati ai videogiochi perché questi ultimi stanno diventando sempre più complessi richiedendo al sistema una vasta moltitudine di calcoli, indirizzati a differenti tipi di esigenze. Sfruttare le disponibilità hardware in maniera quanto più parallelizzata e impedire che la GPU rimanga inoperosa, quindi, diventa cruciale: è un compito che si può svolgere al meglio solamente in presenza di un'unità di Async Compute in hardware che si occupi di bilanciare il carico di lavoro tra le risorse di calcolo della GPU. Queste devono lavorare in maniera dipendente, "asincrona" per l'appunto, in modo da contribuire al rendering dell'immagine finale senza "pestarsi i piedi tra di loro" e senza dover aspettare che un'altra risorsa porti al termine il proprio lavoro.

Fra i tipi di lavori assegnati alle risorse della scheda video potremmo trovare la fisica basata sulla GPU ed elaborazione dell'audio tridimensionale, così come il post-processing degli effetti visivi dei frame già renderizzati e il cosiddetto Asynchronous timewarp, una tecnica utilizzata per la grafica in VR di cui parleremo diffusamente più avanti.

Si parla, quindi, della capacità per la GPU di elaborare istruzioni provenienti dalla CPU in maniera parallela senza dover rispettare una pipeline troppo rigorosa. Il bilanciamento dinamico delle risorse della GPU mantiene la GPU sempre attiva e riduce i tempi di calcolo rispetto all'approccio dello Static Partitioning utilizzato da Maxwell. La precedente architettura di NVIDIA, infatti, si limitava semplicemente a suddividere i tipi di carichi di lavoro tra quelli necessari per l'elaborazione della grafica e quelli necessari per i calcoli generici. Il che poteva essere efficiente solamente in quei casi in cui i due tipi di operazioni si presentassero nella stessa quantità. Se, invece, i calcoli generici richiedevano più tempo, la parte di risorse assegnate a quelli più prettamente grafici andava in idle e risultava momentaneamente sprecata.

Il bilanciamento dinamico in hardware tenta, invece, di distribuire ogni esigenza di calcolo a tutte le risorse disponibili in quel momento. Il ragionamento fatto finora, d'altronde, vale per quei casi in cui non ci sia un'esigenza più impellente di altre, mentre ci possono essere situazioni di gioco per cui un aspetto grafico deve risultare pronto prima degli altri o prima del refresh dello schermo nella condizione di V-Sync attivato, perché in caso contrario si perderà un frame. In questi frangenti è fondamentale l'unità di preemption.

Per ogni comando di rendering impartito dal motore grafico del gioco ci possono essere potenzialmente centinaia di draw call al sistema video e ognuna di esse può contenere centinaia di triangoli. Ogni triangolo, a sua volta, contiene solitamente centinaia di pixel a cui devono essere applicati effetti di shading e infine renderizzati nella forma finale. Una GPU che lavora senza logiche di Async Compute porta a termine in ordine tutte queste operazioni prima di passare a task successivi, e questo può comportare ritardi importanti nel rendering.

Per superare questo problema, Pascal implementa un'unità di Pixel Level Preemption. Questa serve a tenere traccia dei progressi intermedi fatti nel lavoro di rendering: quindi, nel momento in cui viene richiesta una prelazione perché un elemento della grafica serve prima degli altri, si può fermare il lavoro precedente, salvarne lo stato in un buffer e spostarsi momentaneamente su altro.

Per far capire bene come funziona il meccanismo, NVIDIA porta il seguente esempio. Nel buffer dei comandi tre draw call sono già state eseguite, una è attualmente in elaborazione e due sono in attesa. La draw call in elaborazione si compone di sei triangoli, tre dei quali sono già stati processati, uno è in rasterizzazione e due in attesa. La scheda video è a metà del processo di rasterizzazione del quarto triangolo quando sopraggiunge una richiesta di elaborazione. In questo frangente, quindi, rasterizzatore, shading del triangolo e buffer dei comandi vengono contemporaneamente bloccati e il loro stato viene salvato. I pixel che sono già stati rasterizzati vengono spediti all'unità di pixel shading e processati parallelamente, mentre le risorse della GPU assegnate all'incarico più urgente.

NVIDIA GeForce GTX 1080

Come detto, parallelamente alla Pixel Level Preemption, Pascal gestisce anche la Thread Level Preemption, la quale funziona in maniera del tutto speculare alla precedente, ma si occupa di operazioni di tipo General Purpose piuttosto che della rasterizzazione di pixel e che quindi consente un miglioramento sensibile delle elaborazioni anche con i task di elaborazione relativi a CUDA. Per le esigenze di calcolo della grafica dei giochi, Pascal riesce a interrompere in qualunque momento i processi di calcolo relativi a pixel e a thread per focalizzarsi sulle esigenze più impellenti. Un approccio del genere ovviamente richiede la memorizzazione di un maggior numero di registri e quindi di una consistente quantità di stati, visto che il lavoro già svolto ovviamente non deve essere perduto.

NVIDIA GeForce GTX 1080

Uno degli esempi più calzanti quando si parla di prelazione è il già citato Asynchronous Timewarp. Il sistema di prelazione tradizionale agisce in maniera molto conservativa, interrompendo il flusso di lavoro con grande margine rispetto al momento in cui la GPU deve "consegnare" al video il frame per il refresh successivo. Con un doppio sistema di prelazione per i pixel e per i thread come quello in dote di Pascal, invece, la GPU è in grado di "fermarsi" più tardi e in maniera più deterministica e di sfruttare il tempo di calcolo così guadagnato per renderizzare più oggetti nella schermata di gioco.

NVIDIA GeForce GTX 1080

Segue: Simultaneous Multi-Projection Engine

Indice
Pagina 1: La nuova famiglia Pascal
Pagina 2: Architettura e novità in GeForce GTX 1080
Pagina 3: GeForce GTX 1080 Founders Edition
Pagina 4: La tecnologia di compressione della memoria di Pascal
Pagina 5: Asynchronous Compute
Pagina 6: Simultaneous Multi-Projection Engine
Pagina 7: GPU Boost 3.0, Fast Sync e altro
Pagina 8: Configurazione di test
Pagina 9: Consumi, rumore e temperature
Pagina 10: GTA V
Pagina 11: Tom Clancy's The Division
Pagina 12: Crysis 3
Pagina 13: Middle-Earth Shadow of Mordor
Pagina 14: The Witcher 3 Wild Hunt
Pagina 15: GRID Autosport
Pagina 16: Star Wars: Battlefront
Pagina 17: Rise of the Tomb Raider
Pagina 18: Overclocking
Pagina 19: Considerazioni finali
Vai ai Commenti (258)

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Nintendo Switch 2

MSI Prestige 13 AI e i portatili business al Computex

NVIDIA GeForce RTX 5060: le schede video di ogni partner dal Computex

MSI Maestro 9000 al Computex 2025: un case che stupisce

Phanteks al Computex 2025

Corsair al Computex 2025

Dalle radio a transistor ai Micro LED: il viaggio di Hisense da Qingdao al mondo intero Una delle realtà a maggiore crescita nel mondo dell'elettronica di consumo, Hisense Group, affonda le sue radici nella storica città portuale di Qingdao, famosa...

realme GT7: un "flaghsip killer" concreto! La recensione Abbiamo provato l'ultimo smartphone di realme, il nuovo GT7. Si tratta di un device che si colloca in una fascia di mercato delicata, ovvero quella che possiamo...

Mario Kart World lancia Switch 2: la magia Nintendo ora in 4K Abbiamo provato esaustivamente due dei titoli di lancio della nuova console di Nintendo, il cui debutto è previsto per la settimana in corso. Mario Kart World e...

DJI Mavic 4 Pro: sblocca un nuovo livello per le riprese aeree DJI Mavic 4 Pro porta in dote il nuovo Stabilizzatore Infinity a 360°, che permette nuovi gradi di libertà nelle riprese aeree. Non solo può ruotare a 360 gradi,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

La rivoluzione dei dati in tempo reale è in arrivo. Un assaggio a Confluent Current 2025 Siamo andati a Londra per partecipare a Current 2025, la conferenza annuale di Confluent. Il tema al centro dell'evento era l'elaborazione dei dati in tempo reale...

Idrogeno verde in Europa: nuovi studi prevedono costi ben superiori alle aspettative Siamo tutti d'accordo: una eventuale diffusione massiccia di idrogeno verde, prodotto esclusivamente da fonti rinnovabili, risolverebbe tanti problemi. Ma siamo...

Fujifilm X100VI: con le 'ricette' è la fotocamera più divertente del momento Fujifilm X100VI è la fotocamera perfetta per divertirsi con la street photography: è tascabile, offre grande qualità, ma soprattutto permette di giocare molto con...

No Rss