GPU Subwarp Interleaving, NVIDIA studia soluzioni per migliorare le prestazioni in ray tracing

In un documento tecnico NVIDIA parla di GPU Subwarp Interleaving, una tecnica che potrebbe migliorare le prestazioni del ray tracing. L'azienda ne analizza punti di forza e debolezza, concludendo che per ora non è applicabile alle architetture attuali, ma forse lo sarà in futuro.

di Manolo De Agostini pubblicata il 26 Gennaio 2022, alle 17:01 nel canale Schede Video
NVIDIA GeForce RTX

Il rendering ibrido che oggi muove i videogiochi più avanzati, in cui alla rasterizzazione si affiancano per alcuni effetti di ray tracing in tempo reale (illuminazione globale, ombre, ecc.), porta a un maggior realismo dell'immagine ma allo stesso tempo le prestazioni ne risentono.

Per questo dapprima NVIDIA (DLSS) e poi AMD (FSR/RSR) - senza dimenticare Intel con XeSS nel prossimo futuro - hanno proposto soluzioni compensative in grado di preservare quanto più la qualità di immagine e restituire un boost prestazionale. Introdotto per la prima volta con le GPU GeForce RTX 2000 nell'ultima parte del 2018, il ray tracing in tempo reale non è una tecnologia statica e come tutte le altre è oggetto di continuo studio per elevarne qualità e minimizzarne l'impatto.

Un documento pubblicato dai ricercatori di NVIDIA a questo indirizzo, intitolato "GPU Subwarp Interleaving", sembra andare in quella direzione. Stando a quanto riportato, si tratta di un "miglioramento architetturale" che sarebbe in grado - in base alle prime prove - di garantire un aumento prestazionale medio del 6,3% (fino al 20%).

Tutto molto bello, almeno in apparenza, ma c'è un però. Il Subwarp Interleaving, scrive NVIDIA, "presenta carenze che ne precludono l'implementazione nel breve termine". Secondo quanto scrivono i ricercatori è necessario attuare alcuni miglioramenti dell'architettura, altrimenti il ritorno concreto potrebbe essere limitato.

"I kernel di raytracing stressano le GPU in tre modi fondamentali: sono molto divergenti, soffrono di scarsa occupazione e i warp (blocchi di thread) stallano in attesa del completamento delle operazioni a lunga latenza", scrive NVIDIA. "Di solito, gli scheduler della GPU possono nascondere gli stalli a lunga latenza passando ad altri warp pronti, ma i kernel di ray tracing spesso hanno pochi warp attivi per occultare la latenza".

"Subwarp Interleaving è una nuova tecnica che punta a ridurre le bolle nella pipeline nei kernel di ray tracing. Quando un'operazione a lunga latenza blocca un warp e lo scheduler dei warp della GPU non può trovare un warp attivo a cui passare, uno scheduler subwarp può invece passare l'esecuzione del warp corrente a un altro subwarp divergente".

Per dimostrare la tecnica NVIDIA ha creato quelle che definisce "estensioni architetturali" a una GPU "simil-Turing" che sfrutta "molte delle caratteristiche inerenti dell'architettura di base per supportare lo scheduling indipendente dei thread. Subwarp Interleaving riduce gli stalli esposti del 10,5%".

I test hanno dimostrato che la tecnica, pur mostrando alcuni interessanti miglioramenti in termini prestazionali (6,3% in media, 20% massimo) in alcuni campi di applicazione del ray tracing, vede purtroppo un "uso ristretto e una complessità del design che ne limitano l'attrattività per le attuali architetture grafiche".

"Tuttavia, l'evoluzione delle richieste da parte delle applicazioni e il loro comportamento possono motivare il futuro esame di approcci di tolleranza alla latenza e mitigazione della divergenza come Subwarp Interleaving".

Subwarp Interleaving è probabilmente solo uno dei tanti progetti su cui Nvidia sta lavorando per migliorare le architetture future nella gestione del ray tracing: non è detto che la sua applicazione diventerà realtà, ma è proprio questo processo di costante studio e analisi di nuove tecniche che permette di arrivare a ottenere prodotti sempre più potenti e innovativi.

I migliori sconti su Amazon oggi

Oral-B Spazzolino Elettrico Ricaricabile iO 2 Nero, 1 Spazzolino Elettrico, 1 Testina Di Ricambio, Custodia Da Viaggio, Supporto per testine + 1 Dentifricio Oral-B Pro-Expert, Pulizia Denti

129.99€ Compra ora

-3%

Lenovo, Notebook Portatile, V15 G4 IRU, Display 15,6" Full HD, Intel Core i5-13420H, Ram 16 GB DDR4, 512 GB SSD NVMe, Win 11 Pro, Libre Office, Preconfigurato

429.90 419.00€ Compra ora

-23%

Apple Watch SE (2ª gen.) GPS 40 mm Smartwatch con cassa in alluminio Galassia e Cinturino Sport Galassia - S/M. Tracker per il fitness e il sonno, app Battito, Rilevamento incidenti, display Retina

259.00 199.00€ Compra ora

Motorola Frontier: che bomba! Sarà lui il top di gamma con cam da 200MP?

Bobby Kotick: da Microsoft 375 milioni di dollari con l'operazione Activision Blizzard

al13526 Gennaio 2022, 19:22 #1

tanto di cappello agli ingegneri nvidia che continuano a lavorare e sfornare innovazioni e miglioramenti a tempo pieno in ambito grafico

CrapaDiLegno26 Gennaio 2022, 20:14 #2

Mentre dall'altra parte brevettano TMU che possono fare anche BVH usando dati in forma di pseudo-texture... ahahah
http://www.freepatentsonline.com/20190197761.pdf

Siamo su due piani di ricerca e sviluppo completamente diversi.
Questo brevetto proposto quasi un anno dopo Turing.

E' ovvio che Nvidia voglia continuare a fare ricerca avanzata sul RT. Sa bene che è il futuro (insieme agli algoritmi basati sull'AI), rispetto all'ormai vetusto raster, e permette di ottenere immagini migliori con meno lavoro da parte degli sviluppatori. Oltre che a permettere migliore scalatura nel tempo (un gioco vecchio potrebbe facilmente essere aggiornato per l'HW nuovo pompando la qualità grafica semplicemente aumentando la qualità del motore raytracing) .
Ovviamente le prestazioni decadono e perciò ogni aiuto in tal senso è una manna: fare 30% in più è praticamente sfornare una nuova generazione di GPU, quindi se lo si fa per ottimizzazione invece che per forza bruta è un gran risparmio in termini di soldi.

Dai Nvidia, hai risparmiato quasi 40 miliardi dall'inutile acquisto di ARM. Puoi concentrarti a spenderli per una R&D migliore. Se vuoi le super mega CPU ARM based te le puoi fare lo stesso, in casa come fa Apple.

davide15527 Gennaio 2022, 06:58 #3

Originariamente inviato da: CrapaDiLegno

Volevi dire Ampere semmai.

CrapaDiLegno27 Gennaio 2022, 09:21 #4

Originariamente inviato da: davide155

Volevi dire Ampere semmai.

No, Turing.
E' da Turing (2018) che Nvidia ha le unità RT integrate.
Il brevetto AMD è del 2019.
Questo dimostra come non è vero che AMD stesse già lavorando alle unità RT prima di Nvidia, sia per i tempi, sia per il metodo davvero primitivo di tentare di risolvere il problema.
Il metodo di AMD è un metodo molto semplice che non complica l'architettura ma che ha prestazioni e complicazioni di programmazione diverse da quanto fatto da Nvidia.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Sharkoon VK4 ARGB

Nintendo Switch 2

Fujifilm X-E5 con Fujinon XF23mm F2.8: una X100VI ma con ottica intercambiabile

2025 Nikon Comedy Wildlife Awards: i primi scatti del concorso

Nintendo Switch 2

MSI Prestige 13 AI e i portatili business al Computex

Ryzen Threadripper 9980X e 9970X alla prova: AMD Zen 5 al massimo livello AMD ha aggiornato l'offerta di CPU HEDT con i Ryzen Threadripper 9000 basati su architettura Zen 5. In questo articolo vediamo come si comportano i modelli con 64...

BOOX Note Air4 C è uno spettacolo: il tablet E Ink con Android per lettura e scrittura BOOX Note Air4 C rappresenta l'ultima incarnazione della categoria dei tablet E Ink a colori di Onyx, e combina le prestazioni di un dispositivo Android con l'ottima...

The Edge of Fate è Destiny 2.5. E questo è un problema Bungie riesce a costruire una delle campagne più coinvolgenti della serie e introduce cambiamenti profondi al sistema di gioco, tra nuove stat e tier dell’equipaggiamento....

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...

GPU Subwarp Interleaving, NVIDIA studia soluzioni per migliorare le prestazioni in ray tracing

Oral-B Spazzolino Elettrico Ricaricabile iO 2 Nero, 1 Spazzolino Elettrico, 1 Testina Di Ricambio, Custodia Da Viaggio, Supporto per testine + 1 Dentifricio Oral-B Pro-Expert, Pulizia Denti

Lenovo, Notebook Portatile, V15 G4 IRU, Display 15,6" Full HD, Intel Core i5-13420H, Ram 16 GB DDR4, 512 GB SSD NVMe, Win 11 Pro, Libre Office, Preconfigurato

Apple Watch SE (2ª gen.) GPS 40 mm Smartwatch con cassa in alluminio Galassia e Cinturino Sport Galassia - S/M. Tracker per il fitness e il sonno, app Battito, Rilevamento incidenti, display Retina

4 Commenti