|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75173
|
Link alla notizia: https://www.hwupgrade.it/news/skvide...ti_140078.html
Un utente Linux è riuscito ad abilitare FSR 4 su schede video basate sull'architettura RDNA 3 di precedente generazione. Tuttavia, l'assenza delle unità di calcolo FP8 si fa sentire e i risultati, talvolta, risultano peggiori di FSR 3.1 Click sul link per visualizzare la notizia. |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: May 2004
Messaggi: 7465
|
se perdo il vantaggio prestazionale perdo lo scopo di usare uno scaler in generale, quindi su rdna3 meglio il nativo con magari un po di dettaglio in meno che abilitare il fsr3 o 4 limitato
|
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3552
|
Mi chiedo perché dopo tutti questi anni che esistono i modelli AI ancora si discute se qualcosa può funzionare o meno su un HW o un altro.
La risposta è che è possibile far girare qualsiasi motore di inferenza ovunque. Non è che i calcoli per l'inferenza, o anche l'RT, siano cose astruse che richiedono cose particolari. Moltiplicatori, divisoli e sommatori sono parte delle unità di calcolo delle CPU da circa 40 anni. Quello che cambiano solo le prestazioni che dipendono dal numero e tipo di unità di calcolo installate. Se non fosse chiuso si potrebbe far girare il DLSS sulle schede AMD. O anche sul chip della lavatrice. Il fatto che nessuno di queste due soluzioni abbia l'HW specifico per eseguire i calcoli necessari (DLSS o FSR4 che sia) significa che le prestazioni saranno peggiori. Dovendo il risultato essere usato in tempo reale, significa che o si avranno meno frame, fino al punto in cui usare l'interpolazione AI richiede più tempo che calcolare un frame nativamente, oppure meno qualità a parità di velocità di output. Credo non capire questo porta ai solito discorsi su chi è capace di fare cosa, ovvero ci si ferma a dire: eh, ma anche X è in grado di fare lo scaling, RT, FG e quant'altro. La differenza rispetto a X e Z è solo la velocità con cui riesce a eseguire i calcoli e quindi la resa finale. Come detto non è questione di aspettare un po' di più come per gli altri benchmark dove la barretta si allunga o si accorcia, ma poiché il risultato va usato entro un tempo ben determinato ciò che cambia è la qualità dell'output. Cosa che pochi valutano |
![]() |
![]() |
![]() |
#4 | |
Senior Member
Iscritto dal: May 2004
Messaggi: 7465
|
Quote:
|
|
![]() |
![]() |
![]() |
#5 | |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3552
|
Quote:
Dimmi dove ho detto che non serve l'HW dedicato. Poi torna a scusarti per l'ennesima figura di m. che gai fatto. |
|
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Jan 2003
Messaggi: 3106
|
Lo si era già visto settimane fa.
Ma per avere le prestazioni devono ottimizzare/riscrivere il codice per lavorare in FP16 (RDNA3), piuttosto che FP8 (RDNA4). A detta di Azor, ci stanno lavorando. Avevo "previsto" la cosa mesi fa, puntualizzando che prima avrebbero chiuso la lineup RDNA4 (ovviamente). Se decidono effettivamente di andare in questa direzione, ritengo che per l'autunno dovrebbe essere disponibile.
__________________
MASTER: Ryzen 5 9600X LC,Powercolor RX 7700XT,MSI PRO B650M-A WIFI,32GB Ram 6000 CL30 FLARE X in DC,Samsung 980Pro 512GB G4 + 980Pro 2TB G4 + SSHD 2TB SATA + HDD 1TB SATA,Audio ALC897,MSI MPG A650GF,Win 11 PRO,TK X-SUPERALIEN + AQUARIUS III,MSI 32" Optix MAG322CQR,MSI VIGOR GK30 COMBO,MSI Agility GD20 PAD,MSI IMMERSE GH10 HEADSET Ultima modifica di Max Power : 20-06-2025 alle 17:49. |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Jan 2003
Messaggi: 3106
|
Limitato sugli sponsorizzati Nvidia
![]() C'è una differenza significativa nella qualità di implementazione.
__________________
MASTER: Ryzen 5 9600X LC,Powercolor RX 7700XT,MSI PRO B650M-A WIFI,32GB Ram 6000 CL30 FLARE X in DC,Samsung 980Pro 512GB G4 + 980Pro 2TB G4 + SSHD 2TB SATA + HDD 1TB SATA,Audio ALC897,MSI MPG A650GF,Win 11 PRO,TK X-SUPERALIEN + AQUARIUS III,MSI 32" Optix MAG322CQR,MSI VIGOR GK30 COMBO,MSI Agility GD20 PAD,MSI IMMERSE GH10 HEADSET Ultima modifica di Max Power : 20-06-2025 alle 17:57. |
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3552
|
Quote:
|
|
![]() |
![]() |
![]() |
#9 | |
Senior Member
Iscritto dal: Jan 2009
Città: Venezia
Messaggi: 425
|
Quote:
mi chiedo se sia corretto parlare di "emulazione" in questo scenario. Si tratta dal punto di vista dell'unità di calcolo di elaborazioni con un inutile livello di precisione = spreco di risorse |
|
![]() |
![]() |
![]() |
#10 |
Senior Member
Iscritto dal: Sep 2004
Città: Veneto Orientale
Messaggi: 4328
|
Lossless Scaling......... :3
|
![]() |
![]() |
![]() |
#11 | |
Senior Member
Iscritto dal: Jan 2003
Messaggi: 3106
|
Infatti, ti faccio notare che c'è il riferimento alla riscrittura
![]() Quote:
E considerando che il DLSS4 gira su una 3050 6GB, figuriamoci se l'FSR 4, non può girare da una 7600 a salire. È solo questione di volontà, e dato che, in via del tutto eccezionale Nvidia ha attivato l'upscaler trasformer per tutte le RTX, e AMD ha attualmente le RDNA 3.5 in produzione, sarebbe una capoellata non farlo.
__________________
MASTER: Ryzen 5 9600X LC,Powercolor RX 7700XT,MSI PRO B650M-A WIFI,32GB Ram 6000 CL30 FLARE X in DC,Samsung 980Pro 512GB G4 + 980Pro 2TB G4 + SSHD 2TB SATA + HDD 1TB SATA,Audio ALC897,MSI MPG A650GF,Win 11 PRO,TK X-SUPERALIEN + AQUARIUS III,MSI 32" Optix MAG322CQR,MSI VIGOR GK30 COMBO,MSI Agility GD20 PAD,MSI IMMERSE GH10 HEADSET |
|
![]() |
![]() |
![]() |
#12 | ||
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3552
|
Quote:
Quote:
Vediamo se così capisci: hai un tempo limitato per fare i calcoli di scaling. Se sfori fallisci completamente e non ha senso fare i calcoli perché non puoi usarli in un tempo utile. Quindi tutti i sistemi cercano di usare lo stesso tempo massimo di calcolo <con l'aggravante che più vai veloce nel calcolo raster meno tempo hai per l'AI). Definita questa limitazione naturale per come si usano i risultati dei calcoli di inferenza, prova a pensare cosa cambia ad avere 100 unità di calcolo piuttosto che 10000. Vediamo se ci arrivi che i due sistemi fanno due lavori diversi ANCHE SE CI METTONO LO STESSO TEMPO. |
||
![]() |
![]() |
![]() |
#13 | |||
Senior Member
Iscritto dal: Jan 2003
Messaggi: 3106
|
Stupiscimi
![]() Quote:
![]() Ma andiamo avanti Quote:
![]() Quote:
![]() La valorizzazione del tempo (o peso) di elaborazione. Partiamo dal presupposto che anche con una 3050 6GB, ad oggi non si è visto un CAP di elaborazione del DLSS. Voglio dire che il limite è di elaborazione è assoluto, con o senza DLSS. Anche perché saremmo stati di fronte ad una situazione come questa: 300fps in nativo e 250fps in qualità DLSS. Come conseguenza ai tensor core che non riuscivano a "stare dietro" all'elaborazione. Diversamente da frame rate più bassi dove normalmente se faccio 100 in nativo, ne escono almeno 120 in DLSS. Ad oggi non esistono indicatori di carico precisi dei tensor core, tuttavia si può empiricamente dire che non importa che l'elaborazione sia da 100 o 10000 unità di calcolo. Se il peso per gestire 300 FPS con l'upscaler IA è 10... Combinazione DLSS4 ed FSR4, hanno un impatto molto simile sulle prestazioni, ergo si possono fare spannometricamente i dovuti paragoni. E niente, mi dai sempre soddisfazione ![]()
__________________
MASTER: Ryzen 5 9600X LC,Powercolor RX 7700XT,MSI PRO B650M-A WIFI,32GB Ram 6000 CL30 FLARE X in DC,Samsung 980Pro 512GB G4 + 980Pro 2TB G4 + SSHD 2TB SATA + HDD 1TB SATA,Audio ALC897,MSI MPG A650GF,Win 11 PRO,TK X-SUPERALIEN + AQUARIUS III,MSI 32" Optix MAG322CQR,MSI VIGOR GK30 COMBO,MSI Agility GD20 PAD,MSI IMMERSE GH10 HEADSET |
|||
![]() |
![]() |
![]() |
#14 | |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3552
|
Quote:
Per prima cosa stai ancora comparando le prestazioni come tempo di calcolo. Vuol dire che quanto scritto nei due post precedenti non li hai assolutamente compresi. Quindi inutile che scrivi stupiscimi e fuffa. Non hai capito un tubo. Punto. Se vuoi te lo ripeto con un disegnino. Se hai 25ms di tempo per fare i calcoli, e questo è il tempo che è determinato dal raster (hai definito la descrizione precedente fuffa, quindi non hai capito la relazione di tempi che c'è tra la parte raster e quella AI) è ovvio che DLSS o qualsiasi altra cosa ha lo stesso impatto. Sempre 25ms devono metterci SE IN RASTER hanno lo stesso limite. Se usi una 5090 ma tieni il numero di unità della 3050 (quella che tu dici essere in grado di gestire il DLSS senza limitazioni) non riesci ad avere un vantaggio con il framerate che la 5090 riesce a fare in raster. Quindi il tuo ragionamento di comparare il tempo senza tenere conto dell'attuale numero di frame (e risoluzione in gioco) è completamente errato. E fin qui siamo 3 a zero (cioè tre post che ti spiego come funziona e 3 post in cui tu scrivi sciocchezze in risposta). Poi passiamo alla questione tensor core vs metodo di calcolo AI in RDNA3. A quanto pare non sai, come molti altri, che RDNA3 (ma anche la 4, anche se è migliorata con istruzioni più potenti) NON HA UNITA' DI CALCOLO DEDICATE, ma usa gli stessi shader che sono usati per elaborare le funzioni raster. Questo vuole dire che mentre Nvidia può parallelizzare la parte raster con quella di scaling AI, AMD deve necessariamente calcolarli in serie, perché o usa gli shader per il frame raster o per lo scaling. Sì, può usarne un po' e un po', ma a quel punto le prestazioni diminuiscono per entrambe le fasi (e quindi si allungano i tempi di calcolo anche per il raster). La soluzione a questa cosa è semplice (ed è la 4 volta che lo scrivo, vediamo se la capite o se proprio avete un blocco mentale quando si parla di AMD e del fatto che non riesce a tenere il passo di Nvidia): fare meno calcoli AI. Se ho 100 unità di calcolo invece che 10000 i tempi di calcolo per la stessa elaborazione saranno impossibili da fare e quindi taglio la qualità del frame risultante finché ottengo qualcosa di più o meno decente con il tempo a disposizione. Il risultato che TU vedi è che l'impatto dei tempi è lo stesso per entrambi, ma ciò che non valuti è che la qualità di uno è ben diversa da quella dell'altro. Compresa la cosa ora? O vuoi tornare a comprare le prestazioni della 3050 con una 5090 dicendo che l'impatto è lo stesso senza tenere conto che la prima fa 15 frame al secondo, quindi ha 66ms per fare i calcoli con le sue unità di calcolo ridotte, mentre la 5090 ne fa 200 e quindi per avere un frame della stessa qualità ce ne deve mettere 5 (e quindi ha una quantità di unità AI proporzionali a quelle raster e non lo stesso numero di quelle della 3050 che per te bastano e avanzano per calcolare il DLSS)? Ci siamo o no? ![]() Ultima modifica di CrapaDiLegno : 21-06-2025 alle 23:05. |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 07:26.