|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#461 | |
|
Senior Member
Iscritto dal: Apr 2001
Città: Bari
Messaggi: 2776
|
Quote:
|
|
|
|
|
|
|
#462 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
cioè tutti utilizzate la prima passata solo per scrivere valori nello z-buffer? (scusa ma, come sai, la programmazione non è proprio il mio campo e sto cercando di capirci qualcosa) |
|
|
|
|
|
|
#463 | |
|
Senior Member
Iscritto dal: Nov 2002
Città: Singularity
Messaggi: 894
|
Quote:
Vifani saprà darti qualche dettaglio in più dal momento che ha programmato una demo sulle stencil
__________________
echo 'main(k){float r,i,j,x,y=-15;while(puts(""),y++<16)for(x=-39;x++<40;putchar(" .:-;!/>"[k&7])) for(k=0,r=x/20,i=y/8;j=r*r-i*i+.1, i=2*r*i+.6,j*j+i*i<11&&k++<111;r=j);}'&>jul.c;gcc -o jul jul.c;./jul |Only Connect| "To understand is to perceive patterns" Isaiah Berlin "People often speak of their faith, but act according to their instincts." Nietzsche - Bayesian Empirimancer - wizardry |
|
|
|
|
|
|
#464 | |
|
Bannato
Iscritto dal: Dec 2003
Città: Monteveglio(Bo)
Messaggi: 10006
|
Quote:
|
|
|
|
|
|
|
#465 | ||
|
Senior Member
Iscritto dal: Oct 2002
Città: San Jose, California
Messaggi: 11794
|
Quote:
Oddio, suono come un fanboy, la riformulo Io avrei scalato tutto il possibile a fp16, dato in pasto al mercato delle NV3X degli shader ragionevoli e poi concluso che non sono comunque all'altezza, ma dopo un "fair test". Sarebbe come ottimizzare qualcosa ed eseguire il profiling in debug invece che in release: i risultati che ne escono non hanno alcun valore. Quote:
Le omni light, alla fine, sono paradossalmente piu' veloci di una directional light E' vero che vanno renderizzate 6 facce di una cube map, ma e' anche vero che in queste sei facce il numero di oggetti e' di solito davvero esiguo: un buon algoritmo di rimozione degli oggetti nascosti risolve il problema. Mi sono trovato molto bene tanto che il mio primo tentativo con le shadow map e' stato proprio con omni light. I problemi nascono con le luci direzionali (perspective shadow mapping), ma la teoria sta facendo passi da gigante in questa direzione e nel giro di un paio d'anni dovrebbe essere una tecnica consolidata.
__________________
"We in the game industry are lucky enough to be able to create our visions" @ NVIDIA |
||
|
|
|
|
|
#466 | |
|
Senior Member
Iscritto dal: Oct 2002
Città: San Jose, California
Messaggi: 11794
|
Quote:
In pratica si sta pagando il risparmio di fillrate con della geometria; il prezzo vale la candela quando il pixel shader e' molto complesso e l'overdraw della scena e' molto alto. In queste condizioni, una prima passata sullo zbuffer e tecniche come lo ZCull (o HyperZ), permettono di eseguire lo shader complesso strettamente (quasi) una volta per pixel, invece che piu' volte per pixel in situazioni di alto over draw. (In altre parole, secondo me in Doom3 non conviene
__________________
"We in the game industry are lucky enough to be able to create our visions" @ NVIDIA |
|
|
|
|
|
|
#467 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
guarda anche la risposta di fek poco più in basso; con un guadagno del 20-30% su 8/10 fps (comr visto in canals che fa uso di shader fp32 complessi), per NV3x le cose non cambierebbero più di tanto. NV40, invece, qualcosa guadagnerebbe, anche se, in fin dei conti, l'ultimo chip NV riesce a gestire piuttosto bene anche fp32. Il calo vistoso in "canals" dipende dall'uso di fp32 e dalla dipendenza tra alu e tmu; l'impatto del primo si può minimizzare con il ricorso, dove possibile a fp16 Ultima modifica di yossarian : 01-12-2004 alle 12:09. |
|
|
|
|
|
|
#468 |
|
Bannato
Iscritto dal: Dec 2003
Città: Monteveglio(Bo)
Messaggi: 10006
|
Per Yossarian
Ti chiedo come mai in alcuni benchmark additittura la 6800Ultra scende a livelli della 9800XT?
Sicuramente incide la dipendenza tra alu e Tmu(e di fatto l'R420 è superiore)ma non capisco come può andare a livello di una scheda con 8 pipeline e che ha in fill-rate che è la metà. |
|
|
|
|
|
#469 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Capisco il tuo discorso e non è escluso che Valve abbia tentato una strada del genere. Magari facendo come dice avrebbe evitato di fare la figura di chi abbia deciso, per partito preso di boicottare le serie NV3x. Però, da tecnico del settore, ti rendi conto tu stesso della scarsa utilità della cosa. |
|
|
|
|
|
|
#470 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Re: Per Yossarian
Quote:
perchè in quei test viene fatto anche uso massiccio di shader fp32 complessi (con cui tutti i chip, anche R420, NV40, R3x0, nati per gestire sm2.0) accusano una perdita di circa il 40/50%; in più aggiungi che NV40 perde un'ulteriore percentuale a causa del fatto che i calcoli in fp32 in qualche modo incidono negativamente sulle prestazioni (specie in presenza di texture fetch in contemporanea). Diciamo che al calo dovuto alla dipendenza tra tmu e alu devi aggiungere circa un ulteriore 15-20% dovuto all'uso di fp32 (rispetto a fp24di ATi) |
|
|
|
|
|
|
#471 | |
|
Bannato
Iscritto dal: Dec 2003
Città: Monteveglio(Bo)
Messaggi: 10006
|
Quote:
Nella demo canals si fa uso di shader fp32 e dici che scaldando a fp16 NV40 ne gioverebbe parzialmente e poi ti chiedo cosa intendi che riesce a "trattare" piuttosto bene anche shader fp32? Scusami magari se non mi sono espresso bene ma non sono mai stato molto bravo a spiegarmi bene. |
|
|
|
|
|
|
#472 | |
|
Bannato
Iscritto dal: Dec 2003
Città: Monteveglio(Bo)
Messaggi: 10006
|
Re: Re: Per Yossarian
Quote:
|
|
|
|
|
|
|
#473 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Re: Re: Re: Per Yossarian
Quote:
si; NV40, al contrario di NV3x (che non va d'accordo con i calcoli in fp e che, in particolare, con fp32 è un "chiodo"), can lo sm2.0, anche con fp32 ha una resa più che buona. Va da sé che, anche per un ottimo chip come NV40, fp32 è sicuramente un po' più pesante da gestire di quanto non lo sia fp24 e ancora di più fp16; questo soprattutto in presenza di altri tipi di calcoli in contemporanea (nell'esecuzione dei soli calcoli matematici, dai bench sintetici si vede chiaramente che NV40 gestisce fp16 e fp32 con la stessa disinvoltura con cui gestisce i calcoli in fx: questo dimostra che non è afflitto dai problemi evidenziati dalla precedente generazione). |
|
|
|
|
|
|
#474 | |
|
Senior Member
Iscritto dal: Oct 2002
Città: San Jose, California
Messaggi: 11794
|
Quote:
Se uno shader e' computazionalmente esattamente identico in fp16 perche' usare fp32? Non c'e' alcun motivo logico dal punto di vista ingegneristico, ed un programmatore alla Valve, che sicuramente ne sa, non farebbe mai un errore simile. Non voglio accusare nessuno di niente, mi limito a constatare l'ovvio, che qualcosa di strano c'e'.
__________________
"We in the game industry are lucky enough to be able to create our visions" @ NVIDIA |
|
|
|
|
|
|
#475 |
|
Senior Member
Iscritto dal: Jun 2002
Messaggi: 15280
|
Leggete qui....un pò macchinoso e alla carlona,però funziona.
Renderizza tutto correttamente e senza mancanze e artefatti. http://forum.hwupgrade.it/showthread...hreadid=824334
__________________
Boris Strugatskij - Arkadij Strugatskij : Picnic sul ciglio della strada
|
|
|
|
|
|
#476 | |
|
Bannato
Iscritto dal: Dec 2003
Città: Monteveglio(Bo)
Messaggi: 10006
|
Re: Re: Per Yossarian
Quote:
Con future realease di driver potra migliorare la situazione? almeno da far diventare NV40 più veloce almeno della 9800XT |
|
|
|
|
|
|
#477 | |
|
Senior Member
Iscritto dal: Jan 2003
Messaggi: 10395
|
Re: Re: Re: Re: Per Yossarian
Quote:
Scusa Yoss, ma se il calo fosse del 30% non mi sarei stupito più di tanto, qui si parla di più del 50%! A 1024x768 senza filtri, oltretutto. Per quanto si possa esser limitati dall'architettura e dagli FP 32 mi aspetterei prestazioni perlomeno un attimino più elevate. Almeno più di una 9800XT. Sembra come non solo si siano scritti gli shader senza pensare a NV 40, ma persino nella maniera peggiore di come potessero essere scritti....
__________________
PC Specialist Recoil 17 - 13900HX - 32 GB DDR5 5200 - Geforce RTX 4080 Mobile 12Gb 175W - 1 SSD Corsair Core XT MP600 2 TB NVMe - 1SSD Solidigm P41+ 2TB NVMe |
|
|
|
|
|
|
#478 | |
|
Bannato
Iscritto dal: Dec 2003
Città: Monteveglio(Bo)
Messaggi: 10006
|
Re: Re: Re: Re: Re: Per Yossarian
Quote:
|
|
|
|
|
|
|
#479 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
hai ragione, anzi nel mio campo si ha spesso il problema della "coperta corta". Non conosco a fondo il motore di HL2 per sapere che tipo di shader sono stati usati; stando ai test postati da Raffaele, però, è evidente che gli shader della mappa "prison" sono molto meno complessi degli altri, il che farebbe pensare, se veramente fossero in fp32 anche questi, alla possibilità di sostituirli con fp16. E d'altra parte, non credo che non ci sia la possibilità di utilizzare una path dx9 ed effettuare, la dove possibile, shader replacement, scendendo anche fino ai ps1.x. Certo che se Valve dovesse aver utilizzato, per la path dx9, solo fp32 avrebbe commesso un errore piuttosto grossolano (se di errore si è trattato). Non si tratta di accusare o meno qualcuno, però, in effetti, sembra che ID e Valve abbiano operato scelte progettuali un po' strane e fuori dai canoni per non destare qualche sospetto. Tu stesso hai detto, in precedenza, che nel caso specifico di Doom3 l'algoritmo di rendering adoperato da Carmack non è conveniente. La penso allo stesso modo e, da quello che ha scritto, pare che anche Raffaele sia di questa idea. L'unica cosa che può venire in mente è che quel particolare ordine di rendering conviene alle GeForce che, in presenza di soli calcoli relativi allo z-buffer, raddoppiano il pixel fillrate. Questo, di fatto, considerate anche le maggiori frequenze operative, annulla il gap tra NV3x e R3x0 e dà un buon margine di vantaggio a NV40 (nonostante le frequenze inferiori rispetto a R420). Scelta opposta pare essere stata operata da Valve: un uso smodato e ridondante di fp32, anche dove non fosse necessario, avrebbe lo scopo (non dichiarato) di abbattere ulteriormente le prestazioni di una famiglia di chip (NV3x) che non ha molta dimestichezza con lo sm2.0, giustificandone il declassamento a chip DX8.x. IMHO, HL2 e Doom3 rappresentano due facce della stessa medaglia: scelte progettuali opposte dettate, evidentemente, non solo da scelte tecniche "particolari" ma da alleanze politiche e di marketing |
|
|
|
|
|
|
#480 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Re: Re: Re: Re: Re: Per Yossarian
Quote:
se ti ricordi, ne abbiamo parlato anche su nV Italia; io continuo a poensarla sempre alla stessa maniera: sia ID che Valve hanno progettato i loro engine pensando a come "far dispetto al rivale" (ATi e nVIDIA rispettivamente). Sicuramente gli shader di HL2 sono quanto di più indigesto possibile si possa concepire per l'architettura delle GeForce e, sicuramente, sono stati scritti in modo da massimizzare il problema della dipendenza tra alu e tmu, perchè il calo di NV40 è troppo elevato da essere giustificato dal solo utilizzo di fp32. Gli shader della mappa "canals" sono sicuramente complessie piuttosto lunghi: questo dovrebbe provocare (come in effetti avviene) un abbattimento delle prestazioni di tutti i chip. Solo che quelli delle ATi sono più contenuti, vuoi per l'utilizzo di fp24, vuoi per capacità di eseguire più istruzioni per ciclo grazie all'indipendenza tra alu e tmu (le 12 pipeline della X800 pro, in una situazione del genere, risultano più veloci delle 16 della 6800 ultra avendo un vantaggio di 4 operazioni per ciclo di clock che diventano 16 se il confronto si fa con le 16 pipeline della X800XT). |
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 05:31.



















