|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#41 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
per avere più spazio interno per allocare un maggior numero di registri temporanei (le DX9 prevedono un numero minimo almeno quadruplo di registri temporanei, rispetto alle DX8.1 spec PS1.4) e per poter aumentare il numero di ALU, nonchè variarne la qualità (la 9600 contiene anche ALU che eseguono calcoli in FP, che sono più voluminose rispetto alle corrispondenti unità FX; anche nVIDIA si è trovata ad affrontare un problema simile, passando da NV30 a NV35 e da NV31 a NV36 e lo ha risolto diminuendo di qualche unità il numero di registri interni, per la verità già poco sufficiente, però eral'unica modifica possibile). ciao |
|
|
|
|
|
|
#42 |
|
Senior Member
Iscritto dal: Nov 2002
Città: Budapest
Messaggi: 19133
|
ottima spiegazione, anche se io mi riferivo ad un'ipotetica 9600XT con bus a 256 bit...pandyno aveva detto ke non si sarebbe assistito ad un raddoppio prestazionale perchè i 256 bit si sentono di più sulle architetture ad 8 pipe...
bYeZ!
__________________
Improvise, adapt, overcome. |
|
|
|
|
|
#43 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
In realtà, nel test che fu fatto quando venne presentato l'NV35, si fece un bench con Q3, a 1600x1200 AA4x e aniso 4x, con i due chip a frequenze attorno ai 300 MHZ e si vide che, in quelle condizioni, l'NV35 faceva registrare prestazioni doppie rispetto all'NV30. Però, ti ripeto, si tratta di situazioni di impiego estreme. Indubbiamente, attivando i filtri e aumentando la risoluzione, i 256 bit permettono un bel boost prestazionale; però, nel caso specifico della serie 9600 c'è da registrare un comportamento anomalo con l'attivazione dell'AA4x; si ha un calo di prestazioni molto più brusco di quello fatto registrare dalla 9500 pro che ha stesso bus e minor bandwidth. Questo potrebbe far pensare all'impiego di registri interni meno capienti di quelli dell'R300, che incide negativamente sulla capacità di calcolo. ciao |
|
|
|
|
|
|
#44 | |
|
Senior Member
Iscritto dal: Nov 2002
Città: Budapest
Messaggi: 19133
|
Quote:
mmm me ne ero accorto infatti, ed è stata la cosa ke mi ha impedito l'acquisto...cmq la 9500 pro ha 8 pipe...forse è per quello...cmq con i 256 bit di bus tu dici ke la situazione si capovolgerebbe o rimarrebbe uguale? bYeZ!
__________________
Improvise, adapt, overcome. |
|
|
|
|
|
|
#45 | |
|
Senior Member
Iscritto dal: Sep 2003
Città: Torino
Messaggi: 1359
|
Quote:
Oltre a pixel e vertex shader mi vengono in mente il continuous tesselation e l'hdr che vederli fa' piacere pero' non stravolge l'immagine cosi' drasticamente rispetto alla stessa con un buon uso delle possibilita' delle dx8!! Poi magari mi sono perso qualcosa, tu o qualcun'altro saprebbe farmi un'esempio pratico del netto miglioramento visivo?? Grazie.
__________________
Lightsaber: XP ProSP3 |C2D 6600 |Abit AW9D |2GB Corsair |Geffo 8800GTX |Seagate Barracuda |SB Live!
|
|
|
|
|
|
|
#46 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
sarebbe tutto da verificare; il bus a 256 bit favorirebbe lo scambio di dati con l'esterno, però un'insufficiente capienza dei registri interni rallenta l'elaborazione del chip, perchè costringe ad un maggior numero di accessi al frame buffer (quello che, in maniera amplificata, accade alla serie FX, soprattutto quando si elabora in FP32). Quindi sarebbe da vedere quanto l'aumento di ampiezza del canale esterno riesca a compensare le diminuita capacità di trasferimento dei dati all'interno del chip. L'NV38 o l'NV35, pur avendo una bandwidth maggiore rispetto all'R360 o, ancor di più , rispetto all'R350 e all'R300, paradossalmente (almeno ad unìanalisi superficiale che tenga conto solo della bandwidth), perdono terreno proprio con i filtri, ad alta risoluzione (questo, sia con i PS2.0, con cui sappiamo che sono in difficoltà, ma anche con i PS1.x); questo a causa del maggior numero di accessi al frame buffer a cui sono obbligate anche dalla minor capacità dei registri interni. |
|
|
|
|
|
|
#47 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
|
|
|
|
|
|
|
#48 |
|
Senior Member
Iscritto dal: Nov 2002
Città: Budapest
Messaggi: 19133
|
ti ringrazio!
bYeZ!
__________________
Improvise, adapt, overcome. |
|
|
|
|
|
#49 |
|
Senior Member
Iscritto dal: Nov 2002
Città: Budapest
Messaggi: 19133
|
forse è un po OT...
yossarian, mi sai dire quante texture per passata e quante per ciclo di clock può elaborare il 7500? e come mai ATi ha scelto di utilizzare ben TRE tmu e 2 pipe rinunciando a un più classico 4x2? bYeZ!
__________________
Improvise, adapt, overcome. |
|
|
|
|
|
#50 | |
|
Senior Member
Iscritto dal: Sep 2003
Città: Torino
Messaggi: 1359
|
Quote:
__________________
Lightsaber: XP ProSP3 |C2D 6600 |Abit AW9D |2GB Corsair |Geffo 8800GTX |Seagate Barracuda |SB Live!
|
|
|
|
|
|
|
#51 | |
|
Senior Member
Iscritto dal: Oct 2001
Città: Civitavecchia (RM)
Messaggi: 1525
|
Quote:
Che franki mi perdoni se prendo in prestito il suo lavoro e linko un grafico che riassume bene la differenza solo numerica della precisione di calcolo ![]() Al di la' delle feature, qui e' proprio un completamento e la messa in atto di un processo iniziato timidamente all'epoca delle dx7. Il tanto criticato transform & lighting e le prime istruzioni shader sono state una coraggiosa scommessa, le dx8 sono state il primo vero implementamento e le dx9 sono il coronamento del disegno. Veder girare Half Life 2 e' qualcosa di incredibile, e se consideriamo che non sfrutta ancora appieno cio' che l'api puo' dare per via della limitatezza delle schede attuali... la prossima generazione di hw dx9.1 sara' qualcosa di incredibile
__________________
Com'era l'onda sullo scoglio aperta / cosi su quella fronte a me diletta era il mio amore - e non sapevo quanto / ne gioisse lo scoglio o fosse in pianto. |
|
|
|
|
|
|
#52 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Di conseguenza, la 7500, ossia l'R100 avendo 2 pipelines con 3 TMU, può elaborare 2 pixel per ciclo di clock e per single pass, a cui può applicare fino a 3 textures per single pass. Diciamo che è l'unico chip, insieme alla Parhelia, a poter applicare un effetto come l'EMBM in un solo ciclo di clock. Purtroppo però, per applicare un numero superiore di textures (4, 5, .....) è costretto a far ricorso al classico multipass rendering, in cui i risultati intermedi sono immagazzinati in una porzione del frame buffer. |
|
|
|
|
|
|
#53 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
|
|
|
|
|
|
|
#55 | |
|
Senior Member
Iscritto dal: Sep 2001
Città: Pescara
Messaggi: 3695
|
Quote:
Posso farti una domanda yossarian? La 9600PRO quando si trova in condizione di dover applicare un'antialiasing 4X non potrebbe semplicemente non avere abbasstanza fill-rate per offrire una velocità comparabile a quella della 9500PRO? E' vero che con l'AA conta sopratutto la banda verso la memoria e la 9600PRO in questo vince, però è anche vero che un pixel deve essere disegnato più volte e per questo anche la forza bruta delle pipeline potrebbe essere messa sotto sforzo, sopratutto tenendo conto che la 9600PRO ha solo 4 pipe e quindi potrebbe anche essere già discretamente soddisfatta da un bus verso la memoria di 128bit. Anche una domanda per CS25 (non insultatemi E' vero che nelle schede moderne hanno estrema importanza le prestazioni delle unità shader, però credo che anche l'efficenza nell'applicazione di texture sia molto importante perchè fin quando non si utilizzeranno in larga misura le texture frattali i textel andranno sempre letti da una texture... Inoltre in questo contesto vedo molto meglio un chip che abbia un elevato numero di pipe e altrettante unità pixel shader (una per pipe, l'R300 se non sbaglio è fatto così) rispetto a un chip con meno pipe (e relative minori unità pixel shader). E' anche vero che i motori vertex shader sono in genere "separati" dal resto (es: R300 ha 8 pipe ma 4 unità vertex shader). Addirittura l'NV30 ha il cosiddetto vertex shader array (potresti spiegarmi meglio che significa?). Qualcuno sa perchè si sceglie questo approccio (quello di separare dal resto delle pipe i motori vertex shader)? Grazie. |
|
|
|
|
|
|
#56 | ||
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
Quote:
Hai un po' semplificato l'architettura dell'R3x0, che ha 8 pipelines, con una TMU e due unità FP96 su ogni pipeline; si tratta di tutte unità di tipo vettoriale, composte da 4 unità scalari FP24. La scelta di non includere le unità VS nelle pipelines di rendering eè dettata dal fatto che non è necessario un numero di VS pari a quello dei PS e, poichè il flusso di dati permette di farlo, si sceglie di tenere le unità VS separate. In realtà non + neppure giusto dire che sono separate, anche se il fatto che siano in numero inferiore potrebbe far pensare ciò; d'altronde, i chip Volari hanno un numeor di pipelines doppio rispetto al numero delle TMU: ciò non significa che le TMU siano al di fuori della pipeline di rendering. Anticipo la tua prossima domanda: ogni TMU fa uso di due serie di buffer interni in cui immagazzinare i risultati delle elaborazioni fatte; ogni serie di buffer è relativo ad una pipeline, quindi ogni TMU serve di fatto due pipelines. Il motivo della scelta è semplice: XGI ha fatto la tua stessa considerazione: meglio avere un numero di pixels in output il più elevato possibile. Non essendo possibile un'architettura 16x1, per motivi di spazio, hanno optato per due architetture con 8 pipeline e 4 TMU ciascuna. Veniamo alla vertex array. In realtà, pare proprio che le FX non abbiano alcuna vertex array (che invece si trova sul VP10 di 3DLabs), per un motivo molto semplice: un'unità vettoriale tradizionale è costituita da 4 unità scalari di tipo FP32 ognuna delle quali lavora su una coordinata (nello spazio ampliato si usano 4 ccordinate per definire un vettore se si usano coordinate cartesiane e 3 se si usano coordinate sferiche o cilindriche). Per cui, l'R3x0, con 4 unità vettoriali, ha di fatto 16 unità scalari raggruppate a 4 a 4. Un array tipo VP10, è anch'esso composto da 16 unità FP32 (nel caso specifico del VP10 sono proprio 16), ognuno dei quali lavora, però, su un valore scalare in input e non su una coordinata scalare di un vettore. Concettualmente è la stessa cosa:basta prendere un vettore e scomporlo nelle sua 4 coordinate, ognuna delle quali viene passata ad un'unità scalare dell'array; il problema è che questo passaggio costa in termini di prestazioni (al punto che, utilizzando vettori in input, l'array del VP10, a parità di unità scalari complessive, perde 1/3 circa in prestazioni, nei confronti dell'R3x0. L'array diventa vantaggioso con quelle applicazioni che non fanno largo uso di input in forma vettoriale classica (soprattutto programmi di grafica 3D pro, il cui input è piuttosto variegato), mentre è svantaggioso con i giochi. Perciò, valutando anche le prestazioni delle unità VS, e facendo questo tipo di considerazioni (la serie FX è destinata anche ai giocatori, mentre i chip di 3DLabs solo ad usi pro), diventa difficile ipotizzare la presenza di un array sull'NV3x, in luogo di unità vettoriali classiche. |
||
|
|
|
|
|
#57 |
|
Senior Member
Iscritto dal: Oct 2003
Città: Tra la mia amata Trento e Curitiba
Messaggi: 19526
|
Grazie a yossarian e CS25 per le spiegazioni sulla precisione di calcolo....... siete forti..!!
__________________
PSN wiston75 | PS5 + Series X + Series S | iPad Air M2 | iPhone 15 Pro Max | Watch Series 8 | MacBook Air M3 | Monitor Samsung 4K 28" U28R550 + LG 4K 32” UL750| NAS WD MyCloudEX2 2x2TB | What's wrong????? | Una foto al dì | Che bello il Brasile del Sud!
|
|
|
|
|
|
#58 |
|
Bannato
Iscritto dal: Mar 2001
Città: Lunata (LUcca)
Messaggi: 8686
|
Miiiinchi@ questa discussione mi ha fatto perdere il sonno
Bella bella... erano mesi e mesi che non assistevo più ad una discussione dove avevo da imparare qualcosa di veramente importante NICE Stà cosa del FP e dei registri interni mi intrippa Ora però ninno.. bonanotte |
|
|
|
|
|
#59 | |
|
Senior Member
Iscritto dal: Mar 2001
Messaggi: 5390
|
Quote:
è quello che penso anch'io, però non lo facciamo sapere in giro |
|
|
|
|
|
|
#60 |
|
Senior Member
Iscritto dal: Nov 2002
Città: Budapest
Messaggi: 19133
|
l'occhio umano riuscirebbe a distinguere differenze tangibili tra FP24 e FP32? o già FP24 darebbe modo di aumentare la qualità a livelli assurdi?
bYeZ!
__________________
Improvise, adapt, overcome. |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 16:56.




















