PDA

View Full Version : 7800GTX: nn ho capito una cosa...


Matrix_Genesis
07-07-2005, 09:41
Riportando dall'articolo di HW (Raster Operations Unit):
"Ciò significa che anche se dal punto di vista teorico G70 è in grado di elaborare ventiquattro pixel per ciclo di clock, di fatto non può scriverne più di sedici all’interno del frame buffer. NVIDIA ha già adottato con successo una soluzione simile all’interno di NV43, il processore grafico alla base delle schede GeForce 6600: in questo caso le pipeline ammontano ad otto, mentre le ROPs sono quattro. Il motivo delle ottime performance della GeForce 6600 nonostante questo collo di bottiglia è dovuto alla scarsissima probabilità che ogni pipeline sia in grado di elaborare effettivamente un pixel per ciclo di clock. La semplice applicazione del filtro trilineare (senza ottimizzazioni) richiede, infatti, due cicli di clock e l’esecuzione di pixel shaders complessi aumenta notevolmente questo valore. NVIDIA ha fatto tesoro, quindi, dell’esperienza maturata con la precedente famiglia di GPU GeForce ed ha evitato di inserire all’interno di G70 un numero di unità ROPs che sarebbe risultato essere sovrabbondante."

Poi dopo viene scritto(Tecnologia UltraShadow II e PureVideo):
"G70 non introduce alcuna novità nei confronti della tecnologia UltraShadow II se non quelle legate al maggior numero di pixel per ciclo di clock elaborati grazie alla presenza di 24 pipeline di rendering. La scheda GeForce 7800 GTX è quindi capace di processare ben 48 pixel per ciclo di clock nel rendering verso il solo z-buffer o il solo stencil buffer."

Secondo voi questa affermazione ha senso? Perchè far processare in linea teorica ben 48 pixel per Clock se poi nn è possibile metterli su buffer.
Posso capire prima dove i pixel messi su buffer erano 24;con il raddoppio nn può essere solo un collo di bottiglia?

Ciauzzz

Matrix_Genesis
07-07-2005, 14:31
Nessuno vuole dare la sua opinion? :D :)
O forse scrivo così male che nessuno riesce a capire :fagiano:

Matrix_Genesis
09-07-2005, 10:31
up please :D

Dumah Brazorf
09-07-2005, 10:42
Credo sia lo stesso discorso della parte sopra. La gpu in linea teorica riesce a processare 48 pixel per ciclo di clock ma nella realtà ne processa molti di meno perchè deve applicare filtri e amenità varie. E' cmq un notevole balzo in avanti da 4 a 16 pixel effettivamente scrivibili per ciclo di clock.
Fa conto che non ci capisco niente di 'sta roba eh!
Ciao.

yossarian
09-07-2005, 13:09
prima di tutto la possibilità di elaborare un pixel per ciclo è del tutto teorica; questo vale anche per operazioni semplici (o apparentemente tali) tipo pure z-ops (o stencil ops). Già il prelievo dei valori pivot di una tessera 4x4 e il confronto con i valori contenuti nello z-buffer richiede, come minimo, 3 cicli di clock (senza tener conto delle eventuali operazioni di riduzione alla display resolution se ci sono confronti che lasciano adito a dubbi e di scrittura dell'eventuale nuovo dato nello z-buffer).

Fatta questa premessa, l'utilizzo massiccio di stencil o z ops risulta particolarmente utile solo con giochi che adottano un rendering tipo Doom3 e sono solo una piccola parte delle operazioni che svolge una pipeline.
Da qui si evince che se le ROP's di NV30, NV40 e G70 sono state pensate specificatamente per velocizzare le operazioni di rendering con SW "specifici", G70, rispetto a NV40 è, invece pensato per aumentare la velocità nei calcoli matematici. Quindi, il fatto di avere solo 16 ROP's, in tal senso, non rappresenta un handicap. Avendo dovuto scegliere tra due opzioni: aumentare il numero delle ROP's o potenziare la capacità di calcolo delle pipeline, è stata scelta quest'ultima

Matrix_Genesis
09-07-2005, 15:18
In effetti un ciclo di clock è proprio poco per quello che devono fare, anche se in un clock se ne possono fare di cose :D
Grzie mille per le risposte; era da un pò che aspettavo :D
Buon week-end ciauz