Quote:
Originariamente inviato da A.L.M.
Le prestazioni di R600 sicuramente dipendono dalla disponibilità di codice ottimizzato e/o dalla capacità del compiler di "raggruppare" le istruzioni (e questa è una cosa che viene dettata dai drivers). E' inoltre favorito, vedi Unreal Engine 3 e altri, in quei giochi in cui il rapporto ALU:TEX è fortemente favorevole alle ALU.
G80 invece si trova bene nella situazione opposta: più gli shaders sono semplici, più a fondo sfrutterà i suoi SP. E' molto più potente nel texture filtering, e quello, nei giochi non molto pesanti sugli shaders (come sono molti giochi attuali) sicuramente è un gran vantaggio.
Però non mi pare corretto il tuo calcolo, visto che devi tenere in conto le frequenze.
Direi che il rapporto tra le capacità di calcolo si comprenda più se ci si basa sulle istruzioni/sec che sui GFlops. R600 è in vantaggio (nella situazione migliore), ma di poco:
R600XT-->237760 ShadersOp/sec (ottenuto facendo n°shader units x shader clock)
G80GTX-->172800 ShadersOp/sec
Nel caso di 8800GT vs RV670
RV670Pro (HD3850)-->240000 ShadersOp/sec (nel caso della XT avremmo 264000 ShadersOp/sec)
G92GT-->168000 ShadersOp/sec
Come vedi non è sugli shaders che R600 è debole, clockarli separatamente non è necessario, anche perchè se i drivers funzionano bene si riesce ad ottenere addirittura un certo vantaggio, altrimenti credo che esista un sostanziale pareggio. Sono TMU e ROPs ad essere troppo poco potenti rispetto a G80 (soprattutto la GTX): le capacità di texture filtering di R600XT sono quasi circa il 35% di quelle di G80GTX, ad esempio, e nei giochi attuali questo è un grave handicap.
Per non parlare poi delle ROPs malfunzionanti, che azzoppano (e non poco) le prestazioni della scheda con l'AA.
Ecco perchè penso che si saranno concentreati su quello in RV670.
Il calore e l'energy draining dovrebbero essere problemi risolti (RV670Pro potrebbe andare come la GT e consumare poco meno).
|
Però secondo me (potrei sbagliarmi sto solo cercando di capire

) quei numeri non sono confrontabili: le 172800 shaders op/sec di G80 sono effettive perchè tutti gli shaders funzionano ad ogni ciclo di clock, le 237760 shaders op/sec di R600 sono potenziali perchè non si sa quanti sp vengono effettivamente utilizzati. Io ho calcolato le istruzioni processabili da ogni ALU ipotizzando un valore medio per R600 e raddoppiando quelle di G80 perchè di fatto i suoi sp vanno a frequenza doppia rispetto a quelli di R600.
In sostanza la soluzione ati ha una potenza di calcolo leggermente superiore solo in una situazione per lei ottimale. Per questo secondo me potrebbero apportare dei miglioramenti anche in questo ambito.