29-06-2008, 14:27
|
#765
|
|
Senior Member
Iscritto dal: May 2004
Città: Erchie
Messaggi: 6927
|
Quote:
Originariamente inviato da yossarian
se si esclude il caso di the witcher, fino a 1920*1200 la bandwidth sembra limitare hd4850 rispetto ad hd4870 di circa il 10%; questo porterebbe a concludere che RV770 gestisca piuttosto bene la banda passante, considerato anche che, rispetto a RV6x0 deve "alimentare" il 150% in più di alu e di tmu. Uno dei problemi della serie precedente è che il ring bus è utilizzato non solo dalle unità che si occupano di elaborazione di immagini 3D, ma anche tutta una serie di sottosistemi integrati nel chip che, pur non necessitando di elevata banda passante, vanno ad intasare il traffico di dati nel ring bus. Per questo, su rv770, è stato introdotto l'hub (con bus a 2048 bit), che si occupa di dirottare su un canale a parte il traffico di dati che non ha nulla a che fare con elaborazioni 3D.
Altro elemento determinante, dal punto di vista prestazionale, è il numero delle alu; un'architettura vliw, tranne i casi in cui può elaborare codice ottimizzato, difficilmente riesce a raggiungere il massimo parallelismo teorico possibile. Quindi un approccio di tipo "brute force" è quello che consente risultati migliore nell'immediato (in attesa di ottimizzare il codice), potendo contare sulle notevolmente ridotte dimensioni di questo tipo di architettura (molti meno registri e blocchi di controllo e trasmissione = molto meno spazio richiesto) e sulla maggior velocità di elaborazione che questo approccio permette (le unità eseguono un'istruzione senza dover "prendere decisioni").
Da osservare che ATi e nVidia hanno scelto strade differenti ma entrambe hanno privilegiato un approccio più "raffinato" in alcuni tipi di elaborazione e uno di tipo "brute force" in altri. Ad esempio, lo shader core dei chip NV è progettato in modo da ottenere un livello di occupazione delle alu molto elevato con qualunque tipo di codice (meno sp ma in grado di autobilanciare i carichi di lavoro e di gestire il parallelismo), però nelle operazioni di texturing ha puntato sul numero senza pensare ad ottimizzazioni raffinate per nascondere le latenze. Al contrario, ATi ha ottimizzato al massimo le tmu e ha puntato sul numero elevato di sp, arrivando a ridurne le dimensioni anche grazie all'aliminazione di un'unità dedicata alle operazioni di integer bitshift che è presente in ogni sp di R600 e di RV670; in RV770 ogni singola alu è in grado di svolgere tale operazione
|
a proposito di the witcher anandtech aveva evidenziato ke
Quote:
|
Finally, it's interesting to note that the 4870 and the 3870 X2 are neck-and-neck until we finally crank up the resolution to 2560x1600, at which point the 3870 X2 pulls ahead. This is not what we would have expected. The HD4000 series seems to scale just a bit worse with resolution than either NVIDIA's cards or the HD3000 series.
|
secnodo te questo a cosa può essere dovuto?...ciao
|
|
|