|
Efficienza. E’ questa la parola chiave dietro la quale si nasconde
l’architettura del processore grafico R520. In realtà questo termine è tutto
fuorché univoco e può essere riferito genericamente alla capacità di saper gestire in
maniera ottimale (cioè con il minimo costo ed il massimo rendimento) determinate
situazioni. In questa sede daremo una caratterizzazione a questo termine riferendoci, in
particolare, agli ambiti in cui il nuovo progetto canadese eccelle.
Abbiamo già discusso in un precedente articolo
del tipo di sviluppo che ATI ha portato avanti e delle novità introdotte in R520 rispetto
a R480, il suo precedente processore grafico di punta. L’analisi tecnica ha mostrato
chiaramente che l’approccio seguito dall’azienda canadese nella progettazione di
R520 è votato essenzialmente all’incremento dell’efficienza nella gestione di
determinate situazioni di rendering. In particolare ATI ha progettato un motore di shading
che, nonostante non abbia un’architettura a shader unificati, risulta essere
completamente inedito nell’organizzazione logica rispetto a quanto visto fino ad ora
e possiede diversi punti di contatto con R500, la GPU a shader unificati alla base della
console XBOX 360 di Microsoft. Per la prima volta abbiamo l’indipendenza tra ALU e
TMU, un Ultra-Threading Dispatch Processor ed un General Purpose Register Array che
offrono una flessibilità nella configurazione delle unità di calcolo sconosciuta alle
architetture attuali, un controller della memoria di tipo ring bus con organizzazione
interna a 512 bit e verso l’esterno a 256 bit diviso in otto canali da 32 bit, un
calcolo con precisione sempre a 32 bit in tutto il percorso di rendering e la capacità di
applicare l’High Dynamic Range completo di antialiasing. Queste caratteristiche
esclusive di R520 vanno ad aggiungersi ad una serie di ottimizzazioni legate a
funzionalità già da tempo implementate in una GPU come ad esempio il filtro anisotropico
ad area, la compressione dei dati relativi allo z-buffer, l’utilizzo di una cache
full associative e la rimozione delle superfici nascoste.
In che cosa R520 è, quindi, più efficiente? Dal punto di vista teorico la sua
architettura è completamente votata al dynamic branching (una funzionalità il cui uso è
crescente negli shader più complessi), all’elaborazione di pixel shaders ricchi di
operazioni su texture e di operazioni matematiche e, più in generale, a qualsiasi
situazione di rendering in grado di mettere in crisi l’accesso alla memoria video.
| |
ATI Radeon X1800 XT |
ATI Radeon X1800 XL |
ATI Radeon X850 XT PE |
ATI Radeon X850 XT |
NVIDIA GeForce 7800 GTX |
NVIDIA GeForce 7800 GT |
NVIDIA GeForce 6800 Ultra |
| Bus di memoria |
256 bit |
256 bit |
256 bit |
256 bit |
256 bit |
256 bit |
256 bit |
| Processo produttivo |
0.09 micron |
0.09 micron |
0.13 micron |
0.13 micron |
0.11 micron |
0.11 micron |
0.13 micron |
| Frequenza chip e memoria |
625/1500 |
500/1000 |
540/1180 |
520/1080 |
430/1200 |
400/1000 |
400/1100 |
| Bus |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
| Unità di Vertex Shading |
8 |
8 |
6 |
6 |
8 |
7 |
6 |
| Unità di Pixel Shading |
16 |
16 |
16 |
16 |
24 |
20 |
16 |
| Numero di TMU |
16 |
16 |
16 |
16 |
24 |
20 |
16 |
| Texture per ciclo di clock |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
| Numero di Rops |
16 |
16 |
16 |
16 |
16 |
16 |
16 |
| Fill Rate |
10000 Mpixel e 10000 Mtexel |
8000 Mpixel e 8000 Mtexel |
8640 Mpixel e 8640 Mtexel |
8320 Mpixel e 8320 Mtexel |
10320 Mpixel e 10320 Mtexel |
8000 Mpixel e 8000 Mtexel |
6400 Mpixel e 6400 Mtexel |
| Banda Passante |
48 GB |
32 GB |
37,7 GB |
34,5 GB |
38,4 GB |
32 GB |
35,2 GB |
| Versione Vertex Shader |
3.0 |
3.0 |
2.0 |
2.0 |
3.0 |
3.0 |
3.0 |
| Versione Pixel Shader |
3.0 |
3.0 |
2.0b |
2.0b |
3.0 |
3.0 |
3.0 |
| Full Scene Anti-Aliasing |
Adaptive AA e Multisampling |
Adaptive AA e Multisampling |
Smoothvision HD |
Smoothvision HD |
Intellisample 4.0 |
Intellisample 4.0 |
Intellisample 3.0 |
| Altro... |
Ring Bus Memory Controller, Ultra- Threaded Shader Engine, AVIVO |
Ring Bus Memory Controller, Ultra- Threaded Shader Engine, AVIVO |
Smartshader HD, Videoshader HD, Hyper-Z HD |
Smartshader HD, Videoshader HD, Hyper-Z HD |
CineFX 4.0, UltraShadow II |
CineFX 4.0, UltraShadow II |
CineFX 3.0, UltraShadow II |
Le schede video analizzate in questa occasione sono la Radeon X1800 XT e la Radeon
X1800 XL, entrambe basate su R520 e dotate di sedici pipeline di rendering, anche se
questa denominazione può essere considerata ormai obsoleta rispetto all’architettura
di R520. E’ più corretto affermare, infatti, che le schede Radeon X1800 possiedono
sedici TMU e sedici unità di pixel shading ognuna con due ALU e possono potenzialmente
elaborare sedici pixel (e fino a due istruzioni per pixel) e sedici texture per ciclo di
clock. Le due implementazioni di R520 qui analizzate si differenziano sia nella frequenza
nel core che delle memorie. In particolare la Radeon X1800 XT ha un core lavorante a 625 MHz e memorie a 1500 MHz, mentre la Radeon X1800 XL ha un core lavorante a 500 MHz e memorie a 1000 MHz. Le specifiche tecniche sono quindi pari a 10000 Mpixel/s, 10000 Mtexel/s e 48 GB/s di banda passante per la Radeon X1800 XT, mentre la Radeon X1800 XL può elaborare fino a 8000 Mpixel/s, 8000 Mtexel/s con una banda passante da 32 GB/s.
|