Radeon X1900: l'evoluzione della specie

Nonostante siano passati pochi mesi dall'introduzione delle schede Radeon X1800 dedicate alla fascia alta di mercato, ATI presenta le nuove Radeon X1900, basate sul processore grafico R580, attraverso le quali dimostra di non essere impreparata al prossimo scontro con NVIDIA.
di Raffaele Fanizzi pubblicato il 24 Gennaio 2006 nel canale Schede VideoNVIDIAATIRadeonAMD
Caratteristiche tecniche – parte 2
R580 possiede lo stesso numero di TMU visto su R520, ma la potenza di calcolo relativa ai pixel shaders è di tre volte superiore. Il numero di PSU (pixel shading unit) è salito, infatti, da 16 a 48 (raggruppate in 12 Quad Pixel Shader Core), il che ha portato il rapporto tra numero di PSU e numero di TMU a 3:1, esattamente come per RV530. Nel complesso, quindi, l'architettura di R580 a livello di pixel shading è equiparabile a quattro volte RV530. Volendo dare qualche numero sulle capacità computazionali di R580, possiamo dire che può eseguire 166 miliardi di operazioni al secondo sui pixel shaders (contro i 60 di R520) e 553 GFLOPS (contro i 272,5 di R520). Poiché l'architettura delle PSU non è cambiata e poiché ogni PSU è composta da due ALU, abbiamo in totale la possibilità di eseguire per ogni PSU quattro MADD (operazione combinata di addizione e moltiplicazione), quattro addizioni ed una operazione di flow control per pixel per ciclo di clock. Poiché abbiamo 48 PSU e 16 TMU, ogni ciclo di clock R580 esegue 192 MADD, 192 addizioni, 192 operazioni di flow control e fino a 16 texture fetch. R520 si ferma a 64 MADD, 64 addizioni e 64 operazioni di flow control, con lo stesso numero di texture fetch, mentre G70 può eseguire fino a 192 MADD senza texture fetch oppure 96 MADD + 24 texture fetch.
Facendo un'analisi di questa architettura in termini di pipeline, ci rendiamo conto di quanto questo sia difficile. Se, infatti, R520, pur non avendo una struttura di calcolo a pipeline, poiché possiede 16 TMU, 16 PSU e 16 ROPs può essere rapportato ad un'architettura a 16 pipeline, con R580 tale operazione non possiamo farla con altrettanta leggerezza. R580 mantiene la capacità di eseguire 16 texture fetch per ciclo di clock e possiede 16 ROPs, ma le sue capacità di calcolo con i pixel shaders sono decisamente superiori. Ciò significa che se con i pixel shaders più complessi R520 non riusciva a saturare le capacità delle ROPs perché non in grado di elaborazione 16 pixel per ciclo di clock, R580, invece, sfrutterà meglio le sue ROPs e, in caso di shaders poco complessi, risulterà persino frenato da esse.
ATI non si è limitata ad aumentare il numero di unità di calcolo, ma ha colto l'occasione per eseguire anche qualche altra revisione. Le unità di texture mapping di R580 sono state potenziate e rispetto a quelle di R520 sono ora in grado di eseguire un'operazione denominata FETCH4. Durante operazioni come lo shadow mapping, per ottenere delle ombre il più realistiche possibili, si esegue un elevato numero di texture fetch tra indirizzi adiacenti della shadow map. Le TMU di R580, grazie all'operatore FETCH4, possono eseguire quattro fetch di tipo point sample in quattro indirizzi adiacenti della shadow map in un singolo ciclo di clock. Ciò quadruplica a tutti gli effetti le operazioni di texture sampling possibili.
Inoltre, sempre rispetto a quanto visto con R520, ATI ha incrementato del 50% la cache onchip dedicata alle operazioni di Hierarchical Z, cioè alla rimozione delle superfici nascoste. Tale miglioramento consente di ottenere un rendimento più costante di questa funzionalità all'aumentare della risoluzione utilizzata.
Segnaliamo, infine, anche un miglioramento nella gestione dinamica delle frequenze che consente a R580 di variare la frequenza di funzionamento di core e memorie a seconda del carico di lavoro, migliorando così la logica del risparmio energetico.
ATI Radeon X1900 XTX |
ATI Radeon X1900 XT |
ATI Radeon X1800 XT |
NVIDIA GeForce 7800 GTX 512 MB |
NVIDIA GeForce 7800 GTX 256 MB |
|
Bus di memoria | 256 bit |
256 bit |
256 bit |
256 bit |
256 bit |
Processo produttivo | 0.09 micron |
0.09 micron |
0.09 micron |
0.11 micron |
0.11 micron |
Frequenza chip e memoria | 650/1550 |
625/1450 |
630/1400 |
550/1700 |
430/1200 |
Bus | PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
Unità di Vertex Shading | 8 |
8 |
8 |
8 |
8 |
Unità di Pixel Shading | 48 |
48 |
16 |
24 |
24 |
Numero di TMU | 16 |
16 |
16 |
24 |
24 |
Texture per ciclo di clock | 1 |
1 |
1 |
1 |
1 |
Numero di Rops | 16 |
16 |
16 |
16 |
16 |
Fill Rate | 10400 Mpixel e 10400 Mtexel |
10000 Mpixel e 10000 Mtexel |
10080 Mpixel e 10080 Mtexel |
13200 Mpixel e 13200 Mtexel |
10320 Mpixel e 10320 Mtexel |
Banda Passante | 49,6 GB |
46,4 GB |
44,8 GB |
54,4 GB |
38,4 GB |
Versione Vertex Shader | 3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
Versione Pixel Shader | 3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
Full Scene Anti-Aliasing | Adaptive AA e Multisampling |
Adaptive AA e Multisampling |
Adaptive AA e Multisampling |
Intellisample 4.0 |
Intellisample 4.0 |
Altre caratteristiche | Ring Bus Memory Controller, Ultra-Threaded Shader Engine, AVIVO |
Ring Bus Memory Controller, Ultra-Threaded Shader Engine, AVIVO |
Ring Bus Memory Controller, Ultra-Threaded Shader Engine, AVIVO |
CineFX 4.0, UltraShadow II |
CineFX 4.0, UltraShadow II |
Con il lancio di R580 ATI presenta tre diverse schede video: la Radeon X1900 XTX, la Radeon X1900 XT e la Radeon X1900 CrossFire. La prima ha un core operante a 650 Mhz e memorie a 1550 Mhz, mentre le altre hanno frequenze per core e memorie rispettivamente pari a 625 Mhz e 1450 Mhz. E' interessante notare come le frequenze delle memorie non si discostino molto da quelle della Radeon X1800 XT. La spiegazione a questa scelta è nel numero di TMU rimasto costante: tra le operazioni che richiedono maggiore banda passante, l'accesso alle texture è sicuramente il più gravoso e poiché R580 ha 16 TMU esattamente come R520, non sono richiesti moduli GDDR3 più veloci.
Le restanti funzionalità di R580 sono una esatta fotocopia di quanto abbiamo visto con la nuova famiglia di prodotti Radeon X1000. Per maggiori informazioni al riguardo vi rimandiamo ad un precedente articolo.