ATI Radeon X1800: quando 16 pipeline sono meglio di 24

Abbiamo atteso a lungo prima di mettere le mani sul processore grafico R520, tempo in cui si è detto tutto ed il contrario di tutto al riguardo. In questa sede analizziamo qualità, prestazioni, overclock, consumi e rumorosità dell’antagonista di G70 che con le sue sedici pipeline ed una architettura all’avanguardia promette di infrangere ogni record di efficienza.
di Raffaele Fanizzi pubblicato il 12 Ottobre 2005 nel canale Schede VideoATIRadeonAMD
Caratteristiche tecniche
Efficienza. E’ questa la parola chiave dietro la quale si nasconde l’architettura del processore grafico R520. In realtà questo termine è tutto fuorché univoco e può essere riferito genericamente alla capacità di saper gestire in maniera ottimale (cioè con il minimo costo ed il massimo rendimento) determinate situazioni. In questa sede daremo una caratterizzazione a questo termine riferendoci, in particolare, agli ambiti in cui il nuovo progetto canadese eccelle.
Abbiamo già discusso in un precedente articolo del tipo di sviluppo che ATI ha portato avanti e delle novità introdotte in R520 rispetto a R480, il suo precedente processore grafico di punta. L’analisi tecnica ha mostrato chiaramente che l’approccio seguito dall’azienda canadese nella progettazione di R520 è votato essenzialmente all’incremento dell’efficienza nella gestione di determinate situazioni di rendering. In particolare ATI ha progettato un motore di shading che, nonostante non abbia un’architettura a shader unificati, risulta essere completamente inedito nell’organizzazione logica rispetto a quanto visto fino ad ora e possiede diversi punti di contatto con R500, la GPU a shader unificati alla base della console XBOX 360 di Microsoft. Per la prima volta abbiamo l’indipendenza tra ALU e TMU, un Ultra-Threading Dispatch Processor ed un General Purpose Register Array che offrono una flessibilità nella configurazione delle unità di calcolo sconosciuta alle architetture attuali, un controller della memoria di tipo ring bus con organizzazione interna a 512 bit e verso l’esterno a 256 bit diviso in otto canali da 32 bit, un calcolo con precisione sempre a 32 bit in tutto il percorso di rendering e la capacità di applicare l’High Dynamic Range completo di antialiasing. Queste caratteristiche esclusive di R520 vanno ad aggiungersi ad una serie di ottimizzazioni legate a funzionalità già da tempo implementate in una GPU come ad esempio il filtro anisotropico ad area, la compressione dei dati relativi allo z-buffer, l’utilizzo di una cache full associative e la rimozione delle superfici nascoste.
In che cosa R520 è, quindi, più efficiente? Dal punto di vista teorico la sua architettura è completamente votata al dynamic branching (una funzionalità il cui uso è crescente negli shader più complessi), all’elaborazione di pixel shaders ricchi di operazioni su texture e di operazioni matematiche e, più in generale, a qualsiasi situazione di rendering in grado di mettere in crisi l’accesso alla memoria video.
ATI Radeon X1800 XT | ATI Radeon X1800 XL | ATI Radeon X850 XT PE | ATI Radeon X850 XT | NVIDIA GeForce 7800 GTX | NVIDIA GeForce 7800 GT | NVIDIA GeForce 6800 Ultra | |
Bus di memoria | 256 bit | 256 bit | 256 bit | 256 bit | 256 bit | 256 bit | 256 bit |
Processo produttivo | 0.09 micron | 0.09 micron | 0.13 micron | 0.13 micron | 0.11 micron | 0.11 micron | 0.13 micron |
Frequenza chip e memoria | 625/1500 | 500/1000 | 540/1180 | 520/1080 | 430/1200 | 400/1000 | 400/1100 |
Bus | PCI Express 16x | PCI Express 16x | PCI Express 16x | PCI Express 16x | PCI Express 16x | PCI Express 16x | PCI Express 16x |
Unità di Vertex Shading | 8 | 8 | 6 | 6 | 8 | 7 | 6 |
Unità di Pixel Shading | 16 | 16 | 16 | 16 | 24 | 20 | 16 |
Numero di TMU | 16 | 16 | 16 | 16 | 24 | 20 | 16 |
Texture per ciclo di clock | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
Numero di Rops | 16 | 16 | 16 | 16 | 16 | 16 | 16 |
Fill Rate | 10000 Mpixel e 10000 Mtexel | 8000 Mpixel e 8000 Mtexel | 8640 Mpixel e 8640 Mtexel | 8320 Mpixel e 8320 Mtexel | 10320 Mpixel e 10320 Mtexel | 8000 Mpixel e 8000 Mtexel | 6400 Mpixel e 6400 Mtexel |
Banda Passante | 48 GB | 32 GB | 37,7 GB | 34,5 GB | 38,4 GB | 32 GB | 35,2 GB |
Versione Vertex Shader | 3.0 | 3.0 | 2.0 | 2.0 | 3.0 | 3.0 | 3.0 |
Versione Pixel Shader | 3.0 | 3.0 | 2.0b | 2.0b | 3.0 | 3.0 | 3.0 |
Full Scene Anti-Aliasing | Adaptive AA e Multisampling | Adaptive AA e Multisampling | Smoothvision HD | Smoothvision HD | Intellisample 4.0 | Intellisample 4.0 | Intellisample 3.0 |
Altro... | Ring Bus Memory Controller, Ultra- Threaded Shader Engine, AVIVO | Ring Bus Memory Controller, Ultra- Threaded Shader Engine, AVIVO | Smartshader HD, Videoshader HD, Hyper-Z HD | Smartshader HD, Videoshader HD, Hyper-Z HD | CineFX 4.0, UltraShadow II | CineFX 4.0, UltraShadow II | CineFX 3.0, UltraShadow II |
Le schede video analizzate in questa occasione sono la Radeon X1800 XT e la Radeon X1800 XL, entrambe basate su R520 e dotate di sedici pipeline di rendering, anche se questa denominazione può essere considerata ormai obsoleta rispetto all’architettura di R520. E’ più corretto affermare, infatti, che le schede Radeon X1800 possiedono sedici TMU e sedici unità di pixel shading ognuna con due ALU e possono potenzialmente elaborare sedici pixel (e fino a due istruzioni per pixel) e sedici texture per ciclo di clock. Le due implementazioni di R520 qui analizzate si differenziano sia nella frequenza nel core che delle memorie. In particolare la Radeon X1800 XT ha un core lavorante a 625 MHz e memorie a 1500 MHz, mentre la Radeon X1800 XL ha un core lavorante a 500 MHz e memorie a 1000 MHz. Le specifiche tecniche sono quindi pari a 10000 Mpixel/s, 10000 Mtexel/s e 48 GB/s di banda passante per la Radeon X1800 XT, mentre la Radeon X1800 XL può elaborare fino a 8000 Mpixel/s, 8000 Mtexel/s con una banda passante da 32 GB/s.