Hardware Upgrade - il sito italiano sulla tecnologia - www.hwupgrade.it
« Torna all'articolo  -  Stampa
ATI Radeon X1800: quando 16 pipeline sono meglio di 24
Raffaele Fanizzi - 12 Ottobre 2005
"Abbiamo atteso a lungo prima di mettere le mani sul processore grafico R520, tempo in cui si è detto tutto ed il contrario di tutto al riguardo. In questa sede analizziamo qualità, prestazioni, overclock, consumi e rumorosità dell’antagonista di G70 che con le sue sedici pipeline ed una architettura all’avanguardia promette di infrangere ogni record di efficienza."
Pagina 1 - Caratteristiche tecniche

Efficienza. E’ questa la parola chiave dietro la quale si nasconde l’architettura del processore grafico R520. In realtà questo termine è tutto fuorché univoco e può essere riferito genericamente alla capacità di saper gestire in maniera ottimale (cioè con il minimo costo ed il massimo rendimento) determinate situazioni. In questa sede daremo una caratterizzazione a questo termine riferendoci, in particolare, agli ambiti in cui il nuovo progetto canadese eccelle.

Abbiamo già discusso in un precedente articolo del tipo di sviluppo che ATI ha portato avanti e delle novità introdotte in R520 rispetto a R480, il suo precedente processore grafico di punta. L’analisi tecnica ha mostrato chiaramente che l’approccio seguito dall’azienda canadese nella progettazione di R520 è votato essenzialmente all’incremento dell’efficienza nella gestione di determinate situazioni di rendering. In particolare ATI ha progettato un motore di shading che, nonostante non abbia un’architettura a shader unificati, risulta essere completamente inedito nell’organizzazione logica rispetto a quanto visto fino ad ora e possiede diversi punti di contatto con R500, la GPU a shader unificati alla base della console XBOX 360 di Microsoft. Per la prima volta abbiamo l’indipendenza tra ALU e TMU, un Ultra-Threading Dispatch Processor ed un General Purpose Register Array che offrono una flessibilità nella configurazione delle unità di calcolo sconosciuta alle architetture attuali, un controller della memoria di tipo ring bus con organizzazione interna a 512 bit e verso l’esterno a 256 bit diviso in otto canali da 32 bit, un calcolo con precisione sempre a 32 bit in tutto il percorso di rendering e la capacità di applicare l’High Dynamic Range completo di antialiasing. Queste caratteristiche esclusive di R520 vanno ad aggiungersi ad una serie di ottimizzazioni legate a funzionalità già da tempo implementate in una GPU come ad esempio il filtro anisotropico ad area, la compressione dei dati relativi allo z-buffer, l’utilizzo di una cache full associative e la rimozione delle superfici nascoste.

In che cosa R520 è, quindi, più efficiente? Dal punto di vista teorico la sua architettura è completamente votata al dynamic branching (una funzionalità il cui uso è crescente negli shader più complessi), all’elaborazione di pixel shaders ricchi di operazioni su texture e di operazioni matematiche e, più in generale, a qualsiasi situazione di rendering in grado di mettere in crisi l’accesso alla memoria video.

  ATI Radeon X1800 XT ATI Radeon X1800 XL ATI Radeon X850 XT PE ATI Radeon X850 XT NVIDIA GeForce 7800 GTX NVIDIA GeForce 7800 GT NVIDIA GeForce 6800 Ultra
Bus di memoria 256 bit 256 bit 256 bit 256 bit 256 bit 256 bit 256 bit
Processo produttivo 0.09 micron 0.09 micron 0.13 micron 0.13 micron 0.11 micron 0.11 micron 0.13 micron
Frequenza chip e memoria 625/1500 500/1000 540/1180 520/1080 430/1200 400/1000 400/1100
Bus PCI Express 16x PCI Express 16x PCI Express 16x PCI Express 16x PCI Express 16x PCI Express 16x PCI Express 16x
Unità di Vertex Shading 8 8 6 6 8 7 6
Unità di Pixel Shading 16 16 16 16 24 20 16
Numero di TMU 16 16 16 16 24 20 16
Texture per ciclo di clock 1 1 1 1 1 1 1
Numero di Rops 16 16 16 16 16 16 16
Fill Rate 10000 Mpixel e 10000 Mtexel 8000 Mpixel e 8000 Mtexel 8640 Mpixel e 8640 Mtexel 8320 Mpixel e 8320 Mtexel 10320 Mpixel e 10320 Mtexel 8000 Mpixel e 8000 Mtexel 6400 Mpixel e 6400 Mtexel
Banda Passante 48 GB 32 GB 37,7 GB 34,5 GB 38,4 GB 32 GB 35,2 GB
Versione Vertex Shader 3.0 3.0 2.0 2.0 3.0 3.0 3.0
Versione Pixel Shader 3.0 3.0 2.0b 2.0b 3.0 3.0 3.0
Full Scene Anti-Aliasing Adaptive AA e Multisampling Adaptive AA e Multisampling Smoothvision HD Smoothvision HD Intellisample 4.0 Intellisample 4.0 Intellisample 3.0
Altro... Ring Bus Memory Controller, Ultra- Threaded Shader Engine, AVIVO Ring Bus Memory Controller, Ultra- Threaded Shader Engine, AVIVO Smartshader HD, Videoshader HD, Hyper-Z HD Smartshader HD, Videoshader HD, Hyper-Z HD CineFX 4.0, UltraShadow II CineFX 4.0, UltraShadow II CineFX 3.0, UltraShadow II

Le schede video analizzate in questa occasione sono la Radeon X1800 XT e la Radeon X1800 XL, entrambe basate su R520 e dotate di sedici pipeline di rendering, anche se questa denominazione può essere considerata ormai obsoleta rispetto all’architettura di R520. E’ più corretto affermare, infatti, che le schede Radeon X1800 possiedono sedici TMU e sedici unità di pixel shading ognuna con due ALU e possono potenzialmente elaborare sedici pixel (e fino a due istruzioni per pixel) e sedici texture per ciclo di clock. Le due implementazioni di R520 qui analizzate si differenziano sia nella frequenza nel core che delle memorie. In particolare la Radeon X1800 XT ha un core lavorante a 625 MHz e memorie a 1500 MHz, mentre la Radeon X1800 XL ha un core lavorante a 500 MHz e memorie a 1000 MHz. Le specifiche tecniche sono quindi pari a 10000 Mpixel/s, 10000 Mtexel/s e 48 GB/s di banda passante per la Radeon X1800 XT, mentre la Radeon X1800 XL può elaborare fino a 8000 Mpixel/s, 8000 Mtexel/s con una banda passante da 32 GB/s.

Pagina 2 - Le schede

scheda_1_s.jpg (30139 bytes)

scheda_2_s.jpg (29048 bytes)

scheda_6_s.jpg (36625 bytes)

Osservando il layout delle schede video Radeon X1800 notiamo che entrambe sono basate sul medesimo PCB e ognuna è caratterizzata da una soluzione di raffreddamento differente: a doppio slot per la Radeon X1800 XT e a singolo slot per la Radeon X1800 XL. La lunghezza delle schede è pari a 22 centimetri e mezzo, la stessa delle schede GeForce 7800 GTX, mentre le schede GeForce 7800 GT e GeForce 6800 Ultra possono vantare un ingombro più ridotto di circa un centimetro.

scheda_3_s.jpg (24179 bytes)

Il sistema di raffreddamento della Radeon X1800 XT ricorda molto quello adottato da ATI per la reference board della Radeon X850 XT e ripreso anche da alcuni partner dell’azienda canadese come Sapphire. L’occupazione dello slot adiacente a quello PCI Express 16x è dovuta alla presenza di un canale a conduzione forzata dove l’aria, aspirata dall’interno del case dall’apposita ventola a turbina, attraversa le alette di raffreddamento in alluminio e viene espulsa fuori all’esterno attraverso la grata montata in corrispondenza del secondo slot occupato. L’elemento principale del dissipatore è una massiccia placca in alluminio a diretto contatto con buona parte delle superficie della scheda, sostituita da un elemento in rame in corrispondenza del processore grafico.

Il comportamento della ventola dal punto di vista acustico è lo stesso visto con la Radeon X850 XT: all’avvio del sistema, prima che il monitor si accenda, la velocità della turbina è impostata al massimo ed abbiamo riscontrato una moderata rumorosità. Dopo qualche secondo la velocità di rotazione si abbassa notevolmente e la scheda diventa estremamente silenziosa. Durante tutti i test non abbiamo mai rilevato temperature di esercizio molto elevate per il dissipatore che si è mantenuto sempre freddo o, al più, tiepido.

scheda_4_s.jpg (62493 bytes)

La Radeon X1800 XL, contrariamente alla sua sorella maggiore, utilizza un differente sistema di raffreddamento a slot singolo. Il suo principio di funzionamento è molto semplice: la ventola spinge l’aria all’interno del dissipatore dotato di numerose alette in rame e di un sistema a heat pipe che migliora la distribuzione del calore e, conseguentemente, aumenta l’efficienza del raffreddamento. Come vedremo successivamente, la rumorosità di questa soluzione, anche se non raggiunge mai livelli preoccupanti, è superiore a quella della Radeon X1800 XT. Inoltre anche dal punto di vista termico il dissipatore è sempre risultato essere molto caldo durante le nostre sessioni di test.

scheda_5_s.jpg (33809 bytes)

Come per tutte le soluzioni di fascia alta del mercato, anche le nuove Radeon X1800 possiedono in alto a sinistra un connettore di alimentazione supplementare a sei pin ed un dissipatore passivo in alluminio colorato di rosso dedicato allo smaltimento del calore prodotto dagli elementi discreti.

Il dissipatore è fissato sulla scheda video con otto diverse viti, quattro più esterne e quattro disposte a quadrato attorno al processore grafico. Queste ultime mantengono il core a strettamente a contatto con l’elemento in rame del sistema di raffreddamento. Una volta rimosso il dissipatore possiamo osservare che entrambe le Radeon X1800 possiedono il chip Rage Theater e pertanto sono dotate di funzionalità di acquisizione video. Notiamo, inoltre, che in alto a sinistra è presente un alloggiamento vuoto dello stesso tipo di quelli utilizzati dal composing engine delle schede CrossFire il che fa presumere che il disegno del PCB sia già predisposto alla circuiteria necessaria per l’abilitazione della tecnologia CrossFire che verrà utilizzata sulle schede CrossFire Edition.

Le memorie utilizzate sulle schede Radeon X1800 XT e Radeon X1800 XL sono Samsung rispettivamente da 1,2 ns e 1,6 ns con frequenza massima teorica pari a 1600 MHz e 1400 MHz e voltaggio di 2 V (contro gli 1,8 V normalmente visti sui moduli di memoria GDDR3 DRAM con frequenze inferiori). I moduli di memoria sono tutti distribuiti sul lato frontale della scheda, anche per il sample di Radeon X1800 XT che, in questo articolo, è stato provato in versione dotata di 512 MB di memoria video.

La staffa di fissaggio presenta due uscite DVI-I ed un ingresso/uscita S-Video. Per il collegamento dei tradizionali monitor CRT è quindi necessario adottare un adattatore DVI-I -> VGA.

Pagina 3 - Driver

I driver forniti da ATI in occasione di questo articolo sono i 8.173 beta, revisione successiva ai Catalyst 5.9, ma antecedente i Catalyst 5.10, che saranno i primi certificati WHQL a supportare le schede Radeon X1800. La versione preliminare da noi utilizzata è la prima beta compatibile con R520 e in grado di abilitare le nuove modalità di antialiasing ed alcune capacità di questo processore grafico come l’HDR.

La procedura di installazione della periferica è quella classica: si inserisce la scheda video nello slot PCI Express 16x e all’avvio Windows XP riconosce la periferica e richiede i driver. Abbiamo provveduto ad impedire la ricerca dei driver per poi avviare il setup dei driver 8.173 beta usati per l’occasione. Il setup installa sia il driver per la scheda video che il Catalyst Control Center. Completata l’installazione è necessario riavviare il sistema operativo.

ATI non ha introdotto novità nel layout o nelle funzionalità del Catalyst Control Center e pertanto i possessori di schede video Radeon non si troveranno di certo spaesati dopo aver installato una Radeon X1800. Le uniche differenze degne di nota sono l’abilitazione dell’Adaptive Antialiasing e della opzione High Quality del filtro anisotropico, oltre alla dicitura AVIVO che racchiude tutte le impostazioni relative alla riproduzione video. E’ interessante notare che nelle opzioni API Specific, il geometry instancing sia ora abilitato di default e non possa essere disabilitato. Evidentemente il pieno supporto allo shader model 3.0 per R520 ha spinto ATI a mantenere sempre attiva questa funzionalità che può incrementare le prestazioni nei videogames compatibili.

driver_1.gif (63738 bytes)

driver_2.gif (72496 bytes)

driver_3.gif (60977 bytes)

driver_4.gif (60069 bytes)

Nonostante si tratti della prima revisione di driver a supportare le schede Radeon X1800, non abbiamo riscontrato comportamenti anomali durante l’esecuzione dei videogames sia in termini velocistici che qualitativi. Tuttavia, alcune problematiche legate alla riproduzione video (abilitando l’accelerazione WMV i video mostrano evidenti artefatti), dimostrano che si tratta di una revisione tutto fuorché matura.

Pagina 4 - Analisi qualitativa: antialiasing - samples pattern

L’antialiasing è senza ombra di dubbio una di quelle funzionalità che più hanno rivoluzionato il mondo della computer grafica. L’aliasing è un problema ben presente in tantissimi ambiti di elaborazione e si manifesta come una imprecisione dovuta alla incapacità da parte di un calcolatore di eseguire elaborazioni con una precisione infinita ed alla necessità di rappresentare i dati in forma discreta. Nella grafica tridimensionale il problema di aliasing si manifesta essenzialmente come una serie di segmenti sui bordi poligonali. Ciò accade perché è necessario visualizzare una scena tridimensionale attraverso una griglia (la risoluzione). Per ridurre l’aliasing esistono due metodi: incrementare la risoluzione fino a livelli estremamente elevati o applicare un filtro di antialiasing che sfumi i contorni poligonali in modo da non farli percepire all’occhio umano in maniera netta. La prima soluzione è decisamente poco praticabile in quanto richiede costosissimi monitor in grado di supportare elevatissime risoluzioni con un refresh accettabile. La seconda soluzione, invece, benché richieda una notevole potenza di calcolo, è quella più utilizzata sia all’interno delle workstation grafiche professionali per il rendering delle immagini attraverso software di modellazione tridimensionale, che nella grafica tridimensionale in tempo reale dove un impulso decisivo fu dato da 3dfx Interactive nel 2000. I filtri di antialiasing all’interno della grafica in tempo reale, quella che comunemente vediamo nei videogames, vengono applicati dal processore grafico e richiedono l’estrapolazione delle informazioni necessarie al calcolo del colore finale di ogni singolo pixel a partire da un determinato numero di samples. La qualità di un filtro di antialiasing è determinata principalmente da tre fattori: il numero di samples, la loro distribuzione ed il trattamento delle informazioni del colore.

In questo primo capitolo dedicato all’analisi qualitativa dell’antialiasing proposto dalle nuove soluzioni Radeon X1800, vi proponiamo le immagini ottenute con il FSAAViewer, un’applicazione capace di mostrare la distribuzione dei samples di ogni modalità di antialiasing.

ATI Radeon X1800XT

1x_s.png (5519 bytes) 2x_s.png (6068 bytes)
No Anti Aliasing Anti Aliasing 2x
4x_s.png (6434 bytes) 6x_s.png (6510 bytes)
Anti Aliasing 4x Anti Aliasing 6x

NVIDIA GeForce 7800 GTX

noAA_s.png (5551 bytes)
No Anti Aliasing
AA2x_s.png (6197 bytes) AA2xQ_s.png (6046 bytes)
Anti Aliasing 2x Anti Aliasing 2x quality
AA4x_s.png (6548 bytes) AA8x_s.png (6639 bytes)
Anti Aliasing 4x Anti Aliasing 8x

NVIDIA GeForce 6800 Ultra

noAA_s.png (5551 bytes)
No Anti Aliasing
AA2x_s.png (6197 bytes) AA2xQ_s.png (6046 bytes)
Anti Aliasing 2x Anti Aliasing 2x quality
AA4x_s.png (6548 bytes) AA8x_s.png (6639 bytes)
Anti Aliasing 4x Anti Aliasing 8x

ATI Radeon X850XT PE

noAA_s.png (5497 bytes) AA2x_s.png (6075 bytes)
No Anti Aliasing Anti Aliasing 2x
AA4x_s.png (6413 bytes) AA6x_s.png (6516 bytes)
Anti Aliasing 4x Anti Aliasing 6x

Con la nuova generazione di processori grafici della serie Radeon X1x00, ATI non ha apportato modifiche né al numero di samples supportati né alla distribuzione dei samples in ogni modalità. Questa decisione è stata presa in quanto fin dalle schede Radeon 9700 PRO, l’azienda canadese aveva già implementato un motore di antialiasing particolarmente complesso ed efficiente. La forza di questo motore è nella sua completa programmabilità che gli consente, attraverso i driver, di dare vita a qualsiasi distribuzione dei samples che i tecnici di ATI ritengono necessaria, con un numero massimo di sei samples. La qualità ottenuta dalle schede video Radeon da allora è sempre rimasta al vertice ed il concorrente NVIDIA solo recentemente con l’introduzione del processore grafico G70 è riuscito a raggiungere e superare la resa delle GPU canadesi con l’introduzione della correzione gamma (supportata dai prodotti Radeon fin dal 2002) e del Transparency Antialiasing. Quest’ultima funzionalità trova nelle schede Radeon X1x00 una risposta che si chiama Adaptive Antialiasing della quale parleremo approfonditamente più avanti. Per il momento ci limitiamo ad osservare che la distribuzione dei samples per R520 è la stessa vista nella famiglia di prodotti R3x0 e R4x0.

La modalità a due samples vede nei processori grafici Radeon e GeForce una filosofia di applicazione simile nella disposizione, ma diametralmente opposta nell’angolo di rotazione. Anche usando quattro samples, la modalità più comune e che solitamente rappresenta il miglior compromesso tra qualità e prestazioni, vede in ATI e NVIDIA una filosofia simile nella distribuzione, ma diversa nell’angolo di rotazione. In entrambi i casi si tratta comunque di un antialiasing di tipo RGMS, cioè Rotated Grid MultiSampling.

Le modalità di antialiasing di tipo multisampling puro finiscono qui per le schede NVIDIA: sia G70 che NV40 supportano un antialiasing ad otto samples, ottenuto mixando la tecnica multisampling con la supersampling. Come vedremo successivamente, nonostante il buon livello qualitativo, questa modalità è contraddistinta da un pesante impatto sulle prestazioni. Le schede video Radeon, invece, supportano una modalità multisampling proprietaria dotata di sei samples: sfruttando la programmabilità del motore di antialiasing alla base di tutte le GPU Radeon qui provate, i tecnici canadesi hanno messo a punto una distribuzione denominata sparse pattern. Questa ha storicamente sempre fornito un’ottima resa dell’immagine e prestazioni adeguate al livello qualitativo proposto.

Pagina 5 - Analisi qualitativa: antialiasing – FSAATester

Il FSAATester è un’applicazione realizzata con lo specifico scopo di esaltare il problema dell’aliasing e, conseguentemente, mostrare in maniera chiara i vantaggi derivanti dall’uso di una tecnica di antialiasing. La scena mostrata dal FSAATester consiste in una serie di poligoni disposti a raggiera che ai loro bordi presentano un forte aliasing: abilitando l’antialiasing è possibile osservare alle varie angolazioni proposte dai poligoni, la bontà della riduzione dell’aliasing. In questa nostra analisi vi proponiamo gli screenshots completi ottenuti in tutte le modalità di antialiasing disponibili con i processori grafici presi in considerazione e, per ogni screenshots, due immagini che esaltano due zone, una dedicata alla valutazione della riduzione dell’aliasing sui bordi poligonali orizzontali e l’altra su quelli verticali.

ATI Radeon X1800XT

1x_s.jpg (7627 bytes) 2x_s.jpg (7621 bytes) 4x_s.jpg (7592 bytes)
no 2x 4x
6x_s.jpg (7600 bytes)
6x
2x 2xO.jpg (1811 bytes)
4x 4xO.jpg (1938 bytes)
6x 6xO.jpg (1972 bytes)
2xV.jpg (1366 bytes) 4xV.jpg (1542 bytes) 6xV.jpg (1558 bytes)
2x 4x 6x

NVIDIA GeForce 7800 GTX

immagini/g70/aa/fsaatest/noAA_s.jpg (13648 bytes) immagini/g70/aa/fsaatest/AA2x_s.jpg (13494 bytes) immagini/g70/aa/fsaatest/AA2xGC_s.jpg (13494 bytes)
No 2x 2xGC
immagini/g70/aa/fsaatest/AA2xQ_s.jpg (13462 bytes) immagini/g70/aa/fsaatest/AA2xQGC_s.jpg (13462 bytes) immagini/g70/aa/fsaatest/AA4x_s.jpg (13459 bytes)
2xQ 2xQGC 4x
AA4xGC_s.jpg (13459 bytes) AA8x_s.jpg (13457 bytes) AA8xGC_s.jpg (13457 bytes)
4xGC 8xS 8xSGC
No noAAO.jpg (24213 bytes)
2x AA2xO.jpg (26516 bytes)
2xGC AA2xGCO.jpg (26516 bytes)
2xQ AA2xQO.jpg (27124 bytes)
2xQGC AA2xQGCO.jpg (27124 bytes)
4x AA4xO.jpg (27174 bytes)
4xGC AA4xGCO.jpg (27174 bytes)
8xS AA8xO.jpg (28151 bytes)
8xSGC AA8xGCO.jpg (28151 bytes)
noAAV.jpg (19345 bytes) AA2xV.jpg (21181 bytes) AA2xGCV.jpg (21181 bytes) AA2xQGCV.jpg (21865 bytes) AA4xV.jpg (21627 bytes) AA8xV.jpg (21601 bytes) AA8xGCV.jpg (21601 bytes)
No 2x 2xGC 2xQ 2xQGC 4x 4xGC 8xS 8xSGC

NVIDIA GeForce 6800 Ultra

immagini/6800/aa/fsaatestnoAA_s.jpg (13648 bytes) AA2x_s.jpg (13494 bytes) AA2xQ_s.jpg (13462 bytes)
No 2x 2xQ
AA4x_s.jpg (13459 bytes) AA8x_s.jpg (13457 bytes)
4x 8xS
No noAAO.jpg (24213 bytes)
2x AA2xO.jpg (26516 bytes)
2xQ AA2xQO.jpg (27124 bytes)
4x AA4xO.jpg (27174 bytes)
8xS AA8xSO.jpg (28149 bytes)
noAAV.jpg (19345 bytes) AA2xV.jpg (21181 bytes) AA2xQV.jpg (21865 bytes) AA4xV.jpg (21627 bytes) AA8xSV.jpg (21656 bytes)
No 2x 2xQ 4x 8xS

ATI Radeon X850XT PE

noAA_s.jpg (13658 bytes) AA2x_s.jpg (13573 bytes) TAA2x_s.jpg (25123 bytes)
No 2x 2xTAA
AA4x_s.jpg (13540 bytes) TAA4x_s.jpg (25128 bytes) AA6x_s.jpg (13549 bytes)
4x 4xTAA 6x
immagini/x850/aa/fsaatest/TAA6x_s.jpg (25140 bytes)
6xTAA
No noAAO.jpg (18269 bytes)
2x AA2xO.jpg (18807 bytes)
4x AA4xO.jpg (18971 bytes)
4xTAA TAA4xO.jpg (27816 bytes)
6x AA6xO.jpg (18970 bytes)
6xTAA TAA6xO.jpg (28451 bytes)
noAAV.jpg (15854 bytes) AA2xV.jpg (17004 bytes) TAA2xV.jpg (21926 bytes) AA4xV.jpg (17118 bytes) TAA4xV.jpg (21947 bytes) AA6xV.jpg (17093 bytes) TAA6xV.jpg (21963 bytes)
No 2x 2xTAA 4x 4xTAA 6x 6xTAA

Le immagini sopra proposte mostrano chiaramente che l’incremento del numero di samples porta ad un aumento del numero di sfumature utilizzate per ammorbidire i bordi poligonali e, conseguentemente, ad una superiore qualità dell’immagine complessiva.

Un’ulteriore osservazione è relativa alla differenza nel trattare tutte le modalità di antialiasing tra le schede Radeon e le GeForce. Le prime utilizzano sfumature più chiare, funzionalità denominata correzione gamma e che consiste nel non eseguire gradazioni lineari tra le più scure e le più chiare, ma nel assegnare un maggior numero di sfumature ai livelli più delicati. Questo modo di trattare l’immagine porta ad un antialiasing che viene percepito dall’occhio umano in maniera più morbida e piacevole. Anche le schede video basate sul processore grafico G70 di NVIDIA supportano l’antialiasing gamma corrected anche se si tratta di una funzionalità disattivata di default (la si può abilitare dalle impostazioni avanzate della scheda video).

Tenendo conto sia della correzione gamma che del numero e della distribuzione dei samples possiamo osservare che la qualità offerta dall’antialiasing 2x sia da ATI che da NVIDIA non è particolarmente convincente. Su tutt’altro piano la modalità 4x che offre una resa soddisfacente, specie con le schede video ATI. Livelli qualitativi ancora più elevati li raggiungiamo utilizzando le modalità 6x e 8xS, con un leggero vantaggio per quest’ultima dovuto al maggior numero di samples. Le schede video Radeon possiedono, inoltre, il vantaggio del Temporal AntiAliasing, una speciale modalità che, alternando su frame pari e dispari due differenti distribuzioni dei samples (un’altra applicazione del motore programmabile di antialiasing delle GPU canadesi), portano ad una resa effettiva pari al doppio dei samples realmente utilizzati. Ecco quindi che il Temporal AntiAliasing 2x ha la stessa qualità dell’antialiasing 4x e che il Temporal AntiAliasing 4x e 6x, hanno la migliore qualità attualmente disponibile in un sistema dotato di scheda video singola. L’unica limitazione del Temporal AntiAliasing è la seguente: la sua abilitazione è possibile solo se il numero di frame al secondo è pari o superiore al refresh del monitor.

Pagina 6 - Analisi qualitativa: antialiasing – 3DMark03

L’analisi qualitativa dell’antialiasing condotta fino a questo momento non tiene conto di una delle funzionalità più interessanti legata alle nuove schede video serie Radeon X1000: l’Adaptive AntiAliasing. Sotto questo nuovo si cela una particolare modalità che si affianca alle tradizionali tecniche di antialiasing con lo scopo di ridurre l’aliasing sulle texture dotate di un canale di trasparenza. In questo caso, infatti, un antialiasing di tipo multisampling non offre alcun miglioramento della qualità in quanto il multisampling si applica solo ai bordi poligonali e non alle texture. L’Adaptive AntiAliasing, invece, abilita un antialiasing di tipo supersampling per le sole porzioni di schermo a cui fanno riferimento texture dotate di un canale di trasparenza. Questa funzionalità è simile nel principio di funzionamento al Transparency AntiAliasing introdotto da NVIDIA con le schede GeForce 7800, ma al contrario di quest’ultima funziona solo in supersampling.

Il frame numero 1669 del test Mother Nature del 3DMark03 mostra una scena tridimensionale particolarmente utile all’individuazione dell’effetto di aliasing presente sia a livello poligonale (rami degli alberi, fili d’erba, pietre e rocce) sia a livello di texture con elementi trasparenti (foglie degli alberi).

ATI Radeon X1800XT

noAA01669_s.jpg (15782 bytes)
No AA
2xAA01669_s.jpg (15819 bytes) 2xAAAD01669_s.jpg (15856 bytes)
AA 2x AA 2x Adaptive
4xAA01669_s.jpg (15855 bytes) 4xAAAD01669_s.jpg (15882 bytes)
AA 4x AA 4x Adaptive
6xAA01669_s.jpg (15845 bytes) 6xAAAD01669_s.jpg (15886 bytes)
AA 6x AA 6x Adaptive

2xAA01669.jpg (21351 bytes) 2xAAAD01669.jpg (21056 bytes)
AA 2x AA 2x Adaptive
4xAA01669.jpg (20610 bytes) 4xAAAD01669.jpg (19934 bytes)
AA 4x AA 4x Adaptive
6xAA01669.jpg (20560 bytes) 6xAAAD01669.jpg (19719 bytes)
AA 6x AA 6x Adaptive

NVIDIA GeForce 7800 GTX

noAA01669_s.jpg (15686 bytes) noAATSS01669_s.jpg (15686 bytes)
No AA No AA Transparent AA SuperSampling
noTMS01669_s.jpg (15686 bytes) AA2x01669_s.jpg (15572 bytes)
No AA Transparent AA MultiSampling AA 2x
AA2xGC01669_s.jpg (15675 bytes) AA2xTMS01669_s.jpg (15574 bytes)
AA 2x Gamma Corrected AA 2x Transparent AA MultiSampling
AA2xTSS01669_s.jpg (15576 bytes) AA2xTSSGC01669_s.jpg (15660 bytes)
AA 2x Transparent AA SuperSampling AA 2x Transparent AA SuperSampling
Gamma Corrected
AA2xQ01669_s.jpg (15438 bytes) AA2xQGC01669_s.jpg (15438 bytes)
AA 2xQ AA 2xQ Gamma Corrected
AA2xQTMS01669_s.jpg (15451 bytes) AA2xQTSS01669_s.jpg (15454 bytes)
AA 2xQ Transparent AA MultiSampling AA 2xQ Transparent AA SuperSampling
AA2xQTSSGC01669_s.jpg (15454 bytes) AA4x01669_s.jpg (15562 bytes)
AA 2xQ Transparent AA SuperSampling
Gamma Corrected
AA 4x
AA4xGC01669_s.jpg (15630 bytes) AA4xTMS01669_s.jpg (15558 bytes)
AA 4x Gamma Corrected AA 4x Transparent AA MultiSampling
AA4xTSS01669_s.jpg (15564 bytes) AA4xTSSGC01669_s.jpg (15632 bytes)
AA 4x Transparent AA SuperSampling AA 4x Transparent AA SuperSampling
Gamma Corrected
AA8x01669_s.jpg (15638 bytes) AA8xGC01669_s.jpg (15638 bytes)
AA 8x AA 8x Gamma Corrected
AA8xTMS01669_s.jpg (15653 bytes) AA8xTSS01669_s.jpg (15663 bytes)
AA 8x Transparent AA MultiSampling AA 8x Transparent AA SuperSampling
AA8xTSSGC01669_s.jpg (15663 bytes)
AA 8x Transparent AA SuperSampling
Gamma Corrected

noAA01669.jpg (21172 bytes) noAATSS01669.jpg (21172 bytes)
No AA No AA Transparent AA SuperSampling
noTMS01669.jpg (21172 bytes) AA2x01669.jpg (20359 bytes)
No AA Transparent AA MultiSampling AA 2x
AA2xGC01669.jpg (20211 bytes) AA2xTMS01669.jpg (20329 bytes)
AA 2x Gamma Corrected AA 2x Transparent AA MultiSampling
AA2xTSS01669.jpg (19961 bytes) AA2xTSSGC01669.jpg (19864 bytes)
AA 2x Transparent AA SuperSampling AA 2x Transparent AA SuperSampling
Gamma Corrected
AA2xQ01669.jpg (18354 bytes) AA2xQGC01669.jpg (18354 bytes)
AA 2xQ AA 2xQ Gamma Corrected
AA 2xQ Transparent AA MultiSampling AA 2xQ Transparent AA SuperSampling
AA2xQTSSGC01669.jpg (18417 bytes) AA4x01669.jpg (19587 bytes)
AA 2xQ Transparent AA SuperSampling
Gamma Corrected
AA 4x
AA4xGC01669.jpg (19295 bytes) AA4xTMS01669.jpg (19409 bytes)
AA 4x Gamma Corrected AA 4x Transparent AA MultiSampling
AA4xTSS01669.jpg (18629 bytes) AA4xTSSGC01669.jpg (18418 bytes)
AA 4x Transparent AA SuperSampling AA 4x Transparent AA SuperSampling
Gamma Corrected
AA8x01669.jpg (18805 bytes) AA8xGC01669.jpg (18805 bytes)
AA 8x AA 8x Gamma Corrected
AA8xTMS01669.jpg (18666 bytes) AA8xTSS01669.jpg (18122 bytes)
AA 8x Transparent AA MultiSampling AA 8x Transparent AA SuperSampling
AA8xTSSGC01669.jpg (18122 bytes)
AA 8x Transparent AA SuperSampling
Gamma Corrected

NVIDIA GeForce 6800 Ultra

noAA01669_s.jpg (15682 bytes) AA2x01669_s.jpg (15569 bytes)
No AA AA 2x
AA2xQ01669_s.jpg (15422 bytes) AA4x01669_s.jpg (15569 bytes)
AA 2xQ AA 4x
AA8xS01669_s.jpg (15648 bytes)
AA 8xS

noAA01669.jpg (21189 bytes) AA2x01669.jpg (20386 bytes)
No AA AA 2x
AA2xQ01669.jpg (18379 bytes) AA4x01669.jpg (19584 bytes)
AA 2xQ AA 4x
AA8xS01669.jpg (18724 bytes)
AA 8xS

ATI Radeon X850XT PE

noAA01669_s.jpg (15734 bytes) AA2x01669_s.jpg (15792 bytes)
No AA AA 2x
AA4x01669_s.jpg (15794 bytes) AA6x01669_s.jpg (15767 bytes)
AA 4x AA 6x

noAA01669.jpg (21303 bytes) AA4x01669.jpg (19311 bytes)
No AA AA 2x
AA4x01669.jpg (19311 bytes) AA6x01669.jpg (19299 bytes)
AA 4x AA 6x

Il primo chiarimento da fare riguardo l’Adaptive AntiAliasing delle schede Radeon X1800 è relativo al suo funzionamento: esattamente come il Transparency AntiAliasing di NVIDIA, l’Adaptive AntiAliasing è abilitabile solo in congiunzione con una tecnica di antialiasing tradizionale. La sua qualità, inoltre, è strettamente dipendente dal numero di samples selezionati per l’antialiasing tradizionale. Sui contorni delle foglie, quindi, l’antialiasing 6x con Adaptive è migliore dell’antialiasing 4x con Adaptive. Senza l’Adaptive AntiAliasing, invece, le foglie si vedono sempre con aliasing, indipendentemente dal numero di samples selezionato.

Poiché l’Adaptive AntiAliasing non fa altro che sfruttare la programmabilità del motore di antialiasing dei processori grafici Radeon, può essere abilitato attraverso una modifica delle impostazioni del registro di Windows anche sulle schede meno recenti. Tuttavia, poiché tale operazione non è stata ufficializzata da ATI, abbiamo deciso di non valutare l’Adaptive Antialiasing con le schede basate su R4x0.

Le immagini proposte rivelano immediatamente che le scene ottenute attraverso R520 con l’antialiasing a 4x o 6x e l’adaptive antialiasing hanno una qualità leggermente più morbida rispetto a quanto possiamo osservare con l’antialiasing 4x o 8xS ed il transparency supersampling di G70, anche se per quest’ultimo abilitiamo la correzione gamma. La modalità multisampling del transparency antialiasing di NVIDIA, invece, ha una resa decisamente meno convincente, aspetto già riscontrato al momento del lancio di G70.

Pagina 7 - Analisi qualitativa: filtro anisotropico – Direct 3D

Il filtro anisotropico è, insieme all'antialiasing, una delle funzionalità votate all'incremento della qualità di una rappresentazione tridimensionale più interessanti di un processore grafico. Il suo obiettivo è quello di migliorare la resa delle texture in alta risoluzione quando sono applicate su superfici lontane dal punto di osservazione: in tal caso, infatti, è molto probabile che una texture debba essere disegnata attraverso numero di pixel sullo schermo notevolmente inferiore rispetto alle sue dimensioni e ciò richiede una sua ricampionatura. Il filtro anisotropico esegue questa operazione e, a seconda delle modalità e del numero di campioni presi, può garantire una qualità delle texture più o meno accurata e, conseguentemente, un realismo della scena tridimensionale finale più o meno convincente.

Per valutare l'implementazione del filtro anisotropico del processore grafico R520 oggetto di questa recensione abbiamo utilizzato il Texture Filter Analyzer sia in versione Direct3D che OpenGL. Questa piccola utility visualizza un cilindro cavo impostando il punto di vista al suo interno con la camera che punta in direzione parallela all'altezza del cilindro. Questo cilindro è tappezzato all'interno con una texture a scacchiera, bianca e nera. L'immagine risultante non è altro che l'interno del cilindro che, a causa della prospettiva, si restringe man mano che le pareti si allontanano dalla camera. Il Texture Filter Analyzer consente di visualizzare i livelli di mipmapping, cioè i livelli di dettaglio (LOD) con cui la scheda video disegna le texture, colorandoli. In particolare la banda più vicina (che per effetto della prospettiva è più esterna) è rossa e rappresenta il primo LOD, cioè la prima ricampionatura (di minor dettaglio) della texture rispetto all'originale. I restanti livelli di mipmap sono più interni e vengono evidenziati con altri colori. Nella valutazione della qualità del filtro anisotropico sono essenzialmente due gli aspetti che ci interessa osservare: la variazione tra un livello di dettaglio e l'altro ed il dettaglio stesso. Il primo lo estrapoliamo osservando come viene effettuato il passaggio da una fascia colorata ad una adiacente, mentre il dettaglio può essere valutato dalla vicinanza della banda rossa al bordo.

ATI Radeon X1800XT

Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x disabled 2x disabled 4x disabled
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x disabled 16x disabled
ST1x_s.jpg (8166 bytes) ST2x_s.jpg (8110 bytes) ST4x_s.jpg (8224 bytes)
1x standard 2x standard 4x standard
ST8x_s.jpg (8449 bytes) ST16x_s.jpg (8476 bytes)
8x standard 16x standard
Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x advanced 2x advanced 4x advanced
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x advanced 16x advanced
Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x IA dis/standard/advanced + HQ 2x IA dis/standard/advanced + HQ 4x IA dis/standard/advanced + HQ
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x IA dis/standard/advanced + HQ 16x IA dis/standard/advanced + HQ

NVIDIA GeForce 7800 GTX

P1x_s.jpg (5037 bytes) HQ1x_s.jpg (4872 bytes) Q1x_s.jpg (4982 bytes) HQ1x_s.jpg (4872 bytes)
Performance 1x High Performance 1x Quality 1x High Quality 1x
P2x_s.jpg (5211 bytes) HP2x_s.jpg (5282 bytes) Q2x_s.jpg (5143 bytes) HQ2x_s.jpg (4977 bytes)
Performance 2x High Performance 2x Quality 2x High Quality 2x
P4x_s.jpg (5152 bytes) HP4x_s.jpg (5302 bytes) Q4x_s.jpg (5016 bytes) HQ4x_s.jpg (4917 bytes)
Performance 4x High Performance 4x Quality 4x High Quality 4x
P16x_s.jpg (5302 bytes) HP8x_s.jpg (5351 bytes) Q8x_s.jpg (5098 bytes) HQ8x_s.jpg (4965 bytes)
Performance 8x High Performance 8x Quality 8x High Quality 8x
P16x_s.jpg (5302 bytes) HP16x_s.jpg (5356 bytes) Q16x_s.jpg (5147 bytes) HQ16x_s.jpg (4981 bytes)
Performance 16x High Performance 16x Quality 16x High Quality 16x

NVIDIA GeForce 6800 Ultra

P1x_s.jpg (5037 bytes) HQ1x_s.jpg (4872 bytes) Q1x_s.jpg (4982 bytes) HQ1x_s.jpg (4872 bytes)
Performance 1x High Performance 1x Quality 1x High Quality 1x
P2x_s.jpg (5211 bytes) HP2x_s.jpg (5282 bytes) Q2x_s.jpg (5143 bytes) HQ2x_s.jpg (4977 bytes)
Performance 2x High Performance 2x Quality 2x High Quality 2x
P4x_s.jpg (5152 bytes) HP4x_s.jpg (5302 bytes) Q4x_s.jpg (5016 bytes) HQ4x_s.jpg (4917 bytes)
Performance 4x High Performance 4x Quality 4x High Quality 4x
P16x_s.jpg (5302 bytes) HP8x_s.jpg (5351 bytes) Q8x_s.jpg (5098 bytes) HQ8x_s.jpg (4965 bytes)
Performance 8x High Performance 8x Quality 8x High Quality 8x
P16x_s.jpg (5302 bytes) HP16x_s.jpg (5356 bytes) Q16x_s.jpg (5147 bytes) HQ16x_s.jpg (4981 bytes)
Performance 16x High Performance 16x Quality 16x High Quality 16x

ATI Radeon X850XT PE

Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x disabled 2x disabled 4x disabled
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x disabled 16x disabled
Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x standard 2x standard 4x standard
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x standard 16x standard
Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x advanced 2x advanced 4x advanced
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x advanced 16x advanced

Le immagini sopraesposte sono state ottenute con il Texture Filter Analyzer in versione Direct 3D e mostrano la qualità di applicazione del filtro anisotropico per le schede NVIDIA e ATI in tutte le modalità disponibili. In particolare per le prime sono state considerate le impostazioni High Quality, Quality, Performance e High Performance, mentre per le Radeon abbiamo diversificato i risultati legando tale diversificazione alle modalità disponibili del Catalyst IA e cioè Disabled, Standard e Advanced. Per tutte le architetture è possibile selezionare un numero di samples pari a 2, 4, 8 o 16.

All'epoca delle prime implementazioni del filtro anisotropico, l'impatto sulle prestazioni a cui si assisteva era tale da renderlo di fatto una funzionalità scarsamente fruibile. Questa problematica non poteva che accentuarsi con l'avvento delle nuove architetture dotate di una sola TMU per pipeline e quindi incapaci di realizzare filtraggi complessi in pochi cicli di clock (il filtro trilineare, decisamente meno complesso di quello anisotropico, ne richiede due). Sia ATI che NVIDIA hanno, quindi, deciso di implementare una serie di ottimizzazioni che riducono notevolmente l'impatto sulle prestazioni del filtro anisotropico sacrificando la qualità in maniera il più delle volte trascurabile. Una delle ottimizzazioni ormai entrate nel bagaglio tecnologico della maggioranza dei processori grafici è quella relativa alla dipendenza dell'applicazione del filtro anisotropico dall'angolo di inclinazione della superficie poligonale. In particolare G70, NV40 e R480 applicano un filtro anisotropico completo solo a determinate angolazioni (multipli di pi/4), mentre si limitano a soluzioni più conservative in tutti gli altri casi. Il principio alla base di tale ottimizzazione è il seguente: poiché la maggioranza dei videogames, specie gli FPS, mostrano un ambiente con pavimenti e muri perpendicolari tra loro e dotati di texture discretamente dettagliate e poiché è principalmente in quei punti dello schermo che è concentrata l'attenzione del giocatore, è possibile risparmiare potenza di calcolo nell'elaborazione del filtro anisotropico per le altre superfici. Questo principio è, ovviamente, un compromesso che, benché non tenga conto della crescente popolazione di videogames che propongono superfici più tondeggianti e meno regolari, è stato sviluppato su basi ragionevoli che fino ad ora hanno garantito risultati velocistici e qualitativi soddisfacenti.

Con la nuova generazione di schede video Radeon X1800, ATI ha deciso di voler abbattere questo compromesso e propone alcune novità legate all'applicazione del filtro anisotropico introducendo una nuova opzione denominata High Quality. L'azienda canadese, infatti, con R520 ha colto l'occasione per rivisitare le unità di texturing che adesso sono capaci di elaborare il filtro anisotropico più rapidamente applicando la medesima qualità su tutte le angolazioni poligonali. Le immagini del Texture Filter Analyzer mostrano chiaramente come la qualità con HQ abilitato (in modalità Catalyst IA Standard) sia decisamente superiore a tutte le soluzioni commercializzate attualmente sia da parte del concorrente NVIDIA, che da ATI stessa.

Rispetto a quanto visto con la precedente generazione di processori grafici, ATI afferma che R520 introduce anche un filtraggio trilineare più accurato. Il Texture Filter Analyzer ci mostra un'applicazione del filtro trilineare simile a quella vista con R480, tuttavia non escludiamo che le modalità Standard e Advanced, che ottimizzano la resa delle texture (applicando un'approssimazione del filtro trilineare) a seconda delle loro stesse caratteristiche, siano state migliorate in questa direzione. Purtroppo poiché si tratta di ottimizzazioni che entrano in gioco quando il passaggio da un livello di dettaglio al successivo è contraddistinto da texture simili e poiché la visualizzazione a scacchiera del Texture Filter Analyzer insieme alla colorazione del livello di dettaglio fa sì che venga sempre applicato un filtro anisotropico a partire da campioni filtrati in trilineare, non siamo in grado di valutare eventuali miglioramenti in tal senso.

Concentrando la nostra analisi sulle modalità High Quality e Quality delle schede NVIDIA e confrontandole rispettivamente con le modalità Disabled e Standard dei prodotti ATI senza HQ, possiamo osservare come, pur tenendo conto della variabilità dovuta alla natura adattiva della tecnologia Catalyst IA in modalità Standard, la qualità del filtro anisotropico di R520/R480 è sempre migliore o, al peggio, uguale a quella di G70/NV40.

NVIDIA GeForce 7800 GTX

Modalità Stage 0
Stage 1
HQ HQ8x_s.jpg (4965 bytes) HQ8x_s.jpg (4965 bytes)
Q onoffoff_s.jpg (5098 bytes) onoffoffstage1_s.jpg (5098 bytes)

NVIDIA GeForce 6800 Ultra

Modalità Stage 0 Stage 1
HQ HQ8x_s.jpg (4965 bytes) HQ8x_s.jpg (4965 bytes)
Q onoffoff_s.jpg (5098 bytes) onoffonstage1_s.jpg (5193 bytes)

ATI Radeon X850 XT PE

Modalità Stage 0/1
IA Disabled aaHQ8x_s.jpg (5681 bytes)
IA Standard aaHQ8x_s.jpg (10045 bytes)

ATI Radeon X1800 XT

Modalità Stage 0/1
IA Disabled Q8x_s.jpg (5681 bytes)
IA Standard ST8x_s.jpg (8449 bytes)

Concludiamo l'analisi della qualità del filtro anisotropico sotto Direct 3D osservando che la modalità Quality delle schede video NVIDIA fornisce per gli stage successivi al primo (stage 0) una qualità inferiore: il livello di pixel popping è decisamente superiore a quello osservato sul primo stage e questo porta ad un degrado qualitativo in determinate situazioni. Questo comportamento non lo ritroviamo con i processori grafici Radeon che applicano il medesimo filtraggio (compreso quello adattivo in caso di Catalyst IA Standard) su tutti i livelli di texture.

Ricordiamo che per stage 0 si intende la prima texture applicata ad una superficie e, solitamente, tale texture consiste nella mappa diffusa, cioè quella che conferisce il colore al poligono. Gli stage successivi al primo, invece, sono utilizzati per altre tipologie di texture come le normal map, usate per il bump mapping, le glass map, usate per il parallax mapping, o anche le reflection map usate per le superfici riflettenti come l'acqua.

Pagina 8 - Analisi qualitativa: filtro anisotropico – OpenGL

Il comportamento dei processori grafici NVIDIA e ATI non è indipendente dall'API utilizzata. Esistono delle differenze che abbiamo rilevato con il Texture Filter Analyzer in versione OpenGL e che portano quasi sempre ad una resa inferiore rispetto al Direct 3D sia per i prodotti GeForce che per quelli Radeon. Evidentemente entrambe le aziende hanno deciso di concentrare i propri sforzi sull'ottimizzazione dell'ambiente Direct 3D vista la sua massiccia diffusione in ambito gaming.

ATI Radeon X1800XT

Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x disabled 2x disabled 4x disabled
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x disabled 16x disabled
Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x standard 2x standard 4x standard
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x standard 16x standard
Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x advanced 2x advanced 4x advanced
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x advanced 16x advanced

NVIDIA GeForce 7800 GTX

P1x_s.jpg (5037 bytes) HQ1x_s.jpg (4872 bytes) Q1x_s.jpg (4982 bytes) HQ1x_s.jpg (4872 bytes)
Performance 1x High Performance 1x Quality 1x High Quality 1x
P2x_s.jpg (5211 bytes) HP2x_s.jpg (5282 bytes) Q2x_s.jpg (5143 bytes) HQ2x_s.jpg (4977 bytes)
Performance 2x High Performance 2x Quality 2x High Quality 2x
P4x_s.jpg (5152 bytes) HP4x_s.jpg (5302 bytes) Q4x_s.jpg (5016 bytes) HQ4x_s.jpg (4917 bytes)
Performance 4x High Performance 4x Quality 4x High Quality 4x
P16x_s.jpg (5302 bytes) HP8x_s.jpg (5351 bytes) Q8x_s.jpg (5098 bytes) HQ8x_s.jpg (4965 bytes)
Performance 8x High Performance 8x Quality 8x High Quality 8x
P16x_s.jpg (5302 bytes) HP16x_s.jpg (5356 bytes) Q16x_s.jpg (5147 bytes) HQ16x_s.jpg (4981 bytes)
Performance 16x High Quality 16x Quality 16x High Quality 16x
Modalità Stage 0
Aniso mip filter
opt off
Aniso sample
opt off
Stage 0
Aniso mip filter
opt off
Aniso sample
opt on
Stage 0
Aniso mip filter
opt on
Aniso sample
opt off
Stage 0
Anisot mip filter
opt on
Anisot sample
opt on
Brilineare
OFF
offoffon_s.jpg (4967 bytes) offonoff_s.jpg (4967 bytes) offonon_s.jpg (4967 bytes)
Brilineare
ON
onoffoff_s.jpg (5098 bytes) onoffon_s.jpg (5098 bytes) ononon_s.jpg (5098 bytes)

NVIDIA GeForce 6800 Ultra

HQ1x_s.jpg (4872 bytes) HP2x_s.jpg (5282 bytes) HP4x_s.jpg (5302 bytes)
High Performance 1x High Performance 2x High Performance 4x
HP8x_s.jpg (5351 bytes) HP16x_s.jpg (5356 bytes)
High Performance 8x High Quality 16x
Modalità Stage 0
Aniso mip filter
opt off
Aniso sample
opt off
Stage 0
Aniso mip filter
opt off
Aniso sample
opt on
Stage 0
Aniso mip filter
opt on
Aniso sample
opt off
Stage 0
Anisot mip filter
opt on
Anisot sample
opt on
Brilineare
OFF
offoffon_s.jpg (4967 bytes) offonoff_s.jpg (4967 bytes) offonon_s.jpg (4967 bytes)
Brilineare
ON
onoffoff_s.jpg (5098 bytes) ononoff_s.jpg (5074 bytes) ononon_s.jpg (5098 bytes)

ATI Radeon X850XT PE

Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x disabled 2x disabled 4x disabled
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x disabled 16x disabled
Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x standard 2x standard 4x standard
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x standard 16x standard
Q1x_s.jpg (5597 bytes) Q2x_s.jpg (5582 bytes) Q4x_s.jpg (5617 bytes)
1x advanced 2x advanced 4x advanced
Q8x_s.jpg (5681 bytes) Q16x_s.jpg (5687 bytes)
8x advanced 16x advanced

Le schede video Radeon dimostrano di garantire una qualità dell'immagine pressoché identica a quella vista in ambiente Direct 3D utilizzando le modalità Catalyst IA Disabled e Standard. Nel momento in cui abilitiamo la modalità Advanced, i driver ATI abilitano l'applicazione del filtro brilineare in tutte le situazioni.

Abilitando l'opzione HQ, che si affianca alla modalità scelta del Catalyst IA, il comportamento è il medesimo osservato in ambiente Direct 3D e la qualità migliora notevolmente.

Anche le schede video GeForce estremizzano le loro ottimizzazioni in ambiente OpenGL anche se tale comportamento è, come per i prodotti ATI, legato solo alla modalità più aggressiva, quella denominata High Performance. In questo caso, infatti, il dettaglio delle texture è sempre più basso (la banda rossa è sempre molto vicino al bordo) e anche l'ottimizzazione legata all'inclinazione poligonale è più aggressiva: il filtro anisotropico è applicato in maniera accurata ad un minor numero di angolazioni.

Pagina 9 - Analisi qualitativa: filtro anisotropico – Far Cry

Al di là di quello che è la valutazione della qualità del filtro anisotropico effettuata con il Texture Filter Analyzer abbiamo cercato un riscontro dei risultati ottenuti anche con un videogames di successo come Far Cry. Questo titolo è contraddistinto da texture in alta risoluzione e fa ampio uso di normal map e di specular map per la generazione di effetti come il bump mapping e le riflessioni speculari.

L'analisi della qualità consiste sia nel confronto visivo della resa delle varie modalità disponibili, sia nell'utilizzo di Adobe Photoshop per rilevare, attraverso una operazione di differenza per pixel, l'impatto sulla qualità delle ottimizzazioni introdotte con le diverse impostazioni dei driver Catalyst per le GPU ATI e dei driver ForceWare per quelle NVIDIA. Ogni modalità è stata confrontata con quella che offre la massima qualità possibile che consiste nel Catalyst IA Disabled per le schede Radeon e nella modalità High Quality per le schede GeForce.

ATI Radeon X1800XT

Disabled1x_s.jpg (2758 bytes) Disabled8x_s.jpg (2769 bytes)
Disabled 1x Disabled 8x
Standard1x_s.jpg (2759 bytes) Standard8x_s.jpg (2771 bytes) Advanced1x_s.jpg (2763 bytes) Advanced8x_s.jpg (2785 bytes)
Standard 1x Standard 8x Advanced 1x Advanced 8x
Standard1x_s.jpg (2759 bytes) Standard8x_s.jpg (2771 bytes) Advanced1x_s.jpg (2763 bytes) Advanced8x_s.jpg (2785 bytes)
Standard 1x Standard 8x Advanced 1x Advanced 8x

NVIDIA GeForce 7800 GTX

Q1x_s.jpg (2735 bytes) Q8x_s.jpg (2776 bytes) HQ1x_s.jpg (2740 bytes) HQ8x_s.jpg (2777 bytes)
Quality 1x Quality 8x High Quality 1x High Quality 8x
P1x_s.jpg (2746 bytes) P8x_s.jpg (2762 bytes) HP1x_s.jpg (2744 bytes) HP8x_s.jpg (2758 bytes)
Performance 1x Performance 8x High Performance 1x High Performance 8x
Q1x_s.jpg (2735 bytes) Q8x_s.jpg (2776 bytes)
Quality 1x Quality 8x
P1x_s.jpg (2746 bytes) P8x_s.jpg (2762 bytes) HP1x_s.jpg (2744 bytes) HP8x_s.jpg (2758 bytes)
Performance 1x Performance 8x High Performance 1x High Performance 8x

NVIDIA GeForce 6800 Ultra

Q1x_s.jpg (2735 bytes) Q8x_s.jpg (2776 bytes) HQ1x_s.jpg (2740 bytes) HQ8x_s.jpg (2777 bytes)
Quality 1x Quality 8x High Quality 1x High Quality 8x
P1x_s.jpg (2746 bytes) P8x_s.jpg (2762 bytes) HP1x_s.jpg (2744 bytes) HP8x_s.jpg (2758 bytes)
Performance 1x Performance 8x High Performance 1x High Performance 8x
Q1x_s.jpg (2735 bytes) Q8x_s.jpg (2776 bytes)
Quality 1x Quality 8x
P1x_s.jpg (2746 bytes) P8x_s.jpg (2762 bytes) HP1x_s.jpg (2744 bytes) HP8x_s.jpg (2758 bytes)
Performance 1x Performance 8x High Performance 1x High Performance 8x

ATI Radeon X850XT PE

Disabled1x_s.jpg (2758 bytes) Disabled8x_s.jpg (2769 bytes)
Disabled 1x Disabled 8x
Standard1x_s.jpg (2759 bytes) Standard8x_s.jpg (2771 bytes) Advanced1x_s.jpg (2763 bytes) Advanced8x_s.jpg (2785 bytes)
Standard 1x Standard 8x Advanced 1x Advanced 8x
Standard1x_s.jpg (2759 bytes) Standard8x_s.jpg (2771 bytes) Advanced1x_s.jpg (2763 bytes) Advanced8x_s.jpg (2785 bytes)
Standard 1x Standard 8x Advanced 1x Advanced 8x

Iniziamo la nostra analisi osservando che, anche se la mappa scelta di Far Cry offre un tipo di ambientazione che poco si adatta a rilevare il vantaggio dell'utilizzo del nuovo filtro anisotropico di tipo HQ di R520, esistono delle piccole differenze degne di nota. Le riflessioni, specie sulla colonna di sinistra, sono, infatti, più presenti in modalità Disabled con HQ rispetto a qualsiasi altra modalità proposta da NVIDIA o dalla stessa ATI.

Analizzando l'impatto sulla qualità del filtro anisotropico 8x dovuto all'uso di modalità più aggressive in termini di prestazioni, emerge che G70 in modalità Quality riduce la resa in misura maggiore rispetto a quanto fa R520 in modalità Standard. Entrambe le architetture, inoltre, mostrano un evidente degrado qualitativo nel passaggio da High Quality (o IA Disabled) a Performance/High Performance (o IA Advanced): le immagini relative alla differenza per pixel mostrano moltissimi punti di diversità, specie in corrispondenza delle texture più dettagliate come quelle della pavimentazione e delle pareti. Anche rispetto a R480, R520 mostra di soffrire meno dell'abilitazione dell'IA Standard con il fitro anisotropico, confermando le migliorie introdotte da ATI a livello di texture mapping.

Più omogenea la situazione riguardo l'impatto sulla qualità del filtro trilineare: G70, NV40, R480 e R520 propongono un degrado simile sia abilitando le modalità Quality e IA Standard che con quelle Performance/High Performance e IA Advanced.

Pagina 10 - Analisi qualitativa: High Dynamic Range

Far Cry è uno dei titoli che per primo ha introdotto l’High Dynamic Range, una particolare funzionalità che ha lo scopo di far percepire l’illuminazione di una scena tridimensionale in maniera decisamente più realistica rispetto a quanto è possibile utilizzando le tradizionali tecniche di rendering. Ciò avviene incrementando il range, dove per range si intende la differenza tra la tonalità più scura e quella più chiara visualizzate all’interno di una scena tridimensionale. Un esempio di situazione in cui il rendering tradizionale non risulta essere realistico la ritroviamo quando osserviamo un oggetto piccolo che occlude una fonte luminosa grande. Pensiamo ad esempio a frapporre tra noi ed il sole un oggetto di piccole dimensioni in modo da non ricoprirlo completamente. L’occhio umano in questo caso perde la capacità di osservare l’oggetto che diventa quasi nero in quanto accecato dalla luce del sole. Nel rendering semplice noi vediamo comunque l’oggetto, magari non illuminato (in quanto osserviamo la parte nascosta alla luce), ma comunque in tutto il suo dettaglio. L’High Dynamic Range, invece, permette di simulare l’esposizione diretta alle fonti luminose variando dinamicamente l’illuminazione e simulando l’effetto di accecamento o, se vogliamo, di eccessiva esposizione.

Questa funzionalità può essere implementata in modi differenti, tuttavia l’implementazione che potremmo definire più classica fa uso di texture in formato floating point a 16 bit per canale di colore. In particolare è necessario renderizzare la scena tridimensionale in queste texture per poi estrapolare le informazioni necessarie alla realizzazione dell’High Dynamic Range. Ciò che rende estremamente pesante l’uso di questa tecnica è il fatto di non poter applicare a texture in formato floating point le tecniche di compressione normalmente utilizzate con le texture in formato interno a 8 bit, il che le rende particolarmente voluminose e, conseguentemente, molto pesanti da utilizzare. Le schede video serie Radeon X850 (o precedenti) non possono renderizzare su una texture in formato floating point ed è per questo che possono supportare l’High Dynamic Range solo con tecniche facenti uso di texture in formato intero a 16/32 bit per canale di colore come quelle utilizzate da Half Life 2 Lost Coast o da Splinter Cell Chaors Theory nella modalità Shader Model 2.0 introdotta con l’ultima patch. Le schede video della serie GeForce 6x00 e 7800, invece, sono in grado di renderizzare in questo tipo di texture e di utilizzare tale operazione per realizzare l’High Dynamic Range. L’unico limite dell’architettura messa a punto da NVIDIA è nella impossibilità di abilitare qualsiasi forma di antialiasing nel momento in cui disegna una texture in formato floating point. Le schede video serie Radeon X1000, invece, non solo possono renderizzare in una texture in formato floating point a 16 bit, ma possono anche applicare contemporaneamente qualsiasi modalità di antialiasing grazie ad alla maggiore indipendenza che c’è in R520 tra le unità di pixel shading e le ROPs, le unità che si occupano di scrivere all’interno del frame buffer..

Al momento attuale nessuno dei giochi che supporta l’High Dynamic Range è in grado di abilitare anche l’antialiasing quando tale funzionalità è attiva. Questo perché tutti gli sviluppatori hanno preso come riferimento la piattaforma NVIDIA il che ha escluso automaticamente ogni possibilità di attivare l’antialiasing con l’High Dynamic Range. Affinché si possa sfruttare questa funzionalità delle schede video Radeon X1800 è necessario attendere nuovi videogames o patch per quelli già esistenti. Durante la presentazione di R520 ATI ha mostrato alcune immagini di Far Cry con HDR e antialiasing abilitati. Abbiamo pertanto chiesto ad ATI le modalità di attivazione con Far Cry e siamo riusciti ad ottenere una versione pre-beta della patch 1.4 del gioco CryTEK che offre un miglior supporto al processore grafico R520, consentendo di attivare l’antialiasing insieme all’High Dynamic Range.

CryTEK non consente di abilitare l’High Dynamic Range attraverso le impostazioni del gioco, ma è necessario utilizzare la console e scrivere “\r_hdrrendering X”. Di default X è uguale a 0 e l’High Dynamic Range è disabilitato. Noi lo abbiamo impostato a 7, valore che rappresenta un buon compromesso in termini di resa (maggiore è X, più brillante è l’illuminazione).

GeForce 7800 GTX

nohdr_s.jpg (17770 bytes) No HDR
hdr_s.jpg (17685 bytes) HDR
nohdr2_s.jpg (20769 bytes) No HDR
hdr2_s.jpg (19039 bytes) HDR
nohdr3_s.jpg (14058 bytes) No HDR
hdr3_s.jpg (20944 bytes) HDR

Radeon X1800XT

nohdr_s.jpg (17719 bytes) No HDR
hdr_s.jpg (20630 bytes) HDR
hdr+aa_s.jpg (20549 bytes) HDR + AA
nohdr2_s.jpg (20888 bytes) No HDR
hdr2_s.jpg (19117 bytes) HDR
hdr+aa2_s.jpg (19305 bytes) HDR + AA
nohdr3_s.jpg (14010 bytes) No HDR
hdr3_s.jpg (28570 bytes) HDR
hdr+aa3_s.jpg (28419 bytes) HDR + AA

Le immagini proposte sono relative alla posizione di ingresso all’interno delle mappe Volcano, Training e Research e sono state ottenute utilizzando il semplice filtro trilineare e le impostazioni di default dei driver NVIDIA e ATI. Gli screenshots sono stati catturati sia senza che con HDR e, per le schede video Radeon X1800, abbiamo provveduto anche ad abilitare l’antialiasing 4x. Per le schede video NVIDIA è stata utilizzata la versione 1.33 di Far Cry, mentre per le Radeon X1800 la 1.4.

A livello di resa l’High Dynamic Range mostra, a parità di impostazione, un’illuminazione più brillante per le schede video Radeon X1800 rispetto alle G70/NV40. Questo risultato può essere dovuto ad una differente gestione dell’effetto con la patch 1.4: : ricordiamo che, trattandosi di una revisione non definitiva della patch 1.4, la resa potrebbe non essere quella definitiva. Questo elemento non rappresenta comunque un punto negativo in quanto piccole differenze nella gestione cromatica degli effetti sono comprensibili viste le diversità a livello di architettura e la loro valutazione ha spesso una forte componente soggettiva.

Indipendentemente dall’intensità dell’illuminazione, l’aspetto più interessante è sicuramente la qualità offerta dall’High Dynamic Range in congiunzione con l’antialiasing. Osservando attentamente gli screenshots si deduce chiaramente che le schede Radeon X1800 offrono nel complesso la migliore qualità dell’immagine possibile: High Dynamic Range e contemporanea riduzione dell’effetto di aliasing.

Pagina 11 - Configurazione di test

Configurazione di test

Processore

AMD Athlon 64 FX-55 (2,6 GHz di clock, 1 Mbyte cache L2, Socket 939)

connession HyperTransport

1000 MHz

Scheda Madre

ASUS AN8-SLI Deluxe - NFORCE 4 SLI

Ram

2x512 MB Corsair XMS PC3200 PRO Series

Sistema Operativo

Windows XP Professional SP2

Versione dei drivers

ATI Catalyst 5.9
Driver 8-173-1-050921a-026915E

NVIDIA ForceWare 81.84

Pacchetto benchmark

3DMark 05

Si tratta del famoso e diffuso benchmark sintetico sviluppato da FutureMark. Nonostante il suo obbiettivo sia quello di valutare le prestazioni di una scheda video in ambito DirectX 9, in questo articolo non verrà utilizzato per questa finalità bensì per raccogliere alcune informazioni utili riguardo l'architettura di un chip grafico. Abbiamo pertanto fatto partire solo i test relativi al Fill Rate, ai Vertex Shader ed ai Pixel Shader 2.0. I risultati che abbiamo ottenuto sono quindi da intendere solo come elementi di studio e non di valutazione.

Far Cry

Far Cry fa uso dell'innovativo motore grafico CryENGINE dei Crytek Studios. Massiccio è l'uso dei Vertex e Pixel Shader, in parte anche in versione 2.0b e 3.0, per realizzare effetti grafici come il riflesso sull'acqua, il bump mapping e le soft shadows. Due sono le mappe utilizzate: Training e Volcano. La prima è caratterizzata da ampi spazi aperti e effetti atmosferici, mentre la seconda è al chiuso e mette meglio in evidenza il bump mapping e la tecnologia Polybump per il rendering dei personaggi. Il gioco è stato aggiornato con la patch in versione 1.33.

Splinter Cell: Chaos Theory

Realizzato dalla UbiSoft e dotato di una versione pesantemente revisionata dell'Unreal Engine, questo videogames è utilizzato in modalità timedemo per valutare le prestazioni di una scheda video. Per le schede supportanti lo shader model 3 è stato selezionato tale supporto senza abilitare l'high dynamic range, le soft shadows enhaced ed il parallax mapping. Per le altre schede è stato selezionato lo shader model 1. La demo utilizzata è stata registrata nella mappa Light House. Il gioco è stato aggiornato con la patch in versione 1.3.

The Chronicles Of Riddick

Sviluppato dai Starbreeze Studios e basato sul Starbreeze Engine, The Chronicles of Riddick: Escape from Butcher Bay fa uso dell'API OpenGL per l'accelerazione della grafica tridimensionale. Tra le sue caratteristiche più interessanti riportiamo il massiccio uso di stencil shadows e del normal mapping. Lo shader model impostato è il 2.0 per tutti i benchmark. La demo utilizzata è disponibile al seguente indirizzo: http://www.benchemall.com/download/RiddickBenchmark.exe

Doom 3

Uno dei titoli più attesi del 2004, seguito del principe di tutti gli shooter in tre dimensioni, Doom 3 è l'ultima fatica di John Carmak. Tra le caratteristiche principali che questo motore grafico mette in mostra troviamo un pensante uso di stencil shadows. Sono presenti anche alcuni vertex e pixel shaders, anche se non in misura così avanzata come in Far Cry. Doom 3 è sviluppato, come vuole la tradizione Id Software, rigorosamente in OpenGL.

Battlefield 2

Battlefield 2 è un gioco multiplayer di guerra di grande successo nel 2005. Essenzialmente si tratta di uno shooter 3D basato sull'API Direct 3D e caratterizzato da ampi spazi aperti e dall'utilizzo di vertex e pixel shaders 2.0 o superiori, oltre che da ombre di tipo shadow map.

Unreal Tournament 2004

Basato su una versione rivista e aggiornata del motore grafico di Unreal Tournament 2003, questo titolo è uno dei più diffusi a livello di multiplayer gaming. Tra le caratteristiche più interessanti troviamo l'uso del T&L e del Bump Mapping. Quasi del tutto assenti invece i Vertex ed i Pixel Shader. Le due mappe prese in considerazione sono Antalus ed Asbestos. La prima è contraddistinta da spazi aperti molto vasti, mentre la seconda è al chiuso in un ambiente più claustrofobico.

Call Of Duty 2 Demo

Sparatutto 3D targato Activision, Call Of Duty 2 è il sequel di Call Of Duty un titolo incentrato sulla guerra, di particolare successo e rinomanza nel panorama videoludico mondiale. La grafica tridimensionale proposta è contraddistinta da ampi spazi aperti, oggetti e modelli ricchi di poligoni ed alcuni interessati effetti particellari e di shading. Il titolo sfrutta l’API Direct 3D ed è protagonista del lancio di XBOX 360. La versione da noi utilizzata è la demo e, in particolare, per eseguire i benchmark abbiamo registrato una piccola sequenza di gioco.

Pagina 12 - Benchmark sintetici

In occasione della preview delle schede Radeon X1800 abbiamo già mostrato alcuni risultati relativi al 3DMark05 che, tuttavia, oggi commentiamo nuovamente in quanto dopo aver osservato il comportamento con i videogames è possibile eseguire un’analisi più completa ed accurata dei valori ottenuti con questo benchmark.

3dmark_1.png (46159 bytes)

I valori di fill rate mostrano come il Radeon X1800 XT, nonostante dal punto di vista puramente teorico possegga un fill rate leggermente inferiore a quello della scheda GeForce 7800 GTX, nel rendering in multitexturing riesce ad essere allo stesso livello. La scheda Radeon X1800 XL paga una frequenza del core pari a 500 MHz nei confronti delle Radeon X850 XT e mostra risultati leggermente inferiori a queste ultime. Questi test mostrano una situazione di rendering estremamente semplice atta a valutare solo ed esclusivamente la capacità di elaborazione dei pixel in caso di rendering senza elaborazioni a livello di shaders o di texture filtering.

3dmark_2.png (42938 bytes)

L’elaborazione poligonale è un campo in cui le schede video Radeon hanno sempre dimostrato di essere particolarmente veloci e anche R520 fa registrare valori decisamente interessanti. La scheda Radeon X1800 XT è oltre il 70% più veloce della GeForce 7800 GTX nel calcolo dei vertex shaders più semplici, mentre in quelli più complessi il vantaggio si assesta attorno al 30%. Anche la Radeon X1800 XL è rapida in questo ambito: è leggermente più veloce della GeForce 7800 GTX.

3dmark_3.png (36963 bytes)

Il calcolo dei pixel shaders è un’operazione in cui l’architettura messa a punto da NVIDIA ha più volte stabilito primati in termini di performance. Del resto in termini di complessità e supporto tecnologico G70 e NV40 sono sempre stati una spanna sopra R480. R520 dal punto di vista tecnico possiede un’architettura particolarmente efficiente nella gestione dei pixel shaders anche se tale efficienza è strettamente legata alle caratteristiche degli shaders. Frequenti accessi alle texture inframmezzati da costose elaborazioni matematiche o anche l’utilizzo massiccio di dynamic branching, possono porre le unità di R520 in una condizione di vantaggio rispetto a G70 o NV40. Il test relativo ai pixel shader usato nel 3DMark05 non fa uso massiccio di tali caratteristiche: il team FutureMark si è concentrato nello sviluppo di shaders perfettamente compatibili con lo shader model 2.0 il che gli ha impedito di sfruttare le peculiarità proprie dello shader model 3 così care a R520. G70 può, quindi, avvantaggiarsi del suo maggior numero di unità di calcolo lavoranti in parallelo in grado di eseguire 8 MAD per ciclo di clock per porsi autoritariamente al primo posto. In seconda posizione troviamo la Radeon X1800 XT, allo stesso livello della GeForce 7800 GT. E’ molto interessante notare che la Radeon X1800 XL, nonostante possieda una frequenza di elaborazione inferiore a quella della Radeon X850 XT PE, abbia prestazioni superiori in questo ambito il che ci suggerisce che, indipendentemente dal pixel shader considerato, l’architettura di R520 a parità di frequenza e di numero di pipeline è più rapida di R480. Tratteremo questo tipo di confronto con maggior spessore nel paragrafo dedicato all’analisi dell’efficienza.

Pagina 13 - Doom 3 - The Chronicles Of Riddick

doom3_1.png (67893 bytes)

doom3_2.png (67782 bytes)

riddick_1.png (66377 bytes)

riddick_2.png (69164 bytes)

Doom 3 e The Chrnonicles Of Riddick sono due videogames che possiedono più di un elemento di contatto a livello di motore grafico.
Nonostante siano basati su motori grafici sviluppati autonomamente, entrambi fanno uso di OpenGL, API alternativa al Direct 3D e particolarmente diffusa in ambiente professionale, e di un sistema di illuminazione che trova fondamento nelle stencil shadows. Questa tecnica per proiettare le ombre ha subito una moderata diffusione nell’ultimo anno e vede in NVIDIA una accanita sostenitrice al punto che l’azienda di Santa Clara ha deciso di implementare all’interno dei propri processori grafici (fin dalla serie GeForce Fx) alcune funzionalità atte ad incrementarne le prestazioni. Oltre all’utilizzo di questa tecnologia, Doom 3 e The Chrnonicles Of Riddick fanno uso di shaders molto semplici per realizzare effetti come la rifrazione o il bump mapping.

Le caratteristiche di questi motori grafici probabilmente sono quelle che più di tutte si muovono in antitesi rispetto al principio che ha guidato gli ingegneri di ATI nella progettazione di R520: il supporto alle stencil shadows è di tipo classico e la mancanza di shaders complessi rende l’architettura di R520 decisamente mal sfruttata. I risultati attesi, quindi, sono esattamente quelli ottenuti: le schede GeForce sono sempre più veloci delle corrispondenti soluzioni canadesi.

Pagina 14 - Far Cry

fc_1.png (77965 bytes)

fc_2.png (76072 bytes)

fc_3.png (78237 bytes)

fc_4.png (76914 bytes)

Una delle novità introdotte con questa recensione è l’analisi delle prestazioni alla risoluzione di 1920x1440. Questa scelta è dovuta essenzialmente a due ragioni. Innanzitutto i prodotti di fascia alta come quelli qui considerati sono espressamente dedicati ad una fascia d’utenza che pretende di utilizzare elevate risoluzioni e filtri di antialiasing e anisotropico. Inoltre una risoluzione di 1920x1440 risulta con maggior difficoltà essere CPU limited il che ci consente di effettuare un lavoro di valutazione più fedele e completo.

Il confronto tra la Radeon X1800 XT e la GeForce 7800 GTX vede una situazione di sostanziale parità nella mappa Volcano, mentre esiste un leggero vantaggio per il prodotto NVIDIA nel rendering semplice. Nel momento in cui abilitiamo il rendering più complesso, con antialiasing 4x e filtro anisotropico 8x, l’ago della bilancia si sposta decisamente a favore della Radeon X1800 XT, sempre più veloce della GeForce 7800 GTX in una misura che va dal trascurabile (4 fps) al significativo (23 fps) a seconda delle mappa e della risoluzione presa in considerazione. E’ interessante notare che la mappa in cui il vantaggio è più evidente è Volcano, contraddistinta da ambienti chiusi dove l’efficienza delle tecniche di rimozione delle superfici nascoste è molto importante.

Le prestazioni della Radeon X1800 XL sono leggermente nascoste dai buoni risultati mostrati dalla Radeon X850 XT PE, specie nel rendering più semplice, dove il maggiore fill rate di quest’ultima la rende competitiva anche rispetto alla GeForce 7800 GT. La Radeon X1800 XL passa in una situazione di lieve superiorità soltanto abilitando l’antialiasing ed il filtro anisotropico riconfermando i miglioramenti a livello di architettura apportati da ATI a tutto vantaggio della maggiore efficienza in situazioni gravose per la banda passante.

Pagina 15 - Splinter Cell Chaos Theory - Battlefield 2

sc_1.png (75509 bytes)

sc_2.png (80511 bytes)

battlefield2_1.png (68774 bytes)

battlefield2_2.png (67688 bytes)

Splinter Cell Chaos Theory e Battlefield 2 sono due dei titoli più recenti e che fanno uso delle funzionalità più avanzate del Direct 3D, situazione ideale per verificare la validità dell’architettura di R520.

Splinter Cell Chaos Theory vede la Radeon X1800 XT sempre in vantaggio rispetto alla GeForce 7800 GTX: passiamo da un distacco minimo nel rendering più semplice, ad una superiorità decisamente più marcata abilitando l’antialiasing 4x ed il filtro anisotropico 8x. Leggermente differente il quadro per la Radeon X1800 XL, di poco più o meno veloce della GeForce 7800 GT a seconda della situazione di rendering. Questo comportamento, già riscontrato in altri titoli, conferma come le tecniche di ottimizzazione del flusso di informazioni che entrano in gioco specie applicando l’antialiasing ed il filtro anisotropico sono particolarmente efficienti in R520.

Battlefield 2 è senza ombra di dubbio il titolo che ha mostrato i maggiori distacchi in termini assoluti sia a favore di NVIDIA che a favore di ATI. Osservando il grafico derivante dai risultati ottenuti senza l’applicazione di filtri, constatiamo senza troppe difficoltà che le schede GeForce 7800 sono dotate di una maggiore potenza bruta. Tale potenza, tuttavia, subisce un crollo verticale abilitando l’antialiasing ed il filtro anisotropico: la Radeon X1800 XT a 1600x1200 è più veloce di oltre il 40% rispetto alla GeForce 7800 GTX. Evidente è anche il vantaggio della Radeon X1800 XL non solo nei confronti della GeForce 7800 GT, ma anche rispetto alle schede Radeon X850 a riprova del decisivo passo in avanti fatto da ATI nel passaggio da R480 a R520.

Pagina 16 - Unreal Tournament 2004 - Call of Duty 2

ut_1.png (69831 bytes)

ut_2.png (70454 bytes)

ut_3.png (71122 bytes)

ut_4.png (73005 bytes)

Unreal Tournament 2004 non è un titolo in grado di sfruttare l’efficiente architettura di shading alla base di R520, tuttavia possiede alcune caratteristiche come l’uso di texture in alta risoluzione, rendering in multitexturing e, in alcune mappe, elevati coefficienti di overdraw che metto in risalto alcune peculiarità della nuova generazione di processori grafici ATI.

Il raffronto tra la Radeon X1800 XT e la GeForce 7800 GTX vede la prima sempre in vantaggio in tutte quelle situazioni in cui non si è CPU limited. Un esempio di quadro CPU limited è rappresentato dalla mappa Asbestos nel rendering senza filtri, dove le prestazioni delle prime tre/quattro schede video sono pressoché allineate. Abilitando l’antialiasing 4x ed il filtro anisotropico 8x otteniamo un deciso vantaggio per la Radeon X1800 XT, specie nella mappa Antalus.

Anche la Radeon X1800 XL è competitiva nei confronti della GeForce 7800 GT con questo titolo e le sue migliori prestazioni anche nei confronti delle Radeon X850, nonostante una frequenza di lavoro inferiore per il core e le memorie, sono un ulteriore punto a favore dell’architettura di R520.

cod_1.png (73532 bytes)

cod_2.png (73388 bytes)

La demo di Call Of Duty 2 rappresenta una new entry all’interno del nostro pacchetto benchmark: in occasione di questo articolo abbiamo registrato una piccola sequenza di gioco, utilizzata successivamente per il rilevamento delle prestazioni delle schede video qui prese in considerazione. Tutti i settaggi all’interno del gioco sono stati impostati al massimo livello di dettaglio possibile.

Call Of Duty 2 conferma quanto già visto con altri titoli recenti facenti un uso corposo di vertex e pixel shaders avanzati e lo estende in tutte le situazioni: la scheda Radeon X1800 XT è sempre più veloce della GeForce 7800 GTX, in particolar modo nel rendering con antialiasing 4x e filtro anisotropico 8x. Il distacco in quest’ultimo caso raggiunge percentuali anche molto corpose: la più potente implementazione di R520 è oltre il 60% più veloce della GeForce 7800 GTX alla risoluzione di 1920x1440.

Ottimi anche i risultati della Radeon X1800 XL più veloce della GeForce 7800 GT anche se il margine è più ridotto rispetto a quello vista tra i due pesi massimi.

Pagina 17 - High Dynamic Range: analisi prestazioni
L’High Dynamic Range è una delle funzionalità più innovative e ricercate negli ultimi tempi e giochi come Splinter Cell Chaos Theory e Far Cry sono già in grado di sfruttarla per garantire una resa dell’illuminazione e cromatica superiore alla norma. Splinter Cell Chaos Theory al momento del suo lancio supportava questa feature solo con le schede compatibili con lo shader model 3.0. In realtà si tratta di una caratterizzazione sbagliata in quanto l’implementazione dell’High Dynamic Range è indipendente dalla capacità di gestire lo shader model 3.0, ma è strettamente legata principalmente alle capacità di rendering e di blending del processore grafico. Tuttavia, il fatto che le schede basate su NV40 e G70 compatibili con lo shader model 3.0 sono anche in grado di realizzare l’HDR ha portato a questa associazione. L’ultima patch introduce il supporto allo shader model 2.0 ed anche all’High Dynamic Range, realizzato utilizzando texture in formato intero, invece che in floating point. Non abbiamo avuto alcuna difficoltà nell’abilitare l’High Dynamic Range con il profilo shader model 3.0 con le schede Radeon X1800, anche se non è stato possibile attivare l’antialiasing in questo stato. E’ possibile, tuttavia, che una futura patch rilasciata da Ubisoft offra un miglior supporto a questa funzionalità disponibile in R520.

sc_hdr_1.png (78451 bytes)

sc_hdr_2.png (79678 bytes)

I risultati velocistici eseguiti con l’attuale ultima versione disponibile di Splinter Cell Chaos Theory mostra un evidente vantaggio per la Radeon X1800 XT rispetto alla GeForce 7800 GTX nel rendering con High Dynamic Range abilitato. Osservando il grafico relativo all’impatto sulle prestazioni è possibile dimostrare che R520 nella gestione di questa funzionalità è più veloce di G70 in quanto garantisce un impatto sulle prestazioni inferiore. Anche la Radeon X1800 XL è più veloce della GeForce 7800 GT nonostante il vantaggio sia estremamente ridotto.

fc_hdr_1.png (74688 bytes)

fc_hdr_2.png (86562 bytes)

fc_hdr_3.png (75191 bytes)

fc_hdr_4.png (87082 bytes)

Far Cry è stato il primo titolo a supportare l’High Dynamic Range. I ragazzi della CryTEK hanno aggiunto questa funzionalità al loro motore grafico tempo fa attraverso la patch 1.3. Oggi l’ultima patch ufficiale di Far Cry è la 1.33 che introduce il supporto a questa nuova generazione di processori grafici anche se non consente ancora l’uso dell’High Dynamic Range. Attraverso ATI siamo riusciti ad ottenere una versione pre-beta della patch 1.4 che ci ha permesso di abilitare l’High Dynamic Range sia in presenza che senza antialiasing con R520. Trattandosi di una versione non ancora definitiva, l’utilizzo di questa patch è avvenuto solo in occasione dei benchmark relativi alle schede Radeon X1800 con High Dynamic Range abilitato. In tutti gli altri casi è stata usata la patch 1.33.

Esattamente come per Splinter Cell Chaos Theory, anche in questo caso l’impatto sulle prestazioni derivante dall’uso dell’High Dynamic Range è inferiore sulle schede basate su R520 rispetto a quanto visto con G70. Inoltre i risultati ottenuti con R520 mediante l’utilizzo congiunto di High Dynamic Range e dell’Adaptive AA 4x evidenziano come la giocabilità di Far Cry in queste condizioni sia la stessa delle schede GeForce 6800 Ultra senza antialiasing.

Pagina 18 - Anti Aliasing: analisi prestazioni

La validità delle schede video Radeon nell’applicazione dell’antialiasing è cosa ben nota fin dai tempi delle Radeon 9700 PRO. Le novità a livello di architettura introdotte da ATI con R520 promettono un ulteriore miglioramento in questa direzione in quanto sono state ottimizzate molte delle operazioni critiche legate all’applicazione dell’antialiasing.

In questa sede vogliamo valutare l’impatto sulle prestazioni derivante dall’abilitazione dell’antialiasing nelle sue varie modalità alla risoluzione di 1600x1200 con Splinter Cell Chaos Theory e Far Cry.

sc_aa_1.png (74587 bytes)

sc_aa_2.png (75090 bytes)

fc_aa_1.png (87274 bytes)

fc_aa_2.png (85224 bytes)

fc_aa_3.png (113434 bytes)

fc_aa_4.png (114960 bytes)

I grafici relativi all’impatto sulle prestazioni parlano chiaro: l’implementazione dell’antialiasing sulle schede video Radeon X1800 è di primissimo livello e l’impatto sulle prestazioni dovuto alla sua abilitazione è, mediamente, molto più contenuto rispetto a quanto possiamo osservare con le schede GeForce. Siamo rimasti particolarmente colpiti dalle eccellenti prestazioni fatte registrare in modalità 6x con Far Cry, nettamente superiori a quelle ottenute da G70 in modalità 8xS: la Radeon X1800 XT è oltre il doppio più veloce di una GeForce 7800 GTX in questo caso. Anche se questi risultati non possono essere intesi come un indice di giocabilità in quanto sono ottenuti con audio disabilitato, è interessante notare come le schede video Radeon X1800 sfoderino oltre 60 fps a 1600x1200 con un antialiasing 6x: in questa situazione l’effetto di aliasing è quasi completamente assente. Molto buono anche l’impatto sulle prestazioni della modalità Adaptive: sempre abbastanza ridotto, anche se il Transparency SuperSampling di NVIDIA sembra essere in percentuale un po’ più leggero.

Tutti i test relativi all'antiliasing delle schede NVIDIA sono stati eseguiti senza correzione gamma abilitata a causa di bug che porta ad un anomalo degrado delle prestazioni con questa funzionalità in ambiente Direct 3D. Si tratta di un problema segnalato ad NVIDIA e riconosciuto che verrà risolto in una successiva release dei driver ForceWare.

Pagina 19 - Filtro anisotropico: analisi prestazioni

sc_aniso_1.png (136457 bytes)

sc_aniso_2.png (131675 bytes)

fc_aniso_1.png (144466 bytes)

fc_aniso_2.png (135903 bytes)

fc_aniso_3.png (143895 bytes)

fc_aniso_4.png (135570 bytes)

I grafici mostrano due andamenti leggermente distinti a seconda del videogames preso in considerazione.

Splinter Cell Chaos Theory è un titolo decisamente shader bound: le sue prestazioni non sono limitate dalla capacità di gestire le texture, ma da quella di applicare gli effetti di pixel shading. Questa è la ragione per cui nella quasi totalità dei casi il passaggio dal rendering con filtro trilineare a quello con filtro anisotropico 16x non comporta un apprezzabile degrado delle prestazioni sia con le schede ATI che con quelle NVIDIA.

Far Cry è sicuramente più complesso in termini di texture rispetto a Splinter Cell Chaos Theory e per questo motivo osserviamo un degrado delle prestazioni derivante dall’abilitazione del filtro anisotropico leggermente più marcato. E’ comunque evidente che il filtro anisotropico, specie se utilizzato in congiuzione con le impostazioni di default dei driver ATI (IA Standard) e NVIDIA (Quality), è una funzionalità il cui rapporto qualità/prestazioni lo rende non solo desiderabile, ma anche ampiamente utilizzabile.

Estremamente contenuto è l’impatto sulle prestazioni della nuova opzione High Quality introdotta da R520: il degrado delle prestazioni non è mai andato oltre i 2 fps.

Pagina 20 - Analisi efficienza dell'architettura

Come già detto in precedenza la parola “efficienza” può avere molteplici caratterizzazioni a livello pratico: quando testiamo aspetti come il rendering con antialiasing testiamo l’efficienza di un processore grafico nella gestione di ampi flussi di informazioni, mentre se valutiamo le prestazioni di un processore grafico comparandole, a parità di capacità di calcolo, con quelle di altre GPU, allora ne testiamo l’efficienza nell’eseguire un determinato numero di operazioni per ciclo di clock.

In questo paragrafo abbiamo confrontato la Radeon X1800 XL direttamente con la GeForce 6800 Ultra, la GeForce 7800 GTX e la Radeon X850 XT modificando le frequenze di lavoro e/o le unità di elaborazione attive, in maniera da ottenere le medesime specifiche tecniche in termini di fill rate e di banda passante. In particolare abbiamo portato le schede GeForce 6800 Ultra, Radeon X850 XT e Radeon X1800 XL alle frequenze di 450 MHz per il core e 1000 MHz per le memorie, mentre la GeForce 7800 GTX è stata testata in due modalità: con 24 pipeline lavoranti a 300 MHz o con sole 16 pipeline abilitate lavoranti a 450 MHz.

efficienza_3dmark_1.png (45138 bytes)

Il 3DMark05 evidenzia come al livello di fill rate le schede video NVIDIA abbiano una maggiore capacità di eseguire operazioni in single texturing, mentre in multitexturing R520 risulta essere il più competitivo.

efficienza_3dmark_2.png (43248 bytes)

efficienza_3dmark_3.png (36604 bytes)

Le otto unità di vertex shading di R520 risultano essere più rapide delle sei unità caratterizzanti la GeForce 6800 Ultra e la Radeon X850 XT. Nei confronti di G70, R520 si pone in una posizione di vantaggio nel calcolo dei vertex shaders più semplici, mentre è allo stesso livello in quelli più complessi. Da notare come la versione dotata di 24 pipeline di G70 abbia prestazioni inferiori: le otto unità di vertex shading lavorano a 300 MHz, contro i 450 MHz degli altri.

Velocissimo G70 sia in modalità a 16 che a  24 pipeline nel calcolo dei pixel shaders proposto dal 3DMark05. Al terzo posto si colloca la Radeon X1800 XL, di poco più veloce della GeForce 6800 Ultra. Un po’ più indietro la Radeon X850 XT: R520 dimostra di essere circa il 30% più veloce nel calcolo dei pixel shaders proposti dal 3DMark05, un buon risultato se consideriamo che non si tratta di shaders studiati per sfruttare le peculiarità dello shader model 3.0.

efficienza_sc_1.png (71374 bytes)

efficienza_sc_2.png (72455 bytes)

efficienza_fc_1.png (68096 bytes)

efficienza_fc_2.png (66049 bytes)

efficienza_fc_3.png (68327 bytes)

efficienza_fc_4.png (69903 bytes)

I risultati di Splinter Cell Chaos Theory e Far Cry confermano quanto era già emerso nel corso delle altre analisi velocistiche. Nel rendering semplice l’architettura di R520 a parità di capacità di calcolo e di banda passante è leggermente indietro a G70, mentre in quello più complesso i miglioramenti a livello di architettura e nella gestione della banda passante gli consentono di posizionarsi leggermente avanti a tutti i processori grafici considerati.

Pagina 21 - R520 vs SLI

Questi grafici vi propongono un confronto del tutto atipico: la Radeon X1800 XT è paragonata alle soluzioni SLI di NVIDIA basate su GeForce 6800 Ultra, GeForce 7800 GT e GeForce 7800 GTX. Naturalmente questo raffronto è stato eseguito per puro spirito di curiosità e, per ovvie ragioni, non ha finalità valutative.

fc_sli_1.png (58467 bytes)

fc_sli_2.png (56036 bytes)

fc_sli_3.png (60182 bytes)

fc_sli_4.png (53991 bytes)

sc_sli_1.png (58008 bytes)

sc_sli_2.png (59765 bytes)

Coloro che si attendevano una completa debacle della Radeon X1800 XT non potranno che mostrare tutto il loro stupore dopo aver osservato che la più potente implementazione di R520 nel rendering con antialiasing 4x e filtro anisotropico 8x riesce a competere senza troppe difficoltà con due GeForce 6800 Ultra lavoranti in parallelo e, in talune situazioni, ad avvicinarsi anche a due GeForce 7800 GT in SLI. Si tratta di un risultato decisamente interessante se consideriamo che fino a pochi mesi fa due GeForce 6800 Ultra in SLI rappresentavano il top, mentre oggi esistono situazioni, che probabilmente sono le più rilevanti in questa fascia di prezzo, in cui una scheda riesce ad essere più veloce in solitario.

Pagina 22 - Scalabilità al variare del processore

I test di scalabilità al variare del processore ci consentono di valutare il comportamento di una scheda video su più configurazioni contraddistinte da una differente potenza di calcolo della CPU. Questo genere di valutazione può essere utile per quantificare la dipendenza tra le prestazioni di una scheda video in ambito grafico e le capacità computazionali del processore di sistema. A tal proposito abbiamo impostato il nostro processore Athlon FX-55, lavorante di default a 2600 MHz, alle frequenze di 2000 MHz e di 1600 MHz, variandone il moltiplicatore.

scalabilita_sc_1.png (135207 bytes)

scalabilita_sc_2.png (142077 bytes)

scalabilita_fc_1.png (135848 bytes)

scalabilita_fc_2.png (131083 bytes)

scalabilita_fc_3.png (139860 bytes)

scalabilita_fc_4.png (132921 bytes)

L’utilizzo di un processore di sistema dotato di una potenza di calcolo insufficiente a garantire i dati con un certa continuità alla scheda video, porta ad un appiattimento delle prestazioni che, quindi, non varieranno più al variare della scheda video o della risoluzione, ma saranno completamente limitate dalla CPU. Tale situazione si definisce appunto “CPU Limited” e può dipendere dall’applicazione utilizzata (che può poggiarsi in misura più o meno rilevante sulla CPU e sulla GPU), dalle impostazioni (se troppo poco pesanti per la scheda video) e, più in generale, da uno squilibrio tra la potenza di calcolo della scheda video e quella del processore.

Pagina 23 - Consumi e rumorosità

Il rilevamento della potenza necessaria al corretto funzionamento del sistema è stato eseguito con una pinza amperometrica Lafayette PA-33 sulla corrente alternata utilizzata dall'alimentatore del sistema di test. Attraverso questo strumento abbiamo provveduto sia a misurare la tensione (pari a 230 Volt) che la corrente (in Ampere). In un circuito elettrico attraversato da corrente continua la potenza, che si misura in Watt, è data da tensione*corrente. Sfortunatamente, avendo una misurazione della corrente alternata, dobbiamo tenere conto di un terzo fattore denominato fattore di potenza. La formula pertanto risulta essere la seguente:

potenza = tensione*corrente*cos(Phi)

dove Phi è l'angolo di sfasamento e cos(Phi) è il fattore di potenza. L'angolo di sfasamento dipende dal tipo di carico: resistivo, induttivo o capacitivo. Gli alimentatori dei personal computer di fascia alta hanno solitamente un tipo di carico che rende l'angolo di sfasamento vicino allo zero e, conseguentemente, il fattore di potenza può essere approssimato con l'unità. Per correttezza, tuttavia, non indicheremo i risultati ottenuti in Watt, ma in VA (Volt per Ampere). Coloro che vogliono effettuare un confronto tra i risultati ottenuti e la potenza massima erogabile dall'alimentatore devono tenere a mente che nel migliore dei casi (cioè quando cos(Phi) è approssimabile con l'unità) il valore in VA può essere tradotto in Watt senza alcuna operazione, mentre in tutti gli altri casi la potenza in Watt sarà inferiore.

consumi.png (38429 bytes)

Esistono due elementi che saltano immediatamente all’occhio osservando la potenza assorbita dai sistemi con schede video Radeon X1800 XT e Radeon X1800 XL in modalità idle e sotto stress. Innanzitutto entrambe le schede fanno registrare i più elevati valori in idle, il che fa presumere la presenza di una gestione dell’alimentazione e delle frequenze in ambiente Windows non troppo efficiente per R520. I risultati sotto stress, inoltre, rivelano che la Radeon X1800 XT è la scheda video più ingorda di energia del lotto. Bisogna tuttavia considerare che le schede Radeon X1800 possiedono moduli di memoria con un voltaggio superiore rispetto a quelli utilizzati negli altri prodotti e che la versione XT qui provata è dotata di 512 MB di memoria video. Quest’ultimo elemento influisce sicuramente sulle richieste energetiche: la Radeon X1800 XL dotata di 256 MB sotto stress è la scheda che richiede il minor quantitativo di VA

Le misurazioni della rumorosità sono state effettuate su un sistema di test privo di case con un fonometro posto ad una distanza di circa 10 cm dal sistema di dissipazione della scheda video. Bisogna, pertanto, interpretare questi valori non come misure assolute, ma limitatamente alla comparazione tra i vari prodotti, cioè solo per la valutazione di quale è la scheda più rumorosa del lotto. E' evidente, infatti, che la maggioranza degli utenti monta il proprio personal computer in un case chiuso dal quale si trova normalmente ad una distanza superiore a 10 cm.

db.png (33672 bytes)

La rumorosità della scheda Radeon X1800 XT è in linea a quella della Radeon X850 XT: non è un caso che il sistema di raffreddamento di questi due prodotti sia simile sia a livello estetico che funzionale. La soluzione single slot Radeon X1800 XL, invece, paga la minore superficie di dissipazione con l’adozione di una ventola leggermente più rumorosa rispetto alla Radeon X1800 XT, ma comunque più silenziosa di quella alla base delle schede GeForce 6800 Ultra.

Pagina 24 - Overclock

L’overclock delle schede video Radeon X1800 è stata senza ombra di dubbio una delle operazioni più complesse legate alla realizzazione di questo articolo. Le nuove schede Radeon X1800 non vengono riconosciute da nessuno dei tradizionali software di tweaking (Rivaturner, ATITool, Powerstrip, ecc...) e, naturalmente, questa situazione ci ha inizialmente impedito di procedere con la pratica dell’overclock. Una prima ricerca di una via di fuga è consistita nel contattare l’autore di ATiTool (Wizzard) chiedendogli informazioni al riguardo. Grazie al suo aiuto abbiamo ricevuto una prima soluzione: una build interna di ATITool in grado di overcloccare il solo core della scheda Radeon X1800 XL (l’autore ha affermato di incontrare molti problemi nella modifica delle frequenze della memoria a causa del nuovo controller). Non contenti di questo compromesso ed essendo a conoscenza di prove di overclock effettuate durante la presentazione ad Ibiza di R520, abbiamo chiesto ad ATI di fornirci l’utility interna usata in quell’occasione: Winclk. Con non poche difficoltà siamo riusciti ad ottenere questo piccolo applicativo anche se in contemporanea abbiamo ricevuto la seguente informazione: i sample di R520 a noi forniti sono limitati nelle capacità di overclock attraverso il BIOS. Abbiamo quindi richiesto un BIOS sbloccato, che abbiamo ricevuto poco dopo per la sola Radeon X1800 XT. Sfortunatamente il flash di questa versione del BIOS ha portato alla impossibilità di avviare il sistema. Abbiamo quindi ripristinato il BIOS originale montando la Radeon X1800 XT sul secondo slot PCI Express 16x della scheda madre Asus A8N-SLI Deluxe ed utilizzando come scheda primaria una GeForce 7800 GTX. Questo processo di aggiornamento del BIOS e, successivo, ripristino di quello originale, è stato eseguito ben quattro volte utilizzando svariati programmi per il flashing e diverse versioni del BIOS sbloccante. Fortunatamente siamo riusciti ad ottenere in tempo per la pubblicazione una versione funzionante del BIOS sbloccato.

La Radeon X1800 XT con BIOS originale ci ha consentito di arrivare alle frequenze di 700 MHz per il core e 1540 MHz per le memorie. Dopo aver aggiornato la scheda con il BIOS sbloccato siamo riusciti a raggiungere 725 MHz per il core e 1600 MHz per le memorie. La Radeon X1800 XL, invece, è stata overcloccata solo con BIOS originale e non ha superato i 570 MHz per il core ed i 1180 MHz per le memorie.

fc_oc_1.png (92904 bytes)

fc_oc_2.png (89821 bytes)

fc_oc_3.png (92812 bytes)

fc_oc_4.png (88549 bytes)

L’incremento delle prestazioni in Far Cry può essere quantificato nell’ordine del 10% per entrambe le schede video, specie nel rendering in alta risoluzione con antialiasing e filtro anisotropico abilitato.

Pagina 25 - Conclusioni

Efficienza, è questa la parola attorno la quale ruotano tutte le scelte adottate dagli ingegneri canadesi nella progettazione dell’architettura di R520. Era il 2002 l’anno in cui ATI Technologies presenta al mondo R300, un processore grafico che avrebbe fatto la storia grazie ad un eccellente supporto tecnologico ed un salto sul fronte delle prestazioni impressionante rispetto alla precedente generazione. Da allora il bagaglio tecnologico dell’azienda canadese ha subito un processo di evoluzione più o meno marcato con i vari R3x0 e R4x0, ma è sempre venuto a mancare quell’impulso innovativo che l’aveva contraddistinta al lancio dei prodotti Radeon 9700. Oggi con R520 ATI dà nuova linfa vitale alla sua creatività ed al suo bagaglio tecnologico proponendo un’architettura realmente innovativa sotto tutti i punti di vista. Il salto generazionale tra R480 e R520, benché possa aver deluso coloro che si aspettavano un’architettura con elaborazione unificata degli shaders, può essere considerato a tutti gli effetti come un passo che, se da un lato definire “rivoluzionario” risulterebbe essere eccessivo, dall’altro sarebbe riduttivo descrivere semplicemente come “evolutivo”. Possiamo quindi parlare di una radicale evoluzione di quello che è stato R480 (o se vogliamo R300), con il quale R520 condivide i punti di forza, uno su tutti la gestione completamente programmabile dell’antialiasing, ma dal quale non eredita i punti di debolezza che, al contrario, grazie ad una buona dose di creatività ed ingegno sono stati elegantemente risolti con alcune soluzioni del tutto inedite. Ci riferiamo all’indipendenza tra ALU e TMU, all’Ultra-Threading Dispatch Processor, al General Purpose Register Array, al ring bus con architettura interna a 512 bit, al miglioramento della gestione delle superfici nascoste e della compressione dei dati relativi allo z-buffer ed al pieno supporto dello shader model 3.0 e dell’High Dynamic Range completo di antialiasing. La totalità di questi elementi fa di R520 un processore grafico proiettato decisamente verso il futuro, dove l’efficienza nella gestione del dynamic branching e di altre situazioni complesse è fondamentale. Fin dall’avvento della GPU NV40 di NVIDIA, ATI ha dovuto cedere lo scettro del miglior supporto tecnologico a causa di alcune scelte conservative effettuate negli ultimi anni. Oggi, con R520 e la nuova generazione di schede video Radeon X1000, questo scettro ritorna saldamente nelle sue mani.

I nostri benchmark hanno chiaramente evidenziato come l’architettura di R520 si trovi a suo agio in tutte quelle situazioni complesse di rendering, in particolare abilitando l’antialiasing, il filtro anisotropico e l’High Dynamic Range. Questo comportamento è stato osservato non solo nello scontro tra Radeon X1800 XT e GeForce 7800 GTX e tra Radeon X1800 XL e GeForce 7800 GT, ma anche portando tutti i processori grafici nelle stesse condizioni in termini di fill rate e banda passante. Non possiamo non citare a tal proposito i risultati ottenuti nella valutazione dell’impatto sulle prestazioni derivante dall’attivazione dell’antialiasing: le schede Radeon X1800 mostrano mediamente un degrado velocistico molto più contenuto rispetto a tutte le schede GeForce, il che consente realmente l’utilizzo di modalità avanzate come la sparse samples 6x, cosa che non accade con la 8xS di NVIDIA.

Lo sviluppo di R520, inoltre, non ha visto solo l’efficienza come linea guida, ma anche l’incremento della qualità dell’immagine è stato oggetto di attenzione ed è per questo che le schede Radeon X1800 propongono una nuova opzione High Quality che dà vita al miglior filtro anisotropico attualmente disponibile con un trascurabile impatto sulle prestazioni. Inoltre, analogamente a quanto fatto da NVIDIA con il suo Transparency AntiAliasing, anche ATI ha introdotto con l’Adaptive AntiAliasing una tecnica dedicata alla riduzione dell’aliasing delle texture con elementi trasparenti con ottimi risultati sotto il profilo qualitativo e velocistico.

I prezzi di riferimento delle soluzioni Radeon X1800 sono gli stessi dei corrispondenti prodotti GeForce 7800. In particolare la Radeon X1800 XT 512 MB è quotata $ 549, la Radeon X1800 XT 256 MB è quotata $ 499 e la Radeon X1800 XL 256 MB è quotata $ 449; si tratta dei prezzi ufficiali in dollari, sul mercato nord americano, comunicati da ATI al lancio delle schede. Al momento attuale non abbiamo a disposizione cifre indicative attendibili sullo street price in Euro nel mercato italiano, ma riteniamo che nei prossimi giorni i primi sample di scheda faranno la loro comparsa.

La disponibilità delle prime due è prevista per l’inizio di Novembre, mentre le prime Radeon X1800 XL possono essere già trovate in commercio in alcuni paesi. La permanenza sul mercato da diversi mesi per le schede GeForce 7800 GTX e GeForce 7800 GT ha portato ad una lenta ma progressiva riduzione dei prezzi al punto che la quotazione di lancio della Radeon X1800 XT 256 MB è superiore al costo di una GeForce 7800 GTX 256 MB, così come la quotazione di lancio della Radeon X1800 XL 256 MB è superiore al costo di una GeForce 7800 GT. Tuttavia, poiché il confronto tra Radeon X1800 XT e GeForce 7800 GTX, ha evidenziato una superiorità per il prodotto canadese sul fronte tecnologico, qualitativo e, nelle situazioni più rilevanti in questa fascia di mercato (alte risoluzioni, antialiasing, filtro anisotropico e High Dynamic Range), nonostante driver in versione beta ed immaturi, velocistico, riteniamo che, anche allo stato attuale dei prezzi, la Radeon X1800 XT 256 MB rappresenti la migliore soluzione. Più strettamente dipendente dal prezzo di commercializzazione, invece, è il successo della Radeon X1800 XL, anch’essa dotata delle medesime caratteristiche qualitative e tecnologiche della sorella maggiore, ma, rispetto a quest’ultima, meno preponderante nello scontro velocistico con la diretta rivale, GeForce 7800 GT. E’ possibile prevedere un riallineamento dei prezzi delle schede Radeon alla concorrenza nelle settimane successive alle prime commercializzazioni e, in tal caso, il confronto tra la Radeon X1800 XL e a GeForce 7800 GT vede una convenienza sostanzialmente allineata, strettamente dipendente dalle specifiche esigenze dell’acquirente: maggiori prestazioni per la GeForce 7800 GT e migliore qualità per la Radeon X1800 XL.

Prossima fermata: una versione a 512 Mbytes di memoria video, con presumibilmente frequenze di clock aumentate, della scheda GeForce 7800 GTX. Lo scontro tra i due colossi continua, più agguerrito che mai.