Hardware Upgrade - il sito italiano sulla tecnologia - www.hwupgrade.it
« Torna all'articolo  -  Stampa
Radeon X1900: l'evoluzione della specie
Raffaele Fanizzi - 24 Gennaio 2006
"Nonostante siano passati pochi mesi dall'introduzione delle schede Radeon X1800 dedicate alla fascia alta di mercato, ATI presenta le nuove Radeon X1900, basate sul processore grafico R580, attraverso le quali dimostra di non essere impreparata al prossimo scontro con NVIDIA."
Pagina 1 - Introduzione

La presentazione di nuovi processori grafici destinati al mercato di fascia alta è sempre un evento molto interessante per i videogiocatori incalliti e per gli appassionati del mondo delle schede video. Tuttavia, come si può del resto immaginare, tale avvenimento non è sempre visto di buon occhio da quella cerchia di utenti che hanno acquistato da poco tempo prodotti particolarmente costosi e che, pertanto, non gradiscono vedere i propri sforzi economici vanificati nel giro di pochi giorni.

Da questo punto di vista l'introduzione delle schede Radeon X1900 a breve distanza dall'arrivo sul mercato delle Radeon X1800 può sembrare una mossa discutibile. Tuttavia, per spiegare questa introduzione così ravvicinata, è necessario ricordare che R520, il processore grafico alla base delle schede video Radeon X1800, ha subito un ritardo di diversi mesi dovuto a varie problematiche a livello di rese produttive. Considerando questo elemento e ricordando che l'introduzione delle nuove soluzioni di fascia alta da parte di NVIDIA non sembra essere troppo lontana, è chiaro che ATI ha semplicemente deciso di non ritardare anche l'immissione sul mercato R580 a seguito del ritardo di R520 per non doversi ritrovare nuovamente nella situazione di inseguitore ed ha giocato d'anticipo.

Ecco, quindi, che a quattro mesi dall'arrivo di R520, ATI procede con il lancio di R580, un processore grafico che non rappresenta per l'azienda canadese solo una nuova opportunità per imporsi come produttore della scheda video più veloce, ma anche una possibilità per dare una forte prova di serietà. Il lancio di R580, infatti, è stato definito “hard launch”, termine con il quale si indica la disponibilità immediata dal prodotto nella vendita al dettaglio lo stesso giorno della presentazione.

Pagina 2 - Caratteristiche tecniche – parte 1

La storia del processore grafico R580 risale a molti mesi prima dell'arrivo di R520 sul mercato. La prima volta che si sentì parlare di questo prodotto, infatti, è stato a marzo del 2005, quasi un anno fa. In quel periodo erano ancora incerte le informazioni relative allo stato dei lavori per R520, ma si seppe da subito che ATI stava già lavorando al suo successore. Si tratta, quindi, di una GPU le cui fasi di progettazione sono proseguite parallelamente a quelle di R520 ed oggi, conoscendone analogie e differenze, possiamo comprendere come ciò sia stato possibile.

Iniziamo l'analisi del processore grafico R580 dicendo che in termini di processo produttivo i suoi 384 milioni di transistor sono stati realizzati sulle medesime linee di produzione a 90 nanometri con cui oggi vengono costruiti RV515, RV530 e R520 e che, contrariamente a quest'ultimo, il suo concepimento non ha incontrato particolari problemi. Fin dalla presentazione delle schede Radeon X1800, infatti, ATI aveva affermato di avere un chip chiamato R580 già in produzione. Questa è senza ombra di dubbio una buona notizia non solo per l'azienda canadese, ma anche per i suoi clienti in quanto avere meno problemi a livello produttivo si traduce in rese superiori, costi inferiori ed una disponibilità maggiore.

L'architettura di base di R580 non differisce molto da quella di R520. Con l'introduzione della famiglia Radeon X1000, ATI ha messo a punto uno schema di funzionamento che, al di là della porzione relativa al calcolo dei vertex shaders, l'unica rimasta conservativa, si compone di una serie di unità di calcolo rivolte allo svolgimento delle operazioni matematiche (PSU) e di texturing (TMU) e di un Ultra-Threaded Dispatch Processor dedicato alla gestione contemporanea di un determinato numero di threads. Questa modalità di organizzare l'elaborazione dei pixel shaders è fortemente innovativa e possiede numerosi vantaggi, uno su tutti l'elevata efficienza, in quanto l'intervento dell'Ultra-Threaded Dispatch Processor in abbinamento alla presenza di un elevato numero di registri condivisi da tutte le unità, consente di parallelizzare al massimo tutte le fasi di elaborazione assicurandosi di sfruttare tutte le unità disponibili in un determinato istante e riducendo le latenze.

La colonna portante alla base della progettazione di R580 è il rapporto tra numero di accessi alle texture e numero di operazioni matematiche all'interno dei pixel shaders. Secondo le statiche mostrateci da ATI, tale rapporto aumenta con il passare del tempo ed i più recenti videogames hanno mediamente pixel shaders con un rapporto di 5:1, il che vuol dire che se abbiamo 10 operazioni di accesso alle texture, ne troveremo circa 50 di carattere matematico. Tale rapporto per titoli come FEAR e Splinter Cell Chaos Theory, che sono tra i più esosi, è rispettivamente pari a 7:1 e 8:1. ATI ha, quindi, sfruttato queste informazioni per progettare un'architettura altamente modulare, che rendesse le TMU e le ALU indipendenti tra loro. In questo modo è possibile dare vita a processori grafici differenti nel numero di ALU, ma non nel numero di TMU e viceversa ed infatti se confrontiamo, ad esempio, RV515 con RV530, osserviamo che la differenza sostanziale è solo nel numero di unità di pixel shading o, se vogliamo, nel rapporto tra unità di pixel shading e unità di texturing.

Pagina 3 - Caratteristiche tecniche – parte 2

R580 possiede lo stesso numero di TMU visto su R520, ma la potenza di calcolo relativa ai pixel shaders è di tre volte superiore. Il numero di PSU (pixel shading unit) è salito, infatti, da 16 a 48 (raggruppate in 12 Quad Pixel Shader Core), il che ha portato il rapporto tra numero di PSU e numero di TMU a 3:1, esattamente come per RV530. Nel complesso, quindi, l'architettura di R580 a livello di pixel shading è equiparabile a quattro volte RV530. Volendo dare qualche numero sulle capacità computazionali di R580, possiamo dire che può eseguire 166 miliardi di operazioni al secondo sui pixel shaders (contro i 60 di R520) e 553 GFLOPS (contro i 272,5 di R520). Poiché l'architettura delle PSU non è cambiata e poiché ogni PSU è composta da due ALU, abbiamo in totale la possibilità di eseguire per ogni PSU quattro MADD (operazione combinata di addizione e moltiplicazione), quattro addizioni ed una operazione di flow control per pixel per ciclo di clock. Poiché abbiamo 48 PSU e 16 TMU, ogni ciclo di clock R580 esegue 192 MADD, 192 addizioni, 192 operazioni di flow control e fino a 16 texture fetch. R520 si ferma a 64 MADD, 64 addizioni e 64 operazioni di flow control, con lo stesso numero di texture fetch, mentre G70 può eseguire fino a 192 MADD senza texture fetch oppure 96 MADD + 24 texture fetch.

Facendo un'analisi di questa architettura in termini di pipeline, ci rendiamo conto di quanto questo sia difficile. Se, infatti, R520, pur non avendo una struttura di calcolo a pipeline, poiché possiede 16 TMU, 16 PSU e 16 ROPs può essere rapportato ad un'architettura a 16 pipeline, con R580 tale operazione non possiamo farla con altrettanta leggerezza. R580 mantiene la capacità di eseguire 16 texture fetch per ciclo di clock e possiede 16 ROPs, ma le sue capacità di calcolo con i pixel shaders sono decisamente superiori. Ciò significa che se con i pixel shaders più complessi R520 non riusciva a saturare le capacità delle ROPs perché non in grado di elaborazione 16 pixel per ciclo di clock, R580, invece, sfrutterà meglio le sue ROPs e, in caso di shaders poco complessi, risulterà persino frenato da esse.

ATI non si è limitata ad aumentare il numero di unità di calcolo, ma ha colto l'occasione per eseguire anche qualche altra revisione. Le unità di texture mapping di R580 sono state potenziate e rispetto a quelle di R520 sono ora in grado di eseguire un'operazione denominata FETCH4. Durante operazioni come lo shadow mapping, per ottenere delle ombre il più realistiche possibili, si esegue un elevato numero di texture fetch tra indirizzi adiacenti della shadow map. Le TMU di R580, grazie all'operatore FETCH4, possono eseguire quattro fetch di tipo point sample in quattro indirizzi adiacenti della shadow map in un singolo ciclo di clock. Ciò quadruplica a tutti gli effetti le operazioni di texture sampling possibili.

Inoltre, sempre rispetto a quanto visto con R520, ATI ha incrementato del 50% la cache onchip dedicata alle operazioni di Hierarchical Z, cioè alla rimozione delle superfici nascoste. Tale miglioramento consente di ottenere un rendimento più costante di questa funzionalità all'aumentare della risoluzione utilizzata.

Segnaliamo, infine, anche un miglioramento nella gestione dinamica delle frequenze che consente a R580 di variare la frequenza di funzionamento di core e memorie a seconda del carico di lavoro, migliorando così la logica del risparmio energetico.

ATI Radeon X1900 XTX

ATI Radeon X1900 XT

ATI Radeon X1800 XT

NVIDIA GeForce 7800 GTX 512 MB

NVIDIA GeForce 7800 GTX 256 MB

Bus di memoria

256 bit

256 bit

256 bit

256 bit

256 bit

Processo produttivo

0.09 micron

0.09 micron

0.09 micron

0.11 micron

0.11 micron

Frequenza chip e memoria

650/1550

625/1450

630/1400

550/1700

430/1200

Bus

PCI Express 16x

PCI Express 16x

PCI Express 16x

PCI Express 16x

PCI Express 16x

Unità di Vertex Shading

8

8

8

8

8

Unità di Pixel Shading

48

48

16

24

24

Numero di TMU

16

16

16

24

24

Texture per ciclo di clock

1

1

1

1

1

Numero di Rops

16

16

16

16

16

Fill Rate

10400 Mpixel e 10400 Mtexel

10000 Mpixel e 10000 Mtexel

10080 Mpixel e 10080 Mtexel

13200 Mpixel e 13200 Mtexel

10320 Mpixel e 10320 Mtexel

Banda Passante

49,6 GB

46,4 GB

44,8 GB

54,4 GB

38,4 GB

Versione Vertex Shader

3.0

3.0

3.0

3.0

3.0

Versione Pixel Shader

3.0

3.0

3.0

3.0

3.0

Full Scene Anti-Aliasing

Adaptive AA e Multisampling

Adaptive AA e Multisampling

Adaptive AA e Multisampling

Intellisample 4.0

Intellisample 4.0

Altre caratteristiche

Ring Bus Memory Controller, Ultra-Threaded Shader Engine, AVIVO

Ring Bus Memory Controller, Ultra-Threaded Shader Engine, AVIVO

Ring Bus Memory Controller, Ultra-Threaded Shader Engine, AVIVO

CineFX 4.0, UltraShadow II

CineFX 4.0, UltraShadow II

Con il lancio di R580 ATI presenta tre diverse schede video: la Radeon X1900 XTX, la Radeon X1900 XT e la Radeon X1900 CrossFire. La prima ha un core operante a 650 Mhz e memorie a 1550 Mhz, mentre le altre hanno frequenze per core e memorie rispettivamente pari a 625 Mhz e 1450 Mhz. E' interessante notare come le frequenze delle memorie non si discostino molto da quelle della Radeon X1800 XT. La spiegazione a questa scelta è nel numero di TMU rimasto costante: tra le operazioni che richiedono maggiore banda passante, l'accesso alle texture è sicuramente il più gravoso e poiché R580 ha 16 TMU esattamente come R520, non sono richiesti moduli GDDR3 più veloci.

Le restanti funzionalità di R580 sono una esatta fotocopia di quanto abbiamo visto con la nuova famiglia di prodotti Radeon X1000. Per maggiori informazioni al riguardo vi rimandiamo ad un precedente articolo.

Pagina 4 - Layout
Radeon X1900 XTX
Radeon X1900 CrossFire

Le schede Radeon X1900 XTX e Radeon X1900 CrossFire hanno un layout del tutto paragonabile a quello delle corrispondenti Radeon X1800 XT e Radeon X1800 CrossFire.

Il sistema di raffreddamento adottato vede protagonista un voluminoso elemento in alluminio che copre buona parte del lato frontale della scheda video e che, in corrispondenza del processore grafico è rimpiazzato da una placca in rame. Il tutto è chiuso all'interno di un canale a conduzione forzata alla cui estremità troviamo una turbina che aspira l'aria dall'interno del case e la espelle fuori attraverso una feritoia presente in corrispondenza del secondo slot occupato dalla scheda video.

Radeon X1900 XTX
Radeon X1900 CrossFire

L'unica reale differenza tra le schede Radeon X1800 e le Radeon X1900 è nel gruppo di alimentazione. Le prime revisioni del PCB delle schede basate su R520 contavano cinque mosfet, al quale ne è stato aggiunto successivamente uno grazie al quale si sono raggiunti i requisiti per produrre versioni delle Radeon X1800 XT con frequenze superiori a quelle delle specifiche iniziali. Le schede Radeon X1900, invece, presentano ben sette mosfet confermando che i 384 milioni di transistor di R580 richiedono un maggiore quantitativo di energia per funzionare correttamente.

La differenza sostanziale tra la Radeon X1900 XTX e la Radeon X1900 CrossFire osservando il PCB è nella disposizione di un led: la prima lo posiziona vicino il connettore di alimentazione supplementare a sei pin, mentre nella seconda lo ritroviamo subito sopra il dissipatore, esattamente come nella Radeon X1800 CrossFire.

Le due schede in modalità CrossFire sulla scheda madre Sapphire Pure CrossFire Advanced

Rimuovendo il dissipatore possiamo osservare altri elementi di distinzione tra questi due modelli. Esattamente come per le schede Radeon X1800 CrossFire, anche la Radeon X1900 CrossFire possiede la circuiteria necessaria all'alloggiamento del composing engine, dei TMDS receivers e dei TMDS transmitters che rendono possibile l'applicazione della tecnologia CrossFire. Non rileviamo differenze in queste componenti rispetto a quanto già visto con la Radeon X1800 CrossFire e, pertanto, vi rimandiamo ad un articolo già pubblicato per maggiori dettagli sulle loro specifiche tecniche.

Radeon X1900 XTX
Radeon X1900 CrossFire

Tutte le schede Radeon X1900 sono dotate di connessioni Dual Link DVI-I. Sulla staffa di fissaggio della Radeon X1900 XTX troviamo due uscite DVI-I ed un ingresso/uscita S-Video, mentre la Radeon X1900 CrossFire possiede una uscita DVI-I ed un'uscita proprietaria alla quale collegare il cavo ad Y necessario per far lavorare in parallelo due schede Radeon X1900 in modalità CrossFire.

Pagina 5 - Configurazione di test
Configurazione di test
Processore

AMD Athlon 64 FX-55 (2,6 GHz di clock, 1 Mbyte cache L2, Socket 939)

Front Side Bus
2000 Mhz
Scheda Madre NFORCE
ASUS AN8-SLI Deluxe - NFORCE 4 SLI
Scheda Madre CrossFire
Sapphire PureCrossFire ADV - Radeon Xpress 200 CrossFire
Ram
2x512 MB Corsair XMS PC3200 PRO Series
Sistema Operativo
Windows XP Professional SP2
Versione dei drivers
ATI Catalyst 5.13
ATI Catalyst 6.1 Beta per le Radeon X1900
 
NVIDIA ForceWare 81.98

A causa della indisponibilità delle schede Radeon X1800 e GeForce 7800 GTX non abbiamo potuto rieseguire i benchmark di questi prodotti con quei test che hanno subito modifiche dal nostro ultimo rilevamento: Call Of Duty 2, Serious Sam 2 e Battlefield 2. Ometteremo, quindi, i risultati di questi prodotti con tali videogames. Saranno, invece, completi i risultati ottenuti dalle schede Radeon X1900 e GeForce 7800 GTX 512 MB.

Pacchetto benchmark

3DMark 05

Si tratta del famoso e diffuso benchmark sintetico sviluppato da FutureMark. Nonostante il suo obbiettivo sia quello di valutare le prestazioni di una scheda video in ambito DirectX 9, in questo articolo non verrà utilizzato per questa finalità bensì per raccogliere alcune informazioni utili riguardo l’architettura di un chip grafico. Abbiamo pertanto fatto partire solo i test relativi al Fill Rate, ai Vertex Shader ed ai Pixel Shader 2.0. I risultati che abbiamo ottenuto sono quindi da intendere solo come elementi di studio e non di valutazione.

Far Cry

Far Cry fa uso dell'innovativo motore grafico CryENGINE dei Crytek Studios. Massiccio è l'uso dei Vertex e Pixel Shader, in parte anche in versione 2.0b e 3.0, per realizzare effetti grafici come il riflesso sull'acqua, il bump mapping e le soft shadows. Due sono le mappe utilizzate: Training e Volcano. La prima è caratterizzata da ampi spazi aperti e effetti atmosferici, mentre la seconda è al chiuso e mette meglio in evidenza il bump mapping e la tecnologia Polybump per il rendering dei personaggi. Il gioco è stato aggiornato con la patch in versione 1.32.

Splinter Cell: Chaos Theory

Realizzato dalla UbiSoft e dotato di una versione pesantemente revisionata dell’Unreal Engine, questo videogames è utilizzato in modalità timedemo per valutare le prestazioni di una scheda video. Per tutte le schede video sono stati abilitati tutti gli effetti ad eccezione dell'High Dynamic Range in quanto con quest'ultimo non è possibile abilitare l'antialiasing. La demo utilizzata è stata registrata nella mappa Light House. Il gioco è stato aggiornato con la patch in versione 1.3.

The Chronicles Of Riddick

Sviluppato dai Starbreeze Studios e basato sul Starbreeze Engine, The Chronicles of Riddick: Escape from Butcher Bay fa uso dell’API OpenGL per l’accelerazione della grafica tridimensionale. Tra le sue caratteristiche più interessanti riportiamo il massiccio uso di stencil shadows e del normal mapping. Lo shader model impostato è il 2.0 per tutti i benchmark. La demo utilizzata è disponibile cliccando qui.

Doom 3

Uno dei titoli più attesi del 2004, seguito del principe di tutti gli shooter in tre dimensioni, Doom 3 è l’ultima fatica di John Carmak. Tra le caratteristiche principali che questo motore grafico mette in mostra troviamo un pensante uso di stencil shadows. Sono presenti anche alcuni vertex e pixel shaders, anche se non in misura così avanzata come in Far Cry. Doom 3 è sviluppato, come vuole la tradizione Id Software, rigorosamente in OpenGL.

Half Life 2

Assieme a Doom 3 è stato uno dei titoli più attesi del 2004, sequel del famosissimo Half-Life lanciato nel lontano1998. L'engine grafico si caratterizza principalmente per l'utilizzo massiccio di shaders 2.0, alcuni dei quali tra i più complessi attualmente integrati in un titolo 3D.

Half-Life 2 Lost Coast

Questa piccola espansione di Half-Life 2 rappresenta per lo più una demo tecnologica che mostra le potenzialità del Source Engine e della nuova tecnica di High Dynamic Range introdotta da Valve. I benchmark sono stati eseguiti nella mappa introduttiva in una scena all’aperto ed in una al chiuso (all’interno della chiesa).

Serious Sam 2

Seguito del famigerato Serious Sam, titolo sviluppato dalla Croteam e che negli anni scorsi ha trovato il consenso di un’ampia schiera di videogiocatori. La sua colorata grafica, generata dal Serious Engine, è caratterizzata dall’uso di pixel shaders in versione 2.0 e 3.0 per la realizzazione di effetti avanzati come il parallax mapping, le rifrazioni e le soft shadows. Serious Sam 2 supporta anche l’High Dynamic Range e può funzionare sia in modalità Direct 3D, che OpenGL, benché l’API Microsoft sia quella selezionata di default. La demo utilizzata nel corso dei nostri benchmark è Branchester.

Call Of Duty 2

Sparatutto 3D targato Activision, Call Of Duty 2 è il sequel di Call Of Duty un titolo incentrato sulla guerra, di particolare successo e rinomanza nel panorama videoludico mondiale. La grafica tridimensionale proposta è contraddistinta da ampi spazi aperti, oggetti e modelli ricchi di poligoni ed alcuni interessati effetti particellari e di shading. Il titolo sfrutta l’API Direct 3D. Per eseguire i benchmark abbiamo registrato una piccola sequenza di gioco multiplayer.

Fear

Fear è uno sparatutto 3D particolarmente atteso grazie alla interessante trama ed all’ottima resa grafica di cui dispone. Basato sul motore grafico Jupiter EX, Fear fa uso di funzionalità avanzate per il rendering attraverso il Direct 3D ed è caratterizzato anche dall’uso del motore Havok per la gestione della fisica. Tra le funzionalità più significative rileviamo un uso piuttosto corposo di pixel shaders 2.0 e 3.0 e di un sistema di illuminazione dinamico basato sulle stencil shadows.

Pagina 6 - Test sintetici

I risultati relativi al fill rate mostrano i limiti dell'approccio scelto da ATI nella sua architettura R580. Possedendo 16 TMU e 16 ROPs esattamente come R520, le schede Radeon X1900 a parità di frequenza di clock non possono scrivere un numero di pixel nel frame buffer superiore a quello delle schede Radeon X1800. Questo test non tiene conto, infatti, in alcun modo delle capacità di elaborazione dei pixel shaders e pertanto le 48 PSU di R580 non vengono considerate. Al contrario l'architettura di G70, dotata di 24 TMU e 16 ROPs, ottiene ottimi risultati.

Il test dedicato ai vertex shaders del 3DMark05 mette in luce un'ottima gestione da parte delle schede video Radeon X1800 e Radeon X1900 di un numero elevato di poligoni sia facendo uso di vertex shaders semplici che complessi. Queste operazioni, infatti, sono tradizionalmente molto gradite alle architetture canadesi e un ruolo fondamentale nel raggiungere tale risultato è stato sicuramente giocato dall'elevata frequenza di funzionamento di R520 e R580 rispetto a G70.

Per la prima volta vediamo una scheda video Radeon sopravanzare il corrispondente prodotto GeForce nel test dei pixel shaders del 3DMark05. Le schede Radeon X1900 possono in questa sede sfruttare le loro 48 unità di pixel shading e l'eccezionale potenza di elaborazione di cui sono dotate raggiungendo risultati simili a quelli fatti registrare da due Radeon X1800 XT in modalità CrossFire. Si tratta senza ombra di dubbio di un risultato molto interessante che mostra i vantaggi di cui dispone l'architettura messa a punto da ATI.

New entry nel nostro pacchetto di test sintetici è il test Perlin Noise del 3DMark06. Questo benchmark fa uso esclusivo dello shader model 3.0 e, in particolare, di un pixel shader molto complesso che mostra un effetto grafico simile a quello delle nuvole.

Le schede Radeon X1900 fanno registrare valori eccellenti in questo test, migliori di una corposa percentuale rispetto a quelli della GeForce 7800 GTX 512 MB e non troppo distanti da quelli di due GeForce 7800 GTX 512 MB in modalità SLI.

 

Poiché l'elaborazione dei pixel shaders assume un ruolo sempre più preponderante all'interno dei videogames abbiamo deciso di includere all'interno dei nostri test sintetici anche lo Shadermark 2.1. Questo benchmark gratuito non fa altro che visualizzare una sequenza di ben 25 pixel shaders dotati di caratteristiche differenti sia in termini di numero che di tipologia di operazioni eseguite.

Poiché il nome di alcuni pixel shaders è molto lungo non lo abbiamo riportato all'interno del grafico. Utilizzeremo, quindi, come riferimento la posizione del pixel shader nella sequenza del benchmark.

La prima serie di pixel shaders è caratterizzata per lo più da sistemi di illuminazione per pixel dalla complessità variabile e da qualche materiale di tipo procedurale. Come possiamo osservare nella quasi totalità dei casi le schede Radeon X1900 riescono ad essere più veloci della GeForce 7800 GTX 512 MB in misura più o meno maggiore a seconda della versione considerata.

La seconda serie di pixel shaders valuta aspetti più mirati. Lo shader 17 fa uso massiccio di alpha blending; lo shader 18 visualizza tanti diversi pixel shaders nella stessa scena; i pixel shaders 19 e 20 fanno uso di shadow map, mentre i pixel shaders 21, 22 e 23 sono dedicati all'High Dynamic Range. Gli ultimi due, infine, fanno uso di render target multipli cioè renderizzano diversi elementi della scena in più buffer contemporaneamente.

Da questa analisi emerge che R580 è particolarmente veloce nel pixel shader switching, cioè nel passaggio da un pixel shaders ad un altro, nella gestione dell'High Dynamic Range e di render target multipli. Le schede NVIDIA, invece, si trovano più a proprio agio con lo shadow mapping e le operazioni di alpha blending.

Pagina 7 - Far Cry

Molti dei risultati ottenuti con Far Cry, specie in condizioni senza filtri, mostrano una chiara situazione CPU limited. Le schede video prese in considerazione, infatti, sono dotate di una potenza di calcolo estremamente elevata e anche in configurazione singola, cioè senza l'ausilio della tecnologia SLI o CrossFire, il processore Athlon 64 Fx-55 non riesce a stare dietro la loro richiesta di dati. Questo non è l'unico videogame in cui osserviamo questo comportamento e pertanto baseremo la nostra analisi soprattutto nell'osservazione dei valori ottenuti alle alte risoluzioni e con i filtri di antialiasing e anisotropico abilitati.

Con Far Cry le schede video Radeon X1900 sono più veloci della GeForce 7800 GTX 512 MB sia nella versione XT che XTX. Il vantaggio non è sempre particolarmente significativo anche se non mancano risultati sorprendenti come quello che vede la Radeon X1900 XTX allo stesso livello di due GeForce 7800 GTX 256 MB in configurazione SLI.

Ottimi anche i risultati ottenuti da due Radeon X1900 XT in modalità CrossFire sempre ai vertici della classifica.

Pagina 8 - Doom 3 e The Chronicles Of Riddick

Questi due videogames rappresentano senza ombra di dubbio una delle situazioni meno favorevoli per le schede basate su R520 e R580. Si tratta, infatti, di motori grafici che richiedono un elevato z-stencil fill rate e che fanno uso di pixel shaders piuttosto semplici da elaborare.

La scheda GeForce 7800 GTX 512 MB in questo caso è sempre più veloce delle nuove Radeon X1900 anche se queste ultime possiedono un comportamento migliore delle Radeon X1800. I distacchi, tuttavia, specie nel rendering con antialiasing e filtro anisotropico, non sono sempre significativi.

Pagina 9 - Splinter Cell Chaos Theory e Fear

Splinter Cell Chaos Theory e Fear sono tra quei titoli, che secondo le informazioni rilasciate da ATI, possiedono un elevato rapporto tra numero di operazioni matematiche e numero di accessi alle texture: situazione ideale per sfruttare le potenza di calcolo delle 48 PSU di R580. Conseguenza di ciò nel gioco Ubisoft le schede Radeon X1900 superano la GeForce 7800 GTX 512 MB con un vantaggio che va dal 5% al 10% a seconda della risoluzione e del tipo di rendering effettuato.

Il vantaggio per le schede Radeon X1900 diventa notevole con Fear dove in percentuale si arrivia fino ad un +70% rispetto alla GeForce 7800 GTX 512 MB.

Discreto anche il comportamento di R580 in modalità CrossFire, anche se in quest'ultimo caso il vantaggio rispetto a due GeForce 7800 GTX 512 MB in SLI non è sempre presente o è comunque più ridotto.

Pagina 10 - Half-Life 2

Sempre molto veloci le schede Radeon con Half-Life 2. In questa occasione, infatti, già la Radeon X1800XT aveva fatto registrare in alcuni casi risultati migliori della GeForce 7800 GTX 512 MB. Le schede Radeon X1900, invece, riescono ad essere sempre le più veloci e, abilitando i filtri, anche allo stesso livello (o leggermente più rapide) di due GeForce 7800 GTX 512 MB in configurazione SLI.

Buono anche il comportamento delle due Radeon X1900 in modalità CrossFire, anche se il loro vantaggio rispetto alla configurazione SLI, in virtù anche di situazioni maggiormente CPU limited, non è sempre presente o significativo.

Pagina 11 - Half-Life 2 Lost Coast

Half-Life 2 Lost Coast mostra un quadro più equilibrato rispetto a quanto visto con Half-Life 2. Le schede video Radeon X1900 e GeForce 7800 GTX 512 MB si scambiano vicendevolmente la posizione a seconda della mappa, della risoluzione e del tipo di rendering considerato. In ogni caso i distacchi risultano essere sempre molto ridotti: siamo nell'ordine dei 2-5 fps.

Pagina 12 - Serious Sam 2 e Call Of Duty 2

Serious Sam 2 vede una situazione di leggero vantaggio per la GeForce 7800 GTX 512 MB nel rendering privo di antialiasing e filtro anisotropico e una sostanziale parità con la Radeon X1900 XTX nel momento in cui abilitiamo tali filtri.

L'analisi del comportamento delle configurazioni SLI e CrossFire, invece, evidenzia come, escludendo i casi vistosamente CPU limited, la prima sia in vantaggio di una percentuale che va dal 10% al 15%.

Molto buono il comportamento delle Radeon X1900, invece, con Call Of Duty 2. Le schede basate su R580 sono sempre più veloci della GeForce 7800 GTX 512 MB, anche se le differenze risultano essere spesso molto ridotte. Un bug di gioventù, invece, affligge le schede Radeon X1900 in configurazione CrossFire con questo videogame: le prestazioni sono inferiori a quelle ottenute in singola scheda.

Pagina 13 - Far Cry e Half-Life 2 - massimo dettaglio

Questi risultati sono stati ottenuti misurando le prestazioni delle schede video singole utilizzando la massima modalità di antialiasing e del filtro anisotropico supportata in termini di numero di samples.

Grazie alla modalità di antialiasing multisampling a sei samples, le schede Radeon X1800 e X1900 riescono ad offrire prestazioni decisamente superiori a quelle mostrate dalle schede GeForce 7800 GTX 512 MB. Queste ultime supportano un antialiasing ibrido multisampling/supersampling che a fronte di una qualità simile, possiede un impatto sulle prestazioni decisamente superiore. Le schede Radeon, quindi, sono senza ombra di dubbio le migliori in questo caso.

E' interessante anche osservare che nonostante il fill rate sia simile, tra le Radeon X1800 e le Radeon X1900 esiste una differenza abbastanza significativa nelle prestazioni a favore di R580 dovuta alla maggiore capacità di calcolo dei pixel shaders ed alla superiore memoria onboard dedicata alla rimozione delle superfici nascoste.

Pagina 14 - Splinter Cell Chaos Theory e Serious Sam 2 – HDR

Abilitando l'High Dynamic Range la maggiore propensione dell'architettura R580 nella gestione di questo effetto già vista con lo Shadermark viene riconfermata. Le schede Radeon X1900 sono sempre più veloci delle GeForce 7800 GTX 512 MB sia in modalità a singola scheda, sia con l'ausilio delle tecnologie SLI e CrossFire.

Pagina 15 - Far Cry – analisi AA

Con queste misure abbiamo voluto osservare il comportamento di R580 e G70 con le varie modalità di antialiasing supportate. Sono state utilizzate tutte le configurazioni in termini di samples e, per la modalità a 4 samples, anche l'ausilio dell'Adaptive AA in modalità Performance e Quality per le schede Radeon X1900 e in modalità MultiSampling e SuperSampling per la GeForce 7800 GTX 512 MB.

Quanto emerso già precedentemente con i test eseguiti al massimo dettaglio, viene nuovamente confermato in questi grafici. Le schede Radeon X1900 possiedono una gestione dell'antialiasing migliore al punto che le loro prestazioni in Far Cry, utilizzando 6 samples, sono superiori a quelle della GeForce 7800 GTX 512 MB in modalità a 4 samples.

Pagina 16 - Far Cry – analisi filtro anisotropico

Analogamente a quanto fatto con l'antialiasing, in questo caso vogliamo analizzare il comportamento dei vari processori grafici utilizzando il solo filtro anisotropico in modalità a 16 samples. Le impostazioni relative alla modalità Catalyst IA per le schede ATI ed alla Image Quality per le schede NVIDIA sono quelle di default. Inoltre per le schede basate su R580 abbiamo provveduto anche a valutare l'impatto sulle prestazioni della modalità High Quality contraddistinta dall'applicazione del filtro anisotropico ad un maggior numero di superfici rispetto a quanto visto in tutti gli altri casi.

In questa analisi non emergono risultati particolarmente eclatanti. L'impatto sulle prestazioni dovuto all'uso del filtro anisotropico a 16 samples è esiguo per tutte le schede video considerate. Anche la modalità High Quality per le Radeon X1900 non comporta un pesante decremento velocistico.

Pagina 17 - Super AA vs SLI AA

I risultati ottenuti nell'analisi dell'antialiasing con le schede video singole vengono nuovamente rinconfermati anche confrontando le modalità Super AA disponibili grazie alla tecnologia CrossFire con le modalità SLI AA di NVIDIA.

Le schede video Radeon X1900 e X1800 sono sempre più veloci di due GeForce 7800 GTX 512 MB indipendentemente dalla risoluzione, dalla mappa o dalla modalità di antialiasing presa in considerazione.

Pagina 18 - Overclock, consumi e rumorosità

La pratica dell'overclock per le schede video Radeon X1900 è stata attuata utilizzando inizialmente il Catalyst Control Center e, in particolare, le impostazioni disponibili sotto la voce Overdrive. Successivamente, poiché i massimi valori impostabili non hanno messo in crisi le schede basate su R580, abbiamo proseguito l'innalzamento delle frequenze relative a core e moduli di memoria con un software interno ad ATI.

Le schede video Radeon X1900 hanno dimostrato di possedere una discreta tolleranza all'overclock. La Radeon X1900 XT, infatti, è passata da 625 Mhz a 700 Mhz per il core e da 1450 Mhz a 1600 Mhz per le memorie. La Radeon X1900 XTX, invece, è rimasta stabile fino alle frequenze di 720 Mhz e 1770 Mhz rispettivamente per la GPU ed i moduli GDDR3.

I già ottimi risultati di Far Cry subiscono un ulteriore balzo in avanti grazie all'overclock con incrementi che arrivano fino ad un +10%.

Il rilevamento della potenza necessaria al corretto funzionamento del sistema è stato eseguito con una pinza amperometrica Lafayette PA-33 sulla corrente alternata utilizzata dall'alimentatore del sistema di test. Attraverso questo strumento abbiamo provveduto sia a misurare la tensione (pari a 230 Volt) che la corrente (in Ampere). In un circuito elettrico attraversato da corrente continua la potenza, che si misura in Watt, è data da tensione*corrente. Sfortunatamente, avendo una misurazione della corrente alternata, dobbiamo tenere conto di un terzo fattore denominato fattore di potenza. La formula pertanto risulta essere la seguente:

potenza = tensione*corrente*cos(Phi)

dove Phi è l'angolo di sfasamento e cos(Phi) è il fattore di potenza. L'angolo di sfasamento dipende dal tipo di carico: resistivo, induttivo o capacitivo. Gli alimentatori dei personal computer di fascia alta hanno solitamente un tipo di carico che rende l'angolo di sfasamento vicino allo zero e, conseguentemente, il fattore di potenza può essere approssimato con l'unità. Per correttezza, tuttavia, non indicheremo i risultati ottenuti in Watt, ma in VA (Volt per Ampere). Coloro che vogliono effettuare un confronto tra i risultati ottenuti e la potenza massima erogabile dall'alimentatore devono tenere a mente che nel migliore dei casi (cioè quando cos(Phi) è approssimabile con l'unità) il valore in VA può essere tradotto in Watt senza alcuna operazione, mentre in tutti gli altri casi la potenza in Watt sarà inferiore.

Le schede video Radeon X1900 XT e Radeon X1900 XTX nonostante la nuova gestione dinamica della frequenza di core e memorie, fanno registrare i consumi più elevati sia in idle, che sotto stress. Tale risultato è dovuto alla complessità di R580 che con i suoi 384 milioni di transistor uniti alle elevate frequenze, necessita di una alimentazione superiore rispetto a G70.

Difficile commentare, invece, i valori ottenuti dalla configurazione CrossFire in quanto è stata utilizzata una scheda madre diversa. Possiamo, tuttavia, ipotizzare che a parità di consumo della scheda madre, le Radeon X1900 in modalità CrossFire richiedano più energia di due GeForce 7800 GTX 512 MB.

 

Le misurazioni della rumorosità sono state effettuate su un sistema di test privo di case con un fonometro posto ad una distanza di circa 10 cm dal sistema di dissipazione della scheda video. Bisogna, pertanto, interpretare questi valori non come misure assolute, ma limitatamente alla comparazione tra i vari prodotti, cioè solo per la valutazione di quale è la scheda più rumorosa del lotto. E' evidente, infatti, che la maggioranza degli utenti monta il proprio personal computer in un case chiuso dal quale si trova normalmente ad una distanza superiore a 10 cm .

Nonostante il sistema di raffreddamento sia il medesimo delle Radeon X1800, le schede Radeon X1900 sono leggermente più silenziose. Questo comportamento è dovuto al fatto che sotto stress la turbina raggiunge una velocità di rotazione meno elevata. Ciò si spiega o con una minore dissipazione termica da parte di R580 rispetto a R520, oppure con una differente logica di gestione della velocità di rotazione della ventola che tiene conto di una maggiore tolleranza alle alte temperature di R580.

Pagina 19 - Risultati HQV Benchmark

Di seguito pubblichiamo i risultati ottenuti con l'HQV Benchmark dalle schede Radeon X1800, Radeon X1900 e GeForce 7800 GTX 512 MB con e senza l'ausilio del PureVideo Decoder. Per non appesantire l'articolo, abbiamo preferito riportare solo il punteggio ottenuto, invitiamo tutti coloro che sono interessati ad approfondire questo argomento a leggere l'articolo dedicato alla riproduzione video che abbiamo recentemente pubblicato, tenendo conto che i risultati delle schede Radeon X1900 sono esattamente gli stessi delle schede Radeon X1800.

Radeon X1800
Radeon X1900
GeForce 7800 senza PV
GeForce 7800 con PV
Color Bar/Vertical Detail
10
10
5
5
Jaggies Pattern 1
5
5
5
5
Jaggies Pattern 2
5
5
3
3
Waving Flag
5
5
5
5
Picture Detail
0
0
0
0
Noise Reduction
5
5
0
0
Motion Adaptive Noise Reduction
5
5
0
0
Film Detail 3:2 Detection
10
10
0
10
Cadence 2:2
5
5
0
0
2:2:2:4
5
5
0
0
2:3:3:2
5
5
0
0
3:2:3:2:2
5
5
0
5
5:5
5
5
0
0
6:4
5
5
0
0
8:7
5
5
0
0
3:2
5
5
0
5
Mixed 3:2 Film with video titles
10
10
10
10
Totale
95
95
28
48

Le schede video Radeon X1900 supportano appieno tutte le funzionalità della tecnologia AVIVO e, pertanto, possiedono la medesima ottima qualità di riproduzione di tutti gli altri processori grafici appartenenti alla famiglia Radeon X1000. Segnaliamo in particolare le eccellenti capacità di deinterlacciamento e di rilevamento della cadenza, oltre che i buoni risultati ottenuti nei test che valutano la riduzione del rumore presente in sorgenti video disturbate.

Pagina 20 - Conclusioni

La valutazione di una scheda video di fascia alta è sempre una operazione molto interessante per un redattore, specie quando il prodotto in prova non rappresenta un semplice upgrade in termini di frequenze, ma possiede caratteristiche innovative a livello di architettura.

R580 è senza ombra di dubbio una importante evoluzione del progetto R520 che ci permette di effettuare alcune considerazioni non solo sul prodotto in sé, ma anche sull'evoluzione tecnologica che l'azienda canadese ha intenzione di attuare nei prossimi anni. L'uso di pixel shaders dalla complessità crescente all'interno dei videogames ha portato ATI a sviluppare un'architettura flessibile e modulare che potesse adattarsi a queste esigenze incrementando solo il numero di unità di calcolo strettamente necessarie. L'indipendenza delle unità di pixel shading da quelle di texture mapping, unita alla gestione di tutte le operazioni da parte dell'Ultra-Threaded Dispatch Processor non è altro che l'implementazione di questo concetto. R580 è una prova indiscutibile della flessibilità di questo pensiero: il chip possiede tre volte le unità di pixel shading viste in R520, mentre non è stato incrementato il numero di TMU o di ROPs. Ulteriore conseguenza di questo processo evolutivo è che le capacità computazionali sono drasticamente aumentate a fronte di un solo 20% in più di transistor e senza richiedere maggiore banda passante visto che il numero di accessi alle texture è rimasto sostanzialmente invariato. Ci troviamo, quindi, di fronte ad un'architettura estremamente ottimizzata, non dotata di capacità di calcolo sovrabbondanti o ridondanti, e le cui caratteristiche sono scaturite da una attenta osservazione delle richieste degli sviluppatori di videogames.

I rilevamenti velocistici hanno dimostrato come l'architettura di R580 sia particolarmente veloce in tutti quei videogames facenti pesante uso di pixel shaders complessi e di tecniche di High Dynamic Range in formato floating point. Non è un caso che titoli come Doom 3 e The Chronicles Of Riddick, che usano pixel shaders semplici uniti a stencil shadows e che per questo sono essenzialmente fill rate limited, non brillano particolarmente con le schede Radeon X1900. Solo abilitando l'antialiasing ed il filtro anisotropico otteniamo prestazioni vicine a quelle della GeForce 7800 GTX 512 MB. Al contrario Fear, un altro videogame che possiede un sistema di illuminazione basato su stencil shadows, grazie alla elevata complessità dei suoi pixel shaders consente ad R580 di essere fino al 70% più veloce di G70. In generale il confronto velocistico da noi eseguito tra le schede Radeon X1900 e GeForce 7800 GTX 512 MB vede le prime mediamente in vantaggio.

Uno dei maggiori punti di forza delle schede video Radeon e che con queste nuove Radeon X1900 ha trovato ulteriore conferma è senza ombra di dubbio la gestione dell'antialiasing. La nostra analisi ha evidenziato che la modalità a sei samples di R580, oltre ad offrire una qualità dell'immagine superiore a quella della modalità a quattro samples di G70, garantisce prestazioni superiori. Questo risultato, unito alla elevatissima qualità ed al basso impatto sulle prestazioni del filtro anisotropico in modalità High Quality, farà la felicità di tutti coloro che, acquistando una scheda video di fascia alta, pretendono di giocare fluidamente con tutti i filtri abilitati. A tal proposito ricordiamo che le schede Radeon X1000 sono attualmente le uniche in grado di gestire contemporaneamente sullo schermo l'High Dynamic Range (in tutte le sue forme) e l'antialiasing, consentendo, quindi, di raggiungere una resa grafica ancora più realistica.

La valutazione delle schede Radeon X1900 non sarebbe completa senza esaminare anche le capacità di riproduzione video. R580 supporta pienamente la tecnologia AVIVO introdotta da ATI con le schede appartenenti alla famiglia Radeon X1000. Ciò gli consente di offrire una qualità durante la riproduzione video Mpeg2/DVD che, come emerso nel corso dei nostri benchmark, è decisamente migliore rispetto a quella mostrata dalle schede GeForce 7800 GTX 512 MB. Segnaliamo, inoltre, che grazie ad un decoder a pagamento sviluppato da Cyberlink, è possibile sfruttare la potenza di elaborazione di R580 per accelerare in hardware la riproduzione del formato video H264.

Il lancio delle schede Radeon X1900 rappresenta per ATI non solo una ritrovata leadership velocistica, ma è anche un'occasione per dare prova delle propria serietà ed è per questo motivo che le schede Radeon X1900 XTX e XT sono attualmente disponibili in commercio nel nostro paese. Un enorme sforzo a livello di marketing è stato necessario per raggiungere questo obiettivo e il dato più interessante è che, secondo quanto riferitoci da ATI, il numero di schede basate su R580 disponibili al lancio in tutto il mondo è dalle due alle tre volte maggiore a quello di tutte le GeForce 7800 GTX 512 MB fino ad ora prodotte da NVIDIA.

Considerando, infine, che il prezzo consigliato da ATI per le schede Radeon X1900 XTX è pari a $ 649, quello per le Radeon X1900 XT è di $ 549, mentre le Radeon X1900 CrossFire sono acquistabili per $ 599 e ricordando che le poche GeForce 7800 GTX 512 MB disponibili non si trovano mediamente a meno di € 750 nel nostro paese, non troviamo un solo motivo per non affermare che le schede Radeon X1900 rappresentano attualmente la migliore soluzione di fascia alta. La palla adesso passa ad NVIDIA e al suo futuro G71 la cui introduzione è prevista nei prossimi mesi.