Hardware Upgrade - il sito italiano sulla tecnologia - www.hwupgrade.it
« Torna all'articolo  -  Stampa
Radeon X800: è il momento di R420
"Con il chip R420 ATI raddoppia di fatto le prestazioni della precedente top della gamma, sferrando un duro colpo alle soluzioni NV40 di NVIDIA. Che però non resta a guardare, presentando due nuove schede GeForce 6800 in grado di battagliare ad armi pari con le schede Radeon X800"
Pagina 1 - Introduzione

titolo.jpg (24146 bytes)

Lo scorso 14 Aprile NVIDIA ha ufficialmente presentato la prima scheda video basata su progetto NV40, modello GeForce 6800 Ultra, facendo immediatamente dimenticare il fallimentare progetto NV30 grazie alle elevatissime prestazioni e all'elevato contenuto tecnologico. Abbiamo pubblicato in quello stesso giorno una dettagliata analisi della nuova soluzione NVIDIA a questo indirizzo, comprendente sia lo studio delle novità tecnologiche sia l'andamento prestazionale a confronto delle concorrenti.

In quello stesso giorno, con un tempismo che non può parere casuale, ATI ha invitato a Toronto un gruppo di giornalisti internazionali per presentare le proprie nuove soluzioni video, quasi a voler distogliere parte dell'attenzione dal proprio concorrente NVIDIA. R420, questo il nome in codice, è la nuova soluzione video di fascia alta che ATI ha presentato in quell'evento e che quest'oggi viene ufficialmente rilasciata nelle schede Radeon X800 XT Platinum Edition e Radeon X800 PRO. Se per la prima scheda, nuova top della gamma, la disponibilità sul mercato è attesa verso le fine di Maggio, per la soluzione X800 PRO ATI inizierà da quest'oggi la distribuzione, quindi sarà possibile acquistare le prime schede già nelle prossime settimane.

L'approccio di NVIDIA con il progetto NV40 è stato legato ai risultati ottenuti con le architetture NV3x: necessità di contrastare direttamente ATI sul piano prestazionale, oltre a continuare l'innovazione tecnologica proponendo qualcosa che non si fosse ancora visto nel panorama delle schede video DirectX 9. Da questo sono nate sia le performances assolute di NV40, sia il supporto agli Shader 3.0.

ATI, viceversa, deve per molti versi dimostrare poco al mercato. Nel corso del 2002 e soprattutto del 2003 il produttore canadese ha capitalizzato al meglio la bontà architetturale del proprio progetto R300, evolutosi nel corso dei mesi per sprigionare prestazioni superiori ma rimasto in buona sostanza invariato quanto ad architettura. Come verrà spiegato in dettaglio all'interno dell'articolo, l'approccio di ATI non è cambiato rispetto al passato: R420 vanta le medesime caratteristiche architetturali della famiglia di chip R3x0, pur se con notevoli incrementi in termini prestazionali.

Shader 2.0 e fp a 24bit: queste le principali caratteristiche dell'architettura R420, mutuate da quella R3x0 e destinate a scatenare molte discussioni tra gli appassionati. Qual è, infatti, l'approccio vincente in termini di qualità, prestazioni e longevità tra ATI e NVIDIA? La risposta non è in nessun modo semplice da dare e richiede un'analisi dettagliata, che cercheremo di fornire in queste pagine.

nota: al pari della preview delle soluzione NVIDIA GeForce 6800, questo articolo è stato scritto a 4 mani. Paolo Corsini ha curato la parte tecnica sul chip R420, mentre Raffaele Fanizzi ha eseguito tutte le analisi prestazionali e qualitative compresi i commenti ad essa associati. Le conclusioni sono frutto del lavoro congiunto di entrambi gli autori, e ovviamente sono presenti contributi reciproci in tutte le sezioni. In definitiva, un lavoro di squadra, l'unico percorribile stante il poco tempo a disposizione per eseguire tutti i test con la scheda.

Pagina 2 - R420: architettura di base

La tabella seguente riporta le principali caratteristiche tecniche delle due nuove soluzioni ATI, confrontate con la scheda NVIDIA GeForce 6800 Ultra e con le soluzioni ATI R360 e NVIDIA NV38.

GeForce 6800 Ultra Extreme

GeForce 6800 Ultra

GeForce 6800 GT

Radeon X800 XT

Radeon X800 PRO

GeForce Fx 5950 Ultra

Radeon 9800 XT

Bus di memoria

256 bit

Processo produttivo

0.13 micron

0.13 micron

0.13 micron

0.13 micron Low-K

0.13 micron Low-K

0.13 micron

0.15 micron

Frequenza chip e memoria

450/1100

400/1100

350/1000

520/1120

475/900

475/950

412/730

Bus

AGP 8X

Numero di pipeline

16

16

16

16

12

4

8

Texture per ciclo di clock

1

1

1

1

1

2

1

Fill Rate

7200 Mpixel e 7200 Mtexel

6400 Mpixel e 6400 Mtexel

5600 Mpixel e 5600 Mtexel

8368 Mpixel e 8368 Mtextel

5700 Mpixel e 5700 Mtexel

1900 Mpixel e 3800 Mtexel

3296 Mpixel e 3296 Mtexel

Banda Passante

35,2 GB

35,2 GB

32,0 GB

35,8 GB

28,8 GB

30,4 GB

23,3 GB

Versione Vertex Shader 3.0 3.0 3.0 2.0+

2.0+

2.0

2.0

Versione Pixel Shader 3.0 3.0 3.0 2.0+

2.0+

2.0

2.0

Full Scene Anti-Aliasing

Intellisample 3.0

Intellisample 3.0

Intellisample 3.0

Smoothvision HD

Smoothvision HD

Intellisample HCT

Smoothvision 2.1

Altre caratteristiche

CineFX 3.0, UltraShadow II

CineFX 3.0, UltraShadow II

CineFX 3.0, UltraShadow II

Smartshader HD, Videoshader HD, Hyper-Z HD

Smartshader HD, Videoshader HD, Hyper-Z HD

CineFX Engine 2.0, UltraShadow Technology

Smartshader 2.1, Videoshader, Hyper-Z III+, Truform II

Le due soluzioni ATI R420 si differenziano principalmente per il numero di pipeline di rendering, oltre che per le frequenze di clock di chip e memoria video. La soluzione Radeon X800 XT integra 16 pipeline di rendering, al pari della soluzione concorrente NVIDIA GeForce 6800 Ultra; il chip video opera a 520 MHz di clock, con 256 Mbytes di memoria GDDR3 operante a 1.120 MHz. La scheda Radeon X800PRO integra 12 pipeline di rendering, al pari della scheda GeForce 6800, con frequenza di clock del chip pari a 475 MHz e 256 Mbytes di memoria GDDR3 a 900 MHz di clock.

Il chip R420 integra circa 160 milioni di transistor, contro i poco più di 220 milioni del chip NVIDIA NV40. Il processo produttivo è quello a 0.13 micron Low-K introdotto originariamente con le schede Radeon 9600 nel mese di Febbraio 2003, grazie al quale ATI è riuscita a ottenere elevate frequenze di clock per il chip R420 abbinate a requisiti di dissipazione termica che sono allineati, a pieno carico, a quelli della soluzione Radeon 9800XT.

In termini di Shader Model, ATI ha seguito un approccio conservativo con i chip R420 mantenendo supporto alle versioni 2.0 di Pixel e Vertex Shader, mentre NVIDIA ha introdotto supporto agli Shader 3.0 quale caratteristica principale dell'architettura NV40 delle schede GeForce 6800. Pur incrementando il numero di istruzioni per shader con il chip R420, l'architettura ATI riprende sostanzialmente quella del chip Radeon 9800XT, ovviamente portandone oltre quanto disponibile i limiti tecnologici del chip. Nel prossimo paragrafo analizzeremo in dettaglio il perché ATI abbia scelto di non supportare gli Shader 3.0 come fatto da NVIDIA.

architettura_r420.jpg (41665 bytes)

Le vertex unit sono passate, rispetto al chip Radeon 9800XT, da 4 a 6, con varie migliorie anche al setup engine. L'architettura del chip video, come già segnalato, integra 12 o 16 pipeline di rendering a seconda del modello. L'architettura di R420 è basata su gruppi di 4 pipeline di rendering, così che sia possibile passare alla produzione di differenti versioni di scheda video utilizzando lo stesso chip come base, abilitando il numero di blocchi di 4 pipeline richiesti a seconda delle esigenze produttive.

ATI ha confermato che il lock delle pipeline non attivate verrà fatto a livello hardware e non software, come originariamente introdotto con la scheda Radeon 9500 PRO. Per questo motivo non sarà possibile abilitare manualmente le pipeline inutilizzate nel chip R420. Smoothvision, al quale compete la gestione dell'Anti Aliasing, è stato migliorato nell'architettura R420 e altrettanto per Hyper Z.

Pagina 3 - Shader 2.0 e 24bit

Osservando le caratteristiche tecniche delle due schede ATI Radeon X800, emerge chiaramente come ATI non abbia scelto di integrare supporto agli Shader 3.0, via seguita dalla concorrente NVIDIA con il progetto GeForce 6800. Le motivazioni alla base di questa decisione sono varie, riassumibili nei seguenti punti:

  • secondo i games developer, tutto quello che può essere fatto con gli Shader 3.0 è attualmente accessibile anche con gli Shader 2.0. L'utilizzo degli Shader 3.0 permette di ottenere, se ben dosato, migliori risultati in termini di performances velocistiche ma dal punto di vista qualitativo, stando a quanto dichiarato da ATI, non vi sarebbero differenze prendendo il lavoro attualmente sviluppato dai games developer.
  • costi e tempi di realizzazione. Sviluppare un'architettura Shader 3.0 richiede parecchio tempo e ATI non sarebbe probabilmente stata capace di proporre, per la primavera del 2004, una nuova famiglia di prodotti con la quale porsi in diretta concorrenza con NVIDIA.

Discorso molto simile viene fatto per la precisione a 24bit: anche in questo caso ATI ha scelto una strada legata alla continuità, basando questo approccio sulla considerazione che con i titoli attuali e quelli in sviluppo per il 2004 l'utilizzo di una precisione a 24bit è tale da non generare differenze qualitative rispetto ad una a 32bit.

Le opinioni circa la necessità di Shader 3.0 e supporto ai 32bit è variabile tra i games developer; emergono forti differenze in merito a seconda di quanto la specifica software house sia vicina a uno o all'altro dei produttori tra ATI e NVIDIA.

L'approccio di ATI è indubbiamente più "semplice", in termini di complessità architetturale, rispetto a quello di NVIDIA. Quale sia dei due il preferibile è difficile dirlo, ora come ora, in quanto la risposta a questa domanda implica la definizione di alcuni parametri valutativi.

Chi spende oltre 500€ per una scheda video ricerca, a nostro avviso, un ideale connubio tra qualità d'immagine e pure prestazioni velocistiche. Con queste schede video si vuole poter giocare a qualsiasi titolo alle risoluzioni massime, abilitando filtraggio anisotropico e FSAA in modo tale da garantire la più elevata qualità d'immagine, senza però far scendere i frames al secondo a valori troppo bassi. Se il risultato qualitativo è, con i giochi attualmente a disposizione, identico tra due differenti architetture saranno le superiori prestazioni velocistiche a far propendere verso un prodotto oppure l'altro.

Gli Shader model 3.0 sono, indubbiamente, la via verso la quale tutti i produttori di chip video e gli sviluppatori di giochi si sposteranno nei prossimi anni. Resta da capire quanto tempo richiederà questa progressiva migrazione, oltre a quando un'architettura Shader 3.0 permetterà di ottenere significativi vantaggi, prestazionali e qualitativi, su una Shader 2.0. Al momento attuale non pare che il supporto agli Shader 3.0 sia un requisito imprescindibile per un'architettura video top della produzione odierna, ma non è possibile prevedere prima di quando un chip video con supporto hardware agli Shader 3.0 possa guadagnare un sensibile margine, prestazionale e/o qualitativo, su un'architettura simile ma Shader 2.0.

Il supporto Shader 2.0 non si è però limitato, nell'architettura ATI R420, a lasciare invariato quanto disponibile con le schede Radeon 9800. Rispetto ai chip R3x0, ATI ha innalzato il numero di istruzioni Pixel Shader eseguibili contemporaneamente, passando da 64 a 512 sia per il n° massimo di vector instructions che di scalar instructions. A questo bisogna sommare l'incremento da 32 a 512 texture instructions processabili contemporaneamente, per un numero complessivo di istruzioni che passa da 160 a 1.536.

Questi limiti sono ben superiori a quanto attualmente disponibile con i giochi in commercio. Stando alle dichiarazioni di ATI, infatti, il titolo con shader più complessi in commercio o di prossima introduzione arriva ad un valore prossimo a 40 istruzioni per shader, quindi ben sotto il numero massimo teorico disponibile con architettura R420.

pixel_shader_unit.jpg (19181 bytes)
schema di una pixel shader unit del chip R420

Non è comunque solo il numero di istruzioni processabili a garantire le prestazioni velocistiche. Con il progetto R420 ATI ha focalizzato la propria attenzione sulla necessità di mantenere un'architettura efficiente, in modo tale che i dati vengano processati per quanto possibile in sequenza senza che sorgano evidenti colli di bottiglia. Analizzando l'architettura delle Shader unit, infatti, emerge chiaramente come ATI ricerchi di massimizzare l'occupazione delle 5 ALU (Arithmetic and Logic Unit) integrate in ciascuna Pixel Shader Unit. Le ALU presenti sono 2 ALU 72-bit floating point vector, 2 ALU 24-bit floating point scalar e 1 ALU 96-bit texture address.

Se NVIDIA, con NV40, ha voluto proporre nuovi riferimenti in termini di sviluppo, con supporto a Shader 3.0 e a un numero di istruzioni processabili così elevato da poter essere considerato pressoché infinito per gli standard attuali, ATI ha scelto la via della continuità, puntando su una superiore efficienza del percorso di generazione delle scene 3D, limitando al massimo l'insorgere di eventuali colli di bottiglia.

Pagina 4 - Memorie GDDR3

Un trend evidenziato sia da NVIDIA con le schede GeForce 6800 che da ATI con le soluzioni Radeon X800 è quello dell'aumentata bandwidth della memoria video. La crescente potenza di calcolo dei chip video, infatti, incontra nella bandwidth della memoria video un forte collo di bottiglia. Oltre ad aumentare le frequenze di clock sino al massimo ottenibile attualmente, ATI e NVIDIA hanno introdotto memorie GDDR3 sulle proprie soluzioni video: GDDR3 rappresenta un'innovazione estremamente importante nel mercato delle schede video di fascia alta, in quanto permette di ottenere un inferiore consumo bilanciato da una frequenza di clock superiore rispetto a DDR 1 e a GDDR2.

E' interessante segnalare come sia stata ATI a sviluppare inizialmente e a proporre al JEDEC l'adozione di memorie GDDR3, quale soluzione specificamente pensata per le esigenze delle schede video di fascia più alta. Oltre alle soluzioni ATI Radeon X800, le memorie GDDR3 sono al momento utilizzate da NVIDIA per le schede GeForce 6800 Ultra e per alcuni modelli di schede GeForce FX 5700 Ultra.

GDDR3 ha un'architettura completamente differente rispetto a DDR e a GDDR2, come chiaramente mostrato dalla tabella seguente:

schema_gddr3.jpg (15015 bytes)

Nelle memorie GDDR3 sono state rimosse le terminazioni, in quanto integrate all'interno della memoria: questo ha permesso di diminuire le interferenze e quindi garantire maggiore stabilità a frequenze di lavoro superiori. Rispetto a schede video con memoria DDR e GDDR2, la rimozione delle terminazioni sul PCB della scheda ha portato all'eliminazione della relativa circuiteria di alimentazione, con un'ulteriore semplificazione a livello di layout.

In termini di consumo, le memorie GDDR3 permettono di contenere l'utilizzo di corrente rispetto alle memorie GDDR2. Questo si rende molto utile sia in ambiente mobile, dove l'ottimizzazione del consumo è fondamentale per la durata delle batterie, sia in quello desktop, dove un consumo inferiore ha un riflesso diretto sui requisiti di dissipazione termica delle schede.

back_scheda_memoria.jpg (30818 bytes)

Osservando la scheda Radeon X800 XT Platinum Edition si nota immediatamente come le memorie GDDR3 abbiano requisiti nettamente inferiori, in termini di dissipazione termica, rispetto ai moduli DDR e GDDR2. Nella parte posteriore della scheda sono presenti vari chip memoria, sprovvisti di sistemi di raffreddamento di alcun tipo: nella scheda Radeon 9800XT ATI aveva scelto di raffreddare i chip memoria con una placca di rame.

schema_memoria.jpg (17820 bytes)

Il memory controller integrato nel chip R420 è di tipo a 256bit, diviso in 4 blocchi da 64bit ciascuno. Ognuno dei 4 sub memory controller può agire indipendentemente rispetto agli altri, leggendo e scrivendo dati nella memoria così da massimizzare l'efficienza quando piccoli pacchetti di dati devono essere utilizzati da o verso la memoria video.

particolare_chip_memoria.jpg (12789 bytes)

Grazie alla forte presenza all'interno del JEDEC, ATI sta ponendo le premesse per lo sviluppo della prossima generazione di memorie video: GGR4. Queste memorie introdurranno innovazioni in termini di risparmio energetico e di consumo, oltre a permettere di ottenere frequenze di clock stimate a 1,4 GHz di clock (2,8 GHz effettivi). Non è comunque previsto che GDDR4 potrà entrare in commercio prima di almeno 1 anno e mezzo.

Pagina 5 - 3Dc: come utilizzare al meglio le normal map

Come già segnalato in precedenza, la bandwidth della memoria riveste un'importanza fondamentale con le più recenti architetture video. Questo spiega per quale motivo sia ATI che NVIDIA abbiano scelto le più veloci memorie GDDR3 attualmente disponibili in commercio, in abbinamento alle proprie nuove schede video top della gamma. Non solo la bandwidth, ma anche il quantitativo di memoria video montato sulla scheda può rappresentare un collo di bottiglia alle prestazioni. Se, infatti, i complessi e ricchi scenari 3D richiedono varie tecniche per poter essere rappresentati al meglio, questo implica il caricamento nella memoria della scheda video di un quantitativo sempre crescente d'informazioni. Vi sono alcune situazioni nelle quali anche 256 Mbytes di memoria video possono non bastare, con la diretta conseguenza di causare un rallentamento nell'esecuzione dei calcoli che portano alla generazione di una scena 3D.

normal_map.jpg (19415 bytes)

ATI ha evidenziato che questo fenomeno è ancor più presente qualora vengano applicate le normal map. Questa tecnica, molto utilizzata dai games developer, permette di ottenere un superiore dettaglio degli oggetti 3D, soprattutto se ricchi di sfaccettature e particolari quali il volto di un personaggio in primo piano, riducendo il numero di poligoni utilizzati per generare l'oggetto. Se, ad esempio, per rappresentare al meglio il viso di un personaggio 3D venissero richiesti circa 15.000 poligoni, servendosi delle normal map la stessa operazione necessita di un quantitativo nettamente inferiore di poligoni, ottenendo un livello di dettaglio finale pressoché identico.

normal_map_howto.jpg (29254 bytes)

Come operano le normal map? Ad un oggetto 3D costruito con pochi poligoni viene applicata una normal map, ottenuta come differenza tra la rappresentazione dell'oggetto con un elevato numero di poligoni (nell'esempio precedente, 15.000) e una con pochi poligoni (1.000). I differenti colori applicati alla normal map indicano le direzioni delle normali. Quando l'oggetto dev'essere generato a video sul modello con pochi poligoni, elaborato in real time, viene applicata la normal map in abbinamento alle informazioni sull'illuminazione della scena, utilizzando i pixel shader. Il risultato che si ottiene è un oggetto che per livello qualitativo si avvicina moltissimo a quello originario, con molti poligoni.

Perché le normal map vengono utilizzate in modo limitato all'interno dei giochi, pur essendo un valido strumento per bilanciare precisione negli oggetti e numero di poligoni? Per un semplice problema d'ingombri. Le normal map devono essere caricate all'interno della memoria della scheda video e questo implica l'utilizzo di un ampio quantitativo di memoria. Qualora la memoria disponibile venga tutta saturata si otterrebbe un impatto negativo sulle prestazioni tale da pregiudicare il risultato finale. Per risolvere questo problema si può ricorrere a tecniche di compressione delle normal map, al pari di quanto avviene per le textures.

Le tradizionali tecniche di compressione, come quella DXTC o S3TC, non permettono di ottenere un risultato qualitativamente valido. Nella compressione delle normal map, infatti, queste tecniche portano alla generazione di scalettature assolutamente poco gradevoli, che vanificano il beneficio qualitativo dato dall'utilizzo delle normal map. Per ovviare a questo problema ATI ha sviluppato un particolare algoritmo di compressione, chiamato 3Dc, specificamente pensato per comprimere le normal map senza ottenere  penalizzazioni dal punto di vista qualitativo.

normal_map_compresse.jpg (32534 bytes)

Utilizzando 3Dc ATI permette di ottenere un rapporto di compressione pari a 4:1 nell'utilizzo delle normal map. Questo ha due possibili riflessi:

  • i games developer possono utilizzare un maggiore quantitativo di normal map rispetto ad una tecnica che non ne preveda la compressione, oppure
  • i games developer possono utilizzare normal map a risoluzione superiore rispetto a quanto accessibile senza compressione, aumentando di conseguenza il dettaglio degli oggetti ai quali le normal map vengono applicate.

Alcune software house hanno già confermato l'uso del 3Dc nei loro prossimi titoli: Valve per Half-Life 2, Firaxis per Pirates!, Croateam per Serious Sam 2, Irritational Games per Tribes Vengeance e Digital Extremes per darkSector.

Pagina 6 - Temporal Anti Aliasing

L'evoluzione delle tecniche di Anti Aliasing è uno dei temi che periodicamente viene sviluppato dai produttori di chip video per innovare le proprie soluzioni e proporre un superiore realismo dell'immagine. Per il chip R420 ATI non ha sostanzialmente cambiato l'approccio all'Anti Aliasing ma introdotto una nuova modalità, chiamata Temporal Anti Aliasing.

Il Temporal AA opera su un principio molto semplice: ad ogni frame vengono alternati due distinti pattern di anti aliasing predefiniti, ottenendo come risultato un immagine che appare come se abbia il doppio di samples per pixel di quelli che vengono realmente applicati, con l'effetto di ottenere un risultato che visivamente appare indistinguibile rispetto ad un tradizionale pattern di Anti Aliasing superiore. Il Temporal AA 2x, quindi, ha un risultato che qualitativamente appare indistinguibile a un Anti Aliasing 4x tradizionale.

Se il frame rate si mantiene sopra un minimo di almeno 25, l'occhio umano tende a non distinguere i due frames generati e a non notarne la generazione sullo schermo. La persistenza dell'immagine sulla retina dell'occhio fa si che due frames sequenziali, quando il frame rate si avvicina alla frequenza di refresh del monitor, vengano percepiti come se fossero uno solo e questo genera l'effetto di temporal anti aliasing.

temporal_aa_schema.jpg (25914 bytes)

Lo schema di funzionamento del Temporal Anti Aliasing mostra chiaramente come il risultato ottenibile sia qualitativamente pressoché identico a quello di un tradizionale Anti Aliasing di modalità superiore, con l'innegabile vantaggio di una superiore velocità di esecuzione rispetto al tradizionale FSAA.

Alcune note su Temporal Anti-Aliasing:

  • funziona esclusivamente con v-synk (sincronismo verticale dell'immagine) abilitato;
  • se i frames al secondo scendono sotto un determinato limite, viene disabilitato automaticamente. Al momento attuale questo valore è fissato tra 24 e 30 frames al secondo ma non è detto che ATI possa implementare un selettore manuale direttamente nel control panel dei driver;
  • non è possibile effettuare screenshot di giochi che possano mostrare come il Temporal Anti-Aliasing funzioni correttamente, quantomeno con le classiche tecniche a disposizione.
Pagina 7 - Le schede

r420_xt_s.jpg (26356 bytes)
Radeon X800 XT Platinum Edition

r420_pro_s.jpg (26846 bytes)
Radeon X800 PRO

Le due reference board ATI Radeon X800 appaiono, ad un'analisi esteriore, esattamente identiche l'una rispetto all'altra, distonguibili solo grazie all'etichetta apposta sul dissipatore di calore del modello XT. Il sistema di raffreddamento utilizzato è identico, estremamente simile a quello montato sulle schede Radeon 9800XT e quindi tale da permettere il montaggio di una scheda PCI nello Slot adiacente a quello AGP.

Sulla destra si nota un connettore di colore giallo, simile ai connettori audio integrati sul PCB delle schede madri. ATI ci ha confermato che è un connettore che è stato montato solo sulle reference board per uso interno e che non sarà presente nelle schede destinate alla produzione.

r420_xt_back_s.jpg (14098 bytes)
Radeon X800 XT Platinum Edition

r420_pro_back_s.jpg (14332 bytes)
Radeon X800 PRO

Posteriormente non sono evidenziabili differenze tra la due schede ATI, basate sul medesimo PCB. Il quantitativo di memoria GDDR3 è pari a 256 Mbytes per entrambe le schede, con chip che non necessitano di un sistema di raffreddamento passivo per operare correttamente. Da segnalare anche il chip ATI Rage Theatre, al quale compete la gestione delle funzionalità video unitamente alla parte di video shader integrata nel chip R420.

ATI ha fornito i risultati di alcuni test con i quali è stato misurato il consumo delle due schede R420. La soluzione Radeon X800 PRO ha consumato un massimo di 58 Watt in media, mentre la scheda Radeon X800 XT Platinum Edition ha raggiunto un valore di 76 Watt. Questi risultati spiegano per quale motivo i requisiti di dissipazione termica delle schede Radeon X800 siano pressoché identici a quelli della precedente top della gamma ATI, Radeon 9800XT.

r360_r420_s.jpg (17893 bytes)

In alto: Radeon X800 PRO. In basso: Radeon 9800XT. Le dimensioni delle due schede sono identiche, mentre per la componentistica superficiale si notano numerose somiglianze: l'ausilio delle GDDR3 ha permesso ad ATI di semplificare il design elettronico rimuovendo numerosi condensatori e filtri passa basso.

memoria_1.jpg (8765 bytes) memoria_2.jpg (8451 bytes)
Radeon X800 XT Platinum Edition Radeon X800 PRO

Le due schede Radeon X800 utilizzano memorie GDDR3, ma i chip utilizzati sono differenti: per la scheda Radeon X800 XT Platinum Edition sono marchiati GC16, mentre per la scheda Radeon X800 PRO la sigla utilizzata è quella CG20. Le sigle alla destra della scritta Samsung sono le settimane produttive dei chip, non i tempi di accesso.

dissipatore_rimosso_s.jpg (15235 bytes)

chip_video_s.jpg (10723 bytes)

particolare_dissi_chip_s.jpg (4589 bytes)

Una volta rimosso il dissipatore di calore è possibile accedere al Core del chip video. Il package esterno è molto simile a quello delle soluzioni R3x0 utilizzate nelle precedenti versioni di schede Radeon anche se si nota la notevole superficie complessiva del Core dovuta ai ben 160 milioni di transistor. L'ultima immagine permette di apprezzare un particolare del sistema di raffreddamento: la placca in alluminio che circonda il Core del chip video non appoggia direttamente sul dissipatore, mentre è il chip R420 ad essere posizionato direttamente a contatto del dissipatore di calore.

Pagina 8 - Ingombro e rumore: aspetti importanti per ATI

Uno degli elementi più importanti per ATI con la famiglia Radeon 9800, da un punto di vista marketing, è stata la possibilità di proporre queste schede in abbinamento a sistemi Mini-PC Barebone. Oltre a questo, le soluzioni ATI non hanno mai creato problemi in termini di spazio all'interno del Case, occupando solo l'area dello Slot AGP 8x già con il reference design ATI. I requisiti in termini di alimentazione sono sempre rimasti all'interno di quello che è indicabile come norma, quindi un connettore Molex (identico a quello di un hard disk o di un lettore ottico) per alimentare direttamente la scheda e un alimentatore ATX da almeno 300 Watt, uno standard per un PC di recente costruzione.

ATI ha scelto, con il progetto Radeon X800, di seguire il medesimo trend. Le due schede R420 richiedono di essere alimentate con un tradizionale connettore Molex a 4 pin, in abbinamento ad un tradizionale alimentatore ATX. Le dimensioni complessive e il sistema di raffreddamento permettono di utilizzare queste schede anche in sistemi Mini-PC Barebone, senza particolari requisiti in termini di raffreddamento.

r420_barebone_shuttle.jpg (35490 bytes)
Radeon X800XT in un sistema Mini PC Barebone Shuttle

A questo risultati si è giunti grazie principalmente a due elementi: le memorie GDDR3, capaci di operare con un consumo più ridotto rispetto a quelle DDR e GDDR2, e i vantaggi del processo produttivo 0.13 micron Low-K utilizzato per il chip R420.

L'approccio di NVIDIA con le schede NV40 è completamente all'opposto: il desing richiede di utilizzare anche l'area corrispondente allo Slot PCI adiacente a quello AGP 8x, con 2 Molex di alimentazione che devono essere utilizzati per alimentare la scheda e un alimentatore ATX che è consigliato sia da 480 Watt. Al momento, inoltre, non pare possibile utilizzare schede GeForce 6800 Ultra all'interno di sistemi Barebone quali i popolari Shuttle.

Pagina 9 - NVIDIA al contrattacco: le nuove schede GeForce 6800

Lo scorso 14 Aprile NVIDIA ha presentato ufficialmente le proprie schede video basate su architettura NV40. A questo indirizzo abbiamo pubblicato la recensione della soluzione GeForce 6800 Ultra, la prima scheda video NV40 disponibile per i test. In concomitanza con il debutto delle soluzioni ATI Radeon X800, NVIDIA introduce due nuove schede video nella famiglia di prodotti GeForce 6800. La prima è il modello GeForce 6800 Ultra Extreme, versione evoluta della scheda GeForce 6800 Ultra dalla quale differisce per la frequenza di clock del chip NV40, aumentata sino a 450 MHz.

La seconda scheda è il modello GeForce 6800 GT, dotata sempre di 256 Mbytes di memoria video GDDR3 operante però a 1 GHz di clock, con chip video NV40 a clock di 350 MHz. La scheda GeForce 6800 Ultra Extreme viene proposta quale soluzione top della gamma, prodotta in un limitato numero di esemplari e specificamente pensata per serie limitate, per produttori quali Gainward, magari abbinate a particolari soluzioni di raffreddamento. Il costo di questa scheda non è stato ancora ufficialmente comunicato ma sarà presumibilmente prossimo a 600 dollari.

La scheda GeForce 6800 GT, viceversa, viene posizionata ad un prezzo di 399 dollari, a metà strada quindi tra i 499 dollari della versione GeForce 6800 Ultra e i 299 dollari della scheda GeForce 6800 liscia. Di quest'ultima soluzione mancano al momento attuale i sample, quindi non è dato sapere come si comporti l'architettura NVIDIA NV40 in abbinamento a 12 pipeline di rendering.

La tabella seguente riporta le caratteristiche tecniche delle schede video appartenenti alla famiglia GeForce 6800:

GeForce 6800 Ultra Extreme

GeForce 6800 Ultra

GeForce 6800 GT

GeForce 6800

Bus di memoria

256 bit

Processo produttivo

0.13 micron

0.13 micron

0.13 micron

0.13 micron

Frequenza chip e memoria

450/1100

400/1100

350/1000

325/700

Memoria video

GDDR3

GDDR3

GDDR3

DDR1

Quantitativo memoria

256 Mbytes

256 Mbytes

256 Mbytes

256 Mbytes

Bus

AGP 8X

Numero di pipeline

16

16

16

12

Texture per ciclo di clock

1

1

1

1

Fill Rate

7200 Mpixel e 7200 Mtexel

6400 Mpixel e 6400 Mtexel

5600 Mpixel e 5600 Mtexel

4200 Mpixel e 4200 Mtexel

Banda Passante

35,2 GB

35,2 GB

32,0 GB

22,4 GB

Versione Vertex Shader 3.0 3.0 3.0 3.0
Versione Pixel Shader 3.0 3.0 3.0 3.0
Costo indicativo

non ancora comunicato

499$

399$

299$

Disponibilità Giugno 2004 fine Maggio 2004 metà Giugno 2004 fine Maggio 2004

nv40_extreme_front_s.jpg (14480 bytes)
GeForce 6800 Ultra Extreme

nv40_extreme_back_s.jpg (13424 bytes)
GeForce 6800 Ultra Extreme

nv40_gt_front_s.jpg (14854 bytes)
GeForce 6800 GT

nv40_gt_back_s.jpg (13217 bytes)
GeForce 6800 GT

nv40_gt_connettore_s.jpg (13270 bytes)

Il connettore di alimentazione della scheda GeForce 6800 GT è di tipo single Molex; sul PCB si nota chiaramente la predisposizione per il secondo Molex, caratteristica che fa immediatamente capire come il PCB di questa scheda sia identico a quello delle versioni Ultra e Ultra Extreme. La scheda 6800 GT ha sistema di raffreddamento single slot, come si nota chiaramente dalle immagini; questa scelta, assieme agli inferiori requisiti in termini di alimentazione, rende indubbiamente più semplice poter utilizzare questa scheda nella maggior parte dei sistemi in commercio. La scheda GeForce 6800 Ultra Extreme riprende il design della soluzione 6800 Ultra, dalla quale differisce del resto solo per la superiore frequenza di clock del chip video NV40.

memoria_nv40_1.jpg (3965 bytes) memoria_nv40_2.jpg (4033 bytes)

GeForce 6800 Ultra
Extreme

GeForce 6800 GT

La memoria montata sulla scheda GeForce 6800 GT opera a 500 MHz di clock (1 GHz effettivo), mentre quella della soluzione GeForce 6800 Ultra Extreme ha la medesima frequenza di lavoro della soluzione GeForce 6800 Ultra, quindi 550 MH z(1,1 GHz). Sulla parte posteriore di entrambe le schede sono etichettate le specifiche delle memorie Samsung utilizzate.

Pagina 10 - Configurazione di prova

Configurazione di test

Processore

Intel Pentium 4 3,06 GHz con HyperThreading

Front Side Bus

533 MHz

Scheda Madre

ABIT IC7-MAX3

Chipset

Intel i875

Ram

2x256 MB DDR PC3200

Schede Video

ATI Radeon X800 XT Platinum Edition 256 MB
Frequenza: 525 MHz per il core e 1120 MHz per le memorie
ATI Radeon X800 PRO 256 MB
Frequenza: 475 MHz per il core e 900 MHz per le memorie
NVIDIA GeForce 6800 Ultra Extreme 256 MB
Frequenza: 450 MHz per il core e 1100 MHz per le memorie
NVIDIA GeForce 6800 Ultra 256 MB
Frequenza: 400 MHz per il core e 1100 MHz per le memorie
NVIDIA GeForce 6800 GT 256 MB
Frequenza: 350 MHz per il core e 1000 MHz per le memorie
ATI Radeon 9800 XT 256 MB
Frequenza: 412 MHz per il core e 730 MHz per le memorie
NVIDIA GeForce Fx 5950 Ultra 256 MB
Frequenza: 475 MHz per il core e 950 MHz per le memorie

Sistema Operativo

Windows XP Professional SP1

Versione dei drivers

ATI Catalyst 4.3 (R360)
ATI Catalyst Beta (R420)
NVIDIA ForceWare 56.72 (NV38)
NVIDIA ForceWare 61.11 (NV40)

PC Mark 2004

Tale benchmark è stato sviluppato da FutureMark per testare la bontà di molteplici componenti di un personal computer. Nel nostro caso è stato usato per valutare la velocità di una scheda video nel gestire la GDI di Windows e la riproduzione di file video WMV e DivX. Inoltre i test sulla memoria permettono di rilevare l’efficienza dell’intero sistema CPU-Chipset-AGP-GPU.

WinBench 99 2.0

Questo storico programma marcato Ziff-Davids valuta le prestazioni del sistema testando vari tipi di utilizzo. Nella valutazione della velocità di un acceleratore grafico nel gestire le applicazioni Windows, sono stati eseguiti i pacchetti Business Graphics WinMark e High-End Graphics WinMark. Il primo riproduce sequenze di Corel WordPerfect Suite, Lotus SmartSuite e Office, mentre il secondo di FrontPage, Microstation, Photoshop, Premiere, ecc…

3DMark 2003

Si tratta del famoso e diffuso benchmark sintetico sviluppato da FutureMark. Nonostante il suo obbiettivo sia quello di valutare le prestazioni di una scheda video in ambito DirectX 9, in questo articolo non verrà utilizzato per questa finalità bensì per raccogliere alcune informazioni utili riguardo l’architettura di un chip grafico. Abbiamo pertanto fatto partire solo i test relativi al Fill Rate, ai Vertex Shader ed ai Pixel Shader 2.0. I risultati che abbiamo ottenuto sono quindi da intendere solo come elementi di studio e non di valutazione.

Far Cry

Far Cry è il più recente titolo del nostro pacchetto benchmark che fa uso dell'innovativo motore grafico CryENGINE dei Crytek Studios. Massiccio è l'uso dei Vertex e Pixel Shader, in parte anche in versione 3.0, per realizzare effetti grafici come il riflesso sull'acqua, il bump mapping e le soft shadows. Due sono le mappe utilizzate: Research e Volcano. La prima è caratterizzata da ampi spazi aperti e effetti atmosferici, mentre la seconda è al chiuso e mette meglio in evidenza il bump mapping e la tecnologia Polybump per il rendering dei personaggi. Il gioco è stato aggiornato con la patch in versione 1.1.

AquaMark 3

AquaMark 3 è sviluppato dalla Massive Development, una software house famosa nel mercato dei videogames per i titoli AquaNox e AquaNox 2. Questo benchmark è basato sul motore grafico Krass Engine di AquaNox 2 che possiede alcune caratteristiche molto interessanti tra cui l’uso dei Pixel Shader 2.0.

Splinter Cell

Realizzato dalla UbiSoft e dotato di una versione pesantemente revisionata dell’Unreal Engine, questo videogames è utilizzato in modalità timedemo per valutare le prestazioni di una scheda video. Le due demo utilizzate sono state registrate nelle mappe The Caspian Oil Refinery e The Chinese Embassy. La prima rappresenta una situazione si gioco abbastanza anomala con un overdraw praticamente nullo e valuta l’uso dei Pixel Shader 1.1. La seconda è più realistica a livello di gameplay, ma usa meno effetti programmabili.

Halo

E’ uno dei giochi presenti al lancio di X-Box, la console di Microsoft, ed ha letteralmente sbancato i botteghini per la sua grafica e la sua giocabilità. La versione per PC, approdata solo da poco sugli scaffali dei negozianti, nonostante sia un semplice riadattamento (ricordo che X-Box ha la struttura di un PC ed un processore grafico molto simile al GeForce 4 Titanium) sfrutta i Pixel Shader 2.0 per realizzare gli effetti dei Pixel Shader 1.1 in un minor numero di passate di rendering.

Tomb Raider: The Angel Of Darkness

L’ultimo capitolo della serie che vede protagonista Lara Croft è uno dei giochi più avanzati dal punto di vista grafico. Spicca un pesante uso di effetti come il Bump Mapping, le ombre ed il Depth Of Field (messa a fuoco di particolare zone dello schermo), il tutto rigorosamente realizzato in Pixel Shader 2.0.

X2: The Threat

Anche in questo caso ci troviamo di fronte ad un titolo DirectX 9 anche se la maggioranza degli effetti sono realizzati in Pixel Shader 1.4. Tra le funzionalità più interessanti che vengono sfruttate di una scheda video ritroviamo il DOT3 Bump Mapping e le Stencil Shadow. Il benchmark è una rolling demo, cioè un’animazione non interattiva che mostra alcune parti del gioco.

Unreal Tournament 2004

Basato su una versione rivista e aggiornata del motore grafico di Unreal Tournament 2003, questo titolo è uno dei più diffusi a livello di multiplayer gaming. Tra le caratteristiche più interessanti troviamo l’uso del T&L e del Bump Mapping. Quasi del tutto assenti invece i Vertex ed i Pixel Shader. Le due mappe prese in considerazione sono Antalus ed Asbestos. La prima è girata in spazi aperti molto vasti, mentre la seconda è al chiuso in un ambiente più claustrofobico.

Wolfenstein: Enemy Territory

Espansione di Return To Castle Wolfenstein, basato sul motore grafico di Quake III Arena, questo sparatutto non fa uso di nessuna delle funzionalità programmabili di una scheda video. Nonostante questo la demo da noi utilizzata è risultata essere piuttosto pesante perché ricca di overdraw e di effetti grafici. Si tratta a nostro avviso di uno dei pochi benchmark OpenGL attendibili rimasti.

Call Of Duty

Call Of Duty è la nostra seconda scelta in ambiente OpenGL. Esattamente come Return To Castle Wolfenstein, è basato sul motore grafico di Quake III Arena anche se in questo caso si tratta di una versione pesantemente rivisitata: è stato aggiunto il supporto per i Vertex e Pixel Shader. La demo da noi usata per i test si chiama "Dawnville" ed è disponibile installando la patch versione 1.3.

Pagina 11 - Analisi qualitativa: filtro anisotropico

Il filtro anisotropico è una delle caratteristiche più attivate dai videogiocatori. La sua capacità di aumentare drasticamente la qualità delle texture permette di sfruttare al massimo i titoli più recenti, dotati di un numero sempre più elevato di texture ad alta risoluzione. L'immagine che meglio esplica la tipologia e la resa di una tecnologia di filtro anisotropico è rappresentata da una texture a scacchiera, in bianco e nero. L'occhio umano, infatti, in questo caso riesce a scorgere con molta facilità la differenza tra un'implementazione e l'altra grazie al forte distacco cromatico che contraddistingue questo tipo di immagine. Il Texture Filtering, un programma OpenGL distribuito gratuitamente, ci permette di riproporre una scena tridimensionale rappresentata da un cilindro, visto dall'interno e tappezzato da un motivo a scacchiera. Inoltre, per facilitare ulteriormente la valutazione, vengono visualizzate attraverso bande colorate i vari livelli di mipmapping, cioè i livelli di dettaglio (LOD) delle texture. La banda rossa rappresenta il primo LOD a risoluzione inferiore rispetto a quella originale delle texture: più questo sarà vicino (al bordo dell'immagine), più la qualità sarà degradata.

Radeon X800 XT Platinum Edition

r420_anis_trilineare_s.jpg (3666 bytes)
Filtro trilineare
r420_anis_2xP_s.jpg (4072 bytes) r420_anis_2xQ_s.jpg (3404 bytes) r420_anis_4xP_s.jpg (3929 bytes) r420_anis_4xQ_s.jpg (3502 bytes)
Anisotropico 2x
prestazioni
Anisotropico 2x
qualità
Anisotropico 4x
prestazioni
Anisotropico 4x
qualità
     
r420_anis_8xP_s.jpg (3971 bytes) r420_anis_8xQ_s.jpg (3584 bytes) r420_anis_16xP_s.jpg (3964 bytes) r420_anis_16xQ_s.jpg (3584 bytes)
Anisotropico 8x
prestazioni
Anisotropico 8x
qualità
Anisotropico 16x
prestazioni
Anisotropico 16x
qualità

GeForce 6800 Ultra

Filtro trilineare

nv40_1xhp_s.jpg (4570 bytes) nv40_1xp_s.jpg (3866 bytes) nv40_1xq_s.jpg (3782 bytes) nv40_1xhq_s.jpg (3782 bytes) nv40_anis_noopt_trilineare_.jpg (1937 bytes)
High Performance Performance Quality High Quality no optimization

Filtro anisotropico 2x

nv40_2xhp_s.jpg (4106 bytes) nv40_2xp_s.jpg (3642 bytes) nv40_2xq_s.jpg (3576 bytes) nv40_2xhq_s.jpg (3571 bytes) nv40_anis_noopt_2x_s.jpg (1835 bytes)
High Performance Performance Quality High Quality no optimization

Filtro anisotropico 4x

nv40_4xhp_s.jpg (4181 bytes) nv40_4xp_s.jpg (3626 bytes) nv40_4xq_s.jpg (3554 bytes) nv40_4xhq_s.jpg (3541 bytes) nv40_anis_noopt_4x_s.jpg (1823 bytes)
High Performance Performance Quality High Quality no optimization

Filtro anisotropico 8x

nv40_8xhp_s.jpg (4250 bytes) nv40_8xp_s.jpg (3725 bytes) nv40_8xq_s.jpg (3676 bytes) nv40_8xhq_s.jpg (3667 bytes) nv40_anis_noopt_8x_s.jpg (1856 bytes)
High Performance Performance Quality High Quality no optimization

Filtro anisotropico 16x

nv40_16xhp_s.jpg (4252 bytes) nv40_16xp_s.jpg (3788 bytes) nv40_16xq_s.jpg (3761 bytes) nv40_16xhq_s.jpg (3754 bytes) nv40_anis_noopt_16x_s.jpg (1852 bytes)
High Performance Performance Quality High Quality no optimization

GeForce FX 5950 Ultra

Filtro trilineare

nv38_trilinearepe_s.jpg (4762 bytes) nv38_trilinearep_s.jpg (4771 bytes) nv38_trilineare_s.jpg (3720 bytes)
Prestazioni elevate Prestazioni Qualità

Filtro anisotropico 2x

nv38_aniso2xpe_s.jpg (4103 bytes) nv38_aniso2xp_s.jpg (4107 bytes) nv38_anios2x_s.jpg (3438 bytes)
Prestazioni elevate Prestazioni Qualità

Filtro anisotropico 4x

nv38_aniso4xpe_s.jpg (3448 bytes) nv38_aniso4xp_s.jpg (3423 bytes) nv38_aniso4x_s.jpg (3079 bytes)
Prestazioni elevate Prestazioni Qualità

Filtro anisotropico 8x

nv38_aniso8xpe_s.jpg (3208 bytes) nv38_aniso8xp_s.jpg (2974 bytes) nv38_aniso8x_s.jpg (2833 bytes)
Prestazioni elevate Prestazioni Qualità

Radeon 9800XT

r360_trilineare_s.jpg (3670 bytes)
Filtro trilineare
r360_anis2p_s.jpg (4073 bytes) r360_anis2_s.jpg (3413 bytes) r360_anis4p_s.jpg (3932 bytes) r360_anis4_s.jpg (3593 bytes)
Anisotropico 2x
prestazioni
Anisotropico 2x
qualità
Anisotropico 4x
prestazioni
Anisotropico 4x
qualità
     
r360_anis8p_s.jpg (3969 bytes) r360_anis8_s.jpg (3597 bytes) r360_anis16p_s.jpg (3970 bytes) r360_anis_16_s.jpg (3588 bytes)
Anisotropico 8x
prestazioni
Anisotropico 8x
qualità
Anisotropico 16x
prestazioni
Anisotropico 16x
qualità

Nella documentazione relativa alla qualità dell'immagine di R420, ATI ha sottolineato più di una volta che i suoi processori grafici eseguono sempre il filtro trilineare puro sia con anisotropico disattivato che con anisotropico in modalità qualità. Questa precisazione è ovviamente riferita alla "ottimizzazione trilineare", definita simpaticamente anche "brilinear filtering", introdotta da NVIDIA nei driver ForceWare di NV40. Abbiamo effettuato alcuni confronti e, come potete vedere, la differenza in termini di implementazione tra la modalità qualità e la modalità qualità senza ottimizzazione è notevole, anche nel semplice filtro trilineare: le transizioni da un livello di dettaglio all'altro sono molto più morbide. Indipendentemente dal numero di sample, con NV40, disattivando l'ottimizzazione trilineare, le immagini diventano estremamente simili a quelle di R420 e R360 in modalità qualità. Resta una piccola diversità nel filtro trilineare puro: il GeForce 6800 lo esegue con una resa leggermente inferiore specie alle angolazioni di 45°, 135°, 225° e 315°.

La modalità qualità di ATI, quindi, è perfettamente comparabile con l'omonima modalità di NV40 con ottimizzazione trilineare disattivata. Selezionando "prestazioni", invece, R420 propone un filtro anisotropico senza alcun tipo di filtraggio tra una transizione e l'altra (anche chiamato LINEAR MIPMAP NEAREST), analogo all'impostazione "high performance" del GeForce 6800, anche se leggermente inferiore in termini di resa visto che la riduzione dell'adattabilità per il chip NVIDIA produce un risultato migliore.

Radeon X800 XT Platinum Edition

anis_r420_nature_p_s.jpg (1973 bytes) anis_r420_nature_q_s.jpg (1967 bytes)
Anisotropico 8x
prestazioni
Anisotropico 8x
qualità

GeForce 6800 Ultra

nv40_nature_8xhp_s.jpg (2369 bytes) nv40_nature_8xp_s.jpg (2303 bytes) nv40_nature_8xq_s.jpg (2312 bytes) nv40_nature_8xhq_s.jpg (2309 bytes)
High Performance Performance Quality High Quality

GeForce FX 5950 Ultra

nv38_nature_8xhp_s.jpg (2306 bytes) nv38_nature_8xp_s.jpg (2296 bytes) nv38_nature_8xq_s.jpg (2322 bytes)
High Performance Performance Quality

Radeon 9800XT

radeon_nature_anis_8xp_s.jpg (2286 bytes) radeon_nature_anis_8xp_s.jpg (2286 bytes)
Anisotropico 8x
prestazioni
Anisotropico 8x
qualità

Purtroppo l'ottimizzazione trilineare è un'opzione che ha influenza solo in ambiente OpenGL. Anche disattivandola, in Direct 3D la resa non subisce cambiamenti e ripropone il brilinear filtering. Per questo motivo non ci è stato possibile valutare l'impatto sulla qualità del filtro anisotropico senza ottimizzazione trilineare con il 3D Mark 2003 di FutureMark.

Pagina 12 - Analisi qualitativa: antialiasing

L'antialiasing è una delle caratteristiche maggiormente ricercate dagli acquirenti delle più potenti schede video di ultima generazione. La sua capacità di aumentare la qualità dell'immagine riducendo il fastidioso artefatto grafico noto anche come aliasing (le scalettature presenti ai bordi poligonali) è fondamentale per assicurare il massimo realismo della scena tridimensionale, specie alle risoluzioni meno elevate (cioè quelle in cui l'aliasing è più evidente).

Per valutare l'implementazione dell'antialiasing che ATI ha adottato con R420 abbiamo utilizzato gli stessi strumenti già visti in altre recensioni: il FSAA Viewer ed il FSAA Tester. Il primo visualizza la distribuzione dei sample, cioè la posizione dei campioni usati per il calcolo del colore finale del pixel. Il secondo, invece, disegna una scena tridimensionale caratterizzata da una serie di raggi disposti sia su superficie chiara che scura. In questo modo è possibile valutare l'effettiva riduzione dell'aliasing a diverse angolazioni dei contorni poligonali sia in scene contraddistinte da ambietazioni cupe che in quelle più luminose.

Radeon X800 XT Platinum Edition

r420_pattern_noAA_s.jpg (2275 bytes) r420_pattern_2xAA_s.jpg (2265 bytes) r420_pattern_4xAA_s.jpg (2265 bytes) r420_pattern_6xAA_s.jpg (2275 bytes)
no FSAA FSAA 2x FSAA 4x FSAA 6x
r420_pattern2_noAA_s.jpg (1787 bytes) r420_pattern2_2xAA_s.jpg (1809 bytes) r420_pattern2_4xAA_s.jpg (1893 bytes) r420_pattern2_6xAA_s.jpg (1884 bytes)
no FSAA FSAA 2x FSAA 4x FSAA 6x

GeForce 6800 Ultra

nv40_NoAA_s.jpg (4235 bytes) nv40_2x_s.jpg (4209 bytes) nv40_2x_s.jpg (4209 bytes)
no FSAA FSAA 2x FSAA 2x
quincunx
nv40_4x_s.jpg (4206 bytes) nv40_8x_s.jpg (4215 bytes)
FSAA 4x FSAA 8x
nv40_pattern_noaa_s.jpg (3244 bytes) nv40_pattern_2x_s.jpg (3221 bytes) nv40_pattern_2xq_s.jpg (3246 bytes)
no FSAA FSAA 2x FSAA 2x
quincunx
nv40_pattern_4x_s.jpg (3258 bytes) nv40_pattern_8x_s.jpg (3118 bytes)
FSAA 4x FSAA 8x

GeForce FX 5950 Ultra

nv38_nofsaa_s.jpg (4242 bytes) nv38_fsaa2x_s.jpg (4230 bytes) nv38_fsaa2xq_s.jpg (4206 bytes)
no FSAA FSAA 2x FSAA 2x
quincunx
nv38_fsaa4x_s.jpg (4221 bytes) nv38_fsaa6x_s.jpg (4207 bytes) nv38_fsaa8x_s.jpg (4215 bytes)
FSAA 4x FSAA 6x FSAA 8x
pattern_nv38_nofsaa_s.jpg (3266 bytes) pattern_nv38_fsaa2x_s.jpg (3261 bytes) pattern_nv38_fsaa2xq_s.jpg (3258 bytes)
no FSAA FSAA 2x FSAA 2x
quincunx
pattern_nv38_fsaa4x_s.jpg (3255 bytes) pattern_nv38_fsaa6x_s.jpg (3083 bytes) pattern_nv38_fsaa8x_s.jpg (3083 bytes)
FSAA 4x FSAA 6x FSAA 8x

 

Radeon 9800XT

radeon_no-fsaa2_s.jpg (4233 bytes) radeon_fsaa2x2_s.jpg (4237 bytes) radeon_fsaa4x2_s.jpg (4240 bytes) radeon_fsaa6x2_s.jpg (4239 bytes)
no FSAA FSAA 2x FSAA 4x FSAA 6x
radeon_pattern_no_fsaa_s.jpg (3229 bytes) radeon_pattern_fsaa2x_s.jpg (3320 bytes) radeon_pattern_fsaa4x_s.jpg (3446 bytes) radeon_pattern_fsaa6x_s.jpg (3444 bytes)
no FSAA FSAA 2x FSAA 4x FSAA 6x

Come già detto all'interno della descrizione tecnica di R420, ATI non ha introdotto novità dal punto di vista dell'antialiasing. In realtà una novità esiste e consiste in una nuova modalità denominata Temporal AA di cui parleremo successivamente. Il pannello di controllo delle schede Radeon X800 Pro e X800 XT, nella versione beta dei Catalyst da noi utilizzata, è del tutto identico a quello di tutte le schede video basate su processori grafici R3x0 e RV3x0. Pertanto è possibile scegliere tra due, quattro o sei sample. In tutti i casi parliamo di un antialiasing di tipo Multisampling gamme corrected.

Il FSAA Viewer ci svela che a livello di distribuzione dei sample nulla è stato cambiato in R420. L'antialiasing 4x è un RGMS (Rotated Grid Multi Sampling), mentre scegliendo sei sample si ottiene un SGMS (Sparse Grid Multi Sampling) proprietario di ATI e basato su un pattern con distribuzione pseudo-random che, come già ampiamente dimostrato con la precedente generazione di processori grafici, permette di ottenere un ottimo grado di riduzione dell'aliasing.

Pagina 13 - Analisi qualitativa: confronto antialiasing

In questa parte dell'articolo ci occupiamo di analizzare in dettaglio la resa delle varie modalità di antialiasing. Per far ciò abbiamo utilizzato l'Adobe Photoshop 6. In particolare abbiamo selezionato due zone degli screenshots ottenuti con il FSAA Tester, una che esalta l'applicazione dell'antialiasing ai contorni poligonali posti in orizzontale e l'altra a quelli posti in verticale. Le selezioni sono state successivamente ingrandite del 400% disattivando l'applicazione di qualsiasi filtro di smussamento (niente bilineare o bicubico). Il risultato sono le seguenti immagini.

Radeon X800 XT Platinum Edition

no FSAA onoAA_r420.jpg (1698 bytes)
FSAA 2x o2xAA_r420.jpg (2301 bytes)
FSAA 4x o4xAA_r420.jpg (2418 bytes)
FSAA 6x o6xAA_r420.jpg (2435 bytes)

GeForce 6800 Ultra

no FSAA nv40_oNoAA.jpg (13308 bytes)
FSAA 2x nv40_o2xAA.jpg (14306 bytes)
FSAA 2x
quincunx
nv40_o2xQAA.jpg (14441 bytes)
FSAA 4x nv40_o4xAA.jpg (14488 bytes)
FSAA 8x nv40_o8xAA.jpg (14584 bytes)

GeForce FX 5950 Ultra

no FSAA nv40_oNoAA.jpg (13308 bytes)
FSAA 2x nv38_o2xAA.jpg (14356 bytes)
FSAA 2x
quincunx
nv38_o2xQAA.jpg (14439 bytes)
FSAA 4x nv38_o4xAA.jpg (14371 bytes)
FSAA 6x nv38_o6xAA.jpg (15034 bytes)
FSAA 8x nv38_o8xAA.jpg (14569 bytes)

Radeon 9800XT

no FSAA nv40_oNoAA.jpg (13308 bytes)
FSAA 2x radeon_o2xAA.jpg (14269 bytes)
FSAA 4x radeon_o4xAA.jpg (14447 bytes)
FSAA 6x radeon_o6xAA.jpg (14432 bytes)

Radeon X800 XT Platinum Edition

vnoAA_r420.jpg (1557 bytes) v2xAA_r420.jpg (1945 bytes) v4xAA_r420.jpg (1900 bytes) v6xAA_r420.jpg (1877 bytes)
no FSAA FSAA 2x FSAA 4x FSAA 6x

GeForce 6800 Ultra

nv40_vNoAA.jpg (11536 bytes) nv40_v2xAA.jpg (12028 bytes) nv40_v2xQAA.jpg (12581 bytes) nv40_v4xAA.jpg (12143 bytes) nv40_v8xAA.jpg (12247 bytes)
no FSAA FSAA 2x FSAA 2x
quincunx
FSAA 4x FSAA 8x

GeForce FX 5950 Ultra

nofsaaV_nv38_dett.jpg (1491 bytes) nv38_v2xAA.jpg (12032 bytes) nv38_v2xQAA.jpg (12600 bytes) nv38_v4xAA.jpg (12275 bytes) nv38_v6xAA.jpg (12426 bytes) nv38_v8xAA.jpg (12273 bytes)
no FSAA FSAA 2x FSAA 2x
quincunx
FSAA 4x FSAA 6x FSAA 8x

Radeon 9800XT

nofsaaV_r360_dett.jpg (1491 bytes) radeon_v2xAA.jpg (12681 bytes) radeon_v4xAA.jpg (12492 bytes) radeon_v6xAA.jpg (12481 bytes)
no FSAA FSAA 2x FSAA 4x FSAA 6x

Trovandoci di fronte alla medesima implementazione dell'antialiasing tutte le considerazioni fatte nella recensione della GeForce 6800 Ultra valgono anche in questa sede. NVIDIA con il RGMS di NV40 ha compiuto un indubbio passo in avanti rispetto a ciò che abbiamo visto con le schede GeForce FX. Un pattern ruotato tende a sfumare meglio i contorni poligonali verticali ed orizzontali rispetto ad un ordinato (OGMS - Ordered Grid Multi Sampling). Sia R420 che NV40 implementano la stessa modalità di calcolo dell'antialiasing a quattro campioni anche se esistono due differenze. La prima è nel numero di gradi della rotazione che, anche se molto ridotta, può privilegiare la scelta di una delle due aziende a determinate angolazioni e penalizzarla in altre. La seconda, decisamente più importante dal punto di vista della resa, è l'elaborazione del colore.

gamma_corrected.jpg (14504 bytes)

Con l'introduzione di R300 ATI ha presentato un antialiasing che aveva una caratteristica innovativa: la correzione gamma. Ruotare la distribuzione dei sample, infatti, non fu un'esclusiva visto che è stata implementata in hardware per prima da 3dfx con il suo VSA-100. Lo stesso dicasi per il multisampling, già visto con NVIDIA a partire dalle schede GeForce 3.

La correzione gamma non è altro che una modifica del colore dei sub-pixel (cioè i sample). Quando questi devono essere fusi i chip R3x0, RV3x0 e R420 rielaborano il colore tenendo presente della sua percezione da parte dell'occhio umano attraverso un monitor CRT. Il risultato è evidente: sia con NV40 che con R420 sono ben visibili tre sfumature in modalità 4x, sia in verticale che in orizzontale. Con il GeForce 6800 Ultra queste sfumature sono nette e scure, mentre con i chip canadesi sono più graduali verso tonalità chiare.

Infine ricordiamo che R420 così come i suoi predecessori, è in grado di eseguire un antialiasing multisampling a sei campioni. Le immagini mostrano chiaramente che la gradualità delle sfumature portano ad una eccellente riduzione dell'aliasing, migliore anche rispetto all'antialiasing 8x di NV40 (che è un ibrido tra Multisampling, Supersampling e Quincunx).

Radeon X800 XT Platinum Edition

r420_nature_noaa_s.jpg (1959 bytes) r420_nature_2x_s.jpg (1967 bytes) r420_nature_4x_s.jpg (1979 bytes) r420_nature_6x_s.jpg (2062 bytes)
no FSAA FSAA 2x FSAA 4x FSAA 6x

GeForce 6800 Ultra

nv40_nature_noaa_s.jpg (2317 bytes) nv40_nature_2x_s.jpg (2303 bytes) nv40_nature_2xq_s.jpg (2254 bytes)
no FSAA FSAA 2x FSAA 2x
quincunx
nv40_nature_4x_s.jpg (2253 bytes) nv40_nature_8x_s.jpg (2264 bytes)
FSAA 4x FSAA 8x

GeForce FX 5950 Ultra

nv38_nature_noaa_s.jpg (2307 bytes) nv38_nature_2x_s.jpg (2300 bytes) nv38_nature_2qx_s.jpg (2306 bytes)
no FSAA FSAA 2x FSAA 2x
quincunx
nv38_nature_4x_s.jpg (2299 bytes) nv38_nature_6x_s.jpg (2320 bytes) nv38_nature_8x_s.jpg (2323 bytes)
FSAA 4x FSAA 6x FSAA 8x

Radeon 9800XT

radeon_nature_noaa_s.jpg (2293 bytes) radeon_nature_2x_s.jpg (2304 bytes) radeon_nature_4x_s.jpg (2299 bytes) radeon_nature_6x_s.jpg (2398 bytes)
no FSAA FSAA 2x FSAA 4x FSAA 6x

Attraverso gli screenshots del frame numero 1669 del 3D Mark 2003 di FutureMark possiamo saggiare su una scena tridimensionale complessa la qualità che ogni modalità di antialiasing dei vari concorrenti è in grado di proporre. In particolare se focalizziamo il nostro sguardo sui particolari più piccoli dell'immagine possiamo trovare evidenti differenze tra un processore grafico e l'altro. Le terminazioni dei rami degli alberi, i contorni delle foglie o anche i fili d'erba sono gli elementi che beneficiano di più della riduzione dell'aliasing e ci permettono di osservare al meglio la correzione gamma di R420 e R360. Con NV40, nonostante la qualità sia superiore a quella offerta da NV38, i rami e i fili d'erba sono più rudi e meno sfumati rispetto ai prodotti canadesi.

Pagina 14 - Analisi qualitativa: Temporal antialiasing

Come già detto precedentemente il Temporal AA è una delle novità introdotte da ATI con l'avvento di R420. In realtà tale funzionalità non fa altro che sfruttare la programmabilità del motore di antialiasing messo a punto dalla casa canadese e che è già disponibile su tutti i chip derivati dall'architettura di R300. Gli attuali driver Catalyst danno già la possibilità di attivare il Temporal AA agendo su alcuni valori del registro di configurazione di Windows. ATI stessa ha confermato che successive versioni dei driver daranno la possibilità di attivare il Temporal AA direttamente dal pannello di controllo. Per facilitarci la vita l'azienda ci ha fornito una piccolissima applet che permette di attivare il Temporal AA attraverso un pulsante.

temporal_pattern_2xPari_s.jpg (3211 bytes) temporal_pattern_2xDis_s.jpg (3213 bytes) temporal_pattern_2xAA_s.jpg (3169 bytes)
pari dispari TAA 2x
temporal_pattern_4xPari_s.jpg (3168 bytes) temporal_pattern_4xDis_s.jpg (3180 bytes) temporal_pattern_4xAA_s.jpg (3150 bytes)
pari dispari TAA 4x
temporal_pattern_6xPari_s.jpg (3143 bytes) temporal_pattern_6xDis_s.jpg (3150 bytes) temporal_pattern_6xAA_s.jpg (3122 bytes)
pari dispari TAA 6x

Valutare l'impatto che ha un antialiasing di tipo temporale è estremamente più difficile rispetto alle tradizionali tecniche fin qui viste. Basandosi sull'applicazione di pattern differenti ai frame pari e a quelli dispari, effettuare uno screenshot di una scena tridimensionale alla quale è applicato il Temporal AA equivale a vedere il risultato che solo un pattern è in grado di offrire. Questo, tuttavia, non è ciò che l'occhio umano percepisce perché il cervello non si accorge della velocissima variazione della distribuzione dei sample da un frame all'altro e pertanto tende a fondere in un'unica immagine ciò che vediamo in più frame. Abbiamo pertanto escogitato una nuova modalità di valutazione dell'antialiasing. L'ultima versione del FSAA Viewer ci consente di fermare l'immagine e di eseguire il rendering di un frame alla volta. Questo ci ha permesso di visualizzare la differente distribuzione dei sample nei frame pari e dispari. Arrivare al risultato percepito dall'occhio è stato abbastanza semplice: basta fondere le due immagini al 50% con l'Adobe Photoshop ed ecco che otteniamo ciò che effettivamente vediamo.

temporal_aa.gif (7919 bytes)

Il Temporal AA 2x nonostante faccia uso soltanto di due sample, varia la distribuzione in modo tale da farci percepire l'equivalente di un AA 4x di tipo RGMS. Il TAA 4x, invece, introduce due nuovi pattern SGMS (Sparse Grid Multi Sampling) che, fusi tra di loro, rendono in maniera equivalente ad un SGMS 8x. Nel caso del TAA 6x il numero di sample percepiti sale a 12, un valore impressionante.

temporal_lwheel_2xPari_s.jpg (2264 bytes) temporal_lwheel_2xDis_s.jpg (2268 bytes) temporal_lwheel_2xAA_s.jpg (2262 bytes)
pari dispari TAA 2x
temporal_lwheel_4xPari_s.jpg (2273 bytes) temporal_lwheel_4xDis_s.jpg (2268 bytes) temporal_lwheel_4xAA_s.jpg (2263 bytes)
pari dispari TAA 4x
temporal_lwheel_6xPari_s.jpg (2273 bytes) temporal_lwheel_6xDis_s.jpg (2267 bytes) temporal_lwheel_6xAA_s.jpg (2266 bytes)
pari dispari TAA 6x

FSAA 2x temporal_o2xAA.jpg (2809 bytes)
FSAA 4x temporal_o4xAA.jpg (2836 bytes)
FSAA 6x temporal_o6xAA.jpg (2751 bytes)

temporal_v2xAA.jpg (2048 bytes) temporal_v4xAA.jpg (1990 bytes) temporal_v6xAA.jpg (1990 bytes)
FSAA 2x FSAA 4x FSAA 6x

Le immagini del FSAA Tester sono state ottenute allo stesso modo: abbiamo prima estrapolato due screenshots corrispondenti alle due distribuzioni che si alternano e successivamente ne abbiamo effettuato il blending. Come potete facilmente notare il TAA 2x corrisponde all'AA 4x classico di R420, mentre le modalità TAA 4x e TAA 6x danno luogo ad un numero di sfumature talmente elevato da rendere difficoltoso il loro conteggio nonostante siano ingrandite del 400%. Purtroppo per mancanza di tempo e per le difficoltà associate a questa tecnologia non siamo stati in grado di fornirvi degli screenshots del TAA con il 3D Mark 2003 o con altri titoli. La difficoltà principale nel realizzare queste immagini consiste nel dover catturare la stessa scena tridimensionale nella sua resa in frame pari e dispari. Nel benchmark di FutureMark, ad esempio, ciò non è possibile perché ogni frame comporta un movimento rispetto a quello precedente.

Le nostre impressioni durante l'uso del Temporal AA sono molto positive. Naturalmente, per godere appieno della sua resa, è necessario ottenere un frame rate piuttosto elevato, pari alla frequenza di refresh del monitor. In caso contrario osservando i bordi poligonali notiamo uno piccolo sfarfallio molto veloce che impedisce all'occhio di localizzare con esattezza l'aliasing. Complessivamente, quindi, la resa è soddisfaciente anche con un numero di fps non troppo elevato.

Pagina 15 - Analisi qualità shader: FP16 vs FP32

All'epoca delle schede NVIDIA TNT2, 3dfx Voodoo3 e Matrox G400 una delle più grande diatribe era "16 bit vs 32 bit". A quel tempo non si parlava ancora di effetti programmabili e calcolo in virgola mobile e pertanto il numero di bit era riferito al calcolo delle varie componenti RGB in intero. A distanza di almeno cinque anni, possiamo dire che la storia si ripete anche se con qualche piccola differenza. Da quando i VS e PS 2.0 hanno introdotto il calcolo in virgola mobile ci sono sempre state molte discussioni su quale fosse lo standard riguardo il numero di bit da utilizzare. ATI ha scelto la via dei 24 bit per componente il che porta ad una precisione totale a 96 bit (24 bit * 3 (RGB) + 24 bit (alpha)). Secondo l'azienda canadese questa modalità offre un buon compromesso tra qualità e velocità. NVIDIA, invece, ha intrapreso una strada più dinamica: 16 bit e 32 bit. Nel caso in cui uno shader non dovesse prevedere calcoli troppo complessi la società americana ritiene che la precisione FP16 sia più che sufficiente. In caso contrario è possibile usare 32 bit per canale per un totale di ben 128 bit.Tuttavia, il problema principale nell'architettura di NV3x è sempre stato che abilitando il calcolo FP32 si assisteva ad un vero e proprio crollo delle prestazioni rispetto alla modalità FP16. Del resto ciò era prevedibile visto che una precisione più elevata richiede un maggiore numero di registri ed una superiore banda passante.

shader_r420_1_s.jpg (1621 bytes) shader_r420_2_s.jpg (1574 bytes)

Radeon R360 - R420

shader_nv38_16_1_s.jpg (1583 bytes) shader_nv38_16_2_s.jpg (1557 bytes) shader_nv38_32_1_s.jpg (1613 bytes) shader_nv38_32_2_s.jpg (1550 bytes)

NV38 - FP16

NV38 - FP32
shader_nv40_16_1_s.jpg (1577 bytes) shader_nv40_16_2_s.jpg (1550 bytes) shader_nv40_32_1_s.jpg (1586 bytes) shader_nv40_32_2_s.jpg (1563 bytes)
NV40 - FP16 NV40 - FP32

Far Cry, uno dei giochi che attualmente può vantare il motore grafico più evoluto, fa ampio uso degli effetti programmabili attraverso VS 2.0 e PS 2.0. Esattamente come fanno la maggioranza dei programmatori di videogames, all'interno di questo titolo sono presenti più pattern di rendering, uno specificatamente ottimizzato per una determinata famiglia di processori grafici. Tale ottimizzazione è necessaria in quanto così facendo è possibile avvalersi al massimo delle capacità dell'hardware. Nel caso delle schede NV3x il percorso di rendering prevede l'uso di shader con precisione di calcolo FP16. Anche se tale precisione è più che sufficiente in molte situazioni, ne esistono alcune in cui i risultati possono non essere qualitativamente identici ad un analogo shader FP32.

Per analizzare la resa delle schede NV3x e NV40 con gli shader di Far Cry abbiamo effettuato due screenshots, entrambi all'inizio della mappa Volcano. In particolare abbiamo prima utilizzato il percorso di rendering predefinito dal gioco (quello ottimizzato FP16) e successivamente abbiamo forzato quello generico (FP32). Per meglio evidenziare i risultati abbiamo zoomato alcune zone degli screenshots.

shader_r420_zoom_1.jpg (6391 bytes)

Radeon R360 - R420

shader_nv38_zoom_2.jpg (33848 bytes)

shader_nv38_32_zoom_2.jpg (6084 bytes)

NV38 - FP16

NV38 - FP32

shader_nv40_16_zoom_2.jpg (5684 bytes) shader_nv40_32_zoom_2.jpg (6060 bytes)
NV40 - FP16 NV40 - FP32

shader_r420_zoom_3.jpg (11700 bytes)

Radeon R360 - R420

shader_nv38_zoom_3.jpg (11686 bytes)

shader_nv38_32_zoom_3.jpg (11813 bytes)

NV38 - FP16

NV38 - FP32

shader_nv40_16_zoom_3.jpg (11295 bytes) shader_nv40_32_zoom_3.jpg (11737 bytes)
NV40 - FP16 NV40 - FP32

shader_r420_zoom_2.jpg (29762 bytes)
Radeon R360 - R420

shader_nv38_zoom_1.jpg (27535 bytes)
NV38 - FP16

shader_nv38_32_zoom_1.jpg (28541 bytes)
NV38 - FP32

shader_nv40_16_zoom_1.jpg (27231 bytes)
NV40 - FP16
shader_nv40_32_zoom_1.jpg (28327 bytes)
NV40 - FP32

Delle schede Radeon 9800 XT, X800 Pro e X800 XT abbiamo riportato solo un'immagine di riferimento in quanto il motore grafico di Far Cry, con questi processori grafici, attiva automaticamente il percorso di rendering generico. Del resto anche forzando le schede canadesi a funzionare con shader FP16, loro eseguono comunque i calcoli con precisione FP24 e, quindi, non ci sono differenze nella resa grafica.

Sia con NV38 che NV40 la qualità dell'immagine con precisione FP16 lascia a desiderare: i materiali che fanno uso della riflessione speculare sono soggetti ad un fastioso effetto banding, non presente nel calcolo FP24 delle GPU ATI. Con FP32 la situazione migliora notevolmente e le immagini diventano uguali (se non leggermente migliori) a quelle FP24. La differenza tra FP16 e FP24 è superiore a quella tra FP24 e FP32 per lo stesso motivo per cui tra un desktop a 8 bit ed uno a 16 bit la differenza è superiore rispetto al confronto tra 16 bit e 32 bit: più si aumenta il numero dei colori e più ci si avvicina al limite in cui l'occhio umano non è più in grado di distinguerli perché il numero di sfumature è troppo elevato.

Secondo le nostre fonti non sono previste modifiche del pattern di rendering di Far Cry con le schede NVIDIA. Infatti, come vedremo successivamente, il motivo della scelta da parte della Croteam di utilizzare la precisione FP16 al posto della FP32 nonostante il degrado qualitativo è legato principalmente alle prestazioni.

Pagina 16 - Benchmark 2D

pcmark_memory.gif (12315 bytes)

pcmark_transparent_windows.gif (7982 bytes)

Quando viene presentata una nuova architettura è sempre utile scoprire se i progressi fatti riguardano solo ed esclusivamente la grafica tridimensionale o anche quella bidimensionale. Nel nostro caso il Radeon X800 XT è risultato essere il più veloce nel test Trasparent Windows del PC Mark 2004. Non possiamo dire altrettanto per quanto riguarda Radeon X800 PRO che, invece, è risultato essere pù lento di tutte le varianti di NV40 considerate. Evidentemente la differenza in termini di accesso alla memoria è particolarmente influente nelle chiamate alla GDI del sistema operativo. Anche nei test relativi a questo aspetto, infatti, la versione pompata di R420 è la migliore. In posizione intermedia collochiamo tutte le altre schede GeForce 6800.

pcmark_riproduzione_video.gif (10089 bytes)

Nei test di riproduzione video le schede video Radeon X800 sono leggermente superiori alla controparte NVIDIA. Indipendentemente dalla versione che prendiamo in considerazione R420 sviluppa un frame rate più elevato sia con il codec WMV che con il DivX. Evidentemente l'occupazione del processore è inferiore rispetto a quella che richiede NV40.

winbench_99.gif (9714 bytes)

I test Graphics Winmark misurano le prestazioni di una scheda video visualizzando una serie di sequenze di utilizzo di alcuni software in ambiente Windows 98/ME. Questi valori sono, quindi, indicativi della velocità con cui un processore grafico disegna la GDI del sistema operativo Microsoft. In questo campo NV40, in tutte le sue versioni, è più veloce delle schede basate su R420: mediamente il vantaggio si attesta attorno ai 40 punti in più.

Pagina 17 - Benchmark sintetici

3dmark_2.gif (10801 bytes)

I test fill rate del 3D Mark 2003 di FutureMark ci svelano la potenza di calcolo delle schede Radeon X800 XT e GeForce 6800 Ultra Extreme. La prima dà il meglio di sè nel multitexturing dove sfonda la barriere dei 7000 Mtexel/s. La seconda, invece, fa segnare 3422,6 Mtexel/s che, a titolo di paragone, è quanto faceva NV38 in multitexturing, impressionante! Leggermente indietro la Radeon X800 Pro rispetto alla GeForce 6800 GT, mentre la versione Ultra si pone a metà strada tra la versione ricca e quella povera di NV40.

3dmark_1.gif (11183 bytes)

Nel test relativo ai pixel shader sembra che NV40 non abbia rivali. La versione Ultra Extreme fa registrare ben 176,6 fps e anche la Ultra e su ottimi livelli. Subito dietro troviamo la Radeon X800 XT, seguita dalla GeForce 6800 GT. Più in basso nella classica la Radeon X800 PRO che, in virtù delle sue 12 pipeline, non è in grado di eseguire lo stesso numero di operazioni dei concorrenti.

Il quadro cambia se consideriamo i vertex shader. Qui R420 ha una marcia in più rispetto a NV40. In particolare la versione XT segna 36,2 fps, mentre la PRO 33,2 fps. E' evidente che i motori di Vertex Shader insieme alle ottimizzazioni nella fase di setup dei triangoli hanno permesso di raggiungere questo risultato.

Pagina 18 - Unreal Tournament 2004

ut_asbestos_1.gif (7430 bytes)

ut_asbestos_2.gif (7573 bytes)

ut_asbestos_3.gif (7490 bytes)

ut_asbestos_4.gif (7932 bytes)

ut_antalus_1.gif (7274 bytes)

ut_antalus_2.gif (7425 bytes)

ut_antalus_3.gif (7799 bytes)

ut_antalus_4.gif (7564 bytes)

Eccellenti i risultati della Radeon X800 XT e delle varianti di NV40 con Unreal Tournament 2004 nella modalità standard alla risoluzione di 1600x1200. Nel momento in cui attiviamo l'antialiasing ed il filtro anisotropico il quadro cambia radicalmente e R420 guadagna un certo vantaggio sulle schede NV40. In particolare la versione XT è la più veloce in tutte le risoluzioni, mentre la PRO, nella mappa Antalus, risale al secondo posto. Solo la GeForce 6800 Ultra Extreme riesce a non farsi sorpassare dalla Radeon X800 PRO nella mappa Asbestos.

Pagina 19 - Far Cry

Riprendiamo in questo paragrafo quanto detto precedentemente riguardo la qualità degli shader FP16 e FP32. Abbiamo eseguito i test di Far Cry con entrambe le modalità e i risultati sono i seguenti.

fc_1.gif (10157 bytes)

fc_2.gif (10273 bytes)

fc_3.gif (10310 bytes)

fc_4.gif (10678 bytes)

fc_5.gif (10193 bytes)

fc_6.gif (10430 bytes)

fc_7.gif (10394 bytes)

fc_8.gif (10235 bytes)

Confrontando Radeon X800 XT con i test in modalità FP16 delle varie schede NV40 vediamo che in Research esiste una parità con la GeForce 6800 Ultra Extreme, mentre nella mappa Volcano la scheda estrema di NVIDIA prende la testa della classifica. La Radeon X800 PRO, invece, è più lenta della GeForce 6800 GT. Nel momento in cui attiviamo la precisione di calcolo a 32 bit i risultati subiscono un notevolmente cambiamento e la Radeon X800 XT prende saldamente la testa del lotto. Anche la Radeon X800 PRO guadagna posizioni e riesce a confrontarsi meglio con la GeForce 6800 GT in modalità FP32.

Pagina 20 - AquaMark 3

aquamark_1.gif (7503 bytes)

aquamark_2.gif (7499 bytes)

aquamark_3.gif (7738 bytes)

aquamark_4.gif (7654 bytes)

aquamark_5.gif (7496 bytes)

L'architettura di NV40 sembra trovarsi decisamente a suo agio con AquaMark 3. Nel rendering classico e alle risoluzioni più basse la scheda più veloce è la GeForce 6800 Ultra Extreme. Solo a 1600x1200 la Radeon X800 XT riesce a sopravanzare la totalità della concorrenza. Discorso analogo se confrontiamo la Radeon X800 PRO con la GeForce 6800 Ultra: solo a 1600x1200 con filtri attivati il chip R420 con 12 pipeline riesce a raggiungere NV40. Eccellente il risultato del Triscore dove la versione più costosa di NV40 sfonda la barriere dei 60000 punti.

Pagina 21 - Splinter Cell

sc_caspian_1.gif (7551 bytes)

sc_caspian_2.gif (7650 bytes)

sc_caspian_3.gif (7578 bytes)

sc_caspian_4.gif (7565 bytes)

sc_ce_1.gif (7662 bytes)

sc_ce_2.gif (7744 bytes)

sc_ce_3.gif (7799 bytes)

sc_ce_4.gif (7790 bytes)

A seconda della mappa che prendiamo in considerazione otteniamo risultati differenti. In Caspian Oil Refinery, la scena meno CPU dipendente, la scheda Radeon X800 XT riesce nella maggioranza dei casi ad essere più veloce della GeForce 6800 Extreme Edition. In The Chinese Embassy, invece, tutte le schede fanno segnare grosso modo lo stesso punteggio con un leggero vantaggio per le varie versioni di NV40. Quest'ultimo è un appunto interessante che ritroveremo anche in altri benchmark: nei casi CPU limited le GeForce 6800 riescono ad esprimersi meglio delle schede Radeo X800. Restringendo il campo alla sola Radeon X800 PRO, purtroppo vediamo che questo prodotto è sempre dietro la GeForce 6800 GT: la presenza di sole 12 pipeline si fa sentire con Splinter Cell.

Pagina 22 - Halo

halo_1.gif (7439 bytes)

halo_2.gif (7494 bytes)

halo_3.gif (7411 bytes)

halo_4.gif (7452 bytes)

Velocissime le GeForce 6800 Ultra Extreme e Ultra senza filtri e alle basse risoluzioni. A 1280x1024 e a 1600x1200, invece, la versione XT Platinium Edition di R420 è la migliore. Anche in questo caso la Radeon X800 PRO non riesce ad essere più veloce della GeForce 6800 GT.

Pagina 23 - Tomb Raider The Angel Of Darkness - X2: The Threat

tr_1.gif (7560 bytes)

tr_2.gif (7446 bytes)

tr_3.gif (7875 bytes)

tr_4.gif (7557 bytes)

Eseguendo i test di Tomb Raider ci sembra di essere tornati al confronto tra R360 e NV38. L'architettura di questo motore grafico, infatti, ha da sempre privilegiato le GPU canadesi. Questa nuova generazione non fa eccezione e il Radeon X800 XT riesce a far segnare ben 65,1 fps a 1600x1200 con antialiasing 4x e filtro anisotropico 8x, imponendosi come soluzione più veloce in questo campo. Molto buoni anche i risultati della Radeon X800 PRO, in alcuni casi al secondo posto dopo la sorella maggiore.

x2_1.gif (7461 bytes)

x2_2.gif (7507 bytes)

x2_3.gif (7440 bytes)

x2_4.gif (7337 bytes)

In X2: The Threat abbiamo avuto problemi di instabilità del sistema con la GeForce 6800 GT, probabilmente dovuti alla immaturità dei driver e del BIOS della scheda stessa. Confrontando gli altri prodotti tra di loro vediamo nuovamente tre volte su quattro al primo posto la Radeon X800 XT. Ricordiamo che R420, esattamente come NV40, è in grado di elaborare 32 pixel per ciclo di clock nel calcolo dello Z-buffer e stencil buffer.

Pagina 24 - Enemy Territory

et_1.gif (7827 bytes)

et_2.gif (7757 bytes)

et_3.gif (7550 bytes)

et_4.gif (7594 bytes)

Enemy Territory è uno di quei titoli che, come detto in precedenza, risultando essere CPU limited tende a preferire le schede NV40. Tuttavia quanto appena detto vale solo senza filtri e a 1024x768. All'aumentare della risoluzione R420 si arrampica sulla classifica posizionandosi al primo posto a 1600x1200.

Pagina 25 - Call Of Duty

cod_1.gif (7782 bytes)

cod_2.gif (7774 bytes)

cod_3.gif (7665 bytes)

cod_4.gif (7557 bytes)

La nostra new entry all'interno del pacchetto benchmark ripropone la stessa situazione vista con Enemy Territory anche se in questo caso i chip canadesi non riescono a superare i concorrenti NV40. E' evidente che l'ottimizzazione dei driver NVIDIA in ambiente OpenGL è tale da saper sfruttare fino all'ultima risorsa hardware anche in presenza di un sistema CPU limited.

Pagina 26 - Analisi antialiasing

aa_1.gif (18143 bytes)

aa_2.gif (18581 bytes)

aa_3.gif (18452 bytes)

aa_4.gif (18904 bytes)

aa_5.gif (18414 bytes)

aa_6.gif (18891 bytes)

Nei test con antialiasing vediamo che le schede Radeon X800 a parità di numero di sample sono indietro al concorrente prodotto NVIDIA. In particolare sia la GeForce 6800 Ultra Extreme che la GeForce 6800 Ultra sono sempre più veloci della Radeon X800 XT. L'antialiasing a sei sample, invece, oltre ad essere qualitativamente migliore è anche più veloce della versione a 8x di NVIDIA. Purtroppo a causa di problemi di instabilità della GeForce 6800 GT non è stato possibile eseguire il confronto con la Radeon X800 PRO.

Da questi test si evince che il vantaggio di R420 visto precedentemente nei benchmark con antialiasing e filtro anisotropico non è dovuto ad una superiore velocità dell'antialiasing, ma come vedremo nel prossimo paragrafo, ad una migliore gestione delle risorse con il filtro anisotropico.

Pagina 27 - Analisi filtraggio anisotropico

anis_1.gif (13957 bytes)

anis_2.gif (14083 bytes)

anis_3.gif (15342 bytes)

anis_4.gif (14349 bytes)

anis_5.gif (14433 bytes)

anis_6.gif (14493 bytes)

Ottime le prestazioni di R420 nei test con il filtro anisotropico. La Radeon X800 XT è la più veloce del lotto ed il suo vantaggio aumenta con l'aumentare della risoluzione. Non delude neanche la Radeon X800 PRO che non è mai troppo lontana dalla GeForce 6800 Ultra Extreme. E' evidente che l'algoritmo messo a punto da ATI è molto efficiente.

Pagina 28 - Conclusioni

I risultati prestazionali emersi nel corso dei nostri test evidenziano un andamento medio piuttosto chiaro: ATI Radeon X800 Platinum Edition e NVIDIA GeForce 6800 Ultra fanno registrare prestazioni velocistiche molto vicine tra di loro, anche se la soluzione ATI pare nel complesso superiore. In particolare, il prodotto canadese mostra un chiaro vantaggio utilizzando filtraggio anisotropico e FSAA alle risoluzioni più elevate.

Tra ATI Radeon X800 PRO e NVIDIA GeForce 6800 GT il risultato è molto più equilibrato, merito principalmente dell'architettura con 16 pipeline di rendering del chip NV40 contro le 12 della scheda ATI. Anche in questo caso, la soluzione ATI si avantaggia abilitando filtraggio anisotropico e FSAA, ma viene distanziata in ambito Open GL, contesto nel quale le architetture NVIDIA hanno da sempre potuto godere di un chiaro margine di vantaggio.

Discorso a parte merita la scheda GeForce 6800 Ultra Extreme. Questo prodotto, facendo un paragone con il mercato dei processori, può essere tranquillamente confrontato con la cpu Intel Pentium 4 Extreme Edition. E' una soluzione di nicchia, che verrà proposta solo da alcuni partner di NVIDIA in soluzioni del tutto particolari; la produzione di queste schede sarà presumibilmente molto limitata, a motivo della difficoltà di ottenere buone rese per i chip NV40 all'elevata frequenza di clock di 450 MHz.
Il clock del chip video superiore permette alla scheda GeForce 6800 Ultra Extreme di far segnare livelli prestazionali estremamente elevati, con un generale allineamento alla soluzione ATI Radeon X800 XT Platinum Edition. A favore di quest'ultima abbiamo però il costo inferiore, benché molto elevato in assoluto, e la superiore disponibilità sul mercato.

Nei commenti alla nostra recensione della scheda GeForce 6800 Ultra, una delle critiche mossa più di frequente al nuovo progetto NVIDIA verteva sui requisiti di sistema. Due connettori di alimentazione Molex da collegare alla scheda, sommati ad un alimentatore di potenza adeguata (NVIDIA suggerisce 480 Watt) mal si combinano a un sistema silenzioso e dalle ridotte dimensioni.
Con le nuove schede GeForce 6800 GT NVIDIA propone una soluzione più "tradizionale", che necessita di un solo molex di alimentazione, fornita di un sistema di raffreddamento single slot e senza particolari requisiti per quanto riguarda l'alimentatore.

ATI ha sempre ricercato, con le ultime generazioni di soluzioni video, la massima compatibilità con tutti i tipi di sistema. Niente requisiti particolari anche per le soluzioni Radeon X800, entrambe capaci di operare stabilmente con un alimentatore da almeno 300 Watt, uno standard per i PC odierni. Il calore generato durante il funzionamento da queste schede è addirittura inferiore a quello della soluzione Radeon 9800 XT, con un sistema di raffreddamento proporzionato e tale da non creare ingombri anomali.

Sul versante qualità ATI ha saputo sorprenderci con una nuova tecnologia di antialiasing che sicuramente farà la felicità di tutti coloro che pretendono contemporaneamente qualità e velocità. Il Temporal AA permette di ottenere immagini con un numero di sample percepito doppio rispetto alle tecniche tradizionali, senza alcun impatto sulle prestazioni.

Anche gli algoritmi alla base del filtri, sia trilineare che anisotropico, nonostante siano stati direttamente derivati dalle precedente generazione di GPU, non sfigurato di fronte alla concorrenza. Il filtro trilineare è sempre eseguito in maniera classica ed ha un’implementazione qualitativamente migliore di quella di NV40 (senza ottimizzazioni). Inoltre, come mostrato dai nostri benchmark, le prestazioni del filtro anisotropico, anche in modalità qualità, sono molto elevate ed il suo impatto rispetto al rendering classico è molto contenuto.

Prevediamo che nei prossimi mesi la diatriba tra Shader model 2.0 vs 3.0 salirà parecchio di livello. Tra ATI e NVIDIA si scontrano due scuole di pensiero molto chiare, con un buon numero di games developer schierati dalla parte dell'uno o dell'altro. Ci pare, onestamente, che questa sia più una guerra di marketing che tecnologica, ma ci sono buone speranze che gli Shader 3.0 possano diventare una realtà concreta in molti titoli, non solo in bellissimi demo tecnologici.

Se con la precedente generazione di schede video NVIDIA ha combattuto mese dopo mese, cercando di colmare l'enorme gap accumulato nei confronti di ATI, il quadro è ora nettamente cambiato. ATI e NVIDIA si scontrano su un piano che non è ancora forse di perfetta parità, ma molto vicino a questa condizione. NV40 e R420 sono soluzioni estremamente potenti: se le schede ATI hanno un margine di vantaggio attuale, quelle NVIDIA necessitano ancora di un notevole sviluppo dal versante driver a fronte dell'architettura completamente nuova. In prospettiva il supporto agli Shader 3.0 può rappresentare un elemento di forza per NVIDIA, ma in un mercato come quello delle schede video 3D nel quale nuovi prodotti si alternano ogni 6 mesi è indispensabile poter sfruttare da subito i vantaggi della tecnologia. Al momento attuale, osservando i titoli a disposizione, non pare che gli Shader 3.0 possano realmente fare la differenza, a breve termine, su quelli 2.0.

Con la scheda Radeon X800 XT Premium Edition ATI è stata capace di raddoppiare, in media, le prestazioni velocistiche della propria precedente top della gamma, modello Radeon 9800 XT. E' questo un risultato la cui portata è forse difficilmente comprensibile e per il quale un esempio può essere d'aiuto: pensate di avere a disposizione, da questo momento, un processore di sistema che è potente esattamente il doppio, in tutte le applicazioni, rispetto a quello che utilizzate in questo momento. Un'eventualità di questo tipo è scenario pressoché irrealizzabile nel mercato delle cpu, ma è quanto ci hanno abituato ad ottenere ogni cambio generazionale sia ATI che NVIDIA. E, a pensarci bene, è un risultato strabiliante.