![]() |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| « Torna all'articolo - Stampa | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Pagina 1 - Introduzione
Lo scorso 14 Aprile NVIDIA ha ufficialmente presentato la prima scheda video basata su progetto NV40, modello GeForce 6800 Ultra, facendo immediatamente dimenticare il fallimentare progetto NV30 grazie alle elevatissime prestazioni e all'elevato contenuto tecnologico. Abbiamo pubblicato in quello stesso giorno una dettagliata analisi della nuova soluzione NVIDIA a questo indirizzo, comprendente sia lo studio delle novità tecnologiche sia l'andamento prestazionale a confronto delle concorrenti. In quello stesso giorno, con un tempismo che non può parere casuale, ATI ha invitato a Toronto un gruppo di giornalisti internazionali per presentare le proprie nuove soluzioni video, quasi a voler distogliere parte dell'attenzione dal proprio concorrente NVIDIA. R420, questo il nome in codice, è la nuova soluzione video di fascia alta che ATI ha presentato in quell'evento e che quest'oggi viene ufficialmente rilasciata nelle schede Radeon X800 XT Platinum Edition e Radeon X800 PRO. Se per la prima scheda, nuova top della gamma, la disponibilità sul mercato è attesa verso le fine di Maggio, per la soluzione X800 PRO ATI inizierà da quest'oggi la distribuzione, quindi sarà possibile acquistare le prime schede già nelle prossime settimane. L'approccio di NVIDIA con il progetto NV40 è stato legato ai risultati ottenuti con le architetture NV3x: necessità di contrastare direttamente ATI sul piano prestazionale, oltre a continuare l'innovazione tecnologica proponendo qualcosa che non si fosse ancora visto nel panorama delle schede video DirectX 9. Da questo sono nate sia le performances assolute di NV40, sia il supporto agli Shader 3.0. ATI, viceversa, deve per molti versi dimostrare poco al mercato. Nel corso del 2002 e soprattutto del 2003 il produttore canadese ha capitalizzato al meglio la bontà architetturale del proprio progetto R300, evolutosi nel corso dei mesi per sprigionare prestazioni superiori ma rimasto in buona sostanza invariato quanto ad architettura. Come verrà spiegato in dettaglio all'interno dell'articolo, l'approccio di ATI non è cambiato rispetto al passato: R420 vanta le medesime caratteristiche architetturali della famiglia di chip R3x0, pur se con notevoli incrementi in termini prestazionali. Shader 2.0 e fp a 24bit: queste le principali caratteristiche dell'architettura R420, mutuate da quella R3x0 e destinate a scatenare molte discussioni tra gli appassionati. Qual è, infatti, l'approccio vincente in termini di qualità, prestazioni e longevità tra ATI e NVIDIA? La risposta non è in nessun modo semplice da dare e richiede un'analisi dettagliata, che cercheremo di fornire in queste pagine.
Pagina 2 - R420: architettura di base La tabella seguente riporta le principali caratteristiche tecniche delle due nuove soluzioni ATI, confrontate con la scheda NVIDIA GeForce 6800 Ultra e con le soluzioni ATI R360 e NVIDIA NV38.
Le due soluzioni ATI R420 si differenziano principalmente per il numero di pipeline di rendering, oltre che per le frequenze di clock di chip e memoria video. La soluzione Radeon X800 XT integra 16 pipeline di rendering, al pari della soluzione concorrente NVIDIA GeForce 6800 Ultra; il chip video opera a 520 MHz di clock, con 256 Mbytes di memoria GDDR3 operante a 1.120 MHz. La scheda Radeon X800PRO integra 12 pipeline di rendering, al pari della scheda GeForce 6800, con frequenza di clock del chip pari a 475 MHz e 256 Mbytes di memoria GDDR3 a 900 MHz di clock. Il chip R420 integra circa 160 milioni di transistor, contro i poco più di 220 milioni del chip NVIDIA NV40. Il processo produttivo è quello a 0.13 micron Low-K introdotto originariamente con le schede Radeon 9600 nel mese di Febbraio 2003, grazie al quale ATI è riuscita a ottenere elevate frequenze di clock per il chip R420 abbinate a requisiti di dissipazione termica che sono allineati, a pieno carico, a quelli della soluzione Radeon 9800XT. In termini di Shader Model, ATI ha seguito un approccio conservativo con i chip R420 mantenendo supporto alle versioni 2.0 di Pixel e Vertex Shader, mentre NVIDIA ha introdotto supporto agli Shader 3.0 quale caratteristica principale dell'architettura NV40 delle schede GeForce 6800. Pur incrementando il numero di istruzioni per shader con il chip R420, l'architettura ATI riprende sostanzialmente quella del chip Radeon 9800XT, ovviamente portandone oltre quanto disponibile i limiti tecnologici del chip. Nel prossimo paragrafo analizzeremo in dettaglio il perché ATI abbia scelto di non supportare gli Shader 3.0 come fatto da NVIDIA.
Le vertex unit sono passate, rispetto al chip Radeon 9800XT, da 4 a 6, con varie migliorie anche al setup engine. L'architettura del chip video, come già segnalato, integra 12 o 16 pipeline di rendering a seconda del modello. L'architettura di R420 è basata su gruppi di 4 pipeline di rendering, così che sia possibile passare alla produzione di differenti versioni di scheda video utilizzando lo stesso chip come base, abilitando il numero di blocchi di 4 pipeline richiesti a seconda delle esigenze produttive. ATI ha confermato che il lock delle pipeline non attivate verrà fatto a livello hardware e non software, come originariamente introdotto con la scheda Radeon 9500 PRO. Per questo motivo non sarà possibile abilitare manualmente le pipeline inutilizzate nel chip R420. Smoothvision, al quale compete la gestione dell'Anti Aliasing, è stato migliorato nell'architettura R420 e altrettanto per Hyper Z. Pagina 3 - Shader 2.0 e 24bit Osservando le caratteristiche tecniche delle due schede ATI Radeon X800, emerge chiaramente come ATI non abbia scelto di integrare supporto agli Shader 3.0, via seguita dalla concorrente NVIDIA con il progetto GeForce 6800. Le motivazioni alla base di questa decisione sono varie, riassumibili nei seguenti punti:
Discorso molto simile viene fatto per la precisione a 24bit: anche in questo caso ATI ha scelto una strada legata alla continuità, basando questo approccio sulla considerazione che con i titoli attuali e quelli in sviluppo per il 2004 l'utilizzo di una precisione a 24bit è tale da non generare differenze qualitative rispetto ad una a 32bit. Le opinioni circa la necessità di Shader 3.0 e supporto ai 32bit è variabile tra i games developer; emergono forti differenze in merito a seconda di quanto la specifica software house sia vicina a uno o all'altro dei produttori tra ATI e NVIDIA. L'approccio di ATI è indubbiamente più "semplice", in termini di complessità architetturale, rispetto a quello di NVIDIA. Quale sia dei due il preferibile è difficile dirlo, ora come ora, in quanto la risposta a questa domanda implica la definizione di alcuni parametri valutativi. Chi spende oltre 500 per una scheda video ricerca, a nostro avviso, un ideale connubio tra qualità d'immagine e pure prestazioni velocistiche. Con queste schede video si vuole poter giocare a qualsiasi titolo alle risoluzioni massime, abilitando filtraggio anisotropico e FSAA in modo tale da garantire la più elevata qualità d'immagine, senza però far scendere i frames al secondo a valori troppo bassi. Se il risultato qualitativo è, con i giochi attualmente a disposizione, identico tra due differenti architetture saranno le superiori prestazioni velocistiche a far propendere verso un prodotto oppure l'altro. Gli Shader model 3.0 sono, indubbiamente, la via verso la quale tutti i produttori di chip video e gli sviluppatori di giochi si sposteranno nei prossimi anni. Resta da capire quanto tempo richiederà questa progressiva migrazione, oltre a quando un'architettura Shader 3.0 permetterà di ottenere significativi vantaggi, prestazionali e qualitativi, su una Shader 2.0. Al momento attuale non pare che il supporto agli Shader 3.0 sia un requisito imprescindibile per un'architettura video top della produzione odierna, ma non è possibile prevedere prima di quando un chip video con supporto hardware agli Shader 3.0 possa guadagnare un sensibile margine, prestazionale e/o qualitativo, su un'architettura simile ma Shader 2.0. Il supporto Shader 2.0 non si è però limitato, nell'architettura ATI R420, a lasciare invariato quanto disponibile con le schede Radeon 9800. Rispetto ai chip R3x0, ATI ha innalzato il numero di istruzioni Pixel Shader eseguibili contemporaneamente, passando da 64 a 512 sia per il n° massimo di vector instructions che di scalar instructions. A questo bisogna sommare l'incremento da 32 a 512 texture instructions processabili contemporaneamente, per un numero complessivo di istruzioni che passa da 160 a 1.536. Questi limiti sono ben superiori a quanto attualmente disponibile con i giochi in commercio. Stando alle dichiarazioni di ATI, infatti, il titolo con shader più complessi in commercio o di prossima introduzione arriva ad un valore prossimo a 40 istruzioni per shader, quindi ben sotto il numero massimo teorico disponibile con architettura R420.
Non è comunque solo il numero di istruzioni processabili a garantire le prestazioni velocistiche. Con il progetto R420 ATI ha focalizzato la propria attenzione sulla necessità di mantenere un'architettura efficiente, in modo tale che i dati vengano processati per quanto possibile in sequenza senza che sorgano evidenti colli di bottiglia. Analizzando l'architettura delle Shader unit, infatti, emerge chiaramente come ATI ricerchi di massimizzare l'occupazione delle 5 ALU (Arithmetic and Logic Unit) integrate in ciascuna Pixel Shader Unit. Le ALU presenti sono 2 ALU 72-bit floating point vector, 2 ALU 24-bit floating point scalar e 1 ALU 96-bit texture address. Se NVIDIA, con NV40, ha voluto proporre nuovi riferimenti in termini di sviluppo, con supporto a Shader 3.0 e a un numero di istruzioni processabili così elevato da poter essere considerato pressoché infinito per gli standard attuali, ATI ha scelto la via della continuità, puntando su una superiore efficienza del percorso di generazione delle scene 3D, limitando al massimo l'insorgere di eventuali colli di bottiglia. Pagina 4 - Memorie GDDR3 Un trend evidenziato sia da NVIDIA con le schede GeForce 6800 che da ATI con le soluzioni Radeon X800 è quello dell'aumentata bandwidth della memoria video. La crescente potenza di calcolo dei chip video, infatti, incontra nella bandwidth della memoria video un forte collo di bottiglia. Oltre ad aumentare le frequenze di clock sino al massimo ottenibile attualmente, ATI e NVIDIA hanno introdotto memorie GDDR3 sulle proprie soluzioni video: GDDR3 rappresenta un'innovazione estremamente importante nel mercato delle schede video di fascia alta, in quanto permette di ottenere un inferiore consumo bilanciato da una frequenza di clock superiore rispetto a DDR 1 e a GDDR2. E' interessante segnalare come sia stata ATI a sviluppare inizialmente e a proporre al JEDEC l'adozione di memorie GDDR3, quale soluzione specificamente pensata per le esigenze delle schede video di fascia più alta. Oltre alle soluzioni ATI Radeon X800, le memorie GDDR3 sono al momento utilizzate da NVIDIA per le schede GeForce 6800 Ultra e per alcuni modelli di schede GeForce FX 5700 Ultra. GDDR3 ha un'architettura completamente differente rispetto a DDR e a GDDR2, come chiaramente mostrato dalla tabella seguente:
Nelle memorie GDDR3 sono state rimosse le terminazioni, in quanto integrate all'interno della memoria: questo ha permesso di diminuire le interferenze e quindi garantire maggiore stabilità a frequenze di lavoro superiori. Rispetto a schede video con memoria DDR e GDDR2, la rimozione delle terminazioni sul PCB della scheda ha portato all'eliminazione della relativa circuiteria di alimentazione, con un'ulteriore semplificazione a livello di layout. In termini di consumo, le memorie GDDR3 permettono di contenere l'utilizzo di corrente rispetto alle memorie GDDR2. Questo si rende molto utile sia in ambiente mobile, dove l'ottimizzazione del consumo è fondamentale per la durata delle batterie, sia in quello desktop, dove un consumo inferiore ha un riflesso diretto sui requisiti di dissipazione termica delle schede.
Osservando la scheda Radeon X800 XT Platinum Edition si nota immediatamente come le memorie GDDR3 abbiano requisiti nettamente inferiori, in termini di dissipazione termica, rispetto ai moduli DDR e GDDR2. Nella parte posteriore della scheda sono presenti vari chip memoria, sprovvisti di sistemi di raffreddamento di alcun tipo: nella scheda Radeon 9800XT ATI aveva scelto di raffreddare i chip memoria con una placca di rame.
Il memory controller integrato nel chip R420 è di tipo a 256bit, diviso in 4 blocchi da 64bit ciascuno. Ognuno dei 4 sub memory controller può agire indipendentemente rispetto agli altri, leggendo e scrivendo dati nella memoria così da massimizzare l'efficienza quando piccoli pacchetti di dati devono essere utilizzati da o verso la memoria video.
Grazie alla forte presenza all'interno del JEDEC, ATI sta ponendo le premesse per lo sviluppo della prossima generazione di memorie video: GGR4. Queste memorie introdurranno innovazioni in termini di risparmio energetico e di consumo, oltre a permettere di ottenere frequenze di clock stimate a 1,4 GHz di clock (2,8 GHz effettivi). Non è comunque previsto che GDDR4 potrà entrare in commercio prima di almeno 1 anno e mezzo. Pagina 5 - 3Dc: come utilizzare al meglio le normal map Come già segnalato in precedenza, la bandwidth della memoria riveste un'importanza fondamentale con le più recenti architetture video. Questo spiega per quale motivo sia ATI che NVIDIA abbiano scelto le più veloci memorie GDDR3 attualmente disponibili in commercio, in abbinamento alle proprie nuove schede video top della gamma. Non solo la bandwidth, ma anche il quantitativo di memoria video montato sulla scheda può rappresentare un collo di bottiglia alle prestazioni. Se, infatti, i complessi e ricchi scenari 3D richiedono varie tecniche per poter essere rappresentati al meglio, questo implica il caricamento nella memoria della scheda video di un quantitativo sempre crescente d'informazioni. Vi sono alcune situazioni nelle quali anche 256 Mbytes di memoria video possono non bastare, con la diretta conseguenza di causare un rallentamento nell'esecuzione dei calcoli che portano alla generazione di una scena 3D.
ATI ha evidenziato che questo fenomeno è ancor più presente qualora vengano applicate le normal map. Questa tecnica, molto utilizzata dai games developer, permette di ottenere un superiore dettaglio degli oggetti 3D, soprattutto se ricchi di sfaccettature e particolari quali il volto di un personaggio in primo piano, riducendo il numero di poligoni utilizzati per generare l'oggetto. Se, ad esempio, per rappresentare al meglio il viso di un personaggio 3D venissero richiesti circa 15.000 poligoni, servendosi delle normal map la stessa operazione necessita di un quantitativo nettamente inferiore di poligoni, ottenendo un livello di dettaglio finale pressoché identico.
Come operano le normal map? Ad un oggetto 3D costruito con pochi poligoni viene applicata una normal map, ottenuta come differenza tra la rappresentazione dell'oggetto con un elevato numero di poligoni (nell'esempio precedente, 15.000) e una con pochi poligoni (1.000). I differenti colori applicati alla normal map indicano le direzioni delle normali. Quando l'oggetto dev'essere generato a video sul modello con pochi poligoni, elaborato in real time, viene applicata la normal map in abbinamento alle informazioni sull'illuminazione della scena, utilizzando i pixel shader. Il risultato che si ottiene è un oggetto che per livello qualitativo si avvicina moltissimo a quello originario, con molti poligoni. Perché le normal map vengono utilizzate in modo limitato all'interno dei giochi, pur essendo un valido strumento per bilanciare precisione negli oggetti e numero di poligoni? Per un semplice problema d'ingombri. Le normal map devono essere caricate all'interno della memoria della scheda video e questo implica l'utilizzo di un ampio quantitativo di memoria. Qualora la memoria disponibile venga tutta saturata si otterrebbe un impatto negativo sulle prestazioni tale da pregiudicare il risultato finale. Per risolvere questo problema si può ricorrere a tecniche di compressione delle normal map, al pari di quanto avviene per le textures. Le tradizionali tecniche di compressione, come quella DXTC o S3TC, non permettono di ottenere un risultato qualitativamente valido. Nella compressione delle normal map, infatti, queste tecniche portano alla generazione di scalettature assolutamente poco gradevoli, che vanificano il beneficio qualitativo dato dall'utilizzo delle normal map. Per ovviare a questo problema ATI ha sviluppato un particolare algoritmo di compressione, chiamato 3Dc, specificamente pensato per comprimere le normal map senza ottenere penalizzazioni dal punto di vista qualitativo.
Utilizzando 3Dc ATI permette di ottenere un rapporto di compressione pari a 4:1 nell'utilizzo delle normal map. Questo ha due possibili riflessi:
Alcune software house hanno già confermato l'uso del 3Dc nei loro prossimi titoli: Valve per Half-Life 2, Firaxis per Pirates!, Croateam per Serious Sam 2, Irritational Games per Tribes Vengeance e Digital Extremes per darkSector. Pagina 6 - Temporal Anti Aliasing L'evoluzione delle tecniche di Anti Aliasing è uno dei temi che periodicamente viene sviluppato dai produttori di chip video per innovare le proprie soluzioni e proporre un superiore realismo dell'immagine. Per il chip R420 ATI non ha sostanzialmente cambiato l'approccio all'Anti Aliasing ma introdotto una nuova modalità, chiamata Temporal Anti Aliasing. Il Temporal AA opera su un principio molto semplice: ad ogni frame vengono alternati due distinti pattern di anti aliasing predefiniti, ottenendo come risultato un immagine che appare come se abbia il doppio di samples per pixel di quelli che vengono realmente applicati, con l'effetto di ottenere un risultato che visivamente appare indistinguibile rispetto ad un tradizionale pattern di Anti Aliasing superiore. Il Temporal AA 2x, quindi, ha un risultato che qualitativamente appare indistinguibile a un Anti Aliasing 4x tradizionale. Se il frame rate si mantiene sopra un minimo di almeno 25, l'occhio umano tende a non distinguere i due frames generati e a non notarne la generazione sullo schermo. La persistenza dell'immagine sulla retina dell'occhio fa si che due frames sequenziali, quando il frame rate si avvicina alla frequenza di refresh del monitor, vengano percepiti come se fossero uno solo e questo genera l'effetto di temporal anti aliasing.
Lo schema di funzionamento del Temporal Anti Aliasing mostra chiaramente come il risultato ottenibile sia qualitativamente pressoché identico a quello di un tradizionale Anti Aliasing di modalità superiore, con l'innegabile vantaggio di una superiore velocità di esecuzione rispetto al tradizionale FSAA. Alcune note su Temporal Anti-Aliasing:
Pagina 7 - Le schede
Le due reference board ATI Radeon X800 appaiono, ad un'analisi esteriore, esattamente identiche l'una rispetto all'altra, distonguibili solo grazie all'etichetta apposta sul dissipatore di calore del modello XT. Il sistema di raffreddamento utilizzato è identico, estremamente simile a quello montato sulle schede Radeon 9800XT e quindi tale da permettere il montaggio di una scheda PCI nello Slot adiacente a quello AGP. Sulla destra si nota un connettore di colore giallo, simile ai connettori audio integrati sul PCB delle schede madri. ATI ci ha confermato che è un connettore che è stato montato solo sulle reference board per uso interno e che non sarà presente nelle schede destinate alla produzione.
Posteriormente non sono evidenziabili differenze tra la due schede ATI, basate sul medesimo PCB. Il quantitativo di memoria GDDR3 è pari a 256 Mbytes per entrambe le schede, con chip che non necessitano di un sistema di raffreddamento passivo per operare correttamente. Da segnalare anche il chip ATI Rage Theatre, al quale compete la gestione delle funzionalità video unitamente alla parte di video shader integrata nel chip R420. ATI ha fornito i risultati di alcuni test con i quali è stato misurato il consumo delle due schede R420. La soluzione Radeon X800 PRO ha consumato un massimo di 58 Watt in media, mentre la scheda Radeon X800 XT Platinum Edition ha raggiunto un valore di 76 Watt. Questi risultati spiegano per quale motivo i requisiti di dissipazione termica delle schede Radeon X800 siano pressoché identici a quelli della precedente top della gamma ATI, Radeon 9800XT. In alto: Radeon X800 PRO. In basso: Radeon 9800XT. Le dimensioni delle due schede sono identiche, mentre per la componentistica superficiale si notano numerose somiglianze: l'ausilio delle GDDR3 ha permesso ad ATI di semplificare il design elettronico rimuovendo numerosi condensatori e filtri passa basso.
Le due schede Radeon X800 utilizzano memorie GDDR3, ma i chip utilizzati sono differenti: per la scheda Radeon X800 XT Platinum Edition sono marchiati GC16, mentre per la scheda Radeon X800 PRO la sigla utilizzata è quella CG20. Le sigle alla destra della scritta Samsung sono le settimane produttive dei chip, non i tempi di accesso. Una volta rimosso il dissipatore di calore è possibile accedere al Core del chip video. Il package esterno è molto simile a quello delle soluzioni R3x0 utilizzate nelle precedenti versioni di schede Radeon anche se si nota la notevole superficie complessiva del Core dovuta ai ben 160 milioni di transistor. L'ultima immagine permette di apprezzare un particolare del sistema di raffreddamento: la placca in alluminio che circonda il Core del chip video non appoggia direttamente sul dissipatore, mentre è il chip R420 ad essere posizionato direttamente a contatto del dissipatore di calore. Pagina 8 - Ingombro e rumore: aspetti importanti per ATI Uno degli elementi più importanti per ATI con la famiglia Radeon 9800, da un punto di vista marketing, è stata la possibilità di proporre queste schede in abbinamento a sistemi Mini-PC Barebone. Oltre a questo, le soluzioni ATI non hanno mai creato problemi in termini di spazio all'interno del Case, occupando solo l'area dello Slot AGP 8x già con il reference design ATI. I requisiti in termini di alimentazione sono sempre rimasti all'interno di quello che è indicabile come norma, quindi un connettore Molex (identico a quello di un hard disk o di un lettore ottico) per alimentare direttamente la scheda e un alimentatore ATX da almeno 300 Watt, uno standard per un PC di recente costruzione. ATI ha scelto, con il progetto Radeon X800, di seguire il medesimo trend. Le due schede R420 richiedono di essere alimentate con un tradizionale connettore Molex a 4 pin, in abbinamento ad un tradizionale alimentatore ATX. Le dimensioni complessive e il sistema di raffreddamento permettono di utilizzare queste schede anche in sistemi Mini-PC Barebone, senza particolari requisiti in termini di raffreddamento.
A questo risultati si è giunti grazie principalmente a due elementi: le memorie GDDR3, capaci di operare con un consumo più ridotto rispetto a quelle DDR e GDDR2, e i vantaggi del processo produttivo 0.13 micron Low-K utilizzato per il chip R420. L'approccio di NVIDIA con le schede NV40 è completamente all'opposto: il desing richiede di utilizzare anche l'area corrispondente allo Slot PCI adiacente a quello AGP 8x, con 2 Molex di alimentazione che devono essere utilizzati per alimentare la scheda e un alimentatore ATX che è consigliato sia da 480 Watt. Al momento, inoltre, non pare possibile utilizzare schede GeForce 6800 Ultra all'interno di sistemi Barebone quali i popolari Shuttle. Pagina 9 - NVIDIA al contrattacco: le nuove schede GeForce 6800 Lo scorso 14 Aprile NVIDIA ha presentato ufficialmente le proprie schede video basate su architettura NV40. A questo indirizzo abbiamo pubblicato la recensione della soluzione GeForce 6800 Ultra, la prima scheda video NV40 disponibile per i test. In concomitanza con il debutto delle soluzioni ATI Radeon X800, NVIDIA introduce due nuove schede video nella famiglia di prodotti GeForce 6800. La prima è il modello GeForce 6800 Ultra Extreme, versione evoluta della scheda GeForce 6800 Ultra dalla quale differisce per la frequenza di clock del chip NV40, aumentata sino a 450 MHz. La seconda scheda è il modello GeForce 6800 GT, dotata sempre di 256 Mbytes di memoria video GDDR3 operante però a 1 GHz di clock, con chip video NV40 a clock di 350 MHz. La scheda GeForce 6800 Ultra Extreme viene proposta quale soluzione top della gamma, prodotta in un limitato numero di esemplari e specificamente pensata per serie limitate, per produttori quali Gainward, magari abbinate a particolari soluzioni di raffreddamento. Il costo di questa scheda non è stato ancora ufficialmente comunicato ma sarà presumibilmente prossimo a 600 dollari. La scheda GeForce 6800 GT, viceversa, viene posizionata ad un prezzo di 399 dollari, a metà strada quindi tra i 499 dollari della versione GeForce 6800 Ultra e i 299 dollari della scheda GeForce 6800 liscia. Di quest'ultima soluzione mancano al momento attuale i sample, quindi non è dato sapere come si comporti l'architettura NVIDIA NV40 in abbinamento a 12 pipeline di rendering. La tabella seguente riporta le caratteristiche tecniche delle schede video appartenenti alla famiglia GeForce 6800:
Il connettore di alimentazione della scheda GeForce 6800 GT è di tipo single Molex; sul PCB si nota chiaramente la predisposizione per il secondo Molex, caratteristica che fa immediatamente capire come il PCB di questa scheda sia identico a quello delle versioni Ultra e Ultra Extreme. La scheda 6800 GT ha sistema di raffreddamento single slot, come si nota chiaramente dalle immagini; questa scelta, assieme agli inferiori requisiti in termini di alimentazione, rende indubbiamente più semplice poter utilizzare questa scheda nella maggior parte dei sistemi in commercio. La scheda GeForce 6800 Ultra Extreme riprende il design della soluzione 6800 Ultra, dalla quale differisce del resto solo per la superiore frequenza di clock del chip video NV40.
La memoria montata sulla scheda GeForce 6800 GT opera a 500 MHz di clock (1 GHz effettivo), mentre quella della soluzione GeForce 6800 Ultra Extreme ha la medesima frequenza di lavoro della soluzione GeForce 6800 Ultra, quindi 550 MH z(1,1 GHz). Sulla parte posteriore di entrambe le schede sono etichettate le specifiche delle memorie Samsung utilizzate. Pagina 10 - Configurazione di prova
PC Mark 2004 Tale benchmark è stato sviluppato da FutureMark per testare la bontà di molteplici componenti di un personal computer. Nel nostro caso è stato usato per valutare la velocità di una scheda video nel gestire la GDI di Windows e la riproduzione di file video WMV e DivX. Inoltre i test sulla memoria permettono di rilevare lefficienza dellintero sistema CPU-Chipset-AGP-GPU. WinBench 99 2.0 Questo storico programma marcato Ziff-Davids valuta le prestazioni del sistema testando vari tipi di utilizzo. Nella valutazione della velocità di un acceleratore grafico nel gestire le applicazioni Windows, sono stati eseguiti i pacchetti Business Graphics WinMark e High-End Graphics WinMark. Il primo riproduce sequenze di Corel WordPerfect Suite, Lotus SmartSuite e Office, mentre il secondo di FrontPage, Microstation, Photoshop, Premiere, ecc 3DMark 2003 Si tratta del famoso e diffuso benchmark sintetico sviluppato da FutureMark. Nonostante il suo obbiettivo sia quello di valutare le prestazioni di una scheda video in ambito DirectX 9, in questo articolo non verrà utilizzato per questa finalità bensì per raccogliere alcune informazioni utili riguardo larchitettura di un chip grafico. Abbiamo pertanto fatto partire solo i test relativi al Fill Rate, ai Vertex Shader ed ai Pixel Shader 2.0. I risultati che abbiamo ottenuto sono quindi da intendere solo come elementi di studio e non di valutazione. Far Cry Far Cry è il più recente titolo del nostro pacchetto benchmark che fa uso dell'innovativo motore grafico CryENGINE dei Crytek Studios. Massiccio è l'uso dei Vertex e Pixel Shader, in parte anche in versione 3.0, per realizzare effetti grafici come il riflesso sull'acqua, il bump mapping e le soft shadows. Due sono le mappe utilizzate: Research e Volcano. La prima è caratterizzata da ampi spazi aperti e effetti atmosferici, mentre la seconda è al chiuso e mette meglio in evidenza il bump mapping e la tecnologia Polybump per il rendering dei personaggi. Il gioco è stato aggiornato con la patch in versione 1.1. AquaMark 3 AquaMark 3 è sviluppato dalla Massive Development, una software house famosa nel mercato dei videogames per i titoli AquaNox e AquaNox 2. Questo benchmark è basato sul motore grafico Krass Engine di AquaNox 2 che possiede alcune caratteristiche molto interessanti tra cui luso dei Pixel Shader 2.0. Splinter Cell Realizzato dalla UbiSoft e dotato di una versione pesantemente revisionata dellUnreal Engine, questo videogames è utilizzato in modalità timedemo per valutare le prestazioni di una scheda video. Le due demo utilizzate sono state registrate nelle mappe The Caspian Oil Refinery e The Chinese Embassy. La prima rappresenta una situazione si gioco abbastanza anomala con un overdraw praticamente nullo e valuta luso dei Pixel Shader 1.1. La seconda è più realistica a livello di gameplay, ma usa meno effetti programmabili. Halo E uno dei giochi presenti al lancio di X-Box, la console di Microsoft, ed ha letteralmente sbancato i botteghini per la sua grafica e la sua giocabilità. La versione per PC, approdata solo da poco sugli scaffali dei negozianti, nonostante sia un semplice riadattamento (ricordo che X-Box ha la struttura di un PC ed un processore grafico molto simile al GeForce 4 Titanium) sfrutta i Pixel Shader 2.0 per realizzare gli effetti dei Pixel Shader 1.1 in un minor numero di passate di rendering. Tomb Raider: The Angel Of Darkness Lultimo capitolo della serie che vede protagonista Lara Croft è uno dei giochi più avanzati dal punto di vista grafico. Spicca un pesante uso di effetti come il Bump Mapping, le ombre ed il Depth Of Field (messa a fuoco di particolare zone dello schermo), il tutto rigorosamente realizzato in Pixel Shader 2.0. X2: The Threat Anche in questo caso ci troviamo di fronte ad un titolo DirectX 9 anche se la maggioranza degli effetti sono realizzati in Pixel Shader 1.4. Tra le funzionalità più interessanti che vengono sfruttate di una scheda video ritroviamo il DOT3 Bump Mapping e le Stencil Shadow. Il benchmark è una rolling demo, cioè unanimazione non interattiva che mostra alcune parti del gioco. Unreal Tournament 2004 Basato su una versione rivista e aggiornata del motore grafico di Unreal Tournament 2003, questo titolo è uno dei più diffusi a livello di multiplayer gaming. Tra le caratteristiche più interessanti troviamo luso del T&L e del Bump Mapping. Quasi del tutto assenti invece i Vertex ed i Pixel Shader. Le due mappe prese in considerazione sono Antalus ed Asbestos. La prima è girata in spazi aperti molto vasti, mentre la seconda è al chiuso in un ambiente più claustrofobico. Wolfenstein: Enemy Territory Espansione di Return To Castle Wolfenstein, basato sul motore grafico di Quake III Arena, questo sparatutto non fa uso di nessuna delle funzionalità programmabili di una scheda video. Nonostante questo la demo da noi utilizzata è risultata essere piuttosto pesante perché ricca di overdraw e di effetti grafici. Si tratta a nostro avviso di uno dei pochi benchmark OpenGL attendibili rimasti. Call Of Duty Call Of Duty è la nostra seconda scelta in ambiente OpenGL. Esattamente come Return To Castle Wolfenstein, è basato sul motore grafico di Quake III Arena anche se in questo caso si tratta di una versione pesantemente rivisitata: è stato aggiunto il supporto per i Vertex e Pixel Shader. La demo da noi usata per i test si chiama "Dawnville" ed è disponibile installando la patch versione 1.3. Pagina 11 - Analisi qualitativa: filtro anisotropico Il filtro anisotropico è una delle caratteristiche più attivate dai videogiocatori. La sua capacità di aumentare drasticamente la qualità delle texture permette di sfruttare al massimo i titoli più recenti, dotati di un numero sempre più elevato di texture ad alta risoluzione. L'immagine che meglio esplica la tipologia e la resa di una tecnologia di filtro anisotropico è rappresentata da una texture a scacchiera, in bianco e nero. L'occhio umano, infatti, in questo caso riesce a scorgere con molta facilità la differenza tra un'implementazione e l'altra grazie al forte distacco cromatico che contraddistingue questo tipo di immagine. Il Texture Filtering, un programma OpenGL distribuito gratuitamente, ci permette di riproporre una scena tridimensionale rappresentata da un cilindro, visto dall'interno e tappezzato da un motivo a scacchiera. Inoltre, per facilitare ulteriormente la valutazione, vengono visualizzate attraverso bande colorate i vari livelli di mipmapping, cioè i livelli di dettaglio (LOD) delle texture. La banda rossa rappresenta il primo LOD a risoluzione inferiore rispetto a quella originale delle texture: più questo sarà vicino (al bordo dell'immagine), più la qualità sarà degradata. Radeon X800 XT Platinum Edition
GeForce 6800 Ultra Filtro trilineare Filtro anisotropico 2x Filtro anisotropico 4x Filtro anisotropico 8x Filtro anisotropico 16x GeForce FX 5950 Ultra Filtro trilineare Filtro anisotropico 2x Filtro anisotropico 4x Filtro anisotropico 8x Radeon 9800XT
Nella documentazione relativa alla qualità dell'immagine di R420, ATI ha sottolineato più di una volta che i suoi processori grafici eseguono sempre il filtro trilineare puro sia con anisotropico disattivato che con anisotropico in modalità qualità. Questa precisazione è ovviamente riferita alla "ottimizzazione trilineare", definita simpaticamente anche "brilinear filtering", introdotta da NVIDIA nei driver ForceWare di NV40. Abbiamo effettuato alcuni confronti e, come potete vedere, la differenza in termini di implementazione tra la modalità qualità e la modalità qualità senza ottimizzazione è notevole, anche nel semplice filtro trilineare: le transizioni da un livello di dettaglio all'altro sono molto più morbide. Indipendentemente dal numero di sample, con NV40, disattivando l'ottimizzazione trilineare, le immagini diventano estremamente simili a quelle di R420 e R360 in modalità qualità. Resta una piccola diversità nel filtro trilineare puro: il GeForce 6800 lo esegue con una resa leggermente inferiore specie alle angolazioni di 45°, 135°, 225° e 315°. La modalità qualità di ATI, quindi, è perfettamente comparabile con l'omonima modalità di NV40 con ottimizzazione trilineare disattivata. Selezionando "prestazioni", invece, R420 propone un filtro anisotropico senza alcun tipo di filtraggio tra una transizione e l'altra (anche chiamato LINEAR MIPMAP NEAREST), analogo all'impostazione "high performance" del GeForce 6800, anche se leggermente inferiore in termini di resa visto che la riduzione dell'adattabilità per il chip NVIDIA produce un risultato migliore. Radeon X800 XT Platinum Edition GeForce 6800 Ultra GeForce FX 5950 Ultra Radeon 9800XT Purtroppo l'ottimizzazione trilineare è un'opzione che ha influenza solo in ambiente OpenGL. Anche disattivandola, in Direct 3D la resa non subisce cambiamenti e ripropone il brilinear filtering. Per questo motivo non ci è stato possibile valutare l'impatto sulla qualità del filtro anisotropico senza ottimizzazione trilineare con il 3D Mark 2003 di FutureMark. Pagina 12 - Analisi qualitativa: antialiasing L'antialiasing è una delle caratteristiche maggiormente ricercate dagli acquirenti delle più potenti schede video di ultima generazione. La sua capacità di aumentare la qualità dell'immagine riducendo il fastidioso artefatto grafico noto anche come aliasing (le scalettature presenti ai bordi poligonali) è fondamentale per assicurare il massimo realismo della scena tridimensionale, specie alle risoluzioni meno elevate (cioè quelle in cui l'aliasing è più evidente). Per valutare l'implementazione dell'antialiasing che ATI ha adottato con R420 abbiamo utilizzato gli stessi strumenti già visti in altre recensioni: il FSAA Viewer ed il FSAA Tester. Il primo visualizza la distribuzione dei sample, cioè la posizione dei campioni usati per il calcolo del colore finale del pixel. Il secondo, invece, disegna una scena tridimensionale caratterizzata da una serie di raggi disposti sia su superficie chiara che scura. In questo modo è possibile valutare l'effettiva riduzione dell'aliasing a diverse angolazioni dei contorni poligonali sia in scene contraddistinte da ambietazioni cupe che in quelle più luminose. Radeon X800 XT Platinum Edition GeForce 6800 Ultra GeForce FX 5950 Ultra
Radeon 9800XT Come già detto all'interno della descrizione tecnica di R420, ATI non ha introdotto novità dal punto di vista dell'antialiasing. In realtà una novità esiste e consiste in una nuova modalità denominata Temporal AA di cui parleremo successivamente. Il pannello di controllo delle schede Radeon X800 Pro e X800 XT, nella versione beta dei Catalyst da noi utilizzata, è del tutto identico a quello di tutte le schede video basate su processori grafici R3x0 e RV3x0. Pertanto è possibile scegliere tra due, quattro o sei sample. In tutti i casi parliamo di un antialiasing di tipo Multisampling gamme corrected. Il FSAA Viewer ci svela che a livello di distribuzione dei sample nulla è stato cambiato in R420. L'antialiasing 4x è un RGMS (Rotated Grid Multi Sampling), mentre scegliendo sei sample si ottiene un SGMS (Sparse Grid Multi Sampling) proprietario di ATI e basato su un pattern con distribuzione pseudo-random che, come già ampiamente dimostrato con la precedente generazione di processori grafici, permette di ottenere un ottimo grado di riduzione dell'aliasing. Pagina 13 - Analisi qualitativa: confronto antialiasing In questa parte dell'articolo ci occupiamo di analizzare in dettaglio la resa delle varie modalità di antialiasing. Per far ciò abbiamo utilizzato l'Adobe Photoshop 6. In particolare abbiamo selezionato due zone degli screenshots ottenuti con il FSAA Tester, una che esalta l'applicazione dell'antialiasing ai contorni poligonali posti in orizzontale e l'altra a quelli posti in verticale. Le selezioni sono state successivamente ingrandite del 400% disattivando l'applicazione di qualsiasi filtro di smussamento (niente bilineare o bicubico). Il risultato sono le seguenti immagini. Radeon X800 XT Platinum Edition
GeForce 6800 Ultra
GeForce FX 5950 Ultra
Radeon 9800XT
Radeon X800 XT Platinum Edition
GeForce 6800 Ultra
GeForce FX 5950 Ultra
Radeon 9800XT
Trovandoci di fronte alla medesima implementazione dell'antialiasing tutte le considerazioni fatte nella recensione della GeForce 6800 Ultra valgono anche in questa sede. NVIDIA con il RGMS di NV40 ha compiuto un indubbio passo in avanti rispetto a ciò che abbiamo visto con le schede GeForce FX. Un pattern ruotato tende a sfumare meglio i contorni poligonali verticali ed orizzontali rispetto ad un ordinato (OGMS - Ordered Grid Multi Sampling). Sia R420 che NV40 implementano la stessa modalità di calcolo dell'antialiasing a quattro campioni anche se esistono due differenze. La prima è nel numero di gradi della rotazione che, anche se molto ridotta, può privilegiare la scelta di una delle due aziende a determinate angolazioni e penalizzarla in altre. La seconda, decisamente più importante dal punto di vista della resa, è l'elaborazione del colore.
Con l'introduzione di R300 ATI ha presentato un antialiasing che aveva una caratteristica innovativa: la correzione gamma. Ruotare la distribuzione dei sample, infatti, non fu un'esclusiva visto che è stata implementata in hardware per prima da 3dfx con il suo VSA-100. Lo stesso dicasi per il multisampling, già visto con NVIDIA a partire dalle schede GeForce 3. La correzione gamma non è altro che una modifica del colore dei sub-pixel (cioè i sample). Quando questi devono essere fusi i chip R3x0, RV3x0 e R420 rielaborano il colore tenendo presente della sua percezione da parte dell'occhio umano attraverso un monitor CRT. Il risultato è evidente: sia con NV40 che con R420 sono ben visibili tre sfumature in modalità 4x, sia in verticale che in orizzontale. Con il GeForce 6800 Ultra queste sfumature sono nette e scure, mentre con i chip canadesi sono più graduali verso tonalità chiare. Infine ricordiamo che R420 così come i suoi predecessori, è in grado di eseguire un antialiasing multisampling a sei campioni. Le immagini mostrano chiaramente che la gradualità delle sfumature portano ad una eccellente riduzione dell'aliasing, migliore anche rispetto all'antialiasing 8x di NV40 (che è un ibrido tra Multisampling, Supersampling e Quincunx). Radeon X800 XT Platinum Edition GeForce 6800 Ultra GeForce FX 5950 Ultra Radeon 9800XT Attraverso gli screenshots del frame numero 1669 del 3D Mark 2003 di FutureMark possiamo saggiare su una scena tridimensionale complessa la qualità che ogni modalità di antialiasing dei vari concorrenti è in grado di proporre. In particolare se focalizziamo il nostro sguardo sui particolari più piccoli dell'immagine possiamo trovare evidenti differenze tra un processore grafico e l'altro. Le terminazioni dei rami degli alberi, i contorni delle foglie o anche i fili d'erba sono gli elementi che beneficiano di più della riduzione dell'aliasing e ci permettono di osservare al meglio la correzione gamma di R420 e R360. Con NV40, nonostante la qualità sia superiore a quella offerta da NV38, i rami e i fili d'erba sono più rudi e meno sfumati rispetto ai prodotti canadesi. Pagina 14 - Analisi qualitativa: Temporal antialiasing Come già detto precedentemente il Temporal AA è una delle novità introdotte da ATI con l'avvento di R420. In realtà tale funzionalità non fa altro che sfruttare la programmabilità del motore di antialiasing messo a punto dalla casa canadese e che è già disponibile su tutti i chip derivati dall'architettura di R300. Gli attuali driver Catalyst danno già la possibilità di attivare il Temporal AA agendo su alcuni valori del registro di configurazione di Windows. ATI stessa ha confermato che successive versioni dei driver daranno la possibilità di attivare il Temporal AA direttamente dal pannello di controllo. Per facilitarci la vita l'azienda ci ha fornito una piccolissima applet che permette di attivare il Temporal AA attraverso un pulsante. Valutare l'impatto che ha un antialiasing di tipo temporale è estremamente più difficile rispetto alle tradizionali tecniche fin qui viste. Basandosi sull'applicazione di pattern differenti ai frame pari e a quelli dispari, effettuare uno screenshot di una scena tridimensionale alla quale è applicato il Temporal AA equivale a vedere il risultato che solo un pattern è in grado di offrire. Questo, tuttavia, non è ciò che l'occhio umano percepisce perché il cervello non si accorge della velocissima variazione della distribuzione dei sample da un frame all'altro e pertanto tende a fondere in un'unica immagine ciò che vediamo in più frame. Abbiamo pertanto escogitato una nuova modalità di valutazione dell'antialiasing. L'ultima versione del FSAA Viewer ci consente di fermare l'immagine e di eseguire il rendering di un frame alla volta. Questo ci ha permesso di visualizzare la differente distribuzione dei sample nei frame pari e dispari. Arrivare al risultato percepito dall'occhio è stato abbastanza semplice: basta fondere le due immagini al 50% con l'Adobe Photoshop ed ecco che otteniamo ciò che effettivamente vediamo.
Il Temporal AA 2x nonostante faccia uso soltanto di due sample, varia la distribuzione in modo tale da farci percepire l'equivalente di un AA 4x di tipo RGMS. Il TAA 4x, invece, introduce due nuovi pattern SGMS (Sparse Grid Multi Sampling) che, fusi tra di loro, rendono in maniera equivalente ad un SGMS 8x. Nel caso del TAA 6x il numero di sample percepiti sale a 12, un valore impressionante.
Le immagini del FSAA Tester sono state ottenute allo stesso modo: abbiamo prima estrapolato due screenshots corrispondenti alle due distribuzioni che si alternano e successivamente ne abbiamo effettuato il blending. Come potete facilmente notare il TAA 2x corrisponde all'AA 4x classico di R420, mentre le modalità TAA 4x e TAA 6x danno luogo ad un numero di sfumature talmente elevato da rendere difficoltoso il loro conteggio nonostante siano ingrandite del 400%. Purtroppo per mancanza di tempo e per le difficoltà associate a questa tecnologia non siamo stati in grado di fornirvi degli screenshots del TAA con il 3D Mark 2003 o con altri titoli. La difficoltà principale nel realizzare queste immagini consiste nel dover catturare la stessa scena tridimensionale nella sua resa in frame pari e dispari. Nel benchmark di FutureMark, ad esempio, ciò non è possibile perché ogni frame comporta un movimento rispetto a quello precedente. Le nostre impressioni durante l'uso del Temporal AA sono molto positive. Naturalmente, per godere appieno della sua resa, è necessario ottenere un frame rate piuttosto elevato, pari alla frequenza di refresh del monitor. In caso contrario osservando i bordi poligonali notiamo uno piccolo sfarfallio molto veloce che impedisce all'occhio di localizzare con esattezza l'aliasing. Complessivamente, quindi, la resa è soddisfaciente anche con un numero di fps non troppo elevato. Pagina 15 - Analisi qualità shader: FP16 vs FP32 All'epoca delle schede NVIDIA TNT2, 3dfx Voodoo3 e Matrox G400 una delle più grande diatribe era "16 bit vs 32 bit". A quel tempo non si parlava ancora di effetti programmabili e calcolo in virgola mobile e pertanto il numero di bit era riferito al calcolo delle varie componenti RGB in intero. A distanza di almeno cinque anni, possiamo dire che la storia si ripete anche se con qualche piccola differenza. Da quando i VS e PS 2.0 hanno introdotto il calcolo in virgola mobile ci sono sempre state molte discussioni su quale fosse lo standard riguardo il numero di bit da utilizzare. ATI ha scelto la via dei 24 bit per componente il che porta ad una precisione totale a 96 bit (24 bit * 3 (RGB) + 24 bit (alpha)). Secondo l'azienda canadese questa modalità offre un buon compromesso tra qualità e velocità. NVIDIA, invece, ha intrapreso una strada più dinamica: 16 bit e 32 bit. Nel caso in cui uno shader non dovesse prevedere calcoli troppo complessi la società americana ritiene che la precisione FP16 sia più che sufficiente. In caso contrario è possibile usare 32 bit per canale per un totale di ben 128 bit.Tuttavia, il problema principale nell'architettura di NV3x è sempre stato che abilitando il calcolo FP32 si assisteva ad un vero e proprio crollo delle prestazioni rispetto alla modalità FP16. Del resto ciò era prevedibile visto che una precisione più elevata richiede un maggiore numero di registri ed una superiore banda passante. Far Cry, uno dei giochi che attualmente può vantare il motore grafico più evoluto, fa ampio uso degli effetti programmabili attraverso VS 2.0 e PS 2.0. Esattamente come fanno la maggioranza dei programmatori di videogames, all'interno di questo titolo sono presenti più pattern di rendering, uno specificatamente ottimizzato per una determinata famiglia di processori grafici. Tale ottimizzazione è necessaria in quanto così facendo è possibile avvalersi al massimo delle capacità dell'hardware. Nel caso delle schede NV3x il percorso di rendering prevede l'uso di shader con precisione di calcolo FP16. Anche se tale precisione è più che sufficiente in molte situazioni, ne esistono alcune in cui i risultati possono non essere qualitativamente identici ad un analogo shader FP32. Per analizzare la resa delle schede NV3x e NV40 con gli shader di Far Cry abbiamo effettuato due screenshots, entrambi all'inizio della mappa Volcano. In particolare abbiamo prima utilizzato il percorso di rendering predefinito dal gioco (quello ottimizzato FP16) e successivamente abbiamo forzato quello generico (FP32). Per meglio evidenziare i risultati abbiamo zoomato alcune zone degli screenshots.
Delle schede Radeon 9800 XT, X800 Pro e X800 XT abbiamo riportato solo un'immagine di riferimento in quanto il motore grafico di Far Cry, con questi processori grafici, attiva automaticamente il percorso di rendering generico. Del resto anche forzando le schede canadesi a funzionare con shader FP16, loro eseguono comunque i calcoli con precisione FP24 e, quindi, non ci sono differenze nella resa grafica. Sia con NV38 che NV40 la qualità dell'immagine con precisione FP16 lascia a desiderare: i materiali che fanno uso della riflessione speculare sono soggetti ad un fastioso effetto banding, non presente nel calcolo FP24 delle GPU ATI. Con FP32 la situazione migliora notevolmente e le immagini diventano uguali (se non leggermente migliori) a quelle FP24. La differenza tra FP16 e FP24 è superiore a quella tra FP24 e FP32 per lo stesso motivo per cui tra un desktop a 8 bit ed uno a 16 bit la differenza è superiore rispetto al confronto tra 16 bit e 32 bit: più si aumenta il numero dei colori e più ci si avvicina al limite in cui l'occhio umano non è più in grado di distinguerli perché il numero di sfumature è troppo elevato. Secondo le nostre fonti non sono previste modifiche del pattern di rendering di Far Cry con le schede NVIDIA. Infatti, come vedremo successivamente, il motivo della scelta da parte della Croteam di utilizzare la precisione FP16 al posto della FP32 nonostante il degrado qualitativo è legato principalmente alle prestazioni. Pagina 16 - Benchmark 2D
Quando viene presentata una nuova architettura è sempre utile scoprire se i progressi fatti riguardano solo ed esclusivamente la grafica tridimensionale o anche quella bidimensionale. Nel nostro caso il Radeon X800 XT è risultato essere il più veloce nel test Trasparent Windows del PC Mark 2004. Non possiamo dire altrettanto per quanto riguarda Radeon X800 PRO che, invece, è risultato essere pù lento di tutte le varianti di NV40 considerate. Evidentemente la differenza in termini di accesso alla memoria è particolarmente influente nelle chiamate alla GDI del sistema operativo. Anche nei test relativi a questo aspetto, infatti, la versione pompata di R420 è la migliore. In posizione intermedia collochiamo tutte le altre schede GeForce 6800.
Nei test di riproduzione video le schede video Radeon X800 sono leggermente superiori alla controparte NVIDIA. Indipendentemente dalla versione che prendiamo in considerazione R420 sviluppa un frame rate più elevato sia con il codec WMV che con il DivX. Evidentemente l'occupazione del processore è inferiore rispetto a quella che richiede NV40.
I test Graphics Winmark misurano le prestazioni di una scheda video visualizzando una serie di sequenze di utilizzo di alcuni software in ambiente Windows 98/ME. Questi valori sono, quindi, indicativi della velocità con cui un processore grafico disegna la GDI del sistema operativo Microsoft. In questo campo NV40, in tutte le sue versioni, è più veloce delle schede basate su R420: mediamente il vantaggio si attesta attorno ai 40 punti in più. Pagina 17 - Benchmark sintetici
I test fill rate del 3D Mark 2003 di FutureMark ci svelano la potenza di calcolo delle schede Radeon X800 XT e GeForce 6800 Ultra Extreme. La prima dà il meglio di sè nel multitexturing dove sfonda la barriere dei 7000 Mtexel/s. La seconda, invece, fa segnare 3422,6 Mtexel/s che, a titolo di paragone, è quanto faceva NV38 in multitexturing, impressionante! Leggermente indietro la Radeon X800 Pro rispetto alla GeForce 6800 GT, mentre la versione Ultra si pone a metà strada tra la versione ricca e quella povera di NV40.
Nel test relativo ai pixel shader sembra che NV40 non abbia rivali. La versione Ultra Extreme fa registrare ben 176,6 fps e anche la Ultra e su ottimi livelli. Subito dietro troviamo la Radeon X800 XT, seguita dalla GeForce 6800 GT. Più in basso nella classica la Radeon X800 PRO che, in virtù delle sue 12 pipeline, non è in grado di eseguire lo stesso numero di operazioni dei concorrenti. Il quadro cambia se consideriamo i vertex shader. Qui R420 ha una marcia in più rispetto a NV40. In particolare la versione XT segna 36,2 fps, mentre la PRO 33,2 fps. E' evidente che i motori di Vertex Shader insieme alle ottimizzazioni nella fase di setup dei triangoli hanno permesso di raggiungere questo risultato. Pagina 18 - Unreal Tournament 2004
Eccellenti i risultati della Radeon X800 XT e delle varianti di NV40 con Unreal Tournament 2004 nella modalità standard alla risoluzione di 1600x1200. Nel momento in cui attiviamo l'antialiasing ed il filtro anisotropico il quadro cambia radicalmente e R420 guadagna un certo vantaggio sulle schede NV40. In particolare la versione XT è la più veloce in tutte le risoluzioni, mentre la PRO, nella mappa Antalus, risale al secondo posto. Solo la GeForce 6800 Ultra Extreme riesce a non farsi sorpassare dalla Radeon X800 PRO nella mappa Asbestos. Pagina 19 - Far Cry Riprendiamo in questo paragrafo quanto detto precedentemente riguardo la qualità degli shader FP16 e FP32. Abbiamo eseguito i test di Far Cry con entrambe le modalità e i risultati sono i seguenti.
Confrontando Radeon X800 XT con i test in modalità FP16 delle varie schede NV40 vediamo che in Research esiste una parità con la GeForce 6800 Ultra Extreme, mentre nella mappa Volcano la scheda estrema di NVIDIA prende la testa della classifica. La Radeon X800 PRO, invece, è più lenta della GeForce 6800 GT. Nel momento in cui attiviamo la precisione di calcolo a 32 bit i risultati subiscono un notevolmente cambiamento e la Radeon X800 XT prende saldamente la testa del lotto. Anche la Radeon X800 PRO guadagna posizioni e riesce a confrontarsi meglio con la GeForce 6800 GT in modalità FP32. Pagina 20 - AquaMark 3
L'architettura di NV40 sembra trovarsi decisamente a suo agio con AquaMark 3. Nel rendering classico e alle risoluzioni più basse la scheda più veloce è la GeForce 6800 Ultra Extreme. Solo a 1600x1200 la Radeon X800 XT riesce a sopravanzare la totalità della concorrenza. Discorso analogo se confrontiamo la Radeon X800 PRO con la GeForce 6800 Ultra: solo a 1600x1200 con filtri attivati il chip R420 con 12 pipeline riesce a raggiungere NV40. Eccellente il risultato del Triscore dove la versione più costosa di NV40 sfonda la barriere dei 60000 punti. Pagina 21 - Splinter Cell
A seconda della mappa che prendiamo in considerazione otteniamo risultati differenti. In Caspian Oil Refinery, la scena meno CPU dipendente, la scheda Radeon X800 XT riesce nella maggioranza dei casi ad essere più veloce della GeForce 6800 Extreme Edition. In The Chinese Embassy, invece, tutte le schede fanno segnare grosso modo lo stesso punteggio con un leggero vantaggio per le varie versioni di NV40. Quest'ultimo è un appunto interessante che ritroveremo anche in altri benchmark: nei casi CPU limited le GeForce 6800 riescono ad esprimersi meglio delle schede Radeo X800. Restringendo il campo alla sola Radeon X800 PRO, purtroppo vediamo che questo prodotto è sempre dietro la GeForce 6800 GT: la presenza di sole 12 pipeline si fa sentire con Splinter Cell. Pagina 22 - Halo
Velocissime le GeForce 6800 Ultra Extreme e Ultra senza filtri e alle basse risoluzioni. A 1280x1024 e a 1600x1200, invece, la versione XT Platinium Edition di R420 è la migliore. Anche in questo caso la Radeon X800 PRO non riesce ad essere più veloce della GeForce 6800 GT. Pagina 23 - Tomb Raider The Angel Of Darkness - X2: The Threat
Eseguendo i test di Tomb Raider ci sembra di essere tornati al confronto tra R360 e NV38. L'architettura di questo motore grafico, infatti, ha da sempre privilegiato le GPU canadesi. Questa nuova generazione non fa eccezione e il Radeon X800 XT riesce a far segnare ben 65,1 fps a 1600x1200 con antialiasing 4x e filtro anisotropico 8x, imponendosi come soluzione più veloce in questo campo. Molto buoni anche i risultati della Radeon X800 PRO, in alcuni casi al secondo posto dopo la sorella maggiore.
In X2: The Threat abbiamo avuto problemi di instabilità del sistema con la GeForce 6800 GT, probabilmente dovuti alla immaturità dei driver e del BIOS della scheda stessa. Confrontando gli altri prodotti tra di loro vediamo nuovamente tre volte su quattro al primo posto la Radeon X800 XT. Ricordiamo che R420, esattamente come NV40, è in grado di elaborare 32 pixel per ciclo di clock nel calcolo dello Z-buffer e stencil buffer. Pagina 24 - Enemy Territory
Enemy Territory è uno di quei titoli che, come detto in precedenza, risultando essere CPU limited tende a preferire le schede NV40. Tuttavia quanto appena detto vale solo senza filtri e a 1024x768. All'aumentare della risoluzione R420 si arrampica sulla classifica posizionandosi al primo posto a 1600x1200. Pagina 25 - Call Of Duty
La nostra new entry all'interno del pacchetto benchmark ripropone la stessa situazione vista con Enemy Territory anche se in questo caso i chip canadesi non riescono a superare i concorrenti NV40. E' evidente che l'ottimizzazione dei driver NVIDIA in ambiente OpenGL è tale da saper sfruttare fino all'ultima risorsa hardware anche in presenza di un sistema CPU limited. Pagina 26 - Analisi antialiasing
Nei test con antialiasing vediamo che le schede Radeon X800 a parità di numero di sample sono indietro al concorrente prodotto NVIDIA. In particolare sia la GeForce 6800 Ultra Extreme che la GeForce 6800 Ultra sono sempre più veloci della Radeon X800 XT. L'antialiasing a sei sample, invece, oltre ad essere qualitativamente migliore è anche più veloce della versione a 8x di NVIDIA. Purtroppo a causa di problemi di instabilità della GeForce 6800 GT non è stato possibile eseguire il confronto con la Radeon X800 PRO. Da questi test si evince che il vantaggio di R420 visto precedentemente nei benchmark con antialiasing e filtro anisotropico non è dovuto ad una superiore velocità dell'antialiasing, ma come vedremo nel prossimo paragrafo, ad una migliore gestione delle risorse con il filtro anisotropico. Pagina 27 - Analisi filtraggio anisotropico
Ottime le prestazioni di R420 nei test con il filtro anisotropico. La Radeon X800 XT è la più veloce del lotto ed il suo vantaggio aumenta con l'aumentare della risoluzione. Non delude neanche la Radeon X800 PRO che non è mai troppo lontana dalla GeForce 6800 Ultra Extreme. E' evidente che l'algoritmo messo a punto da ATI è molto efficiente. Pagina 28 - Conclusioni I risultati prestazionali emersi nel corso dei nostri test evidenziano un andamento medio piuttosto chiaro: ATI Radeon X800 Platinum Edition e NVIDIA GeForce 6800 Ultra fanno registrare prestazioni velocistiche molto vicine tra di loro, anche se la soluzione ATI pare nel complesso superiore. In particolare, il prodotto canadese mostra un chiaro vantaggio utilizzando filtraggio anisotropico e FSAA alle risoluzioni più elevate. Tra ATI Radeon X800 PRO e NVIDIA GeForce 6800 GT il risultato è molto più equilibrato, merito principalmente dell'architettura con 16 pipeline di rendering del chip NV40 contro le 12 della scheda ATI. Anche in questo caso, la soluzione ATI si avantaggia abilitando filtraggio anisotropico e FSAA, ma viene distanziata in ambito Open GL, contesto nel quale le architetture NVIDIA hanno da sempre potuto godere di un chiaro margine di vantaggio. Discorso a parte merita la scheda GeForce 6800 Ultra Extreme.
Questo prodotto, facendo un paragone con il mercato dei processori, può essere
tranquillamente confrontato con la cpu Intel Pentium 4 Extreme Edition. E' una soluzione
di nicchia, che verrà proposta solo da alcuni partner di NVIDIA in soluzioni del tutto
particolari; la produzione di queste schede sarà presumibilmente molto limitata, a motivo
della difficoltà di ottenere buone rese per i chip NV40 all'elevata frequenza di clock di
450 MHz. Nei commenti alla nostra recensione della scheda GeForce 6800
Ultra, una delle critiche mossa più di frequente al nuovo progetto NVIDIA verteva sui
requisiti di sistema. Due connettori di alimentazione Molex da collegare alla scheda,
sommati ad un alimentatore di potenza adeguata (NVIDIA suggerisce 480 Watt) mal si
combinano a un sistema silenzioso e dalle ridotte dimensioni. ATI ha sempre ricercato, con le ultime generazioni di soluzioni video, la massima compatibilità con tutti i tipi di sistema. Niente requisiti particolari anche per le soluzioni Radeon X800, entrambe capaci di operare stabilmente con un alimentatore da almeno 300 Watt, uno standard per i PC odierni. Il calore generato durante il funzionamento da queste schede è addirittura inferiore a quello della soluzione Radeon 9800 XT, con un sistema di raffreddamento proporzionato e tale da non creare ingombri anomali. Sul versante qualità ATI ha saputo sorprenderci con una nuova tecnologia di antialiasing che sicuramente farà la felicità di tutti coloro che pretendono contemporaneamente qualità e velocità. Il Temporal AA permette di ottenere immagini con un numero di sample percepito doppio rispetto alle tecniche tradizionali, senza alcun impatto sulle prestazioni. Anche gli algoritmi alla base del filtri, sia trilineare che anisotropico, nonostante siano stati direttamente derivati dalle precedente generazione di GPU, non sfigurato di fronte alla concorrenza. Il filtro trilineare è sempre eseguito in maniera classica ed ha un’implementazione qualitativamente migliore di quella di NV40 (senza ottimizzazioni). Inoltre, come mostrato dai nostri benchmark, le prestazioni del filtro anisotropico, anche in modalità qualità, sono molto elevate ed il suo impatto rispetto al rendering classico è molto contenuto. Prevediamo che nei prossimi mesi la diatriba tra Shader model 2.0 vs 3.0 salirà parecchio di livello. Tra ATI e NVIDIA si scontrano due scuole di pensiero molto chiare, con un buon numero di games developer schierati dalla parte dell'uno o dell'altro. Ci pare, onestamente, che questa sia più una guerra di marketing che tecnologica, ma ci sono buone speranze che gli Shader 3.0 possano diventare una realtà concreta in molti titoli, non solo in bellissimi demo tecnologici. Se con la precedente generazione di schede video NVIDIA ha combattuto mese dopo mese, cercando di colmare l'enorme gap accumulato nei confronti di ATI, il quadro è ora nettamente cambiato. ATI e NVIDIA si scontrano su un piano che non è ancora forse di perfetta parità, ma molto vicino a questa condizione. NV40 e R420 sono soluzioni estremamente potenti: se le schede ATI hanno un margine di vantaggio attuale, quelle NVIDIA necessitano ancora di un notevole sviluppo dal versante driver a fronte dell'architettura completamente nuova. In prospettiva il supporto agli Shader 3.0 può rappresentare un elemento di forza per NVIDIA, ma in un mercato come quello delle schede video 3D nel quale nuovi prodotti si alternano ogni 6 mesi è indispensabile poter sfruttare da subito i vantaggi della tecnologia. Al momento attuale, osservando i titoli a disposizione, non pare che gli Shader 3.0 possano realmente fare la differenza, a breve termine, su quelli 2.0. Con la scheda Radeon X800 XT Premium Edition ATI è stata capace di raddoppiare, in media, le prestazioni velocistiche della propria precedente top della gamma, modello Radeon 9800 XT. E' questo un risultato la cui portata è forse difficilmente comprensibile e per il quale un esempio può essere d'aiuto: pensate di avere a disposizione, da questo momento, un processore di sistema che è potente esattamente il doppio, in tutte le applicazioni, rispetto a quello che utilizzate in questo momento. Un'eventualità di questo tipo è scenario pressoché irrealizzabile nel mercato delle cpu, ma è quanto ci hanno abituato ad ottenere ogni cambio generazionale sia ATI che NVIDIA. E, a pensarci bene, è un risultato strabiliante. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Pagina stampata da Hardware Upgrade: http://www.hwupgrade.it Vietata la copia e la distribuzione (anche parziale) senza la previa autorizzazione di Hardware Upgrade S.r.l Per maggiori informazioni : http://www.hwupgrade.it/sito/legale/ Copyright 1997 - 2012 Hardware Upgrade S.r.l |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||