Hardware Upgrade - il sito italiano sulla tecnologia - www.hwupgrade.it
« Torna all'articolo  -  Stampa
NVIDIA GeForce 8800 GTX: un passo nel futuro
Paolo Corsini - 08 Novembre 2006
"G80 è il nome in codice della prima generazione di schede video dotate di supporto alle API DirectX 10 e allo Shader Model 4. Windows Vista è ancora lontano, ma questo non impedisce alla nuova soluzione NVIDIA GeForce 8800 GTX di svettare sulle proposte concorrenti"
Pagina 1 - Introduzione

titolo.jpg (39198 bytes)

Al debutto di ogni nuova architettura video, sia ATI che NVIDIA, gli appassionati di schede video e i videogiocatori si lanciano in lunghissimi dibattiti su quale sia la migliore architettura disponibile, e in ultima analisi quale sia il miglior acquisto che sia possibile fare in un determinato momento. Se la presentazione di una nuova GPU avviene solo da una delle due parti, buona parte delle discussioni si incentra su quello che la concorrente presenterà a seguire. Se il debutto di una nuova architettura video coindice con il lancio di nuove API, e quindi con un prevedibile futuro cambio nel modo di fare giochi 3D, lo scenario diventa ancor più complesso.

Con il lancio odierno delle architetture GeForce 8800 di NVIDIA, meglio note con il nome in codice di G80, ci troviamo proprio nella situazione di avere un'architettura completamente nuova, nessuna proposta competitiva diretta da parte del concorrente ATI, almeno per il momento, e il debutto prossimo di una nuova generazione di API, quelle DirectX 10 di Microsoft.

Partiamo proprio da quest'ultimo elemento per iniziare questa lunga analisi: G80 è la prima soluzione video dotata di supporto hardware allo Shader Model 4.0, implementato nelle API DirectX 10 che Microsoft presenterà nel proprio sistema operativo Windows Vista. Non vi saranno API DirectX 10 per sistemi operativi Windows XP, e soprattutto prima della disponibilità in commercio di Windows Vista sarà presumibilmente lecito attendere almeno la fine del mese di Gennaio 2007: questo implica che al momento attuale una delle principali caratteristiche tecniche delle schede GeForce 8800 non possa venir utilizzata.

D'altro canto, come vedremo nel corso dell'articolo, NVIDIA ha pensato sia al futuro dei giochi che al presente: la scheda GeForce 8800 GTX, nuova proposta top di gamma, è la soluzione a singola GPU più veloce attualmente disponibile sul mercato, con tutti i giochi DirectX 9.

ATI non ha al momento attuale una soluzione concorrente da poter proporre in alternativa alle schede GeForce 8800: la propria proposta top di gamma, Radeon X1950XTX, è un'architettura DirectX 9 di ottima potenza ma non può competere con G80 sul piano prestazionale con le future API DirectX 10, non supportandole in modo nativo. Inoltre, l'attuale livello di prezzo delle soluzioni Radeon X1950XTX ne suggerisce un posizionamento su un livello di costo più basso rispetto a quello delle soluzioni GeForce 8800 sia GTX che GTS.

La risposta di ATI alle soluzioni G80 prende il nome di R600, e non è attesa al debutto prima di inizio 2007; questo implica che NVIDIA potrà beneficiare di almeno 2 mesi di leadership assoluta nel mercato delle schede video top di gamma con le soluzioni GeForce 8800, ma che al debutto di Windows Vista, o nel giro dei mesi immediatamente seguenti, ATI potrà mettere a disposizione degli appassionati la propria architettura DirectX 10. D'altro canto la storia delle GPU NVIDIA di fascia alta prevede sempre il lancio di una successiva generazione di schede video alcuni mesi dopo il debutto di una nuova architettura: GeForce 8900 potrebbe essere il nome scelto per l'evoluzione di G80, destinato a innalzare ulteriormente il livello prestazionale di questa nuova architettura.

Ha senso una serie di schede video con supporto hardware alle API DirectX 10, quando queste ultime non saranno accessibili con Windows Vista prima della fine di Gennaio 2007 e ben prima che i titoli DirectX 10 siano stati immessi in commercio? La risposta più sensata è sicuramente un no, ma è necessario analizzare la questione in un'accezione più ampia. Innanzitutto, le soluzioni GeForce 8800 sono al momento attuale le schede più veloci disponibili in commercio con i titoli a oggi disponibili. Inoltre, la disponibilità di una nuova architettura video top di gamma prepara la strada a nuove schede video che di quest'ultima riprenderanno le caratteristiche architetturali, con però livelli di costo più contenuti. Detto in altro modo, da una GeForce 8800 è lecito attendersi nei prossimi mesi soluzioni GeForce 8600 e GeForce 8300, o come NVIDIA sceglierà di chiamare le proprie architetture di fascia media e mainstream.

Del resto, l'innovazione tecnologica rappresentata dalle schede video top di gamma ha ricadute positive su tutti gli utenti, appassionati e non, che non acquisteranno queste soluzioni ma si rivolgeranno nei mesi a seguire verso le evoluzioni destinate ai segmenti più accessibili del mercato.

Quest'oggi NVIDIA presenta due nuove schede basate su architettura G80: GeForce 8800 GTX e GeForce 8800 GTS. Vediamone le caratterstiche tecniche principali, per poi passare ad un'analisi dell'architettura della GPU G80.

Pagina 2 - La famiglia di schede GeForce 8800

Come già evidenziato in introduzione, NVIDIA presenta quest'oggi due nuove schede video della serie GeForce 8800: si tratta delle soluzioni GeForce 8800 GTX e GTS, con la prima a rappresentare il top di gamma e la seconda a seguire con un costo più accessibile. I prezzi comunicati da NVIDIA, validi per il mercato retail nord americano, sono pari rispettivamente a 559 dollari USA e 449 dollari USA, tasse escluse. I valori corrispondenti per il mercato europeo, e per quello italiano nello specifico, saranno complessivamente superiori come spesso accade in questi casi: alla differenza data dal tasso di cambio e dagli oneri di importazione dobbiamo aggiungere un margine ulteriore che sicuramente i vari rivenditori praticheranno inizialmente.

8800_gtx_chip.jpg (7044 bytes) 8800_gts_chip.jpg (7073 bytes)

Al debutto di nuove GPU, soprattutto se top di gamma, la domanda di mercato è così sostenuta da saturare l'iniziale offerta di schede: per questo motivo i prezzi tendono sempre ad essere superiori rispetto a quanto saranno nei mesi seguenti, una volta che la disponibilità di questi prodotti sul mercato sarà stabilizzata.

La tabella seguente riassume le caratteristiche tecniche delle soluzioni GeForce 8800 a confronto con quelle NVIDIA e ATI di precedente generazione:

Produttore ATI NVIDIA NVIDIA NVIDIA NVIDIA
Modello

Radeon
X1950

GeForce
7950

GeForce
7900

GeForce
8800
GeForce
8800
Versione


XTX

GX2

GTX

GTX GTS

Bus di memoria (in bit)

256 256 256 384 320

Dotazione memoria in Mbytes

512 1.024 512 768 640

Processo produttivo (micron)

0,09 0,09 0,09 0,09 0,09

Frequenza chip (MHz)

650 500 650 575 500

Frequenza memoria (GHz)

2 1,2 1,6 1,8 1,6

Unità di Vertex Shading

8 16 8 128 stream
processors
96 stream
processors

Unità di Pixel Shading

48 48 24

Numero di Rops

16 32 16 24 20

Banda Passante (GB)

64

76,8

51,2

86,4 64

G80 è la prima architettura NVIDIA ad avere shader unificati; a differenza delle soluzioni GeForce 7900 e GeForce 7950, pertanto, non troviamo più pixel shader e vertex shader divisi, ma un unico floating point shader che integra al proprio interno molteplici processori indipendenti, e quindi paralleli: ognuno di questi processori è capace di operare qualsiasi tipo di operazione legata agli shader, a prescindere dal fatto che sia pixel, vertex, geometric o physics.

La scheda GeForce 8800 GTX integra 128 di questi processori, indicati da NVIDIA con il nome di stream processors, che operano ad una frequenza di clock di 1.350 MHz; per la soluzione GeForce 8800 GTS il loro numero scende a 96, con una frequenza di funzionamento pari a 1.200 MHz. Le GPU GeForce 8800 GTX e GTS hanno frequenze di funzionamento pari rispettivamente a 575 MHz e 500 MHz; a questi valori operano le altre unità che non siano gli stream processors, quindi i dispatch, le texture units e le ROPs units.

Atipico il quantitativo di memoria video presente su queste due schede: per la soluzione GeForce 8800 GTX troviamo infatti 768 Mbytes di memoria GDDR3, con frequenza di clock di 1.800 MHz effettivi. Per la scheda GeForce 8800 GTS il quantitativo scende a 640 Mbytes, in abbinamento a frequenza di clock di 1.600 MHz. Alla base di questi quantitativi troviamo una motivazione tecnica: NVIDIA ha scelto di dotare queste schede di un bus memoria di ampiezza superiore ai tradizionali 256bit utilizzati per le schede top di gamma. La soluzione GeForce 8800 GTX ha bus ampio 384bit, mentre per quella GeForce 8800 GTS è di 320bit; tali valori sono stati ottenuti aumentando il numero di chip memoria presenti sul PCB della scheda, a partire dai 32bit di ampiezza messi a disposizione per ogni chip memoria GDDR3.

La scheda GeForce 8800 GTX monta 12 chip memoria: considerando un'ampiezza di banda di 32bit per ogni chip se ne ricava un totale di 384bit di ampiezza complessiva, per una bandwidth massima di 86,4 Gbytes al secondo. A titolo di paragone la scheda Radeon X1950XTX di ATI, la soluzione a singola GPU con le più veloci memorie video attualmente a disposizione, raggiunge una bandwidth di 64 Gbytes al secondo utilizzando moduli GDDR4 da 2 Gbytes di frequenza di clock, abbinate a un bus da 256bit di ampiezza.

Per la scheda GeForce 8800 GTS l'ampiezza di banda è pari a 320bit: sono 10 in questo caso i chip memoria montati sulla scheda, pr una bandwidth massima teorica pari a 64 Gbytes al secondo in abbinamento a memoria GDDR3 da 1,6 GHz di clock.

wafer_s.jpg (56408 bytes)
wafer di processori G80; tecnologia produttiva a 90 nanometri

Entrambe le GPU GeForce 8800 GTX e GTS sono costruite adottando tecnologia produttiva a 90 nanometri; il chip ha un totale di 681 milioni di transistor, valore più che raddoppiato rispetto a quanto integrato nelle architetture G71 alla base delle schede GeForce 7900. NVIDIA ha optato per non utilizzare la nuova tecnologia produttiva a 80 nanometri con questa GPU, riservandola solo ai die shrink delle proprie soluzioni GeForce 7600 e GeForce 7300 almeno per questi prossimi mesi. E' presumibile che la futura evoluzione delle soluzioni GeForce 8800, se verrà presentata nel corso della primavera, adotterà quantomeno la tecnologia produttiva a 80 nanometri.

Pagina 3 - Architettura di G80

Abbiamo già segnalato nella pagina precedente come con G80 NVIDIA abbia scelto un approccio unificato per gli shader: niente più vertex e pixel shader distinti, ma un'unica unità in grado di processare entrambi. Prima del debutto di G80 varie indiscrezioni hanno fatto ritenere che NVIDIA volesse adottare, per questa architettura video, un approccio non unificato agli shader; in più occasioni David Kirk, Chief Scientist di NVIDIA, ha segnalato come l'approccio a shader unificati non fosse un requisito hardware richiesto da Microsoft per la compatibilità con le API DirectX 10, e che una tecnologia di questo tipo sarebbe stata implementata da NVIDIA nel momento in cui avrebbe avuto senso dal punto di vista prestazionale.

La presenza di shader unificati nelle schede GeForce 8800 ha quindi colto di sorpresa: ci si attendeva una contrapposizione tra architettura a shader separati di NVIDIA e quella a shader unificati che ATI implementerà nella propria GPU R600.

Gli shader unificati, presenti in numero di 128 per la scheda GeForce 8800 GTX e di 96 in quella GeForce 8800 GTS, operano a una frequenza di clock sensibilmente superiore a quella delle altre unità presenti nella GPU quali dispatch, texture units e ROPs units: 1,35 GHz per la soluzione GTX e 1,2 GHz per quella GTS.

Possiamo prevedere che le future versioni di scheda video di fascia media e bassa di NVIDIA, che presumibilmente adotteranno i nomi di GeForce 8600 e GeForce 8300, riprenderanno questa stessa architettura con stream processors, ovviamente integrando un numero inferiore di processori con frequenze di funzionamento inferiori a quelle delle soluzioni GeForce 8800.

Ogni stream processor è in grado di esere dinamicamente allocato per gestire operazioni legate all'elaborazione di vertici, pixel, geometria o fisica della scena 3D. Per usare un paragone che aiuta a capire quale sia il funzionamento di uno stream processors, facciamo un'analogia con la catena di montaggio: al posto di avere due catene di montaggio separate per pixel e vertex shader, altamente specializzate, NVIDIA ne mette a disposizione una che permette di elaborare shader indipendentemente dalla loro natura.

L'efficienza di questa catena, nell'elaborazione di solo pixel o solo vertex shader, sarà ovviamente inferiore rispetto a quella di un'unità specializzata. D'altro canto, nell'elaborazione di una scena 3D il bilanciamento, in un dato istante, tra il carico di lavoro in termini di pixel shaders e di vertex shaders non è mai chiaramente definito, ma in continua variazione a seconda di cosa sia inserito all'interno della scena.

Di conseguenza, un'architettura unificata, o per tornare all'esempio prcedente una catena di montaggio sulla quale sia possibile costruire a piacere uno dei due oggetti, risulta essere sempre occupata in elaborazioni massimizzando l'efficienza complessiva. Al contrario, con pixel e vertex shader separati si presentano spesso scenari nei quali una delle due unità risulta sfruttata al 100% delle capacità, mentre l'altra è poco occupata ad elaborare: pensiamo ad esempio ad una riproduzione in wireframe, dove i vertex shader sono massicciamente sfruttati e i pixel shader di fatto inutilizzati, oppure al contrario una scena carica di elaborazioni sui pixel ma geometricamente estremamente semplice, nella quale i vertex shader sono molto poco utilizzati mentre i pixel shader rappresentano il collo di bottiglia.

architecture_1.gif (47062 bytes)

Lo schema rappresenta l'architettura alla base della GPU G80 in questo caso nell'implementazione della scheda GeForce 8800 GTX. In verde sono evidenziati i 128 stream processors, divisi in 8 gruppi da 16 ciascuno; per ogni blocco sono presenti le texture units, divise in texture filtering unit e in texture address unit, alle quali sono collegate delle cache L1 a loro volta in cascata collegate a cache di secondo livello. Le cache sono quindi collegate direttamente al controller memoria, diviso in 6 blocchi da 64bit di ampiezza ciascuno con due chip memoria collegati ad ogni blocco, per un totale di 384bit di ampiezza complessiva.

Nell'implementazione dell'architettura G80 della scheda GeForce 8800 GTS il bus memoria, come già segnalato, ha ampiezza di 320bit quindi sono 5 i blocchi da 64bit di ampiezza ciascuno; inoltre gli stream processor sono presenti in numero di 96, per un totale di 6 gruppi da 16 processors ciascuno.

architecture_2.gif (28681 bytes)

La presenza di una memoria cache L1 per ogni blocco di 16 stream processors è giustificata dalla natura di questi processori: questi possono infatti effettuare elaborazioni, il cui risultato può essere direttamente reindirizzato ad un altro stream processor per altre elaborazioni. Una volta che uno stream processor completa un'elaborazione, il risultato di quest'ultima viene memorizzato nella cache locale, così che sia immediatamente reso disponibile ad un altro stream processor per una successiva elaborazione. Un'architettura di questo tipo può essere utilizzata anche per elaborazioni SIMD, Single Instruction Multiple Data, nelle quali a un dato di input corrispondono elaborazioni in parallelo di più stream processors.

Pagina 4 - Quantum Effects e CUDA

La scelta di integrare all'interno della propria nuova GPU un elevato numero di stream processors apre la strada all'utilizzo delle schede GeForce 8800, e delle future schede GeForce 8x00 per altri segmenti di mercato, ad elaborazioni che non siano quelle classiche viste del gaming. Del resto, da tempo si parla dell'utilizzo delle GPU anche per elaborazioni di tipo differente, quali quelle legate alla fisica nei giochi e all'ambito della GP-GPU, General Purpose GPU, che vede sia NVIDIA che ATI attivamente partecipi.

Non mancano mai nomi marketing ad indicare le funzionalità implementate in nuove architetture video; se Gigathread Technology sintetizza l'approccio di NVIDIA con stream processors all'interno della GPU, Quantum Effects indica l'insieme di tecnologie che NVIDIA ha implementato all'interno di G80, con l'obiettivo di migliorare le elaborazioni legate alla fisica. Alla base di Quantum Effects troviamo proprio l'uilizzo degli stream processor per l'elaborazione fisica; NVIDIA ha solo anticipato al momento attuale quelle che sono le potenzialità di questo genere di elaborazioni, in quanto sarà solo con l'introduzione delle API DirectX 10 che gli stream processor potranno essere diffusamente utilizzati per elaborazioni legate alla fisica.

CUDA; acronimo di Compute Unified Device Architecture, è il nome scelto da NVIDIA per evidenziare come l'architettura G80 rappresenti, in abbinamento al corretto software, una soluzione hardware che possa essere utilizzata per elaborazioni intense di calcolo parallelo. Detto in altri termini, quindi, parliamo di GP-GPU, quindi della possibilità di sfruttare l'innata natura parallela della GPU in abbinamento alla CPU per elaborazioni che per l'appunto siano parallele per natura.

Gli stream processor possono essere dinamicamente allocati dalla GPU per operare su oggetti legati alla riproduzione 3D a video, oppure per gestire elaborazioni parallele; un thread execution manager schedula l'esecuzione dei thread in modo tale che siano pienamente sfruttate tutte le risorse di elaborazione presenti all'interno della GPU.

CUDA introduce anche una componente software, indispensabile per poter sfruttare al meglio le potenzialità di elaborazione dell'architettura G80; NVIDIA infatti introdurrà un compilatore in linguaggio C specifico per le GPU, che dovrebbe facilitare la vita agli sviluppatori che intendano eseguire elaborazioni parallele servendosi per l'appunto di schede video GeForce 8800. E' questo un elemento fondamentale per la diffusione di applicazoni che sfruttano la GPU per l'elaborazione di dati: le GPU sono intrinsecamente molto più veloci e parallele delle CPU, ma rispetto a queste ultime meno flessibili in termini del tipo di elaborazioni non grafiche che possono eseguire. La disponibilità di nuove architetture di GPU permette di avere accesso a superiori funzionalità, rendendo progressivamente più adatte ad elaborazioni general purpose queste architetture, ma si rende indispensabile avere a disposizione un'interfaccia software che sia all'altezza e permetta di sfruttare al meglio le GPU.

Rispetto agli attuali approcci di GP-GPU, CUDA può beneficiare di due elementi architetturali che migliorano la velocità di elaborazione: da una parte la presenza di cache locali all'interno della GPU, per ogni blocco di stream processors; dall'altra il thread execution manager, che governa al meglio lo sfruttamento degli stream processors in funzione del tipo di elaborazione eseguita.

cuda.gif (31840 bytes)

Quali sono i vantaggi prestazionali ottenibili con CUDA, quindi sfruttando un'architettura GeForce 8800 GTX, in elaborazioni particolari rispetto ad una piattaforma Core 2 Duo E6700 di Intel? NVIDIA ha fornito queste stime, con margini d'incremento che vanno dal 10x a quasi il 200x a seconda del tipo di elaborazione. Si tratta ovviamente di stime fornite da NVIDIA che quindi dovranno poi venir verificate con le specifiche applicazioni: in ogni caso, con il software adatto, l'utilizzo di GPU per elaborazioni general purpose può portare a ottenere incrementi prestazionali, rispetto all'utilizzo di processori, di questa portata.

Pagina 5 - La scheda

Massiccia: questa la prima definizione che viene in mente osservando la reference board NVIDIA basata su GPU GeForce 8800 GTX; la lunghezza di questo prodotto, del resto, è di ben 27 centimetri, quindi ben 4 in più rispetto alla soluzione Radeon X1950XTX di ATI.

scheda_1_s.jpg (22240 bytes)

scheda_2_s.jpg (37903 bytes)

La parte frontale è sormontata dal dissipatore di calore, a diretto contatto sia con la GPU checon i moduli memoria; NVIDIA ha sviluppato una soluzione particolarmente silenziosa, in considerazione della notevole potenza di elaborazione della scheda video, grazie all'utilizzo di una ventola di raffreddamento di diametro elevato, ben 7 cm, che non deve ruotare a velocità troppo elevate per garantire un efficace ricambio d'aria.

Nella parte posteriore della scheda è possibile notare il gran numero di viti utilizzate per fissare il sistema di raffreddamento; nella parte centrale è possibile notare anche le aree del PCB destinate al montaggio delle memorie GDDR3, per un numero complessivo pari a 16. In alto a destra spiccano anche i due connettori per i bridge SLI, per la prima volta pari a due in un'architettura video NVIDIA.

schede_s.jpg (32899 bytes)

La scheda ha, come già segnalato, una lunghezza superiore a quella delle precedenti soluzioni top di gamma sia ATI che NVIDIA; l'ingombro è tale da non creare problemi di montaggio all'interno della maggioranza dei case disponibili in commercio, grazie anche alla rotazione dei due connettori di alimentazione a 6 pin in verticale che non aumenta ulteriormente l'ingombro in lunghezza della scheda all'interno del case.

scheda_aperta_s.jpg (38807 bytes)

Una volta rimosso il dissipatore di calore è possibile osservare i componenti montati sul PCB: al centro spicca la GPU G80, ricoperta da un package in alluminio molto simile a quanto utilizzato sia da Intel che da AMD per i propri processori. Questo garantisce che il montaggio del dissipatore di calore non possa in qualche modo danneggiare il chip video.

Sulla sinistra è presente un secondo chip, in questo caso non ricoperto da una placca di dissipazione: si tratta del TMDS transmitter, che con queste soluzioni NVIDIA ha scelto di non integrare all'interno della GPU ma di montare all'esterno. NVIDIA non ha fornito spiegazioni circa questa scelta: è possibile che alla base vi sia la volontà di contenere la superficie complessiva della GPU, già molto elevata in assoluto, spostando all'esterno un componente storicamente da tempo integrato

Pagina 6 - SLI: due connettori

Come abbiamo segnalato nell'analisi della scheda, la soluzione GeForce 8800 GTX introduce per la prima volta un sistema di connessione SLI con due connettori per ogni scheda video; si tratta di un approccio molto simile a quanto visto nelle scorse settimane per le soluzioni ATI Radeon X1950 PRO e Radeon X1650XT, che per la prima volta hanno adottato un approccio alla tecnologia Crossfire senza cavo di connessione esterno e senza scheda video Master.

connettori_sli_s.jpg (29624 bytes)
GeForce 8800 GTX

connettori_1_s.jpg (46356 bytes)
Radeon X1950 PRO

NVIDIA richiede l'utilizzo di uno solo dei due connettori per configurazioni SLI con schede GeForce 8800 GTX; il secondo connettore è stato predisposto da NVIDIA per future innovazioni nella tecnologia SLI, al momento non abilitate ma che verranno in future versioni dei driver Forceware. E' possibile, con le attuali versioni dei driver, utilizzare indifferentemente uno dei due connettori a piacere.

Quale potrà essere l'utilizzo del secondo connettore? Al pari di quanto anticipato per le schede ATI Radeon basate su GPU RV560 e RV570, la presenza di due connettori può permettere di aumentare la bandwidth del bus di comunicazione tra le due schede video una volta che la tecnologia SLI sia stata abilitata. Inoltre, può permettere di collegare tra di loro più di due schede video sempre con tecnologia SLI, rendendo quindi più facilmente accessibile una tecnologia Quad SLI senza per questo dover adottare due distinte GPU montate su un'unica scheda video.

Pagina 7 - Consumo e rumorosità

La rumorosità di funzionamento sta diventando un  importante elemento di valutazione nel momento in cui si valuta l'acquisto di una nuova scheda video; in genere sono proprio le soluzioni top di gamma a operare con le ventole più rumorose, in quanto necessarie per garantire l'efficace smaltimento del calore generato durante il funzionamento. Le misurazioni qui sotto riportate sono state effettuate con un fonometro posto ad una distanza di 10 cm dalla ventola della scheda video, in asse con il punto di rotazione: rappresentano pertanto valori massimi, più elevati di quanto sia possibile misurare con la scheda montata in un case chiuso. Per quanto possibile si è cercato di isolare il rumore di funzionamento della scheda video da quello dei restanti componenti, staccando la ventola di raffreddamento del processore, utilizzando una scheda madre con dissipatore di calore passivo per il chipset e isolando l'alimentatore.

db.png (21187 bytes)

La nuova scheda Radeon X1950XTX ha introdotto un sistemadi raffreddamento molto più efficiente rispetto a quanto adottato in precedenza da ATI con le schede Radeon X1900; ciò nonostante la rumorosità si mantiene più elevata rispetto a quella della scheda GeForce 8800 GTX nel momento in cui vengono mandate in esecuzione applicazioni 3D per un certo periodo di tempo. Per entrambe le schede il tono del rumore è grave, quindi molto meno fastidioso a parità di rumore assoluto rispetto ad una ventola di più piccole dimensioni che ruota a velocità superiore, producendo un rumore più acuto. NVIDIA conferma il trend visto con le precedenti generazioni di schede video top di gamma: i sistemi di raffreddamento di queste schede sono sicuramente voluminosi e ingombranti, ma riescono a bilanciare una notevole silensiosità di funzionamento.

Per valutare il livello di consumo delle schede video in ppova in queste pagine è stato misurato il consumo dell'intero sistema, cercando di utilizzare gli stessi componenti per le parti condivise; questa la configurazione di test adottata:

  • scheda madre: Intel D975XBX2KR (chipset Intel 975X)
  • memoria: Corsair CM2X1024 6400 (3-4-3-9) @ 800 MHz; 2x1 Gbyte
  • hard disk: Western Digital WD1600JS - Serial ATA - 7.200 rpm, 160 Gbytes
  • processore: Intel Core 2 Extreme X6800
  • alimentatore Tagan TurboJet TG1100-U95 (1.100 Watt)

Le misurazioni sono state effettuate in idle, quindi con sistema operativo attivato e processore non utilizzato, e durante l'esecuzione di un'applicazione 3D particolarmente stresante come la scena Canyon Flight del benchmark 3d mark 2006, alla risoluzione di 2560x1600 con  anti aliasing 4x e filtro anisotropico16x.

consumo.png (29605 bytes)

Sia in idle che a pieno carico la scheda GeForce 8800 GTX fa registrare i consumi più elevati in assoluto; significativo notare come in idle la nuova soluzione NVIDIA faccia registrare un consumo superiore di quasi 50 Watt rispetto alla soluzione GeForce 7900 GTX. E' evidente come una configurazione SLI con due schede GeForce 8800 GTX possa portare ad aumentare considerevolmente il consumo di sistema, e come questo giustifichi non tanto l'utilizzo di un alimentatore da 1.000 Watt di potenza, quanto almeno le specifiche minime indicate da NVIDIA.

Pagina 8 - Alimentatori da 1.000 Watt?

connettori_alimentazione_s.jpg (54279 bytes)

La scheda GeForce 8800 GTX introduce per la prima volta, su una soluzione a singolo PCB, la presenza di due connettori di alimentazione a 6 pin specifici per schede video PCI Express 16x; la loro presenza lascia intendere che i requisiti di alimentazione di questa nuova soluzione top di gamma siano tutt'altro che conservativi. Del resto, la stessa NVIDIA raccomanda nella propria reviewer's guide l'utilizzo di alimentatori di notevole qualità.

psu_slide_1.jpg (59951 bytes)

psu_slide_2.jpg (34932 bytes)

I requisiti minimi consigliati da NVIDIA per un sistema dotato di una scheda GeForce 8800 GTX sono di un alimentatore da almeno 450 Watt o superiore, con la capacità di erogare 30 Ampere sulla linea a 12V. Per la soluzione GeForce 8800 GTS, dotata di un solo connettore di alimentazione, le specifiche sono più conservative: un alimentatore da almeno 400 Watt di potenza capace di erogare 26 Ampere sulla linea a 12V.

Una configurazione con due schede video GeForce 8800 GTX in configurazione SLI richiede la disponibilità di ben 4 connettori di alimentazione a 6 pin; sono pochi gli alimentatori che vantano questa caratteristica, e NVIDIA sta al momento attuale certificandone la compatibilità con configurazioni SLI.

galaxy_1_s.jpg (36433 bytes)

galaxy_2_s.jpg (44967 bytes)

Un alimentatore da 1.000 Watt, come il modello Galaxy di Enermax qui sopra raffigurato, può per molti versi sembrare eccessivo alla luce delle specifiche dei sistemi attualmente in commercio; è possibile che una configurazione SLI con due schede GeForce 8800 GTX, magari overcloccate, possa diventare il vero banco di prova per questa tipoligia di alimentatori. A chi resta basito di fronte a potenze di 1.000 Watt per un alimentatore, ricordiamo come il consumo effettivo sia legato sia al numero di periferiche installate nel PC, sia al loro livello di utilizzo istantaneo; detto in altro modo un alimentatore di questo tipo non consuma 1.000 Watt costantemente, a meno che non sia sottoposto ad un carico di quel tipo dal sistema.

Inoltre, l'acquisto oggi di una soluzione di questo tipo garantisce di poter riutilizzare questo alimentatore anche in futuri sistemi, per i quali il trend prevede un continuo incremento della potenza necessaria per alimentare ogni componente. Se dal versante processori sia Intel che AMD stanno operando verso un generale contenimento dei consumi, il mondo delle soluzioni video sembra sempre più orientato verso un trend che vede i consumi delle VGA superare in modo sensibile i 150 Watt per scheda; le informazioni preliminari sulle soluzioni R600 di ATI, prossima generazione di architettura video DirectX 10 per il produttore canadese, prevedono del resto consumi allineati a quelli delle schede G80 e specifiche simili per quanto concerne gli alimentatori.

Pagina 9 - Lumenex Engine: un nuovo anti aliasing

Con il nome di Lumenex Engine Technology NVIDIA raccoglie tutte le innovazioni introdotte nella GPU GeForce 8800 al fine di migliorare la qualità d'immagine delle scene 3D; alla base nuove tecniche per la gestione dell'anti aliasing e del filtraggio anisotropico delle textures.

NVIDIA introduce con G80 una nuova tecnica di anti aliasing, chiamata CSAA o Coverage Sampling Antialiasing: questa permette di abilitare le modalità 8x, 8xQ, 16x e 16xQ con un ridotto impatto prestazionale, stando a quanto dichiarato da NVIDIA, rispetto all'utilizzo della tradizionale modalità 4x.

a_driver_2.gif (9450 bytes)

I driver Forceware, nel momento in cui rilevano la presenza di una scheda GeForce 8800, mettono a disposizione nel pannello di configurazione della qualità 3D una nuova voce: Antialiasing - Mode. Con questa è possibile selezionare il modo con il quale l'anti aliasing viene gestito: controllato dall'applicazione, completamente disabilitato, con miglioramento delle impostazioni del gioco (enhance the application setting) e bypassando qualsiasi tipo di impostazione data dal gioco.

L'opzione "Enhance the application settings" è la più interessante in assoluto: permette infatti di forzare una superiore qualità d'immagine in anti aliasing rispetto a quanto inizialmente selezionato all'interno del menu del gioco, sfruttando proprio la presenza del Coverage Sampling Antialiasing. Questa opzione, di conseguenza, rende accessibili livelli di anti aliasing superiori rispetto a quanto selezionabile all'interno di uno specifico gioco 3D, e richiede necessariamente che l'anti aliasing sia abilitato dal gioco. Qualora un gioco non supporti nativamente anti aliasing è possibile forzarne l'abilitazione da driver con l'opzione "Override any application settings", ma è possibile che questa modalità possa non funzionare con tutti i giochi.

a_driver_1.gif (9248 bytes)

Una volta selezionato il tipo di anti aliasing, è possibile abilitarne la modalità: il menu sopra raffigurato permette quindi di selezionare dalla modalità 2x a quella 16xQ, introducendo le 4 nuove modalità Coverage Sampling Antialiasing o CSAA 8x, 8xQ, 16x e 16xQ.

Alla base della tecnica del Coverage Sampling Antialiasing troviamo la volontà di superare le limitazioni della tecnologia Multisampling; quest'ultima opera in modo efficace fino a 4 sample, limite superato il quale i requisiti in termini di capacità di elaborazione e spazio di memoria per archiviare tutti i sample diventano così esigenti da creare più limitazioni prestazionali che effettivi benefici qualitativi.

Rispetto alla tecnica del Multisampling, il Coverage Sampling riduce il numero di colori e Z memorizzati per ogni sample, riducendo per questo motivo il quantitativo di memoria utilizzata per ogni sample e di conseguenza la sua bandwidth. La tabella seguente confronta il tipo di samples che vengono presi con Anti Aliasing Multisample e Coverage Sample:

Livello AA 2x 4x 8x 16x 8x 8xQ 16x 16xQ
Tipo

Multisampling

Coverage Sampling

Texture/Shader Samples 1 1 1 1 1 1 1 1
Stored Color/Z Samples 2 4 8 16 4 8 4 8
Coverage Samples 4 4 8 16 8 8 16 16

A parità di livello di anti aliasing, la modalità Coverage Sampling permette di ridurre il numero di sample per colori memorizzati e per Z rispetto alla più dispendiosa modalità Multisample; NVIDIA dichiara che il Coverage Sampling 16x permette quindi di ottenere livelli prestazionali molto vicini a quelli dell'anti aliasing Multisample 4x, con un netto incremento della qualità d'immagine.

NVIDIA ha implementato nelle architetture GeForce 8800 il supporto FP16 e FP32 per l'High Dynamic Range (HDR), congiuntamente con l'utilizzo dell'anti aliasing: questo permette quindi di abilitare HDR con AA con i titoli che supportano questa funzionalità, quali ad esempio Oblivion, sino ad oggi appannaggio delle sole soluzioni ATI Radeon X1000.

Pagina 10 - Analisi prestazioni con Coverage Sampling Antialiasing

Per valutare il livello prestazionale ottenibile con Coverage Sampling Antialiasing abbiamo utilizzato il gioco Far Cry, abbinato alla mappa Regulator e aggiornato alla versione 1.4; le risoluzioni vidoe utilizzate nei test sono state quelle di 1600x1200, 2048x1536 e 2560x1600 pixel, abilitando sempre il filtro anisotropico 16x. Partendo dall'impostazione con Anti Aliasing disabilitato abiamo effettuato rilevazioni con impostazioni 2x e 4x, abilitandole dal gioco, e successivamente da driver forzando la modalità Coverage Sampling Antialiasing con impostazioni 8x e 16x.

far_cry_aa_1.png (43260 bytes)

far_cry_aa_2.png (45827 bytes)

far_cry_aa_3.png (41685 bytes)

E' evidente come l'impatto sulle prestazioni velocistiche sia, abilitando le varie modalità di anti aliasing, decisamente importante ma che rimanga tale da garantire ottima giocabilità complessiva anche alla risoluzione di 2560x1600 con impostazione 4x. Abilitando il Coverage Sampling Antialiasing si evidenziano livelli di frames complessivamente molto interessanti, con un calo più netto forzando le modalità 8xQ e 16xQ soprattutto all'aumentare della risoluzione video.

far_cry_aa_4.png (41346 bytes)

Il confronto con la scheda GeForce 7950 GX2 570M XXX, capace di sfruttare anti aliasing 8x e 8xQ in tradizionale multisampling, si dimostra essere impietoso per quest'ultima: l'impatto sui frames è così elevato già alla risoluzione di 1600x1200 da non poter essere di fatto accettabile.

Pagina 11 - Qualità d'immagine del filtro anisotropico

Uno dei punti deboli riconosciuti delle architetture video NVIDIA GeForce 7900 è sempe stata la qualità del filtro anisotropico, soprattutto se confrontata con quella della soluzione concorrente ATI Radeon X1950. MVIDIA ha implementato da driver varie impostazioni con le quali intervenire a ottimizzare la qualità di questo filtro, non riuscendo tuttavia a garantire un comportamento che bilanciasse al meglio qualità e prestazioni velocistiche. La schermata seguente mostra come, dal pannello dei driver NVIDIA, sia possibile intervenire sulla qualità del filtro anisotropico.

pann_anis_g71.gif (8807 bytes)

Dal pannello è possibile osservare le ottimizzazioni disponibili; le impostazioni di default, tipicamente non toccate dagli utenti, privilegiano le prestazioni, con una resa qualitativa con architetture GeForce 7900 non all'altezza di quanto ottenibile con impostazioni di default con le schede Radeon X1950XTX.

L'obiettivo del filtro anisotropico è di migliorare la resa delle texture in alta risoluzione quando sono applicate su superfici lontane dal punto di osservazione: in tal caso, infatti, è molto probabile che una texture debba essere disegnata attraverso numero di pixel sullo schermo notevolmente inferiore rispetto alle sue dimensioni e ciò richiede una sua ricampionatura. Il filtro anisotropico esegue questa operazione e, a seconda delle modalità e del numero di campioni presi, può garantire una qualità delle texture più o meno accurata e, conseguentemente, un realismo della scena tridimensionale finale più o meno convincente.

Per valutare l'implementazione del filtro anisotropico adottata da NVIDIA con le nuove schede GeForce 8800 abbiamo utilizzato il Texture Filter Analyzer; questa piccola utility visualizza un cilindro cavo impostando il punto di vista al suo interno con la camera che punta in direzione parallela all'altezza del cilindro. Questo cilindro è tappezzato all'interno con una texture a scacchiera, bianca e nera: l'immagine risultante non è altro che l'interno del cilindro che, a causa della prospettiva, si restringe man mano che le pareti si allontanano dalla camera. Il Texture Filter Analyzer consente di visualizzare i livelli di mipmapping, cioè i livelli di dettaglio (LOD) con cui la scheda video disegna le texture, colorandoli. In particolare la banda più vicina (che per effetto della prospettiva è più esterna) è rossa e rappresenta il primo LOD, cioè la prima ricampionatura (di minor dettaglio) della texture rispetto all'originale. I restanti livelli di mipmap sono più interni e vengono evidenziati con altri colori.

Nella valutazione della qualità del filtro anisotropico sono essenzialmente due gli aspetti che ci interessa osservare: la variazione tra un livello di dettaglio e l'altro ed il dettaglio stesso. Il primo lo estrapoliamo osservando come viene effettuato il passaggio da una fascia colorata ad una adiacente, mentre il dettaglio può essere valutato dalla vicinanza della banda rossa al bordo.

Per ogni livello di filtro anisotropico sono state fornite le impostazioni qualitative ottenute con le schede GeForce 8800 GTX, Radeon X1950XTX e GeForce 7950GX2; quest'ultima è identica a quella della soluzione GeForce 7900, essendo entrambe basate sulla stessa architettura di GPU G71. Cliccando sui nomi delle schede è possibile visualizzare lo screenshot corrispondente.

No Anisotropico

Anisotropico 2x

Il livello qualitativo del filtro anisotropico 2x di ATI è complessivamente migliore di quello delle due soluzioni NVIDIA, che in buona sostanza si equivalgono.

Anisotropico 4x

Passando all'anisotropico 4x c'è un netto cambiamento nel modo con il quale le 3 GPU gestiscono la qualità delle textures: GeForce 7950 GX2 e Radeon X1950XTX applicano un filtraggio conservativo ad alcuni angoli, mentre per G80 questa limitazione non si verifica in quanto il filtro viene sempre applicato a tutti gli angoli.

Questa ottimizzazione in funzione dell'angolo è una scelta di compromesso, che permette di risparmiare su alcune elaborazioni. Poiché la maggioranza dei videogames, specie gli FPS, mostrano un ambiente con pavimenti e muri perpendicolari tra loro e dotati di texture discretamente dettagliate e poiché è principalmente in quei punti dello schermo che è concentrata l'attenzione del giocatore, è possibile risparmiare potenza di calcolo nell'elaborazione del filtro anisotropico per le altre superfici. Per questo motivo il livello di filtraggio anisotropico è inferiore per alcuni angoli e non per altri.

Anisotropico 8x

La situazione si ripresenza con livello 8x: G80 non introduce ottimizzazioni legate all'angolo di visuale, mentre questo accade sia con G71 che con R580. Il livello di ottimizzazione scelto da ATI è complessivamente meno spinto, e questo spiega la superiore qualità del filtro anisotropico delle schede Radeon X1950XTX rispetto a quello delle soluzioni GeForce 7900-7950.

Anisotropico 16x

A 16x, infine, G80 evidenzia la migliore qualità di filtraggio possibile, distanziando in modo netto sia Radeon X1950XTX che GeForce 7950 GX2. Attraverso le opportune selezioni da lato driver è possibile migliorare ulteriormente il livello di filtraggio anisotropico sia delle schede ATI che di quelle NVIDIA; abbiamo tuttavia preverito analizzare quelle che sono le impostazioni di default, in quanto quelle che abbiamo adottato nelle analisi prestazionali delle pagine seguenti e soprattutto quelle che riteniamo gli utenti adotteranno come predefinite nel loro sistema.

Bisogna tenere quindi in opportuna considerazione che la scheda GeForce 8800 GTX, con impostazioni di default, ha una qualità d'immagine con filtro anisotropico 4x o superiore abilitato più elevata sia delle altre soluzioni NVIDIA che delle concorrenti ATI. Utilizzando impostazioni qualitative più spinte per le schede Radeon X1950XTX e GeForce 7900 GTX e 7950 GX2 si ha ovviamente un impatto negativo sulle prestazioni velocistiche, con ripercussioni sui frames al secondo generati.

Pagina 12 - PureVideo e PureVideo HD

Le architetture GeForce 8800 contiuano ad integrare al proprio interno il programmable video engine che NVIDIA ha presentato per la prima volta con le soluzioni GeForce 6800 Ultra, note anche con il nome in codice di NV40. Questo è attivamente utilizzato da NVIDIA per gestire al meglio la qualità di tutti i flussi video, attraverso la tecnologia PureVideo che altro non è che il nome marketing utilizzato per evidenziare questo componente hardware, e la controparte software data dai driver Forceware.

ATI e NVIDIA hanno a lungo battagliato, negli ultimi mesi, cercando di proporre la migliroe qualità possibile nella riproduzione con flussi video in standard definition; alla base l'utilizzo del popolare benchmark HQV, che permette di evidenziare come una scheda video, e di conseguenza la tecnologia ad essa associata, intervenga a correggere i principali difetti di riproduzione.

Abbiamo eseguito questo test con le schede Radeon X1950XTX, GeForce 7900 GTX e GeForce 8800 GTX, con i seguenti risultati per i singoli test:

 

Massimo

Radeon X1950XTX

GeForce 7900 GTX

GeForce 8800 GTX

Color Bar/Vertical Detail 10 10 10 10
Jaggies Pattern 1 5 5 5 5
Jaggies Pattern 2 5 5 3 3
Waving Flag 10 5 5 10
Picture Detail 10 10 10 10
Noise Reduction 10 10 10 10
Motion Adaptive Noise Reduction 10 10 10 10
Film Detail 3:2 Detection 10 10 10 10

Cadence

2:2 5 5 5 5
2:2:2:4 5 5 5 5
2:3:3:2 5 5 5 5
3:2:3:2:2 5 5 5 5
5:5 5 5 5 5
6:4 5 5 5 5
8:7 5 5 5 5
3:2 5 5 5 5
Horizontal text crawl 10 10 10 10
Vertical text scroll 10 10 10 10
Totale 130 125 123 128

Con la scheda GeForce 8800 GTX NVIDIA è stata capace di migliroare ulteriormente il punteggio della soluzione 7900 GTX, raggiungendo la soglia di 128 punti su 130 massimi; NVIDIA ha evidenziato come con prossime revision dei driver si miri a raggiungere il punteggio pieno con le nuove architetture G80. Se la riproduzione qualitativa con flussi video standard definition, quelle dei film DVD per essere più chiari, non rappresenta più un problema con le più recenti architetture video sia di ATI che di NVIDIA, lo stesso non può essere detto per i flussi video in alta definizione.

NVIDIA sta operando da tempo per proporre, attraverso il video processing engine implementato in tutte le proprie GPU della serie GeForce 7, una superiore qualità d'immagine con i flussi video HD. In occasione del Computex 2006 di Taipei, lo scorso mese di Giugno, ha presentato PureVideo HD, nome marketing che raccoglie tutte le caratteristiche tecniche del proprio programmable video engine e dei driver Forceware che concorrono a fornire una elevata qualità di riproduzione dei flussi video HD.

Le schede GeForce 8800 introducono alcune funzionalità specificamente pensate per migliorare la qualità d'immagine dei filmati HD:

  • VC-1 e H.264 Spatial-Temporal Deinterlacing;
  • VC-1 e H.264 Inverse Telecine;
  • HD Noise reduction;
  • HD Edge enhancement.

Le innovazioni che nel corso del 2006 NVIDIA ha portato, attraverso nuove revision dei propri driver Forceware, in PureVideo per flussi standard definition verranno progressivamente introdotte anche con materiale high definition. Prossimamente analizzeremo la qualità d'immagine delle soluzioni video ATI e NVIDIA con materiale HD in un articolo dedicato.

Pagina 13 - Configurazione di test

Valutare le prestazioni velocistiche di architetture video di nuova generazione implica l'utilizzo di una piattaforma di test che possa non rappresentare un collo di bottiglia alle prestazioni della scheda video. Per questo motivo è stato utilizzato il processore Intel Core 2 Extreme X6800, attualmente la più veloce soluzione dual core tra quelle disponibili in commercio. Questo processore è stato preferito al recente Core 2 Extreme QX6700, presentato da Intel la scorsa settimana, in quanto gli attuali giochi non permettono di sfruttare appieno la presenza di 4 core di processore distinti; la cpu Core 2 Extreme X6800, con una frequenza di clock di 2,93 GHz, risulta quindi essere preferibile a quella Core 2 Extreme QX6700, dal clock di 2,67 GHz, in questo particolare tipo di utilizzo.

La scheda madre scelta per il sistema è quella Intel D975XBX2KR, soluzione per processori Socket 775 LGA basata su chipset Intel 975X; la memoria DDR2-800, in quantitativo di 2 Gbytes, è quella Corsair XPS CM2X1024-6400C3, configurata per operare con timings pari a 3-4-3-9 alla frequenza di clock di 800 MHz. L'hard disk adottato è un modello Western Digital Caviar WD1600JS da 160 Gbytes, con interfaccia SATA e velocità di rotazione dei piatti di 7.200 giri al minuto.

Il sistema operativo utilizzato è Windows XP Professional, con Service Pack 2 e tutti i fix aggiornati a Ottobre 2006; i driver adottati per le schede video NVIDIA sono quelli Forceware 96.94, mentre per le soluzioni ATI sono stati utilizzati driver Catalyst 6.10.

dell_s.jpg (43097 bytes)
sistema di test con display Dell 3007WFP

Un componente fondamentale nell'analisi di schede video di così elevata potenza elaborativa è il display: ha infatti poco senso abbinare schede così veloci a risoluzioni video ridotte. La scelta è caduta su una delle due soluzioni attualmente disponibili in commercio capaci di supportare nativamente la risoluzione di 2560x1600 pixel: parliamo del display Dell 3007WFP, soluzione con diagonale da 30 pollici.

Le risoluzioni video utilizzate in questo articolo non sono mai state inferiori a quella di 1600x1200, e in nessun caso è stata utilizzata una modalità senza filtro anisotropico 16x abilitato; questa scelta è nuovamente motivata dall'elevata potenza elaborativa di queste schede video, che necessitano proprio di impostazioni qualitative spinte al massimo per poter essere sfruttate al meglio.

Il confronto con la scheda NVIDIA GeForce 8800 GTX è stato effettuato utilizzando le soluzioni GeForce 7950 GX2 e GeForce 7900 GTX di NVIDIA, oltre alla scheda Radeon X1950XTX di ATI; la prima è stata scelta in quanto la più veloce soluzione a singola scheda che NVIDIA ha immesso in commercio, la seconda in quanto la proposta top di gamma di NVIDIA a singola GPU e la terza quale concorrente diretta di ATI, almeno fino alla presentazione delle soluzioni R600 a inizio 2007. In aggiunta troviamo la scheda GeForce 7950 GX2 570M XXX di XFX, che si distingue dalla reference board per utilizzare frequenze di clock sensibilmente superiori (570 MHz GPU e 1.550 MHz memoria).

Pagina 14 - Test sintetici

3dmark_1.png (37148 bytes)

In termini di puro fill rate la scheda GeForce 8800 GTX non si discosta che in misura marginale da quanto registrato dalla soluzione GeForce 7900 GTX che va a sostituire. Ben superiore il risultato della soluzione GeForce 7950 GX2 570M XXX, che del resto combina due GPU G71 sullo stessa scheda collegate attraverso tecnologia SLI. Come vedremo nell'analisi dei giochi 3D nelle pagine seguenti, i titoli attuali sono poco dipendenti dal puro fill rate di cui è capace una scheda video e molto più dalla capacità di elaborazione degli shader.

3dmark_2.png (31235 bytes)

3dmark_3.png (28163 bytes)

Sostanziale allineamento tra le schede GeForce 8800 GTX e GeForce 7950 GX2 570M XXX nei test sintetici su pixel e vertex shader del benchmark 3D Mark 2006. E' bene ricordare come la soluzione GeForce 7950 GX2 sia basata su due GPU operanti in parallelo, architettura che in questo genere di test permette di ottenere una notevole scalabilità delle prestazioni.

3dmark_4.png (28386 bytes)

Il test Perlin Noise 3.0 è una delle novità del benchmark 3D Mark 2006 rispetto a quello versione 2005; in questo test la GeForce 8800 GTX mostra le proprie potenzialità, facendo registrare il valore più elevato in assoluto tra tutte le schede in prova. A titolo di confronto, la soluzione G80 top di gamma è in questo test circa 2,5 volte più veloce della scheda GeForce 7900 GTX.

shadermark.png (77375 bytes)

Shadermark conferma quanto anticipato da alcuni dei test sintetici del 3D Mark 2006: la scheda GeForce 8800 GTX distanzia nettamente le soluzioni a singola GPU Radeon X1950XTX e GeForce 7900 GTX (quest'ultima presa come riferimento prestazionale e quindi con valori sempre pari a 1), ma altrettanto nettamente stacca la scheda GeForce 7950 GX2 570M XXX che beneficia della presenza di due GPU che operano in parallelo.

Pagina 15 - Splinter Cell Chaos Theory

I test con Splinter Cell Chaos Theory, aggiornato alla versione 1.05, sono stati eseguiti utilizzando il demo Lighthouse di Ubisoft; le risoluzioni di test sono quelle di 1600x1200 e 2080x1536, le due più elevate nel formato 4:3, utilizzando filtro anisotropico 16x sempre attivo con anti aliasing 4x in un caso e con High Dynamic Range nell'altro.

sc_1.png (35815 bytes)

Abilitando anti aliasing 4x e anisotropico 16x la scheda GeForce 7950 GX2 570M XXX distanzia la soluzione GeForce 8800 GTX in modo netto ad entrambe le risoluzioni di test, a motivo del superiore fill rate dato dalla presenza di due GPU che lavorano in parallelo; ben più distanziate le altre due schede, con la Radeon X1950XTX a chiudere e a confermare come con queste impostazioni Splinter Cell Chaos Theory si avantaggi di un fill rate elevato.

sc_2.png (35304 bytes)

Passando all'utilizzo dell'High Dynamic Range le schede GeForce 7950 GX2 e 8800 fanno registrare prestazioni velocistiche molto vicine tra di loro, con un lieve margine di vantaggio per la prima; significatico il divario con le soluzioni Radeon X1950XTX e GeForce 7900 GTX, soprattutto con quest'ultima alla risoluzione limite di 2048x1536 pixel.

Pagina 16 - Serious Sam 2

Con il gioco Serious Sam 2 abbiamo utilizzato la scena Branchester, utilizzando la patch versione 2.070 e servendoci dei tool di benchmarking automatizzati di Hocbench. Le risoluzioni video utilizzate sono quelle di 1600x1200 e 2048x1536 pixel, abbinando come per Serios Sam 2 da un lato l'anti aliasing 4x e dall'altro l'HDR al filtraggio anisotropico 16x.

ss2_1.png (34124 bytes)

Netto margine di vantaggio della soluzione GeForce 8800 sulle due soluzioni a singola GPU; rispetto alla scheda GeForce 7900 GTX i frames risultano essere pressoché raddoppiati. Il confronto con la soluzione Geforce 7950 GX2 570M XXX vede la nuova proposta NVIDIA nuovamente in vantaggio, con un margine medio pari a circa il 10% ad entrambe le risoluzioni utilizzate nei test.

ss2_2.png (35038 bytes)

Abilitando l'High Dynamic Range il quadro non cambia: incrementa anzi il margine di vantaggio sulla soluzione GeForce 7950 GX2 570M XXX, con frames superiori di circa il 25% alla risoluzione di 2048x1560 pixel.

Pagina 17 - X3 Reunion - Far Cry

Il rolling demo di X3 Reunion, liberamente scaricabile a questo indirizzo, permette di vedere il funzionamento di questo gioco e di valutare le prestazioni del proprio sistema attraverso la modalità di benchmarking integrata. I test sono stati eseguiti alle risoluzioni di 1920x1200 e 2560x1600, abbinando anti aliasing 4x a filtro anisotropico 16x

x3.png (34484 bytes)

Prestazioni pressoché allineate per le due soluzioni NVIDIA GeForce 8800 GTX e GeForce 7950 GX2 570M XXX, con lieve prevalenza della seconda alla risoluzione inferiore. Più distanziate le altre due schede a singola CPU, in particolare la GeForce 7900 GTX.

Far Cry è un titolo da molto tempo utilizzato nell'analisi delle schede video, ancora valido per valutare le prestazioni di soluzioni top di gamma se abbinato a risoluzioni video particolarmente spinte e all'utilizzo di filtri. Il gioco è stato aggiornato con la patch 1.4, utilizzando le soluzioni di 1600x1200 e 2560x1600 in abbinamento ad anti aliasing 4x e anisotropico 16x.

far_cry.png (33328 bytes)

I risultati evidenziano un lieve margine di vantaggio per la scheda GeForce 8800 GTX sulla soluzione GeForce 7950 GX2 570M XXX ad entrambe le risoluzioni; molto più distanziata la scheda GeForce 7900 GTX, i cui frames al secondo sono di fatto raddoppiati dalla soluzione G80 top di gamma, mentre nel complesso valido il risultato ottenuto dalla scheda Radeon X1950 XTX soprattutto alla risoluzione di 2560x1600 pixel.

Pagina 18 - F.E.A.R.

F.E.A.R. è uno dei giochi più utilizzati per valutare le prestazioni delle schede video di ultima generazione; è un titolo particolarmente esigente quanto a potenza del sottosistema video, e permette di abilitare le soft shadows stressando ulteriormente la GPU. Il gioco è stato patchato alla versione 1.08, utilizzando le risoluzioni video di 1600x1200, 1920x1200 e 2560x1600 in abbinamento a anti aliasing 4x con anisotropico 16x da una parte, e a soft shadows dall'altra.

fear_1.png (35201 bytes)

La scheda GeForce 8800 GTX si dimostra complessivamente la più veloce nel test con F.E.A.R., facendo registrare frames superiori alla soluzione GeForce 7950 GX2 570M XXX alla risoluzione di 2560x1600; alle due inferiori è invece la soluzione dual GPU di NVIDIA ad avantaggiarsi. Passando al confronto con la scheda GeForce 7900 GTX si evidenzia come alla risoluzione limite i frames della nuova arrivata di NVIDIA siano esattamente il doppio di quelli della scheda basata su GPU G71. Buon risultato per la scheda Radeon X1950XTX, che distanzia la scheda GeForce 7900 GTX pur restando ben lontana dalle due proposte NVIDIA top di gamma.

fear_2.png (36304 bytes)

L'analisi dei frames minimi evidenzia come la scheda GeForce 7950 GX2 permetta di registrare valori superiori alla soluzione GeForce 8800 GTX, con un divario superiore a quanto registrato analizzando i frames medi nel precedente grafico; a 1600x1200 i frames non scendono, con queste due schede video, sotto i 40 frames al secondo, soglia che può essere considerata di tutta sicurezza per garantire una buona giocabilità.

fear_3.png (34672 bytes)

Abilitando le soft shadows la scheda GeForce 8800 GTX distanzia nettamente le altre schede, soprattutto alla risoluzione limite di 2560x1600; in questo caso il margine di vantaggio sulla scheda GeForce 7950 GX2 570M XXX è pari a circa il 35%, mentre rispetto alla soluzione GeForce 7900 GTX i frames della scheda GeForce 8800 GTX sono di fatto più che raddoppiati.

Pagina 19 - Half Life 2: Episode 1 e Lost Coast

Episode 1 è l'ultima espansione di Half-Life 2 ad essere stata rilasciata da Valve attraverso il proprio sistema di distribuzione Steam; in questo test abbiamo utilizzato le risoluzioni di 1920x1200 e 2560x1600 pixel, in abbinamento da una parte ad anti aliasing 4x e dall'altra ad HDR sempre forzando il filtro anisotropico a 16x. Il demo utilizzato è quello trdem1 messo a disposizione dal sito techreport.

hl2_ep1_1.png (33152 bytes)

hl2_ep1_2.png (34569 bytes)

Con entrambe le impostazioni la scheda GeForce 8800 GTX si avantaggia nettamente sulle altre soluzioni concorrenti, facendo segnare livelli di frames al secondo che raggiungono un margine di vantaggio di circa il 67% alla risoluzione di 2560x1600 pixel con HDR abilitato rispetto alla scheda GeForce 7950 GX2 570M XXX. Nella stessa configurazione il vantaggio sulla scheda GeForce 7900 GTX supera il 145%.

Lost Coast è stata una delle prime espansioni di Half-Life 2 ad essere stata rilasciata da Valve; i test sono stati eseguiti con lo script di hocbench, utilizzando le risoluzioni di 1600x1200, 1920x1200 e 2560x1600 pixel abilitando sia anti aliasing 4x che anisotropico 16x.

hl2_lc.png (39608 bytes)

Buon margine di vantaggio della scheda GeForce 8800 GTX rispetto alla soluzione GeForce 7950 GX2 570M XXX in tutte le risoluzioni di test, e divario ancor più accentuato con le due soluzioni video a singola GPU di ATI e NVIDIA; segnaliamo come alla risoluzione limite il valore registrato dalla scheda GeForce 8800 GTX sia pari pressoché al doppio di quello della scheda GeForce 7900 GTX.

Pagina 20 - Prey - Quake 4 - Call of Duty 2

Prey è un titolo basato sull'engine di Doom 3, recentemente presentato sul mercato; per valutare le prestazioni con questo titolo abbiamo utilizzato la versione retail del gioco, con il benchmark appositamente sviluppato da hocbench utilizzando il demo hwzone. Le risoluzioni video scelte sono state quelle di 1600x1200 e 2560x1600 pixel, attivando anti aliasing 4x e anisotropico 16x.

prey.png (32483 bytes)

Margine di vantaggio di poco superiore al 10% per la scheda GeForce 8800 GTX rispetto alla soluzione GeForce 7950 GX2 570M XXX con questo titolo; ben più distanziate le altre due schede video ATI e NVIDIA a singola GPU, con nuovamente un raddoppio dei frames alla risoluzione limite della scheda GeForce 8800 GTX rispetto alla proposta GeForce 7900 GTX.

Secondo titolo Open GL è Quake 4, analizzato alle risoluzioni video di 1920x1200 e 2560x1600 in abbinamento ad anti aliasing 4x e anisotropico 16x; il gioco è stato aggiornato alla versione 1.2, utilizzando per i test la netdemo1.

quake4.png (33670 bytes)

Il quadro è simile a quanto visto in precedenza con Prey: la scheda GeForce 8800 GTX distanzia di un certo margine la scheda GeForce 7950 GX2 570M XXX alla risoluzione video più elevata, mentre le due soluzioni a singolo chip rimangono ben più lontane.

cod2.png (34046 bytes)

Con Call Of Duty, analizzato sempre alle risoluzioni di 1920x1200 e 2560x1600 con anti aliasing 4x e anisotropico 16x, la scheda GeForce 7950 GX2 570M XXX si avantaggia su quella GeForce 8800 GTX, con un margine medio quantificabile in meno del 10% ad entrambe le risoluzoni di test. Nel complesso poco distanziata dalla soluzione G80 anche la scheda Radeon X1950XTX, mentre ben più lontana è la scheda GeForce 7900 GTX.

Pagina 21 - Oblivion

Oblivion è indubbiamente uno dei titoli del 2006 che mette maggiormente sotto stress un sistema; mancando una modalità di benchmarking automatizzata, abbiamo rilevato le prestazioni utilizzando l'utility Fraps. Le impostazioni utilizzate sono state quelle di 4x per l'anti aliasing e 16x per il filtro anisotropico, con risoluzione di 1920x1200. La scena misurata è di poco meno di 1 minuto di durata, all'interno del livello 8 del gioco, in uno scenario aperto con un'imponente costruzione su un lato della scena. Il gioco è stato aggiornato alla versione 1.1 in italiano; le impostazioni qualitative all'interno del gioco sono state tutte portate ai massimi valori, tranne per l'HDR che è stato disabilitato.

oblivion_1.png (16679 bytes)

I frames medi evidenziano un chiaro margine di vantaggio per la scheda GeForce 8800 GTX, soprattutto in termini di frame rate minimo.

oblivion_2.png (41302 bytes)

Fraps permette di registrare una seguenza di gioco predefinita dall'utente, memorizzandone tutte le caratteristiche in termini di frame rate per ogni secondo. Nel grafico qui sopra riportato abbiamo evidenziato il comportamento delle 4 schede istante per istante; si deve ricordare che trattandosi di una scena di gioco, è impossibile ripetere in modo identico l'esecuzione della scena misurata con ogni scheda come se si trattasse di un timedemo. Per questo motivo vi possono essere lievi differenze tra una scheda e l'altra, anche se in linea di massima l'andamento è pienamente confrontabile.

Si nota chiaramente come i frames medi della soluzione GeForce 8800 GTX rimangano sempre ben superiori a quelli delle altre 3 soluzioni concorrenti durante lo svolgimento della scena.

Pagina 22 - HDR con anti aliasing

NVIDIA ha implementato nelle architetture GeForce 8800 il supporto FP16 e FP32 per l'High Dynamic Range (HDR), congiuntamente con l'utilizzo dell'anti aliasing; per valutare il livello prestazionale ottenibile abbiamo utilizzato alcuni giochi che supportano l'HDR, abilitando anisotropico 16x e anti aliasing 4x.

hl2_hdr.png (20998 bytes)

sc_hdr.png (23898 bytes)

ss2_hdr.png (22705 bytes)

La scheda GeForce 8800 GTX riesce a far registrare ottimi livelli prestazionali complessivi con HDR e anti aliasing abilitati; il confronto con la scheda Radeon X1950XTX lascia capire come sia possibile, con la scheda G80, utilizzare una risoluzione video superiore a quella della scheda Radeon X1950XTX  lasciando invariate le impostazioni qualitative senza dover per questo peggiorare il livello di frames al secondo.

Pagina 23 - Scalabilità al variare della cpu

E' indispensabile abbinare ad una scheda video di ultima generazione, soprattutto se top di gamma, un processore che sia in grado di bilanciarne la potenza elaborativa. Per questo motivo abbiamo optato per un sistema basato su processore Intel Core 2 Extreme X6800 nella piattaforma di test utilizzata in questo articolo. Cosa succede qualora si utilizzino processori dal clock più basso? In questa pagina analizzeremo le variazioni dei frames con 5 titoli, mantenendo le impostazioni qualitative con anti aliasing 4x e anisotropico 16x, variando il processore: alla cpu Core 2 Extreme X6800 abbineremo un processore Core 2 Duo E6700 (2,66 GHz di clock) e uno Core 2 Duo E6600 (2,4 GHz di clock).

In questa analisi abbiamo scelto di tenere fissi due elementi:

  • la scelta dei processori non comprende soluzioni inferiori alla cpu Core 2 Duo E6600: con cpu dall'inferiore potenza elaborativa avremmo sicuramente ottenuto maggiore variabilità dei frames, ma non ha senso acquistare la scheda video top di gamma attualmente disponibile in commercio e abinare ad essa un processore non sufficientemente potente.
  • non abbiamo modificato le risoluzioni video rispetto a quelle selezionate per i test prestazionali: utilizzando risoluzioni più basse i frames sarebbero stati maggiormente influenzati dalla potenza elaborativa del processore, ma anche in questo caso siamo partiti dalla considerazione che chi vuole acquistare una soluzione video di questo tipo cercherà di sfruttarla al meglio, abbinandola con le più elevate risoluzioni video che il proprio monitor permette di impostare.

cpu_fc.png (13199 bytes)

cpu_hl.png (16651 bytes)

cpu_prey.png (13424 bytes)

cpu_sc.png (12526 bytes)

cpu_ss2.png (13253 bytes)

E' evidente come siano pochi gli scenari nei quali la scheda GeForce 8800 sia limitata dal processore; alla luce delle note espresse in precedenza ricordiamo in ogni caso come sia preferibile avere a disposizione un sistema di elevata potenza elaborativa da abbinare a una scheda come la GeForce 8800 GTX.

Pagina 24 - Conclusioni

Analizzado i risultati prestazionali registrati nel corso dei test bisogna tenere in massima considerazione due elementi:

  • la qualità del filtro anisotropico delle schede GeForce 8800 GTX è nettamente superiore, con impostazione 16x utilizzata nei test, rispetto a quello delle soluzioni concorrenti sia ATI che NVIDIA; per ottenere qualità comparabile con queste architetture si sarebbe ottenuto un ulteriore impatto negativo sui frames, e quindi un ancor più elevato margine di vantaggio per la soluzione GeForce 8800 GTX.
  • quella G80 è un'architettura completamente nuova, che è stata specificamente pensata da NVIDIA per l'abbinamento con le API DirectX 10 e con i giochi di prossima generazione; sarà in questi scenari di utilizzo che questo prodotto, e ovviamente lo stesso vale per la futura concorrente R600 di ATI, potrà esprimersi al meglio. Tutte le analisi prestazionali condotte in questo articolo sono state effettuate con titoli DirectX 9 o Open GL.

Alla luce di queste premesse, la scheda GeForce 8800 GTX si è dimostrata essere la soluzione a singola scheda più veloce tra quelle disponibili in commercio, distanziando nettamente le proposte concorrenti sia della stessa NVIDIA che di ATI. Nel momento in cui è possibile alzare la qualità video ai massimi livelli, abilitando filtri spinti e tutte le impostazioni qualitative all'interno dei giochi, la scheda GeForce 8800 GTX ha distanziato in modo ancor più marcato le altre soluzioni inserite quale metro di paragone: ne è una testimonianza quanto ottenuto con F.E.A.R. abilitando le soft shadows.

E' pertanto indispensabile utilizzare un display di adeguata risoluzione con questa scheda, scegliendo la risoluzione di 1600x1200 come minimo e predilegendo, ove possibile, schermi widescreen in rapporto 16:10 con risoluzione di 1920x1200 o superiore. Abbinare un prodotto di questo tipo a risoluzioni inferiori, o peggio ancora scegliere di non abilitare anti aliasing spinti e filtro anisotropico, equivale a non sfruttare al meglio un investimento economico non indifferente.

In termini di qualità d'immagine NVIDIA ha operato a correggere uno dei principali limiti delle architetture GeForce serie 7: la qualità del filtro anisotropico non ha ora nulla da invidiare a quella delle soluzioni ATI, risultando essere superiore ad impostazioni di default con valore 16x come abbiamo evidenziato all'interno dell'articolo. Le nuove modalità di anti aliasing Coverage Sampling rappresentano un'innovazione indubbiamente interessante: il settaggio 8x è ora utilizzabile anche a risoluzioni video elevate, senza le eccessive penalizzazioni prestazionali evidenziate ad esempio con la soluzione GeForce 7950 GX2.

La GeForce 8800 GTX è una scheda ingombrante, molto costosa, che consuma parecchio e che sarà presumibilmente difficile da trovare in commercio nelle prime settimane di vendita a motivo della forte domanda; d'altra parte, è la più veloce soluzione a oggi disponibile in commercio e soprattutto rappresenta un acquisto che a oggi permetterà di avere pieno supporto delle funzionalità delle API DirectX 10, nel momento in cui Windows Vista verrà rilasciato a inizio 2007.

Ad inizio settimana sono emerse alcune informazioni di un problema costruttivo legato ad alcune schede GeForce 8800 GTX, non GTS, pronte per essere commercializzate. NVIDIA ha confermato il problema intervenendo in questi giorni per risolverlo. Questo quanto dichiarato da Luciano Alibrandi, Director of Product PR - EMEA per NVIDIA, a riguardo:

Oggi NVIDIA ha annunciato il lancio effettivo e l’immediata disponibilità delle nuove GPU di punta della gamma, le GeForce 8800. Alcuni articoli comparsi recentemente sul Web denunciano che le prime serie di schede GeForce 8800 GTX sarebbero affette da un errore BOM (errato valore di un resistore). Tutte le schede che evidenziavano questo problema sono state immediatamente eliminate dalla catena di produzione. I prodotti disponibili nei negozi sono pienamente qualificati e certificati da NVIDIA e dai suoi partner produttori di schede. NVIDIA e i suoi partner garantiscono pienamente la funzionalità e l’efficienza di questi prodotti.

Alcune schede sono disponibili in commercio da subito, mentre altre arriveranno sugli scaffali nei prossimi giorni. E' prevedibile che per il lancio vi saranno prezzi praticati ben superiori a quanto consigliato da NVIDIA e dai partner: è questa una pratica che non condividiamo ma che in un'ottica di mercato è abbastanza scontato si verifichi. Al momento del lancio di architetture top di gamma molto attese, come lo sono le schede GeForce 8800 di NVIDIA, la disponibilità di schede è sempre inferiore alla domanda di mercato: questo spinge verso l'alto in modo naturale i prezzi, destinati a livellarsi nelle settimane seguenti.

La nostra analisi delle soluzioni GeForce 8800 non è terminata: nelle prossime settimane affronteremo la soluzione GeForce 8800 GTS e le configurazioni SLI, soffermando la nostra attenzione sulla qualità d'immagine ottenibile con flussi video high definition e studiando al meglio la scalabilità dei frames e la qualità d'immagine con le nuove modalità di anti aliasing Coverage Sampling. Senza dimenticare la particolare architettura della GPU G80, che apre spazio con CUDA ad elaborazioni intensive che non siano necessariamente legate alla sola grafica dei videogiochi.