![]() |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| « Torna all'articolo - Stampa | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Pagina 1 - Introduzione
Era il 1996 l’anno in cui un’azienda di nome NVIDIA arrivava sul mercato con il suo processore grafico NV1 montato sulle schede video Diamond Edge 3D. Fin da allora le menti di questa società avevano dimostrato di possedere grande inventiva e creatività: NV1 utilizzava superfici curve e non triangoli come primitive per la descrizione di un oggetto tridimensionale. Inoltre possedeva capacità di gestione audio e perfino un controller per periferiche da gioco. Nonostante le innovazioni non si trattò di un prodotto che ebbe molto successo a causa dello scarso supporto da parte delle software house: all’epoca le API Direct 3D e OpenGL come le conosciamo oggi non esistevano e le software house dovevano sviluppare motori grafici in grado di supportare singolarmente ogni GPU. Siamo nel 2005 e da allora sono passati meno di 10 anni. Esistono campi nelle arti e nelle scienze in cui questo periodo di tempo può essere considerato non molto esteso; altri, come l’informatica, in cui 10 anni sono una vera eternità. Un tempo si parlava di 1°, 2° o 3° generazione di processori grafici. Oggi, ormai, a causa della crescente velocità con cui il tutto evolve, si è perso il conto del numero di generazioni che si sono susseguite. Per tutte le aziende impegnate in una lotta commerciale con almeno un concorrente forte, esistono periodi di alti e bassi. NVIDIA, naturalmente, non fa eccezione anche se ripercorrendo la sua storia possiamo affermare che il vero momento buio è stato essenzialmente uno: NV30. Nei restanti casi la società statunitense è sempre stata all’altezza della situazione contrastando i propri concorrenti con prodotti estremamente validi ed innovativi. NV40 è uno di questi. Questo processore grafico non solo è riuscito brillantemente a risollevare l’immagine dell’azienda, ma dal punto di vista puramente tecnico la sua architettura può essere considerata come una di quelle meglio riuscite negli ultimi anni: le schede GeForce 6800 Ultra fin dalla loro introduzione sono state sempre ai primi posti nelle varie comparative velocistiche e vantano un primato in termini di supporto tecnologico ancora imbattuto. Tali caratteristiche non potevano non dare vita ad una famiglia di processori grafici di indubbio successo: le schede GeForce 6600 hanno dimostrato di essere spesso più competitive delle corrispondenti soluzioni Radeon X700 e anche le GeForce 6200 con la loro tecnologia TurboCache hanno mantenuto la testa alta nel confronto con le Radeon X300 SE HyperMemory. A distanza di oltre un anno dall’arrivo di NV40, NVIDIA presenta la scheda video GeForce 7800 GTX, basata sul processore grafico G70. Quest’ultimo rappresenta la nuova offerta di fascia alta ed è destinato a combattere in prima linea nella battaglia contro l’antagonista ATI e la sua GPU di prossima generazione Pagina 2 - G70: l’architettura di base
302 milioni di transistor. E’ questo il primo impressionante dato di G70 che ci viene comunicato durante la presentazione. L’aspetto che sorprende maggiormente è il tipo di paragone che NVIDIA ha fatto: sommando tra loro il numero di transistor di tutte le GPU e CPU delle console GameCube, PS2 e XBox e aggiungendo a questo valore il numero di transistor di un Athlon 64 FX si arriva a 300,4 milioni di transistor, meno di quelli di G70. Ciò fa comprendere quanto sia effettivamente rapido lo sviluppo dei processori grafici per personal computer.
G70 è costruito con un processo produttivo a 0.11 micron da TSMC ed integra al suo interno ventiquattro pipeline di rendering (otto in più rispetto a NV40) ognuna delle quali in grado di applicare una texture per ciclo di clock e fino a sedici per passata di rendering. Il numero di vertex units dedicate all’esecuzione dei calcoli geometrici è passato da sei ad otto, mentre le ROPs, cioè quelle unità che hanno il compito di scrivere nel frame buffer il valore di ogni singolo pixel dello schermo, sono rimaste sedici. Nei prossimi paragrafi descriveremo in dettaglio le novità apportate ad ogni singola componente citata. L’unico elemento che anticipiamo in questo momento è che con la GeForce 7800 GTX NVIDIA aggiorna le tecnologie CineFX ed IntelliSample portandole alla versione 4.0.
La scheda GeForce 7800 GTX presenta una frequenza di lavoro di 430 Mhz per il core e 1200 Mhz per le memorie. Moltiplicando il clock del core per il numero delle pipeline otteniamo un fill rate pari a 10320 Mpixel/s e 10320 Mtexel/s, mentre la banda passante, in virtù di un controller verso la memoria ampio 256 bit, è di 38,4 GB/s. Si tratta dei valori più elevati visti fino a questo momento per un processore grafico destinato all’utenza consumer. Pagina 3 - Vertex Shader: maggiore efficienza Iniziamo lanalisi approfondita delle unità di G70 anticipando da subito che NVIDIA non ha scelto una linea di sviluppo rivoluzionaria, ma si è concentrata nellanalizzare i pochi punti deboli di NV40 e risolverli. E stato scelto, quindi, uno sviluppo di tipo evolutivo e del resto tale soluzione è del tutto comprensibile visto che dal punto di vista delle API le schede GeForce 6x00 supportano già tutto ciò che è disponibile.
Le unità di vertex shading sono dedicate alle operazioni i cui protagonisti sono i vertici. Nellambito della grafica tridimensionale la primitiva più comunemente utilizzata per modellare gli oggetti è il triangolo. Luso di più triangoli affiancati tra loro dà vita alle superfici, le quali a loro volta compongono i vari oggetti che vediamo sullo schermo. Le unità di vertex shading eseguono solitamente tutte le operazioni di trasformazione necessarie per il corretto posizionamento di ogni singolo vertice nei confronti degli assi X, Y e Z del piano cartesiano di riferimento (normalmente, quello della camera). Naturalmente, a seconda del vertex shader caricato in memoria in un determinato istante, queste unità possono andare oltre la semplice trasformazione ed effettuare molteplici operazioni sui vertici. Una volta applicato il vertex shading, il vertice in output viene processato dallunità dedicata al setup dei triangoli. Questa unità esegue unoperazione denominata scan-line conversion: essenzialmente si proietta ogni vertice sullo schermo e si identifica per ogni coordinata x, y, z del vertice, la corrispondente coordinata x, y del pixel sullo schermo. La tecnologia CineFX 4.0 di NVIDIA presenta alcune novità per le vertex unit e lunità per il setup dei triangoli. Innanzitutto il numero di vertex unit è passato da sei ad otto e, pertanto, a parità di frequenza di funzionamento, le capacità computazionali sono aumentate. Inoltre ogni singola vertex unit è stata resa più veloce del 30% nellesecuzione di operazioni scalari, mentre lunità per il setup dei triangoli è stata rivista allo scopo di migliorare lefficienza complessiva e garantire maggiori prestazioni durante loperazione di scan-line conversion.
Per quanto concerne le capacità e larchitettura delle unità ALU di vertex shading, non riscontriamo particolari novità rispetto a quanto già visto con NV40. G70 è perfettamente compatibile con i vertex shaders in versione 3.0, comprese le operazioni di branching ed di vertex texturing. Ogni ALU, infatti, ha la sua unità di Vertex Texture Fetch, direttamente collegata ad una cache L2 dedicata alle texture, e di Branching. Inoltre, così come per qualsiasi architettura compatibile con lo shader model 2.0, ogni ALU è composta anche dalle classiche unità di calcolo FP32 scalare e FP32 vettoriale. Pagina 4 - Pixel Shader: più MAD per tutti Successivamente alla fase di setup dei triangoli la palla passa alle pipeline di rendering. In passato queste non erano altro che delle semplici unità di texture mapping, ma oggi, grazie alla enorme programmabilità delle GPU, il numero di funzionalità ad essere associate è cresciuto al punto da diventare senza ombra di dubbio la parte più complessa di un processore grafico. L’architettura alla base di NV40 prevede per ogni ALU la presenza di due unità FP32 di shading ed un’unità di texture mapping. Una caratteristica di tale architettura è la dipendenza di una delle due unità FP32 dall’unità di texture mapping. In particolare abbiamo la prima unità FP32 in grado di eseguire le operazioni di texturing, moltiplicazione (MUL) o altre funzioni matematiche speciali (normalizzazione FP16 senza impatto sulle prestazioni, ecc...). La seconda, invece, è dedicata alle moltiplicazioni e addizioni (MAD) o al prodotto scalare (DOT). Ciò significa che a seconda del pixel shader da eseguire, NV40 è in grado di eseguire un texture fetch e quattro operazioni, oppure fino ad otto operazioni nel caso in cui non si debba accedere alle texture. A ciò bisogna aggiungere una minu-ALU per unità FP32 dedicata ad operazioni minori come lo scaling o il bias.
La tecnologia CineFX 4.0 implementata in G70 introduce alcuni piccoli, ma significativi miglioramenti nell’architettura delle ALU dedicate al pixel shading. Il primo riguarda l’operazione MAD, cioè di moltiplicazione e addizione. Entrambe le unità FP32 sono ora in grado di eseguire operazioni di tipo MAD. Ciò raddoppia l’efficienza nell’esecuzione di queste operazioni (fino ad 8 MADs per pipeline per ciclo di clock) le quali, ricordiamo, sono funzioni matematiche molto comuni all’interno della grafica tridimensionale, utilizzate per i calcoli più disparati tra i quali citiamo l’illuminazione per pixel. La seconda innovazione riguarda l’unità di texture mapping. Rispetto ad NV40 è stata eseguita un’opera di ottimizzazione di tutti i processi legati all’accesso delle texture che ora risulta essere più rapido. NVIDIA afferma che beneficerà di tali miglioramenti specie l’uso di texture in formato floating point (comuni nelle varie implementazioni dell’High Dynamic Range) e l’applicazione del filtro anisotropico. Per quanto concerne i formati di texture supportati non ci sono particolari novità: G70 supporta texture in formato fixed-point 8 bit (con compressione 3Dc adesso), floating point 16 bit e floating point 32 bit, anche se con quest’ultimo è in grado di eseguire solo un fetch di tipo point-sample (qualsiasi tipo di filtro deve essere implementato attraverso i pixel shaders). Pagina 5 - Raster Operations Unit Una volta completate tutte le operazioni legate ai pixel, tali informazioni vengono processate dalle ROPs. Le ROPs (Raster Operations Unit) sono le unità di un processore grafico che hanno il compito di scrivere all’interno del frame buffer il valore di ogni singolo pixel. NVIDIA con G70 non ha introdotto novità di particolare rilievo all’interno di questa componente e pertanto la sua architettura resta immutata rispetto a quanto abbiamo visto con NV40. L’unica differenza tra le due GPU relativa alle ROPs è legata al rapporto tra il numero di pipeline ed il numero di ROPs: contrariamente a quanto visto con NV40, G70 non possiede un numero di ROPs pari al numero di pipeline. Ciò significa che anche se dal punto di vista teorico G70 è in grado di elaborare ventiquattro pixel per ciclo di clock, di fatto non può scriverne più di sedici all’interno del frame buffer. NVIDIA ha già adottato con successo una soluzione simile all’interno di NV43, il processore grafico alla base delle schede GeForce 6600: in questo caso le pipeline ammontano ad otto, mentre le ROPs sono quattro. Il motivo delle ottime performance della GeForce 6600 nonostante questo collo di bottiglia è dovuto alla scarsissima probabilità che ogni pipeline sia in grado di elaborare effettivamente un pixel per ciclo di clock. La semplice applicazione del filtro trilineare (senza ottimizzazioni) richiede, infatti, due cicli di clock e l’esecuzione di pixel shaders complessi aumenta notevolmente questo valore. NVIDIA ha fatto tesoro, quindi, dell’esperienza maturata con la precedente famiglia di GPU GeForce ed ha evitato di inserire all’interno di G70 un numero di unità ROPs che sarebbe risultato essere sovrabbondante.
Tra le molte funzionalità delle unità ROPs ereditate da NV40, ricordiamo il multiple render target e l’OpenEXR floating point blending. La prima è la capacità di memorizzare i risultati di un pixel shader su più buffer contemporaneamente. Questo dà vita ad alcune interessanti tecniche di rendering come ad esempio il deferred shading. L’OpenEXR floating point blending, invece, è un’operazione molto utile nel caso in cui si vogliano implementare effetti come l’High Dynamic Range o, più in generale, qualsiasi effetto di post-processing che richieda texture floating point a 16 bit. L’OpenEXR è un formato di texture FP16 ideato dalla Industrial Light and Magic, celebre azienda impegnata nella realizzazione di effetti speciali cinematografici, fondata da George Lucas, il creatore della saga di Star Wars. Segnaliamo, infine, che esattamente come per NV40, anche G70 supporta un frame buffer in formato integer ad 8 bit (per componente di colore), floating point a 16 bit e floating point a 32 bit, anche se solo nel primo caso, quello comunemente utilizzato, è supportato l’antialiasing di tipo multisampling. Pagina 6 - Transparency adaptive e gamma corrected antialiasing Con G70 debutta anche la tecnologia IntelliSample 4.0, versione migliorata ed aggiornata dellIntelliSample 3.0 visto con le schede GeForce 6x00. Oltre alle ottimizzazioni legate alla revisione delle unità di texturing di cui abbiamo già discusso in precedenza, la vera novità è rappresentata da due nuove modalità di antialiasing: transparency adaptive supersampling e multisampling. La tecnica di antialiasing più diffusa al momento attuale è basata sul multisampling. Questa ha il vantaggio di eseguire un antialiasing utilizzando un singolo pixel sample e si applica a tutte le primitive, cioè a tutti i triangoli. Il risultato è una riduzione delleffetto di aliasing concentrato sui contorni poligonali. Esistono, tuttavia, delle situazioni in cui può essere utile applicare lantialiasing non solo ai contorni poligonali, ma anche in altre porzioni dello schermo. Pensiamo ad esempio alla vegetazione presente in moltissimi videogames: poiché sarebbe troppo complessa da rappresentare utilizzando tanti piccoli triangoli, questa viene spesso resa attraverso texture sulle quali sono disegnate le foglie ed il cui sfondo è dotato di un canale alpha (trasparenza) impostato in maniera da rendere quella porzione della texture completamente trasparente. Con questa tecnica un albero, ad esempio, può essere reso con pochissimi poligoni (spesso rettangoli) incastrati tra di loro. Un altro esempio è rappresentato dalle inferriate: invece di rendere singolarmente ogni elemento di metallo con poligoni, questi vengono disegnati su una texture e, tra una sbarra e laltra, il canale alpha è impostato in maniera da rendere trasparente quella zona.
In questi casi lantialiasing di tipo multisampling non esegue alcuna riduzione dellaliasing in quanto i contorni delle piante o delle inferiate non sono composti da triangoli, ma semplicemente da pixel su texture con elementi trasparenti. Per ovviare a questa situazione NVIDIA ha ideato il transparency adaptive antialiasing implementato in due modalità: supersampling e multisampling. Lidea di base è quella di riconoscere le texture dotate di texel con un canale alpha impostato in maniera da renderli trasparenti e di applicare un antialiasing di tipo supersampling o multisampling. Nel primo caso poiché vengono acquisiti quattro samples per pixel, la qualità della riduzione dellaliasing sarà superiore, ma nelle applicazioni shader o texture bound (cioè particolarmente affamate di texture o pixel shaders complessi) potrebbe comportare un degrado delle prestazioni. Il multisampling, invece, pur non riuscendo ad ottenere la medesima qualità del supersampling, ha il vantaggio di richiedere un solo sample per pixel e, pertanto, soffre in misura minore del calo delle prestazioni. In ogni caso NVIDIA tiene a precisare che, trattandosi di una tecnica adattiva, applicata cioè solo nelle zone di schermo dove è necessaria, limpatto sulle prestazioni di entrambe le modalità è molto contenuto.
La tecnologia IntelliSample 4.0 porta con sé anche unultima innovazione relativa allantialiasing, già implementata nei processori grafici Radeon fin dal debutto di R300: lantialiasing gamma corrected. Con il termine gamma ci si riferisce alla proporzionalità tra lintensità generata dai tubi catodici (CRT) ed il voltaggio della scheda grafica elevato alla potenza di gamma. Le schede video, infatti, inviano al monitor i segnali dei vari colori in termini di differenti voltaggi. I monitor CRT non hanno una risposta lineare: un voltaggio doppio non produce unintensità doppia. E quindi necessario effettuare una correzione che può essere applicata sia allinterno del frame buffer sia dal RAMDAC. Il gamma corrected antialiasing è una tecnica che tratta lapplicazione dellantialiasing tenendo conto della non linearità nella risposta dei monitor. Ciò, essenzialmente, si traduce in una selezione più morbida dei colori con un conseguente impatto visivo superiore rispetto alle tradizionali tecniche implementate da NVIDIA fino a questo momento. Le restanti caratteristiche della tecnologia IntellSample 4.0 sono sovrapponibili a quelle della revisione 3.0 di NV4x. Ritroviamo, quindi, lo stesso filtro anisotropico 16x visto sulle schede GeForce 6x00 e le medesime modalità di antialiasing: 2x, 2xQ, 4x e 8xS. Tra queste la 4x è di tipo RGMS (Rotated Grid MultiSampling), la 2xQ è basata sulla tecnologia Quincunx, mentre la 8xS è un mix tra un multisampling e supersampling. Rispetto a NV40, G70 è più rapido a parità di clock sia nellapplicazione del filtro anisotropico, grazie alle ottimizzazioni eseguite sulle unità di texturing, sia nella realizzazione dellantialiasing di tipo RGMS a causa di una riduzione delle latenze nellestrapolazione dei samples. Pagina 7 - Tecnologia UltraShadow II e PureVideo La tecnologia UltraShadow è stata introdotta da NVIDIA con lavvento delle GeForce Fx e consente di accelerare in maniera abbastanza considerevole la generazione delle ombre ottenute tramite la tecnica delle stencil shadows (usata in titoli come Doom 3, X2 The Threat, Far Cry, ecc...). Con lavvento di NV40 la tecnologia UltraShadow è arrivata alla sua seconda revisione beneficiando soprattutto del maggior numero di pipeline e della maggiore potenza di calcolo complessiva. Tutti i processori grafici facenti parte della famiglia NV4x sono, infatti, in grado di elaborare due pixel per ciclo di clock per pipeline nel rendering verso il solo z-buffer o il solo stencil buffer. Ciò significa che se NV40 è capace di elaborare fino a 16 pixel per ciclo di clock nel rendering classico (colore + z-buffer), nel rendering verso il solo z-buffer o il solo stencil buffer questo valore sale a 32. Inoltre la tecnologia UltraShadow fa uso anche del depth bound test, cioè la possibilità di ridurre il calcolo delle ombre nella sola porzione dellambiente tridimensionale che ricade allinterno di un determinato range dello spazio. Una fonte di luce omnidirezionale, infatti, normalmente ha una sua zona di influenza sferica al di fuori della quale non contribuisce allilluminazione dellambiente. Il depth bound test evita il calcolo delle stencil shadows al di fuori di questa zona tenendo conto anche della posizione della camera. Il risultato è una marcata riduzione delloverdraw normalmente presente nella generazione delle ombre con questa tecnica. Queste modalità di rendering sono molto comuni nellimplementazione delle stencil shadows e le applicazioni che fanno un uso massiccio di questa tecnica, come il motore grafico di Doom 3 (alla base anche di altri titoli), possono avvantaggiarsi notevolmente della tecnologia UltraShadow. G70 non introduce alcuna novità nei confronti della tecnologia UltraShadow II se non quelle legate al maggior numero di pixel per ciclo di clock elaborati grazie alla presenza di 24 pipeline di rendering. La scheda GeForce 7800 GTX è quindi capace di processare ben 48 pixel per ciclo di clock nel rendering verso il solo z-buffer o il solo stencil buffer. La crescente programmabilità delle schede video ha consentito di trasferire verso la GPU alcune delle operazioni che fino a pochi anni fa erano di completa competenza della CPU di sistema. Il complesso percorso di calcolo alla base della riproduzione dei flussi video è una di queste operazioni.
La tecnologia PureVideo, alla base di tutte le elaborazioni video dei processori grafici GeForce 6x00, in occasione del lancio delle schede GeForce 7800 GTX è stata rinnovata nelle features. Tre sono le novità: Spatial Temporal De-interlacing HD, decodifica H.264 ed Inverse 2:2 Pull-down Correction. Questultima consiste essenzialmente nella ricostruzione di un filmato originariamente girato a 24 fps e convertito a 30 fps per la distribuzione in DVD o via TV digitale. Tale caratteristica non è esclusiva di G70, ma è stata implementata via software in modo da essere disponibile anche con le schede video GeForce 6x00. Lo Spatial Temporal De-interlacing, già facente parte delle funzionalità di PureVideo è stato esteso per la riproduzione di filmati di tipo High Definition. A causa della notevole potenza di calcolo necessaria per questo genere di elaborazione con flussi video HD, solo il processore grafico G70 è in grado di eseguire tale operazione. Per quanto concerne la decodifica H.264, attualmente questa è solo stata annunciata, ma non è funzionante. La sua attivazione è prevista per la fine dellanno. Pagina 8 - La scheda La scheda GeForce 7800 GTX si presenta con un layout particolarmente maestoso, curato sotto tutti i punti di vista: ingombro, rumorosità ed estetica. Iniziamo l’analisi fisica di questa scheda video partendo dalle sue dimensioni: la GeForce 7800 GTX è lunga quasi 23 cm, contro i 21,5 cm della GeForce 6800 Ultra ed i 18,5 cm della Radeon X850 XT PE. Questo valore ha due motivazioni: la predisposizione all’alloggiamento di 512 MB di memoria GDDR3 e la scelta di una soluzione di raffreddamento single-slot. Il sistema di dissipazione della GeForce 7800 GTX ci ha da subito particolarmente colpito per la sua silenziosità: la maggiore estensione degli elementi dissipativi lungo il PCB (contro l’estensione in altezza scelta per le GeForce 6800 Ultra), unita al processo produttivo a 0.11 micron per G70, ha permesso l’utilizzo di una ventola di raffreddamento del tipo a turbina a basso regime. Una volta rimosse le numerose viti (molte delle quali dotate di molla in modo da esercitare una maggiore pressione) è stato possibile asportare l’elegante copertura in plastica (il disegno ricorda il logo NVIDIA) del dissipatore in modo da visionare accuratamente l’architettura di quest’ultimo. Il materiale utilizzato è l’alluminio, sia per la placca montata sopra il core grafico che per le alette dedicate allo smaltimento del calore. Tutti gli elementi dissipativi sono collegati tra loro attraverso una heat-pipe, cioè un tubo metallico contenente un qualche gas o liquido, per garantire una maggiore distribuzione del calore e, conseguentemente, un raffreddamento il più possibile uniforme. Rimuovendo il dissipatore possiamo visionare il processore grafico G70 vistosamente ricoperto di pasta termoconduttiva. Una volta pulito leggiamo le serigrafie “G70” e “GF-7800-GTX-N-A2”. La dicitura A2 è particolarmente interessante perché dimostra come questa GPU abbia già ricevuto almeno due raffinamenti dalla produzione del primo silicon A0. Ciò scredita i rumours secondo i quali il tape-out di G70 è stato effettuato durante il mese di Aprile di quest’anno. Particolarmente interessante è la disposizione dei moduli di memoria. La versione di G70 in nostro possesso è dotata di 256 MB di memoria i quali sono distribuiti su otto moduli di memoria, quattro per lato, montati con una disposizione alternata rispetto ai sedici alloggiamenti disponibili sul PCB: NVIDIA ha pensato bene di adottare questa disposizione lasciando la metà degli alloggiamenti vuoti in maniera da non concentrare la generazione del calore degli otto moduli su un solo lato. Non ci sorprenderebbe vedere in futuro versioni della GeForce 7800 GTX dotate di 512 MB di memoria video e di un sistema di dissipazione più voluminoso. La scheda nel complesso non è particolarmente ricca di componenti discrete: la maggioranza di queste sono concentrate sulla zona alla destra del processore grafico e alcune sono raffreddate passivamente da un dissipatore in alluminio, in maniera analoga a quanto visto con le schede GeForce 6800 Ultra e GeForce 6800 GT. Sul margine alla destra trova spazio anche il connettore a 6 pin per l’alimentazione supplementare, mentre in alto a sinistra troviamo la connessione dedicata alla tecnologia SLI, della quale parleremo nel prossimo paragrafo. La staffa di fissaggio presenta due uscite DVI-I, di cui una pilotata dal transmitter video Philips SAA7115HL montato sotto la ventola di raffreddamento, ed un’uscita TV di tipo S-Video. Pagina 9 - Driver: ForceWare 77.62
Il debutto della GeForce 7800 GTX coincide con quello dei nuovi driver ForceWare 77.62. NVIDIA ha lavorato molto in questo periodo per fare in modo di avere pronti driver ottimizzati al massimo per larchitettura di G70 e nel contempo presentare funzionalità innovative per tutte le tipologie di utenti: appassionati di videogames, di applicazioni video e possessori di notebook e workstation.
I nuovi ForceWare 77.62 introducono un maggior supporto alla tecnologia SLI grazie a nuovi profili ottimizzati per oltre 80 titoli. Inoltre, come risposta alla tecnologia CrossFire di ATI ed alla sua compatibilità verso tutte le applicazioni facenti uso di grafica tridimensionale, NVIDIA consente ora di abilitare la modalità di rendering con GPU multiple SLI per qualsiasi titolo attraverso unapposita opzione presente tra le impostazioni avanzate. Attivando dal registro di Windows i Coolbits è possibile specificare persino la modalità di rendering SLI tra quelle disponibili: AFR, Scissor Mode, AFR 2 e singola GPU. Se un titolo non è direttamente supportato dal driver, utilizza la modalità selezionata dallutente.
La gestione delle risorse per le schede video GeForce 6200 TurboCache è stata migliorata e, pertanto, tutti i possessori di tali prodotti potranno beneficiare di prestazioni superiori (specie in Microsoft Flight Simulator 2004 e Tiger Woods 2004). Un ulteriore ottimizzazione riguarda i driver per il sistema operativo Windows XP x64 Professional che adesso offrono le medesime prestazioni rispetto alla contro parte a 32 bit (in precedenza esisteva un piccolo degrado velocistico). Oggetto di miglioramento è stato anche il driver OpenGL, il quale è ora perfettamente compatibile con la versione 2.0 dellAPI di Silicon Graphics, assicura un incremento del 5% nelle prestazioni di Doom 3 ed è stata perfezionata anche la gestione del rendering multi-GPU in modalità SLI. Segnaliamo anche la risoluzione di alcuni problemi con i videogames World Of Warcraft e EverQuest2. Gli appassionati del video in alta definizione saranno felici di sapere che è stato aggiornato il supporto HDTV (utile soprattutto in Windows XP Media Center) e dei formati video HD: è stata implementata la Inverse 2:2 Pulldown Detection and Correction ed il Spatial Temporal De-interlacing HD (disponibile solo su G70), caratteristiche che abbiamo analizzato precedentemente.
Un enorme lavoro di ottimizzazione è stato effettuato anche a livello di driver 2D e, in particolare, nella cooperazione tra la GDI e le superfici DirectX che ora risulta essere più veloce ed efficiente. I possessori di notebook, inoltre, potranno beneficiare di un miglior supporto alla tecnologia SmartDimmer per la gestione del risparmio energetico. Segnaliamo, inoltre, alcune delle novità che saranno alla base delle future release 8x.xx: maggiori prestazioni, ottimizzazione per le CPU dual-core, maggior numero di titoli supportati dalla tecnologia SLI, overclock indipendente per le due GPU in SLI e possibilità di montare in SLI schede video di differenti costruttori, ma dotate del medesimo processore grafico. Pagina 10 - Analisi qualità: filtro anisotropico - parte 1 Il filtro anisotropico è una funzionalità presente nel bagaglio tecnologico dei processori grafici da diverse generazioni ormai. Evoluzione dello storico filtro trilineare, il suo obiettivo è quello migliorare la qualità delle texture eseguendo un filtraggio che sia in grado di visualizzare una texture nel pieno del suo dettaglio anche quando questa è posta su una superficie poligonale molto distante dal punto di vista: in tal caso la risoluzione della texture conta un numero di texel superiore al numero di pixel usati dallo schermo per visualizzarla ed è quindi necessario ricampionarla. Sia ATI che NVIDIA hanno lavorato alacremente per sviluppare di generazione in generazione questa funzionalità e per migliorarne la qualità e le prestazioni. Le prime implementazioni del filtro anisotropico, infatti, pur garantendo una qualità simile (se non superiore) a quella disponibile con tutti i più recenti processori grafici, abbattevano letteralmente le prestazioni. Oggi ci troviamo di fronte ad implementazioni che, pur non essendo più completamente fedeli a quella classica (il filtro anisotropico è matematicamente definito), riescono a raggiungere livelli velocistici eccellenti a fronte di una qualità estremamente appagante. Per valutare limplementazione del filtro anisotropico del processore grafico G70 oggetto di questa recensione abbiamo utilizzato il Texture Filter Analyzer sia in versione Direct3D che OpenGL. Questa piccola utility visualizza un cilindro cavo impostando il punto di vista al suo interno con la camera che punta in direzione parallela allaltezza del cilindro. Questo cilindro è tappezzato allinterno con una texture a scacchiera, bianca e nera. Limmagine risultante non è altro che linterno del cilindro che, a causa della prospettiva, si restringe man mano che le pareti si allontanano dalla camera. Il Texture Filter Analyzer consente di visualizzare i livelli di mipmapping, cioè i livelli di dettaglio (LOD) con cui la scheda video disegna le texture, colorandoli. In particolare la banda più vicina (che per effetto della prospettiva è più esterna) è rossa e rappresenta il primo LOD, cioè la prima ricampionatura (di minor dettaglio) della texture rispetto alloriginale. I restanti livelli di mipmap sono più interni e vengono evidenziati con altri colori. Nella valutazione della qualità del filtro anisotropico sono essenzialmente due gli aspetti che ci interessa osservare: la variazione tra un livello di dettaglio e laltro ed il dettaglio stesso. Il primo lo estrapoliamo osservando come viene effettuato il passaggio da una fascia colorata ad una adiacente, mentre il dettaglio può essere valutato dalla vicinanza della banda rossa al bordo. NVIDIA GeForce 7800 GTX NVIDIA GeForce 6800 Ultra ATI Radeon X850XT PE
Le impostazioni legate al filtro anisotropico riguardanti la scheda GeForce 7800 GTX sono le medesime viste con tutte le schede NV4x. Gli screenshots sopraesposti visualizzano le immagini ottenute con il Texture Filter Analyzer in Direct3D in tutte le modalità qualitative disponibili sulle schede NVIDIA e ATI. In particolare per le GPU GeForce sono stati eseguiti i rilevamenti con il filtro trilineare ed il filtro anisotropico a 2, 4, 8 e 16 samples, il tutto per ogni modalità: High Quality, Quality, Performance e High Performance. Per R480 le modalità prese in considerazione, invece, sono quelle legate al Catalyst IA: Disabled, advanced e Advanced. Non considereremo in questo articolo le modalità disponibili con i driver Catalyst privi di Catalyst Control Center. Come primo elemento valido per tutti i processori grafici segnaliamo che maggiore è il numero di samples del filtro anisotropico, maggiore sarà il dettaglio delle texture: il bordo rosso del primo livello di dettaglio si allontana allaumentare del numero di samples. Inoltre tutte le GPU implementano unottimizzazione consistente nel variare il livello di dettaglio a seconda dellangolazione della superficie poligonale considerata. Il filtro anisotropico completo è applicato solo ai triangoli posti a 0°, 45°, 90°, ecc , cioè ai multipli di pi/4. Lassunzione alla base di questa ottimizzazione è la seguente: la maggioranza dei videogames propongono texture in alta definizione solo a quelle determinate angolazioni (pavimento e pareti per lo più). Al di là del numero di samples, limplementazione del filtro trilinare e anisotropico è pesantemente dipendente dalla modalità qualitativa presa in considerazione. Per le schede NVIDIA il passaggio dalla modalità High Quality a Quality consiste, sia per il filtro trilineare che anisotropico, essenzialmente nellabilitazione del campionamento tramite filtraggio brilineare, approssimazione del filtro trilineare, e, conseguentemente, in un passaggio meno morbido da un LOD allaltro. Inoltre rileviamo anche un maggior pixel popping, artefatto grafico che riduce il dettaglio delle texture, dovuto ad una maggiore approssimazione nelleseguire il campionamento anisotropico. In modalità Performance e High Performance il fenomeno di pixel popping si accentua ulteriormente e le transizioni diventano sempre più nette. Ciò significa che queste modalità offrono la peggiore qualità delle texture sia in termini di dettaglio, che di passaggio da un livello di dettaglio allaltro. Per la Radeon X850 XT PE il passaggio dal Catalyst IA Disabled (in cui tutte le ottimizzazioni sono disattivate, eccetto quella legata allangolazione delle superfici poligonali) alle altre modalità è indolore sia per quanto riguarda il filtro trilineare che per il filtro anisotropico. La motivazione alla base di questo comportamento è da ricercare allinterno della tecnica adattiva sviluppata da ATI. La società canadese ha implementato una tecnologia in grado di rilevare se esiste una considerevole differenza tra una texture appartenente ad un LOD e quella appartenente ad un LOD adiacente. Se tale differenza non è marcata, applica un filtro anisotropico ottenuto mediante campioni elaborati con un filtro brilineare simile a quello visto in modalità Quality con le schede NVIDIA, mentre se la differenza è molto evidente, elabora i campioni con un filtro trilineare. Il Texture Filter Analyzer, visualizzando ogni LOD con un colore differente, ricade in questultimo caso e, pertanto, il driver applica un filtro anisotropico di qualità elevata. Come vedremo successivamente, tale comportamento è esclusivo delle applicazioni Direct3D e non si ripete in OpenGL. Effettuando un confronto tra NV40 e G70 ci sorprende vedere come questultimo offra una qualità dellimmagine leggermente inferiore. Se in modalità High Quality il comportamento dei due processori grafici è il medesimo, in tutte le altre modalità la GeForce 7800 GTX tende a soffrire in maggior misura di problemi di pixel popping rispetto alla GeForce 6800 Ultra. Pagina 11 - Analisi qualità: filtro anisotropico - parte 2 Oltre alle impostazioni legate al Catalyst IA, ATI consente anche di variare il dettaglio del mip mapping scegliendo tra quattro opzioni: High Quality, Quality, Performance e High Performance. Di default questo settaggio è impostato in High Quality ed è così che lo lasceremo per tutti i nostri test. E comunque interessante osservare il comportamento di R480 al variare di questa funzionalità. quality high quality performance
high performance Possiamo osservare come passando dalla modalità High Quality a quella High Performance assistiamo ad un avvicinamento della banda rossa fino al completo oscuramento della texture nella sua risoluzione originale. Ciò significa che questa impostazione riduce il livello di dettaglio della scena tridimensionale: in modalità High Performance la texture a scacchiera visualizzata dal Texture Filter Analyzer è più sfumata, più povera di dettaglio. NVIDIA GeForce 7800 GTX NVIDIA GeForce 6800 Ultra Le schede NVIDIA propongono nelle impostazioni avanzate dei propri driver, tre differenti settaggi dedicati allottimizzazione del filtro anisotropico: ottimizzazione trilineare, ottimizzazione filtro mip anisotropico e ottimizzazione campione anisotropico. La prima abilita il filtraggio di tipo brilineare per i campioni del filtro anisotropico, la seconda abilita un filtraggio di tipo bilineare per il campionamento, mentre lultima riduce laccuratezza nella selezione dei samples con un conseguente aumento del fenomeno di pixel popping. E bene chiarire che ottimizzazione filtro mip anisotropico e ottimizzazione campione anisotropico vengono applicate solo sugli stage successivi al primo. Il primo livello di texture (stage zero) è normalmente utilizzato per il rendering delle mappe diffuse, cioè le texture che vengono applicate alle superfici per conferirgli il colore. I livelli successivi al primo (stage uno, due, ecc...) sono dedicati ad altri tipi di texture come le normal map, le gloss map, le specular map, le environmental map, ecc... La modalità High Quality disabilita tutte le ottimizzazioni, mentre le restanti modalità abilitano di default ottimizzazione trilineare e ottimizzazione campione anisotropico. Le immagini pubblicate sono ottenute in modalità Quality con tutte le combinazioni possibili dei tre settaggi. Interessante notare come labilitazione di una qualsiasi delle tre ottimizzazioni comporti, oltre alleffetto dellottimizzazione stessa, anche linsorgere delleffetto di pixel popping con G70, aspetto riscontrato anche in precedenza. Evidentemente NVIDIA per il suo nuovo processore grafico ha deciso di utilizzare settaggi più aggressivi nel momento in cui si abilitano le ottimizzazioni. Pagina 12 - Analisi qualità: filtro anisotropico - parte 3 Utilizzando la versione OpenGL del Texture Filter Analyzer abbiamo ottenuto risultati che ci hanno sorpreso per la loro dissomiglianza da quanto visto con la versione Direct3D della stessa applicazione. Ciò significa che le impostazioni relative al filtro anisotropico non determinano il medesimo comportamento con entrambe le API supportate da ATI e NVIDIA. NVIDIA GeForce 7800 GTX
NVIDIA GeForce 6800 Ultra
Con le schede GeForce 6800 Ultra e GeForce 7800 GTX abbiamo rilevato che abilitando la modalità High Performance la gestione dei livelli di dettaglio è completamente differente rispetto a quanto visto in Direct3D. Utilizzando la versione OpenGL del Texture Filter Analyzer otteniamo una resa qualitativamente inferiore: il primo livello di dettaglio (banda rossa) è sempre molto vicino al bordo, anche utilizzando 16 samples. Segnaliamo anche che lottimizzazione legata allinclinazione delle superfici geometriche è applicata con maggior forza sulle angolazioni multiple di pi/2. Inoltre, la distinzione tra il primo livello di texture ed i successivi, legato alle impostazioni ottimizzazione filtro mip anisotropico e ottimizzazione campione anisotropico, è qui assente: tali ottimizzazioni vengono applicate su tutti i livelli delle texture. Anche questo provvedimento comporta una resa qualitativamente meno accurata rispetto a quanto avviene nelle applicazioni Direct3D. ATI Radeon X850XT PE Completiamo lanalisi qualitativa del filtro anisotropico osservando i risultati ottenuti con R480 in ambiente OpenGL. In tal caso non troviamo differenze tra OpenGL e Direct3D nelle modalità IA Disabled, mentre in modalità advanced abbiamo un quasi impercettibile arretramento del livello di dettaglio per la versione OpenGL del Texture Filter Analyzer che si traduce in texture leggermente meno dettagliate. La vera novità, tuttavia, è rappresentata dai risultati ottenuti in modalità Advanced. In OpenGL la natura adattiva del filtro anisotropico ATI sembra essere stata disabilitata quando impostiamo il Catalyst IA su questa posizione: gli screenshots visualizzano chiaramente la resa del filtro anisotropico della Radeon X850 XT PE ottenuto mediante un campionamento dei sample attraverso un filtro brilineare. Pagina 13 - Analisi qualità: filtro anisotropico - parte 4 Per valutare limpatto delle varie modalità qualitative sullapplicazione del filtro trilineare e anisotropico abbiamo utilizzato Far Cry e, in particolare, uno screenshot catturato nella mappa Volcano. Abbiamo, inoltre, preso come riferimento le immagini ottenute con Catalyst IA Disabled per R480 e in modalità High Quality per le schede GeForce, eseguendo un confronto per pixel con le restanti modalità. Eseguita la differenza per pixel, abbiamo contrastato limmagine in maniera da esaltare le diversità. Per eseguire tali operazioni abbiamo fatto uso di Adobe Photoshop. NVIDIA GeForce 7800 GTX
NVIDIA GeForce 6800 Ultra
ATI Radeon X850XT PE
Per la scheda Radeon X850 XT PE la modalità che offre la resa che più si distingue da quella ottenuta senza lausilio delle ottimizzazioni è sicuramente lAdvanced con il filtro trilineare. Gli elementi di distinzione si concentrano essenzialmente nella resa delle texture e delle riflessioni speculari. Anche per quanto riguarda il filtro anisotropico la modalità Advanced è quella qualitativamente meno fedele. Con le schede GeForce labilitazione del filtro brilineare già a partire dalla modalità Quality determina un impatto piuttosto marcato sulla qualità dellimmagine. Gli screenshots ottenuti con Photoshop mostrano delle evidenti bande di mipmapping sulla pavimentazione utilizzando il filtro trilineare. I confronti tra la modalità High Quality e le restanti mostrano dei degradi visivi anche utilizzando il filtro anisotropico, anche se meno evidenti rispetto a quelli mostrati dal filtro trilineare. Volendo eseguire un paragone tra NV40 e G70 possiamo confermare quanto già emerso con il Texture Filter Analyzer: questultimo offre la peggiore resa visiva con le ottimizzazioni abilitate. Ricordiamo che tutte le differenze rilevate con questo tipo di analisi sono basate su un confronto effettuato per pixel e che, escludendo alcuni casi in cui sono apparse clamorose disuguaglianze (come ad esempio tra la modalità High Performance e High Quality di G70 con filtro trilineare), è estremamente difficile coglierle ad occhio nudo, specie nella frenesia di un videogame. Pagina 14 - Analisi qualitativa: antialiasing – parte 1 Iniziamo la nostra analisi qualitativa dell’antialiasing commentando gli screenshots catturati con il Fsaa Viewer, un’applicazione in grado di mostrare la distribuzione dei samples sia per l’antialiasing di tipo supersampling, che per quello di tipo multisampling. NVIDIA GeForce 7800 GTX
NVIDIA GeForce 6800 Ultra
ATI Radeon X850XT PE
G70 non introduce alcuna novità per quanto concerne il numero e la distribuzione dei samples delle varie modalità di antialiasing disponibili. Abbiamo quindi un antialiasing 2x di tipo multisampling, uno 2xQ di tipo multisampling basato sulla tecnologia Quincunx (lo si desume dalla sfocatura di tutti i caratteri, tipica del filtro Quincunx), uno 4x di tipo RGMS (Rotated Grid MultiSampling) e, infine, la modalità 8xS ottenuta mediante un mix tra multisampling e supersampling. Quest’ultima risulta essere diversamente implementata rispetto a quanto visto al lancio di NV40. Evidentemente NVIDIA è intervenuta via software per implementare in modo differente questa modalità per migliorarne la resa. La scheda Radeon X850 XT PE è capace di generare tutte le modalità disponibili da ormai quasi tre anni sui processori grafici Radeon, fin dall’introduzione di R300: 2x di tipo multisampling, 4x di tipo RGMS e 6x di tipo multisampling con sample pattern sparse grid proprietario. Il FSAA Viewer ci ricorda che le modalità 2x e 4x del processore grafico canadese, pur essendo implementate con i medesimi algoritmi di NV40 e G70, possiedono una distribuzione dei samples differente nell’angolo di rotazione. Possiamo ora procedere all’analisi qualitativa osservando gli screenshots ottenuti dal FSAA tester. Questa piccola utility visualizza alcuni triangoli disposti a raggiera che, con le loro varie inclinazioni, risultano essere particolarmente utili per valutare la qualità di una determinata modalità di antialiasing. Una volta ottenuti gli screenshots abbiamo provveduto ad ingrandire del 400% due zone: una dedicata a valutare la resa delle sfumature in orizzontale ed una per quelle in verticale. Per quanto concerne il Temporal AA della Radeon X850 XT PE abbiamo provveduto ad acquisire un’immagine al frame pari ed una al frame dispari ed abbiamo eseguito il blending con Adobe Photoshop in maniera da rendere la qualità percepita dall’occhio umano. NVIDIA GeForce 7800 GTX
NVIDIA GeForce 6800 Ultra
ATI Radeon X850XT PE
Le immagini del FSAA tester non ci hanno restituito i risultati sperati. La nuova tecnica di antialiasing messa a punto da NVIDIA si applica a texture con elementi trasparenti e, poiché questa utility mostra una scena completamente poligonale, non ci sono i pressupposti per abilitare il transparent antialiasing. Ciò, tuttavia, non è altrettanto vero per quanto concerne l’antialiasing di tipo gamma corrected: in tal caso avremmo dovuto rilevare delle differenze cromatiche nelle sfumature che, invece, non abbiamo ottenuto. In definitiva, quindi, il FSAA tester non è stato in grado di svelarci la resa delle nuove modalità di antialiasing implementate da NVIDIA nella nuova GeForce 7800 GTX. Poiché non c’è alcuna differenza nella distribuzione dei samples tra NV40 e G70, gli screenshots prodotti da questi due processori grafici sono identici. Tra le varie modalità segnaliamo la buona qualità dell’antialiasing 4x RGMS di NVIDIA: le sfumature sono perfettamente graduali su entrambi gli assi (orizzontale e verticale), anche se, confrontate con quelle dell’antialiasing 4x di ATI, risultano essere più scure a causa della mancanza della correzione gamma. Il FSAA 8xS di NVIDIA, inoltre, offre qualche gradazione in più in termini di sfumatura rispetto alla modalità 4x, specie sull’asse orizzontale. Sempre pienamente soddisfacente la resa dei processori grafici ATI con il loro antialiasing 6x in multisampling: sia sull’asse verticale che orizzontale abbiamo una riduzione graduale ed uniforme. Naturalmente, abilitando il Temporal AntiAliasing, la qualità offerta dal processore grafico Radeon X850 XT PE aumenta ulteriormente, anche se esistono alcune limitazioni di cui bisogna tener conto quando si abilita questa modalità (il numero di frame al secondo deve essere superiore al refresh del monitor). Pagina 15 - Analisi qualitativa: antialiasing – parte 2 Dovendo valutare la qualità offerta dalle nuove modalità di antialiasing disponibili con il processore grafico GeForce 7800 GTX siamo andati alla ricerca di una scena tridimensionale che potesse presentare ampio uso di texture con pixel trasparenti. La nostra scelta è ricaduta sul 3DMark03 e, in particolare, abbiamo preso in considerazione il frame numero 1669 della sequenza Mother Nature. Lambientazione naturalistica di questa sequenza, ricca di alberi e foglie, è lideale per mettere alla prova sia le tecniche di antialiasing tradizionali, che il nuovo transparency antialiasing di G70. Per la scheda video GeForce 7800 GTX abbiamo effettuato gli screenshots in differenti modalità: per ogni possibile combinazione di samples (2x, 2xQ, 4x e 8xS), è stata abilitata la correzione gamma, il transparency antialiasing multisampling, il transparency antialiasing supersampling ed il transparency antialiasing supersampling insieme alla correzione gamma. La GeForce 6800 Ultra e la Radeon X850 XT PE, invece, hanno generato i soli screenshots relativi alle differenti distribuzioni dei samples. Completata la fase di acquisizione delle immagini abbiamo provveduto ad ingrandire del 200% una zona che raffigura una foglia in primo piano ed i rami di due alberi in lontananza. NVIDIA GeForce 7800 GTX
NVIDIA GeForce 6800 Ultra
ATI Radeon X850XT PE
Senza lausilio della correzione gamma e del transparency antialiasing la resa qualitativa di G70 coincide con quella di NV40, aspetto già svelatoci dal FSAA tester. In questi casi la qualità dellantialiasing 4x delle schede ATI è leggermente più morbida agli occhi di quella della corrispondente modalità NVIDIA. Molto buona è anche la resa dellantialiasing 8xS. Abilitando la correzione gamma con la scheda GeForce 7800 GTX otteniamo una qualità dellimmagine simile a quella delle schede video Radeon in modalità 4x. Sfortunatamente la correzione gamma di G70 non sortisce alcun effetto sulle tecniche di antialiasing ibride, ma solo su quelle di tipo multisampling e pertanto è disponibile solo in modalità 2x e 4x. Unosservazione particolarmente interessante emerge dalle immagini acquisite utilizzando lantialiasing 2xQ e 8xS. In questi due casi, infatti, poiché viene trattata indistintamente tutta la scena, rispettivamente con un filtro di post-processing e la modalità supersampling, otteniamo non solo una riduzione delleffetto di aliasing sui contorni poligonali, ma anche su quelli delle foglie. Una riduzione mirata ed accurata dellaliasing sulle foglie, tuttavia, la possiamo osservare solo abilitando il transparency antialiasing. Come già descritto in precedenza, questa tecnica è disponibile sia in modalità multisampling che supersampling. Nel primo caso assistiamo ad una leggera riduzione dellaliasing, mentre nel secondo la qualità dellimmagine subisce un deciso miglioramento: i contorni della foglia in primo piano e di quelle sullo sfondo sono privi di scalettature e contribuiscono a restituire unimmagine più realistica. Il transparent antialiasing è disponibile solo in congiunzione ad una modalità di antialiasing poligonale e, pertanto, non può essere abilitato singolarmente. Confrontando i vari screenshots ottenuti conveniamo che il transparent antialiasing di tipo supersampling con lantialiasing 8xS fornisce la migliore qualità dellimmagine, ma è estremamente appagante anche la resa dellantialiasing 4x con correzione gamma e transparent antialiasing supersampling. Pagina 16 - Configurazione di test
3DMark 05 Si tratta del famoso e diffuso benchmark sintetico sviluppato da FutureMark. Nonostante il suo obbiettivo sia quello di valutare le prestazioni di una scheda video in ambito DirectX 9, in questo articolo non verrà utilizzato per questa finalità bensì per raccogliere alcune informazioni utili riguardo larchitettura di un chip grafico. Abbiamo pertanto fatto partire solo i test relativi al Fill Rate, ai Vertex Shader ed ai Pixel Shader 2.0. I risultati che abbiamo ottenuto sono quindi da intendere solo come elementi di studio e non di valutazione. Far Cry Far Cry fa uso dell'innovativo motore grafico CryENGINE dei Crytek Studios. Massiccio è l'uso dei Vertex e Pixel Shader, in parte anche in versione 2.0b e 3.0, per realizzare effetti grafici come il riflesso sull'acqua, il bump mapping e le soft shadows. Due sono le mappe utilizzate: Training e Volcano. La prima è caratterizzata da ampi spazi aperti e effetti atmosferici, mentre la seconda è al chiuso e mette meglio in evidenza il bump mapping e la tecnologia Polybump per il rendering dei personaggi. Il gioco è stato aggiornato con la patch in versione 1.3. Splinter Cell: Chaos Theory Realizzato dalla UbiSoft e dotato di una versione pesantemente revisionata dellUnreal Engine, questo videogames è utilizzato in modalità timedemo per valutare le prestazioni di una scheda video. Per le schede supportanti lo shader model 3 è stato selezionato tale supporto senza abilitare lhigh dynamic range, le soft shadows enhaced ed il parallax mapping. Per le altre schede è stato selezionato lo shader model 1. La demo utilizzata è stata registrata nella mappa Light House. Il gioco è stato aggiornato con la patch in versione 1.2. The Chronicles Of Riddick Sviluppato dai Starbreeze Studios e basato sul Starbreeze Engine, The Chronicles of Riddick: Escape from Butcher Bay fa uso dellAPI OpenGL per laccelerazione della grafica tridimensionale. Tra le sue caratteristiche più interessanti riportiamo il massiccio uso di stencil shadows e del normal mapping. Lo shader model impostato è il 2.0 per tutti i benchmark. La demo utilizzata è disponibile al seguente indirizzo: http://www.benchemall.com/download/RiddickBenchmark.exe Doom 3 Uno dei titoli più attesi del 2004, seguito del principe di tutti gli shooter in tre dimensioni, Doom 3 è lultima fatica di John Carmak. Tra le caratteristiche principali che questo motore grafico mette in mostra troviamo un pensante uso di stencil shadows. Sono presenti anche alcuni vertex e pixel shaders, anche se non in misura così avanzata come in Far Cry. Doom 3 è sviluppato, come vuole la tradizione Id Software, rigorosamente in OpenGL. Half Life 2 Assieme a Doom 3 è uno dei titoli più attesi del 2004, sequel del famosissimo Half-Life lanciato nel lontano 1998. L'engine grafico si caratterizza principalmente per l'utilizzo massiccio di Shader 2.0, alcuni dei quali tra i più complessi attualmente integrati in un titolo 3D. Halo E uno dei giochi presenti al lancio di X-Box, la console di Microsoft, ed ha letteralmente sbancato i botteghini per la sua grafica e la sua giocabilità. La versione per PC, approdata solo da poco sugli scaffali dei negozianti, nonostante sia un semplice riadattamento (ricordo che X-Box ha la struttura di un PC ed un processore grafico molto simile al GeForce 4 Titanium) sfrutta i Pixel Shader 2.0 per realizzare gli effetti dei Pixel Shader 1.1 in un minor numero di passate di rendering. Unreal Tournament 2004 Basato su una versione rivista e aggiornata del motore grafico di Unreal Tournament 2003, questo titolo è uno dei più diffusi a livello di multiplayer gaming. Tra le caratteristiche più interessanti troviamo luso del T&L e del Bump Mapping. Quasi del tutto assenti invece i Vertex ed i Pixel Shader. Le due mappe prese in considerazione sono Antalus ed Asbestos. La prima è contraddistinta da spazi aperti molto vasti, mentre la seconda è al chiuso in un ambiente più claustrofobico. Pagina 17 - Test sintetici
I valori del fill rate della GeForce 7800 GTX confermano quanto già rilevato durante l'analisi tecnica: le 24 pipeline di G70 lavoranti a 430 Mhz garantiscono oltre 10 Gtexel/s. Molto buono anche il fill rate in single texturing, anch'essa è il migliore tra tutte le schede singole considerate. Naturalmente i già eccellenti risultati ottenuti con una scheda GeForce 7800 GTX diventano assolutamente impressionanti nel momento in cui si considerano due processori grafici G70 lavoranti in parallelo attraverso la tecnologia SLI: quasi 20000 Mtexel/s in multitexturing, un numero che fa rabbrividire gli oltre 13000 Mtexel/s di due GeForce 6800 Ultra in SLI.
Con nostra grande sorpresa il calcolo dei vertex shader vede in prima posizione tra le schede singole, la Radeon X 850 XT PE. In tal caso gli incrementi nell'efficienza del calcolo poligonale di G70 nei confronti di NV40 non sembrano sortire alcun effetto: la GeForce 7800 GTX mostra una superiorità di circa il 20-25% rispetto alla GeForce 6800 Ultra, un valore basso considerando che il numero di unità di vertex shading è passato da sei ad otto (che si dovrebbe tradurre in un +33%) e che l'efficienza dovrebbe essere aumentata del 30%. Nuovamente impressionanti i numeri delle soluzioni SLI: rispetto al calcolo in singola GPU, SLI consente di ottenere in questo caso un vero e proprio raddoppio delle prestazioni.
La maggiore efficienza nell'eseguire operazioni MAD nel calcolo dei pixel shaders salta fuori nel relativo test sintetico del 3DMark05. La GeForce 7800 GTX è più veloce di oltre l'80% rispetto ad NV40 e in configurazione a singola GPU fa registrare 296,4 fps risultando essere non troppo distante dai 320,8 fps ottenuti con due GeForce 6800 Ultra in SLI. Assolutamente irraggiungibili le due GeForce 7800 GTX in SLI: 582,6 fps, anche in questo caso più veloce di oltre l'80% rispetto alla analoga configurazione delle GeForce 6800 Ultra. Pagina 18 - Half Life 2 Prima di procedere nell'analisi dei risultati è bene chiarire che le impostazioni dei driver utilizzate per il pacchetto benchmark classico qui proposto sono quelle di default, il che, per la GeForce 7800 GTX si traduce in una disattivazione della correzione gamma e del transparent antialiasing. Per le schede NVIDIA, inoltre, è stata utilizzata la modalità Quality per i filtro trilineare e anisotropico, mentre le schede ATI hanno il Catalyst IA impostato di default sulla posizione Standard ed il mipmapping su High Quality. Successivamente valuteremo l'impatto sulle prestazioni delle varie modalità del filtro anisotropico e dell'antialiasing.
Nonostante la rinnovata piattaforma di test c'era da aspettarsi risultati CPU limited con alcuni titoli, specie alle risoluzioni più basse e senza antialiasing e filtro anisotropico: Half-Life 2 è uno di questi. I risultati in condizioni CPU limited, tuttavia, ci hanno svelato una interessante proprietà dei sistemi SLI: questi accentuano il limite da parte della CPU e, conseguentemente, le configurazioni di questo tipo risultano essere leggermente meno veloci delle schede video a singola GPU alle basse risoluzioni. E' possibile che ciò si verifichi perché l'utilizzo di due schede video lavoranti in parallelo richiede da parte della CPU e del chipset una gestione più complessa dei flussi di dati del personal computer. Concentrando la nostra attenzione sui risultati ottenuti alle alte risoluzioni e nel rendering più complesso possiamo osservare che per la prima volta non è una scheda video Radeon ad essere la più veloce con il titolo sviluppato da Valve. La GeForce 7800 GTX riesce sempre ad essere più rapida della Radeon X850 XT PE anche se il distacco non supera mai un +20%. Interessante vedere G70 e R480 battagliare nella mappa prison a testa alta contro le due GeForce 6800 Ultra in modalità SLI. Fanalino di coda la GeForce 6800 Ultra, mentre imprendibili le due GeForce 7800 GTX in SLI, situazione che si ripeterà anche in altri benchmark. Pagina 19 - Far Cry
Nuovamente velocissimo G70 con Far Cry. La nuova creazione NVIDIA distacca la Radeon X 850 XT PE del circa il 20%, mentre questa percentuale sale mediamente a circa il 30-40% nei confronti della GeForce 6800 Ultra. Dello stesso ordine di grandezza è anche il vantaggio delle due GeForce 7800 GTX rispetto alle due GeForce 6800 Ultra in configurazione SLI. Naturalmente, quanto detto con Half-Life 2 è valido anche in questo caso: nel valutare i distacchi è bene concentrarsi sui valori ottenuti alle alte risoluzioni e nel rendering con antialiasing e filtro anisotropico, in modo da non considerare le situazioni CPU limited. Pagina 20 - Doom 3
Per la prima volta dall'introduzione di questo benchmark otteniamo risultati CPU limited con Doom 3. La GeForce 7800 GTX è ancora una volta la scheda video in configurazione singola più veloce del lotto con un +20-30% di prestazioni rispetto alla GeForce 6800 Ultra e qualcosa in più nei confronti della Radeon X850 XT PE, fanalino di coda con questo videogames. Ottimi i risultati ottenuti con le soluzioni SLI: fanno registrare un incremento che va dal 50% fino al 90%, rispetto al rendering con un solo processore grafico, sfiorando il raddoppio delle prestazioni. Pagina 21 - The Chronicles Of Riddick
The Chronicles Of Riddick è uno dei titoli più pesanti che abbiamo nel nostro pacchetto benchmark e non è un caso, infatti, che è quello che fa registrare i distacchi più elevati tra le configurazioni SLI e quelle a singola GPU. In tal caso due GeForce 7800 GTX, nel rendering con antialiasing e filtro anisotropico, ottengono il doppio delle prestazioni rispetto ad una GeForce 7800 GTX e lo stesso discorso è valido anche per le GeForce 6800 Ultra. Fa un certo effetto, inoltre, vedere due GeForce 7800 GTX essere ben tre volte più veloci di una Radeon X850 XT PE. Del resto tale distacco è comprensibile visto che The Chronicles of Riddick è uno di quei titoli particolarmente graditi all'architettura dei processori grafici GeForce. Per quanto concerne il confronto tra la GeForce 7800 GTX e la GeForce 6800 Ultra otteniamo nuovamente un vantaggio per la prima nell'ordine del 20-30%. Pagina 22 - Splinter Cell: Chaos Theory
Anche Splinter Cell: Chaos Theory, come The Chronicles Of Riddick, è riuscito a sfuggire il più delle volte alle situazioni CPU limited grazie ad una grafica particolarmente pesante. La GeForce 7800 GTX, come in tutti gli altri test, risulta essere la più veloce del lotto sia nei confronti delle singole schede che, in modalità SLI, rispetto a due GeForce 6800 Ultra. La superiorità di G70 nei confronti della Radeon X850 XT PE è sancita da un vantaggio che va dal 20% fino al 40%, mentre rispetto a NV40 queste percentuali sono destinate ad aumentare di qualche punto. Pagina 23 - Unreal Tournament 2004
Unreal Tournament 2004 è il videogame tecnologicamente meno recente facente parte della nostra suite di benchmark e, conseguenza di ciò, è quello che, specie con la mappa Asbestos, ha fatto registrare i risultati maggiormente limitati dalla potenza di calcolo della CPU. In tal caso, quindi, in misura ancora superiore rispetto a quanto fatto fino ad ora, prenderemo in considerazione soprattutto i valori ottenuti alle alte risoluzioni con il rendering complesso. Naturalmente anche con questo titolo la superiorità della GeForce 7800 GTX non può essere messa in dubbio e gli stessi margini di vantaggio sono pressoché gli stessi visti fino ad ora: rispetto alla Radeon X850 XT PE abbiamo un +20-50% per G70 e poco più nei confronti della GeForce 6800 Ultra. Ci ha particolarmente sorpreso il numero di fotogrammi al secondo visto nella mappa Asbestos a 1600x1200 con antialiasing 4x e filtro anisotropico 8x: ben 295 fps, cento in più rispetto a R480 e NV40. Pagina 24 - Halo
Concludiamo l'analisi dei risultati ottenuti dal pacchetto benchmark classico con Halo. Questo titolo di Microsoft ci ha restituito situazioni non propriamente normali in alcuni casi. Ad esempio a 1280x1024 con filtro anisotropico 8x ritroviamo una distribuzione anomala dei valori. Nonostante questo elemento, la GeForce 7800 GTX resta la più veloce rispetto alle soluzioni Radeon X850 XT PE e GeForce 6800 Ultra: la percentuale di vantaggio è rispettivamente pari a circa un +20% ed un +40-50%. Pagina 25 - Overclock Per cimentarci nella pratica dell'overclock con la scheda GeForce 7800 GTX abbiamo utilizzato l'apposito pannello dedicato alla modifica delle frequenze di funzionamento reso disponibile dagli stessi driver ForceWare una volta abilitati i Coolbits nel registro di configurazione di Windows XP. Siamo rimasti piacevolmente sorpresi dai risultati ottenuti in quest'ambito dalla scheda GeForce 7800 GTX. Il core è salito dai 430 Mhz originali fino a 480 Mhz ottenendo un guadagno di ben 50 Mhz che, moltiplicati per le ventiquattro pipeline, si traducono in 1200 Mpixel/s e 1200 Mtexel/s in più rispetto alle specifiche tecniche di default. Non ci hanno deluso neanche i moduli di memoria che hanno raggiunto la ragguardevole frequenza di 1400 Mhz, portando la banda passante da 38,4 GB/s a ben 44,8 GB/s.
Gli incrementi dovuti all'overlock in Far Cry si possono quantificare in 10-15 fps in più. In percentuale ciò equivale ad un guadagno medio di circa il 10-15%, un risultato abbastanza soddisfacente. Pagina 26 - Analisi antialiasing: Far Cry Nellanalisi dellantialiasing abbiamo voluto considerare singolarmente tutte le possibili modalità messe a disposizione dei vari processori grafici allo scopo di valutare principalmente limpatto sulle prestazioni che ogni modalità comporta rispetto al rendering senza antialiasing. Per quanto concerne le nuove tecniche di antialiasing introdotte con la GeForce 7800 GTX, le abbiamo valutate solo in modalità 4x.
I risultati ottenuti con le modalità facenti uso di due samples ci mostrano innanzitutto che limpatto sulle prestazioni è dipendente non solo dal motore grafico, ma anche dalla mappa presa in considerazione o, più in generale, dalle caratteristiche della scena tridimensionale. Lantialiasing 2x nella mappa Training ha un impatto sulle prestazioni superiore rispetto a quanto rilevato nella mappa Volcano. La scheda video che misura il più basso degrado delle performance allabilitazione dellantialiasing 2x è la Radeon X850 XT PE, mentre quella che soffre maggiormente è la GeForce 7800 GTX.
Anche utilizzando quattro samples è sempre la Radeon X850 XT PE la scheda che offre in minor abbattimento della velocità abilitando lantialiasing. Allultimo posto di queste classica si pone nuovamente la GeForce 7800 GTX. Per quanto concerne le varie modalità aggiuntive introdotte da G70, notiamo come la correzione gamma comporti un deciso decadimento delle prestazioni, il 35% in meno rispetto alluso dellantialiasing 4x classico. Ottimi i livelli del transparent antialiasing che incide, anche nella sua implementazione più costosa, non più del 6%.
Confrontando le modalità con il più elevato numero di samples otteniamo un quadro che non si distacca troppo da quanto visto in precedenza: R480 riesce ad offrire un antialiasing 6x di tipo multisampling rinunciando a circa il 50% delle prestazioni, mentre le schede GeForce le sacrificano non meno del 65% per applicare lantialiasing 8xS. E interessante notare come questo sia lunico benchmark in cui la Radeon X850 XT PE risulta essere più rapida di G70. Evidentemente luso di otto samples estrapolati mediante la tecnica ibrida multisampling + supersampling è unoperazione gravosa anche per le ventiquattro pipeline della GeForce 7800 GTX. Pagina 27 - Analisi antialiasing: Splinter Cell Chaos Theory
Lelevato impatto sulle prestazioni della correzione gamma e lelevata efficienza delle modalità transparency antialiasing per la GeForce 7800 GTX vengono confermate anche da Splinter Cell Chaos Theory. Sempre ottime le percentuali della Radeon X850 XT PE, mentre la GeForce 6800 Ultra si pone a metà strada. Pagina 28 - Analisi filtro anisotropico: Far Cry Per analizzare le prestazioni del filtro anisotropico abbiamo eseguito per ogni processore grafico i benchmark in tutte le modalità qualitative possibili e con tutte le combinazioni di samples disponibili. Abbiamo, successivamente, estrapolato la percentuale di impatto sulle prestazioni di ogni modalità del filtro anisotropico confrontando i risultati ottenuti con le varie combinazioni di samples con quelli ottenuti con il filtro trilineare.
Laspetto più interessante che deriva da questi grafici è quello relativo alle percentuali di impatto. Ogni processore grafico soffre maggiormente lapplicazione del filtro anisotropico nella modalità qualitativamente più accurata: High Quality per le schede GeForce e Catalyst IA Disabled per le Radeon. Non è un caso che tali modalità siano proprio quelle che disabilitano tutte le ottimizzazioni legate allapplicazione del filtro anisotropico. Passando alle impostazioni Quality e IA Standard, la situazione migliora notevolmente e le percentuali di impatto sulle prestazioni subiscono importanti decrementi. Pagina 29 - Analisi filtro anisotropico: Splinter Cell Chaos Theory
Anche in questo caso Splinter Cell Chaos Theory conferma essenzialmente quanto già visto con Far Cry. Lunico elemento di distinzione nel comportamento delle schede è relativo ai valori in termini assoluti delle percentuali di impatto sulle prestazioni del filtro anisotropico: in questo caso sono molto più bassi rispetto a quelli di Far Cry. Del resto il titolo CryTEK è probabilmente uno dei videogames più complessi e ricchi in assoluto dal punto di vista delle texture. Pagina 30 - Analisi shader model 3.0 Poiché nei confronti effettuati fino ad ora figurava anche la Radeon X850 XT PE, non potevamo abilitare alcuni effetti grafici legati allo shader model 3 ed implementati in Splinter Cell Chaos Theory e The Chronicles Of Riddick. Escludendo R480 dal confronto, possiamo determinare limpatto sulle prestazioni dovuto allabilitazione di queste funzionalità grafiche oltre al comportamento della GeForce 7800 GTX e delle sue unità di shading revisionate. Per Splinter Cell Chaos Theory labilitazione dellHigh Dynamic Range rende impossibile lutilizzo dellantialiasing, mentre per The Chronicles Of Riddick abbiamo potuto eseguire i test abilitando le soft stencil shadows sia nel rendering semplice in quello più complesso.
I risultati evidenziano che la GeForce 7800 GTX sopporta leggermente meglio labilitazione dellHigh Dynamic Range, del Tone Mapping e del Parallax Mapping in Splinter Cell Chaos Theory rispetto alla GeForce 6800 Ultra. Questultima fa registrare un calo delle prestazioni di circa il 35-40%, mentre per G70 questa percentuale è nellordine del 30-35%. Le soft stencil shadows di The Chronicles Of Riddick sono senza ombra di dubbio leffetto grafico più pesante mai visto in un videogame. La loro attivazione comporta sia un deciso aumento della qualità dellimmagine, che un evidente crollo del numero di frame al secondo in una percentuale variabile tra il 50% e l80%, indipendentemente dal processore grafico e dalla configurazione considerata. In tal caso non rileviamo particolari vantaggi per larchitettura di G70 se non quelli dovuti al maggior numero di pipeline ed alle frequenze più elevate. Pagina 31 - Analisi scalabilità Lanalisi della scalabilità ci consente di determinare quanto le schede video considerate in questo articolo sono dipendenti dalla potenza di calcolo della CPU. Abbiamo pertanto eseguito alcuni benchmark di Far Cry e Splinter Cell Chaos Theory downcloccando il nostro Athlon 64 FX-55 dai 2600 Mhz originali a 2000 Mhz e a 1400 Mhz. Anche se una CPU con larchitettura dellAthlon 64 FX lavorante a 1400 Mhz non esiste in commercio, rappresenta comunque un ottimo metro di paragone per dare lidea di come funziona la GeForce 7800 GTX con i personal computer più datati.
Come era possibile prevedere la frequenza del processore di sistema incide notevolmente sulle prestazioni delle schede video specie nelle condizioni in cui si è maggiormente limitati dalla potenza di calcolo della CPU. Ridurre la frequenza di lavoro fino a 1400 Mhz ha portato, infatti, ad un innalzamento del limite con cui la scheda video può eseguire le sue operazioni e, di conseguenza, ad un appiattimento delle prestazioni tra i vari prodotti considerati. Ecco quindi che se le soluzioni a singolo processore grafico nel passaggio da 2600 Mhz a 1400 Mhz non hanno subito un decremento evidente a 1600x1200 con filtri abilitati (perché GPU limited), i sistemi SLI, invece, essendo dotati di una potenza di calcolo superiore (e quindi più CPU limited), hanno visto il loro margine di vantaggio ridursi in modo sensibile. Pagina 32 - Analisi efficienza: test sintetici Lanalisi dellefficienza ha lo scopo di valutare la validità dellarchitettura di un processore grafico e, in particolare, lefficienza delle unità di pixel e vertex shading. Per eseguire tale operazione abbiamo provveduto a portare G70, NV40 e R480 alle medesime specifiche tecniche in termini di fill rate e banda passante. Come riferimento sono stati presi i valori di NV40 ed abbiamo abbassato la frequenza del core e delle memorie di R480 e G70. Poiché R480 ha lo stesso numero di pipeline di NV40, abbiamo semplicemente portato il core a 400 Mhz. Per G70, invece, abbiamo dovuto tener conto del maggior numero di pipeline: in questo caso il core è stato impostato per lavorare a 267 Mhz. Larchitettura del memory controller, invece, sia per R480 che G70 è simile a quella di NV40 e pertanto le memorie sono state impostate a 1100 Mhz come per la GeForce 6800 Ultra. Così facendo abbiamo fatto coincidere le specifiche tecniche di tutti i processori grafici: 6400 Mpixel/s e 6400 Mtexel/s per il fill rare e 35,2 GB/s di banda passante. Solo la potenza di calcolo poligonale è leggermente penalizzata in G70 a causa del differente rapporto tra il numero di pipeline ed il numero di unità di vertex shading.
Molto interessante il comportamento dei vari processori grafici in multitexturing: si attestano tutti attorno ai 6400 MTexel/s. In single texturing spiccano, invece, le ventiquattro pipeline di G70, mentre è leggermente indietro il Radeon X850 XT PE. Un comportamento simile lo avevamo già incontrato nel confronto tra la GeForce 6600 GT e la GeForce 6800: questultima ha un fill rate più elevato in single texturing grazie alle sue dodici pipeline. La maggiore efficienza di NV40 su R480 nel calcolo dei pixel shading a parità di frequenza di clock non è mai stata in dubbio. La vera novità è rappresentata dal risultato della GeForce 7800 GTX: la revisione delle unità di pixel shading ha portato ad una maggiore efficienza di calcolo. Si riscatta la Radeon X850 XT PE nel calcolo poligonale dove mostra tutta la validità delle proprie unità di vertex shading rispetto a quelle di NV40 e G70. Pagina 33 - Analisi efficienza: Far Cry e Splinter Cell Chaos Theory
Come era prevedibile ipotizzare la Radeon X850 XT PE, senza il suo margine di vantaggio in termini di Mhz, scivola dietro la GeForce 6800 Ultra. E evidente, quindi, che i videogames considerati sono dipendenti più dalla capacità di elaborare pixel shaders che non dalla potenza geometrica. Confrontando G70 e NV40 non emerge, tuttavia, lo stesso vantaggio visto nel test relativo ai pixel shaders del 3DMark05. La GeForce 6800 Ultra e la GeForce 7800 GTX fanno, infatti, registrare valori appaiati, privi di alcun distacco significativo. Tale quadro può essere spiegato da una ancora immatura ottimizzazione dei driver che non riescono, quindi, a sfruttare la maggiore capacità di eseguire operazioni MAD di G70. Non bisogna, inoltre, dimenticare che lunità di G70 è stata oggetto di unottimizzazione molto specifica e non è detto che qualsiasi tipo di pixel shaders ne possa trarre vantaggio. Pagina 34 - Consumi e rumorosità Il rilevamento della potenza necessaria al corretto funzionamento del sistema è stato eseguito con una pinza amperometrica Alfa Electronics DM-6052 sulla corrente alternata utilizzata dallalimentatore del sistema di test. Attraverso la pinza amperometrica abbiamo provveduto sia a misurare la tensione (pari a 230 Volt) che la corrente (in Ampere). In un circuito elettrico attraversato da corrente continua la potenza, che si misura in Watt, è data da tensione*corrente. Sfortunatamente, avendo una misurazione della corrente alternata, dobbiamo tenere conto di un terzo fattore denominato fattore di potenza. La formula pertanto risulta essere la seguente: potenza = tensione*corrente*cos(Phi), dove Phi è langolo di sfasamento e cos(Phi) è il fattore di potenza. Langolo di sfasamento dipende dal tipo di carico: resistivo, induttivo o capacitivo. Fortunatamente gli alimentatori dei personal computer hanno un tipo di carico che rende langolo di sfasamento vicino allo zero e, conseguentemente, il fattore di potenza può essere approssimato con lunità. Per correttezza, tuttavia, non indicheremo i risultati ottenuti in Watt, ma in VA (Volt per Ampere). Coloro che vogliono effettuare un confronto tra i risultati ottenuti e la potenza massima erogabile dallalimentatore devono tenere a mente che nel migliore dei casi (cioè quando cos(Phi) è approssimabile con lunità) il valore in VA può essere tradotto in Watt senza alcuna operazione, mentre in tutti gli altri casi la potenza in Watt sarà inferiore.
La maggiore potenza di calcolo della GeForce 7800 GTX rispetto alla GeForce 6800 Ultra non corrisponde ad un conseguente aumento dei consumi. Grazie alluso del processo produttivo a 0.11 micron di TSMC, NVIDIA ha potuto mantenere lassorbimento di corrente su livelli leggermente più contenuti rispetto a quelli visti con la GeForce 6800 Ultra. La scheda video con i consumi maggiormente ridotti è la Radeon X850 XT PE grazie alla minore complessità (e numero di transistor) di R480 rispetto a NV40 e G70. Elevatissime, invece, le richieste di potenza dei sistemi SLI: con le due GeForce 7800 GTX si arriva ad assorbire fino a 310,5 VA, mentre con le due GeForce 6800 Ultra il consumo è di 338,1 VA. Le misurazioni della rumorosità sono state effettuate su un sistema di test privo di case con un fonometro posto ad una distanza di circa 10 cm dal sistema di dissipazione della scheda video. Bisogna, pertanto, interpretare questi valori non come misure assolute, ma limitatamente alla comparazione tra i vari prodotti, cioè solo per la valutazione di quale è la scheda più rumorosa del lotto. E evidente, infatti, che la maggioranza degli utenti monta il proprio personal computer in un case chiuso dal quale si trova normalmente ad una distanza superiore a 10 cm.
La Radeon X850 XT PE risulta essere la scheda più silenziosa tra quelle considerate anche se la GeForce 7800 GTX non far registrare valori molto diversi, specie in idle. La GeForce 6800 Ultra, invece, è senza ombra di dubbio il prodotto più rumoroso del lotto e, in modalità SLI, raggiunge sotto stress livelli che possono incontrare la disapprovazione degli utenti più sensibili allinquinamento acustico. Pagina 35 - Conclusioni Iniziamo le nostre conclusioni riprendendo la domanda che ci siamo posti nel cappelletto introduttivo di questo articolo: evoluzione o rivoluzione? Lanalisi della GeForce 7800 GTX ha evidenziato che NVIDIA per questa generazione di processori grafici ha scelto una linea di sviluppo di tipo evolutivo. Tale soluzione, tuttavia, non alimenta in noi un senso di insoddisfazione tecnologica in quanto G70, contrariamente a quanto unanalisi superficiale potrebbe rilevare, non è semplicemente un NV40 con otto pipeline in più, ma presenta, nei limiti del possibile per un progetto evoluzione, diverse innovazioni che colpiscono la generazione di unimmagine tridimensionale sia dal punto di vista qualitativo che velocistico. Le nuove modalità di antialiasing rappresentano una novità particolarmente gradita e lalgoritmo alla base della loro concezione dimostra sia la creatività degli ingegneri NVIDIA, sia la loro attenzione nel trovare e porre rimedio a tutti gli artefatti dovuti alla natura discreta della grafica tridimensionale su personal computer. Il transparent antialiasing nelle sue implementazioni multisampling e supersampling è in grado di migliorare notevolmente la qualità dellimmagine in tutti quei videogames che presentano ambientazioni ricche di vegetazione o, più in generale, texture dotate di elementi trasparenti. Il bassissimo impatto sulle prestazioni del transparent antialiasing anche in modalità supersampling, inoltre, permette a questa opzione di essere realmente utilizzabile da subito. Siamo rimasti poco entusiasmati, invece, dalla qualità del filtro anisotropico: avremmo gradito ottenere una resa identica a quella di NV40 e non leggermente inferiore. Tuttavia, non riteniamo che questo fattore sia particolarmente importante in quanto è impossibile in sede di gioco accorgersi delle piccole differenze svelate dal Texture Filter Analyzer. Non contenta della già estrema efficienza delle unità di texturing e pixel shading di NV40, NVIDIA ha migliorato ulteriormente questa componente ed alcuni dei nostri benchmark (3DMark05 e Splinter Cell Chaos Theory), hanno già mostrato prestazioni superiori rispetto a NV40 sia nel calcolo dei pixel shader 3.0, che nellapplicazione di effetti avanzati come lHigh Dynamic Range. Il debutto della GeForce 7800 GTX, inoltre, è unoccasione per NVIDIA per rinnovare anche il proprio supporto software con nuovi driver che ottimizzano le prestazioni degli utenti TurboCache e SLI e che migliorano il supporto HDTV ed OpenGL, risolvendo anche alcuni bug con i titoli più recenti. Le innovazioni annunciate per i ForceWare 80, inoltre, fanno sperare in interessanti incrementi nelle prestazioni soprattutto per la GeForce 7800 GTX, dotata di unarchitettura che necessita di essere sfruttata appieno per dare il meglio. La scelta di adottare un processo produttivo a 0.11 micron, affidato a TSMC, ha permesso ad NVIDIA di arrivare sul mercato prima del concorrente canadese e di proporre unarchitettura dotata di ventiquattro pipeline che, rispetto alla GeForce 6800 Ultra, sviluppa meno calore ed è meno vorace di energia. In definitiva, la GeForce 7800 GTX, venduta ad un prezzo di circa 550 iva inclusa, si pone come il nuovo punto di riferimento velocistico scalzando la Radeon X850 XT PE dal primo posto della classifica delle soluzioni a singolo processore grafico, battendo, in modalità SLI, due GeForce 6800 Ultra, il tutto con una qualità di antialiasing superiore e con un consumo ed una rumorosità ridotti. Alla vigilia di un nuovo scontro generazionale, NVIDIA si presenta con una punta di diamante rinnovata nelle performance e nella qualità, disponibile da subito sul mercato, confermando la propria competitività e serietà. La palla ora, passa ad ATI. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||