Introduzione
Il mese di Giugno 2008 verrà ricordato dagli appassionati di grafica 3D per molto
tempo: nel giro di pochi giorni, infatti, NVIDIA e ATI hanno presentato nuove archiretture
per i segmento di fascia media e alta del mercato delle schede video per sistemi desktop,
rivoluzionando uno scenario di mercato che da tempo vedeva NVIDIA saldamente in testa alle
preferenze della maggior parte dei videogiocatori.
La prima a introdurre sul mercato le proprie soluzioni è stata NVIDIA, con le due
schede GeForce GTX 280 e GeForce GTX 260. Entrambe basate su GPU nota con il nome in
codice di GT200, queste nuove soluzioni sono proposte dal produttore americano nel
segmento top di gamma del mercato, riprendendo l'architettura presentata inizialmente con
le schede della serie GeForce 8800 incrementata nel numero di stream processors e dotata
di varie ottimizzazioni e migliorie interne. Queste schede rappresentano il meglio
dell'attuale produzione NVIDIA, superate solo da una futura scheda con due GPU GT200 che
NVIDIA potrà presentare riteniamo solo con il passaggio alla tecnologia a 55 nanometri
per questa nuova architettura.
AMD, con l'annuncio delle nuove schede video ATI Radeon HD 4850 e Radeon HD 4870, è
stata capace di ribaltare il quadro, proponendo due schede video dai validi contenuti
tecnici a livelli di prezzo estremamente concorrenziali. NVIDIA è stata costretta sia ad
abbassare rapidamente il prezzo ufficiale delle proprie schede GeForce 9800 GTX,
allineandolo a quello delle soluzioni Radeon HD 4850, sia ad anticipare il prossimo
debutto della scheda GeForce 9800 GTX+, soluzione che riprende le caratteristiche tecniche
del modello GeForce 9800 GTX con frequenze di clock più elevate grazie all'utilizzo di
una versione di GPU costruita con tecnologia produttiva a 55 nanometri.
Abbiamo analizzato le caratteristiche tecniche e architetturali di tutte le nuove
proposte NVIDIA e ATI in questo articolo e in quest'altro articolo; le riprendiamo in parte analizzando la tabella
seguente, che riassume le caratteristiche tecniche delle soluzioni
| Modello |
GeForce
8800 |
GeForce
9800 |
GeForce
9800 |
GeForce
9800 |
GeForce
GTX |
GeForce
GTX |
| Versione |
GT |
GTX |
GTX+ |
GX2 |
260 |
280 |
GPU |
G92 |
G92 |
G92 |
G92 |
GT200 |
GT200 |
Processo
produttivo (nm) |
65 |
65 |
55 |
65 |
65 |
65 |
Stream
processor |
112 |
128 |
128 |
2x128 |
192 |
240 |
Clock stream
processor (MHz) |
1.500 |
1.688 |
1.836 |
1.512 |
1.242 |
1.296 |
Clock chip
(MHz) |
600 |
675 |
738 |
600 |
576 |
602 |
Numero di
ROPs/render back-ends |
16 |
16 |
16 |
2x16 |
28 |
32 |
| Texture filtering unit |
56 |
64 |
64 |
2x64 |
64 |
80 |
Bus di
memoria (in bit) |
256 |
256 |
256 |
2x256 |
448 |
512 |
Dotazione
memoria in MB |
512-256 |
512 |
512 |
2x512 |
896 |
1024 |
Clock
memoria (GHz) |
1,8 |
2,2 |
2,2 |
2 |
1,998 |
2,214 |
Banda
memoria (GB/s) |
57,6 |
79,4 |
79,4 |
128 |
112 |
141,7 |
| Video processing engine |
VP2 |
VP2 |
VP2 |
VP2 |
VP2 |
VP2 |
| Modello |
Radeon
HD |
Radeon
HD |
Radeon
HD |
Radeon
HD |
Radeon
HD |
| Versione |
3850 |
3870 |
3870X2 |
4850 |
4870 |
GPU |
RV670 |
RV670 |
R680 |
RV770 |
RV770 |
Processo
produttivo (nm) |
55 |
55 |
55 |
55 |
55 |
Stream
processor |
320 |
320 |
2x320 |
800 |
800 |
Clock stream
processor (MHz) |
670 |
775 |
825 |
625 |
750 |
Clock chip
(MHz) |
670 |
775 |
825 |
625 |
750 |
Numero di
ROPs/render back-ends |
16 |
16 |
2x16 |
16 |
16 |
| Texture filtering unit |
16 |
16 |
2x16 |
40 |
40 |
Bus di
memoria (in bit) |
256 |
256 |
2x256 |
256 |
256 |
Dotazione
memoria in MB |
512 |
512 |
2x512 |
512 |
512 |
Clock
memoria (GHz) |
1,65 |
2,25 |
1,8 |
2 |
3,6 |
Banda
memoria (GB/s) |
52,8 |
72 |
2x57,6 |
64 |
115,2 |
| Video processing engine |
UVD |
UVD |
UVD |
UVD2 |
UVD2 |
Tutte le più recenti schede video presentate sul mercato, dotate di supporto alle API
DirectX 10, vedono l'utilizzo di un'architettura a shader unificati basata sull'utilizzo
di stream processors, di fatto dei core di ridotte dimensioni specificamente studiati per
l'elaborazione in parallelo di tutto quello che serve per la generazione delle scene video
dei giochi 3D. NVIDIA e ATI utilizzano approcci differenti, benché non troppo distanti,
per la costruzione dei propri stream processors: da questo ne deriva che non è possibile
confrontarne le prestazioni unicamente analizzandone il numero e le frequenze di
funzionamento. Queste ultime, oltretutto, si differenziano sensibilmente: se per le GPU
ATI Radeon troviamo una frequenza di clock unica per stream processors e altri componenti
interni della GPU, NVIDIA utilizza differenti domini di clock per stream processors e GPU,
con differenze piuttosto sensibili.
Sia le soluzioni ATI che quelle NVIDIA possono venir utilizzate in configurazioni multi
GPU, note rispettivamente con i nomi di CrossfireX e SLI. Sia le nuove schede Radeon HD
4800 che quelle NVIDIA GeForce GTX 200 possono venir affiancate da modelli identici, sino
a 4 schede per le schede Radeon HD 4850 e Radeon HD 4870 e sino a 3 per quelle GeForce GTX
200, incrementando le prestazioni velocistiche con giochi 3D soprattutto alle risoluzioni
video più elevate. La tabella seguente ripropone la stessa tipologia di informazioni
presente nella precedente, ma in questo caso soffermandosi sulle configurazioni SLI e
CrossfireX.
| Modello |
GeForce 9800
GTX SLI |
GeForce 9800
GTX+ SLI |
GeForce GTX
260 SLI |
GeForce GTX
280 SLI |
Radeon HD
4850 Crossfire |
Radeon HD
4870 Crossfire |
Stream
processor |
2x128 |
2x128 |
2x192 |
2x240 |
2x800 |
2x800 |
Clock stream
processor (MHz) |
1.688 |
1.836 |
1.242 |
1.296 |
625 |
750 |
Clock chip
(MHz) |
675 |
738 |
576 |
602 |
625 |
750 |
Numero di
ROPs/render back-ends |
2x16 |
2x16 |
2x28 |
2x32 |
2x16 |
2x16 |
| Texture filtering unit |
2x64 |
2x64 |
2x64 |
2x80 |
2x40 |
2x40 |
Bus di
memoria (in bit) |
2x256 |
2x256 |
2x448 |
2x512 |
2x256 |
2x256 |
Dotazione
memoria in MB |
2x512 |
2x512 |
2x896 |
2x1024 |
2x512 |
2x512 |
Clock
memoria (GHz) |
2,2 |
2,2 |
1,998 |
2,214 |
2 |
3,6 |
Banda
memoria (GB/s) |
158,8 |
158,8 |
224 |
283,4 |
128 |
230,4 |
L'utilizzo di due schede video in parallelo permette di fatto di raddoppiare la potenza
di elaborazione di queste schede video: gli stream processors sono ora in numero doppio, e
raddoppia la bandwidth massima teorica della memoria video. Un limite alla scalabilità
delle prestazioni è dato dal quantitativo di memoria video presente sulla scheda video:
la dotazione complessivamente a disposizione della scheda video, infatti, non è data
dalla somma di ogni memoria associata a ciascuna GPU, ma di fatto alla memoria a
disposizione di ciascuna di esse. Molti dei dati, infatti, devono essere replicati in
ciascun blocco memoria, non rendendo quindi confrontabili quantitativi di memoria, ad
esempio, di 1 Gbyte montati su una scheda a singola GPU come il modello NVIDIA GeForce GTX
280 con lo stesso quantitativo a disposizione di una configurazione CrossfireX con due
schede ATI Radeon HD 4870. |