Caratteristiche tecniche - parte 2
Fino ad ora abbiamo mantenuto il confronto su un piano puramente
computazionale, evidenziando cioè cosa sa fare ogni prodotto in termini di operazioni
aritmetiche e sulle texture. Come detto in fase introduttiva, tuttavia, questo non è il
solo parametro che caratterizza un processore grafico, ma ne esistono altri tra cui il
processo produttivo. NVIDIA con G70 aveva scelto il processo a 0.11 micron, una politica
vincente in quanto ha consentito a questa GPU di arrivare sul mercato diversi mesi prima
di R520 e di monopolizzare a tutti gli effetti il mercato delle soluzioni high-end PCI
Express per la quasi totalità della seconda metà 2005. G71, invece, esattamente come
R520 e R580, è costruito con un processo produttivo a 0.09 micron ed è, quindi, il primo
processore grafico NVIDIA di fascia alta costruito con questa tecnologia.
A fronte di quanto detto in termini di architettura sembrerebbe che G71 sia poco più
di una semplice traduzione (in gergo die shrink) a 0.09 micron di G70, ma la realtà è
che la sua progettazione è andata oltre il semplice passaggio ad un processo produttivo
più raffinato ed il numero di transistor di cui è composto ne è una prova
indiscutibile. Per la prima volta nella storia dei processori grafici, infatti, un nuovo
prodotto di fascia alta conta meno transistor del suo predecessore: 278 milioni per G71
contro i 302 milioni di G70. Tutto ciò è stato possibile grazie ad una formidabile opera
di ottimizzazione il cui scopo primario è quello di raggiungere la più elevata
efficienza in termini di rapporto tra prestazioni e numero di transitor, tra prestazioni e
dimensioni della superficie del core e tra prestazioni e consumo di energia.
Risultato di questa opera è un core che ha una superficie di soli 196 mm quadrati. A
confronto R580 conta 384 milioni di transitor ed ha una superficie di ben 352 mm quadrati.
In percentuale, quindi, R580 ha una dimensione maggiore del 79% ed il 38% in più di
transistor il che si traduce in un numero inferiore di chip prodotti per ogni wafer, in
minori rese, in maggiori costi di produzione, in un maggior consumo di energia ed in una
maggiore dissipazione di calore.
| |
ATI Radeon
X1900 XTX |
ATI Radeon
X1900 XT |
ATI
Radeon X1800 XT |
NVIDIA
GeForce 7900 GTX 512 MB |
NVIDIA
GeForce 7900 GT 256 MB |
NVIDIA
GeForce 7800 GTX 512 MB |
NVIDIA
GeForce 7800 GTX 256 MB |
| Bus di memoria |
256 bit |
256 bit |
256 bit |
256 bit |
256 bit |
256 bit |
256 bit |
| Processo produttivo |
0.09 micron |
0.09 micron |
0.09 micron |
0.09 micron |
0.09 micron |
0.11 micron |
0.11 micron |
| Frequenza chip e memoria |
650/1550 |
625/1450 |
630/1400 |
650/1600 |
450/1320 |
550/1700 |
430/1200 |
| Bus |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
PCI Express 16x |
| Unità di Vertex Shading |
8 |
8 |
8 |
8 |
8 |
8 |
8 |
| Unità di Pixel Shading |
48 |
48 |
16 |
24 |
24 |
24 |
24 |
| Numero di TMU |
16 |
16 |
16 |
24 |
24 |
24 |
24 |
| Texture per ciclo di clock |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
| Numero di Rops |
16 |
16 |
16 |
16 |
16 |
16 |
16 |
| Pixel Fill Rate |
10400 Mpixel |
10000 Mpixel |
10080 Mpixel |
10400 Mpixel |
7200 Mpixel |
8800 Mpixel |
6880 Mpixel |
| Texel Fill Rate |
10400 Mtexel |
10000 Mtexel |
10080 Mtexel |
15600 Mtexel |
10800 Mtexel |
13200 Mtexel |
10320 Mtexel |
| Z / Stencil Fill Rate |
10400 Mtexel |
10000 Mtexel |
10080 Mtexel |
20800 Mpixel |
14400 Mpixel |
17600 Mpixel |
13760 Mpixel |
| Banda Passante |
49,6 GB |
46,4 GB |
44,8 GB |
51,2 GB |
42,2 GB |
54,4 GB |
38,4 GB |
| Versione Vertex Shader |
3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
| Versione Pixel Shader |
3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
3.0 |
| Full Scene Anti-Aliasing |
Adaptive AA e
Multisampling |
Adaptive AA e
Multisampling |
Adaptive AA e
Multisampling |
Intellisample 4.0 |
Intellisample 4.0 |
Intellisample 4.0 |
Intellisample 4.0 |
| Altre caratteristiche |
Ring Bus Memory
Controller, Ultra-Threaded Shader Engine, AVIVO |
Ring Bus Memory
Controller, Ultra-Threaded Shader Engine, AVIVO |
Ring Bus Memory
Controller, Ultra-Threaded Shader Engine, AVIVO |
CineFX 4.0, UltraShadow II, PureVideo |
CineFX 4.0, UltraShadow II, PureVideo |
CineFX 4.0, UltraShadow II, PureVideo |
CineFX 4.0, UltraShadow II, PureVideo |
Relativamente alla scelta da parte di NVIDIA di puntare in maniera così forte
sull'ottimizzazione delle rese produttive per G71, avanziamo una nostra personale ipotesi
non ufficiale che va oltre la ricerca di bassi consumi e minori costi di produzione per il
mercato PC e che vede nella probabile adozione di G71 come GPU della Playstation 3 una
possibile ulteriore motivazione. E' chiaro, infatti, che il processore grafico di una
console per ragioni di compattezza del design e di quantità produttive, deve puntare in
misura ancora superiore alle caratteristiche che abbiamo citato e G71 sembra essere un
candidato fatto su misura.
NVIDIA presenta due versioni di G71: GeForce 7900 GTX e GeForce 7900 GT. Entrambe
caratterizzate dal medesimo numero di unità di elaborazione, si differenziano
esclusivamente per le frequenze adottate per core e memorie. La GeForce 7900 GTX possiede
un core lavorante a 650 Mhz (700 Mhz per le unità di vertex shading) e moduli con un
clock pari a 1600 Mhz. La GeForce 7900 GT, invece, ha un core lavorante a 450 Mhz (470 Mhz
per le unità di vertex shading) e memorie con un clock di 1320 Mhz.
Le architetture NVIDIA utilizzano differenti frequenze di clock per parti interne del
chip, come già scoperto a partire dall'architettura G70 grazie al tool RivaTuner; NVIDIA
ha scelto di esplicitare le frequenze di funzionamento per le unità di vertex shading,
utilizzando tuttavia la frequenza più bassa per indicare il clock della cpu onde evitare
possibili errori d'interpretazione.
|