GeForce 7900: i 90 nanometri secondo NVIDIA

Ad oltre sette mesi dal lancio di G70, NVIDIA si appresta a rinnovare la sua offerta nella fascia alta del mercato con G71. Tale prodotto è stato pensato per dare battaglia alle soluzioni ATI Radeon X1900 non solo dal punto di vista velocistico, ma soprattutto in termini di efficienza delle rese produttive.
di Raffaele Fanizzi pubblicato il 09 Marzo 2006 nel canale Schede VideoNVIDIAATIGeForceRadeonAMD
Caratteristiche tecniche - parte 1
Nello sviluppo di G71 NVIDIA ha intrapreso la strada del raffinamento di un'architettura vincente come quella di G70, introducendo una serie di migliorie sia in termini di processo produttivo, che a livello di architettura.
L'architettura di G71 vede protagoniste le stesse 24 pipeline di G70, ognuna dotata di una unità di pixel shading composta da due unità ALU per l'esecuzione dei calcoli aritmetici ed una unità di texture mapping (TMU) per l'accesso alle texture. Ogni ALU supporta la modalità ibrida di elaborazione FP16/FP32 e l'elaborazione di quattro MADDs (un'operazione composta di moltiplicazione e addizione) per ciclo di clock. In ogni pipeline una delle due ALU è dipendente dalla TMU, il che vuol dire che ogni pipeline di G71 può eseguire 8 MADDs oppure 4 MADDs ed un texture fetch. Aggiungiamo a queste operazioni anche una di controllo del flusso ed una normalizzazione di un vettore FP16. G71 possiede, inoltre, 8 unità di vertex shading dedicate all'elaborazione dei dati geometrici di una scena tridimensionale, e 16 ROPs, componenti che si fanno carico di tutte le operazioni di blending, di quelle relative allo stencil buffer, oltre a scrivere all'interno del frame buffer il valore di ogni singolo pixel.
Esattamente come per G70, anche le ROPs di G71 possono eseguire il doppio delle operazioni relative allo z buffer ed allo stencil buffer per ciclo di clock, mentre resta la limitazione di non poter applicare l'antialiasing in congiunzione con il blending in floating point, cioè essenzialmente durante l'applicazione dell'High Dynamic Range in formato FP.
Rispetto a G70, benché le funzionalità delle ROPs non siano state cambiate, NVIDIA afferma di averne rivisto leggermente l'architettura al fine di renderle più efficienti. Non cambiano, quindi, le capacità tecnologiche delle schede high-end di NVIDIA: il motore di rendering resta il Cine Fx 4.0, pienamente compatibile con lo shader model 3.0, così come il memory controller non subisce modifiche, mantenendo la sua banda ampia 256 bit suddivisa in quattro controller da 64 bit l'uno. Invariate anche le modalità di antialiasing (compreso il transparency antialiasing) ed il filtro anisotropico. Per maggiori informazioni sulle funzionalità delle schede GeForce serie 7000 vi rimandiamo all'articolo pubblicato in occasione del lancio della GeForce 7800 GTX .
Volendo fare un paragone con R580, chip montato sulle schede Radeon X1900, ricordiamo che il chip di ATI possiede 48 unità di pixel shading, ognuna composta da due ALU, in grado di eseguire 4 MADDs e 4 addizioni per ciclo di clock, e sedici unità di texture mapping indipendenti. Il tutto è coordinato dall'Ultra Threaded Dispatch Processor. Il calcolo geometrico in R580 è affidato ad 8 unità di vertex shading in maniera analoga a quanto avviene in G71. Anche in questo caso, inoltre, il numero di ROPs è pari a 16 anche se queste non eseguono il doppio delle operazioni nell'elaborazione dei dati relativi allo z ed allo stencil buffer, ma possono elaborare l'High Dynamic Range unito all'antialiasing.
Esistono essenzialmente due differenze a livello di architettura tra G71 e R580. La prima è la dipendenza delle ALU dalle TMU per G71, il che comporta l'incapacità di G71 di sfruttare appieno le sue potenzialità in ambito aritmetico in presenza di operazioni con le texture. La seconda è il diverso rapporto che c'è tra numero di TMU e numero di pixel shader unit. R580 possiede il triplo di unità dedicate alle operazioni matematiche rispetto alle unità per l'accesso alle texture. G71, invece, ha un rapporto 1:1.
Queste diversità portano i due prodotti a comportarsi in maniera differente e ad avvantaggiarsi in situazioni di calcolo dissimili. G71 si troverà particolarmente a suo agio in tutte quelle scene che puntano maggiormente sulle texture piuttosto che sul calcolo aritmetico, mentre in maniera quasi speculare troveremo R580 molto veloce nelle elaborazioni matematiche che pongono l'accento sulle ALU e non sulle TMU.
Per quanto concerne le funzionalità di accelerazione video, queste restano legate alla tecnologia PureVideo e restano essenzialmente le stesse delle altre schede GeForce serie 7000, anche se in occasione del lancio di G71 NVIDIA ha rilasciato una nuova versione del PureVideo Decoder e dei driver che comportano su tutti i chip NV4x e G7x (escluso NV40 e NV45) una migliore qualità dell'immagine ed abilitano l'accelerazione della decodifica H.264 in hardware. Per motivi di tempo non eseguiremo in questa sede benchmark relativi alle capacità di accelerazione video di questi nuovi prodotti e rimandiamo tali test ad un futuro articolo.