3dfx VooDoo5 5500

3dfx VooDoo5 5500

3dfx ha presentato allo scorso Comdex Fall di Las Vegas (Novembre 1999) la serie di schede VooDoo 4 e VooDoo 5, basate sul nuovo chip VSA-100. L'approccio tecnologico usato da 3dfx è molto simile a quanto adottato con le schede VooDoo 2: si tratta, infatti, di soluzioni multichip; la VooDoo 5 5500, ad esempio, è basata su due chip VSA-100 operanti in parallelo, ciascuno dei quali ha una dotazione di memoria di 32 Mbytes.

di pubblicato il nel canale Schede Video
 

Tecnologia SLI

Lo schema sottostante riporta le principali caratteristiche tecniche della scheda VooDoo 5 5500 in confronto ai principali concorrenti:

  GeForce SDR GeForce DDR GeForce2 GTS ATI Radeon 256 VooDoo5 5500
Frequenza memoria 166Mhz 300Mhz 333MHz 400Mhz  166Mhz
Tipo memoria SDR DDR DDR DDR SDR
Bandwidth 2,6Gb/sec 4,8Gb/sec 5,3Gb/sec 6,4Gb/sec (8Gb/sec HyperZ) 5,3Gb/sec (2chip)

Il processo produttivo a 0.22 micron utilizzato per i chip VSA-100 ha permesso di ottenere una frequenza di clock di 166 Mhz; l'architettura scelta da 3dfx è tale che la frequenza di clock è la medesima sia per chip che per memoria video. L'impiego della memoria SDR può parere una involuzione rispetto alla scelta, da parte di nVidia e degli altri produttori di chip video, di utilizzare memoria video DDR-SGRAM; la bandwidth complessiva è comunque identica a quella delle schede GeForce 2 GTS, cioè di 5.3 Gbytes al secondo, in quanto la quantità di memoria video a disposizione, 64 Mbytes, è divisa in due parti uguali per ciascuno dei chip video. La tecnologia SLI, infatti, fa in modo che ognuno dei due chip si occupi della generazione di un particolare gruppo di linee che compongono l'immagine 3D (ad esempio, quelle orizzontali di numero pari), mentre l'altro chip provvede alla generazione delle restanti: per questo motivo, sia il fill rate che la bandwidth della memoria video sono calcolate sommando rispettivamente il fill rate di ciascuno dei due chip VSA-100 e la bandwidth di ognuno dei due blocchi memoria da 32 Mbytes.

Questa architettura permette, da una parte, di avere bandwidth elevati della memoria video pur utilizzando memoria SDRAM ma, d'altra parte, fa si che la dotazione di 64 Mbytes di memoria video sia, per così dire, una mezza verità: le textures video devono essere replicate in ognuno dei due blocchi da 32 Mbytes, facendo si che le capacità di memorizzazione delle textures della VooDoo 5 5500 siano all'atto pratico le stesse di una scheda single chip con 32 Mbytes di memoria video. Medesimo discorso vale per la VooDoo 5 6000, scheda basata su ben 4 chip VSA-100 e 128 Mbytes di memoria video: se la VooDoo 5 5500 avrà prestazioni, alle alte risoluzioni, limitate dalla dotazione di memoria video "effettiva" (32 Mbytes per ciascuno dei chip video) è presumibile attendersi un comportamento pressoché identico per la VooDoo 5 6000. Una spiegazione tecnica di come operi la modalità SLI è stata data nella preview della scheda VooDoo 5 ed è riportata qui di seguito in corsivo:

Una delle caratteristiche basilari, e sulla quale si basa gran parte del progetto 3dfx, è il Chip SLI, cioè l'affiancamento di più chips su una stessa scheda lavoranti in parallelo, grazie a cui si ottengono Fill Rates notevolmente elevati senza necessità di alzare, con le numerose difficoltà che ne derivano, la frequenza di clock oppure dover utilizzare architetture più evolute (e costose) in grado di renderizzare 4 o più pixel per singolo clock.

3dfx ha utilizzato il termine SLI, per definire una nuova tecnologia di Scan Line Interleave, infatti in questo caso le linee di pixel non vengono elaborate in parallelo da diverse schede (con la necessità quindi di occupare ulteriori slot, per giunta pci) ma da diversi chip VSA-100 montati su una stessa scheda. Questo tipo di SLI, inoltre, non è strutturato alla stessa maniera del precedente, infatti dai chip VSA-100 non vengono elaborate soltanto linee di pixels, bensì molto spesso intere "fasce" facenti parti del frame che dovrà essere visualizzato, che poi vengono riunite nel frame buffer del chip master; infatti fra i diversi chip VSA-100 ve ne sarà uno chiamato Master (gli altri saranno Slave) al quale è attribuita la funzione di riunire tutte le informazione elaborate dai chip slave nel proprio frame-buffer, per poi inviarle al monitor che le visualizzerà sotto forma di un frame. La cosidetta modalità Bands Interleave, come accennato precedentemente, consiste nell'elaborazione in parallelo tra i vari chips di un numero variabile (dinamicamente) da 1 a 128 linee di pixel, definite bands, il che permette di distribuire nel miglior modo possibile il numero di polygon vertexs (i vertici di ogni poligono) tra un chip e l'altro, in modo da non appesantirne in maniera eccessiva uno rispetto al secondo.

Nello schema qui sopra viene descritta l'architettura utilizzata dai chip grafici in SLI in una scheda basata su due chip VSA-100 (V5 5000 o 5500):

  • Dal Bus PCI o AGP, a seconda del modello di scheda che si sta utilizzando, vengono ricevute le informazioni riguardanti i poligoni 3D elaborate dalla CPU.

  • Il bus della memoria ram è a 128-bit per entrambi i chip VSA-100, grazie a tale ampiezza i dati possono venire distribuiti in maniera ottimale diminuendo la bandwidth necessaria per compiere qualsiasi operazione.

  • Ognuno dei chip ha la propria Texture Memory, separata l'una dall'altra, nella quale le textures dovranno venir ripetute tante volte quanto è il numero di chips VSA 100, in questo caso 2 volte; per questo motivo la richiesta di ram per ogni textures sarà doppia, dimezzando quindi, a livello pratico, la quantità di Texture Memory presente sulla scheda. Per quanto riguarda i dati riguardanti i vertici dei poligoni e la profondità, essi sono memorizzati nella memoria unficata, nella quale hanno sede anche i Frame Buffers dei chip grafici.

  • Nei propri frame Buffers i due chip VSA-100 genereranno i pixel che in seguito formeranno linee di pixel e, in caso, fasce di pixel, che verranno poi ricomposte nel Front Frame Buffer del chip Master.

  • A questo punto è stato elaborato un intero frame; le informazioni verranno passate al Ramdac da 350Mhz integrato nel chip VSA-100 Master: da notare come anche nei chip VSA-100 Slave sia presente lo stesso Ramdac, tuttavia esso rimarrà inutilizzato in quanto vi è la necessità del solo Ramdac del chip Master. La decisione di integrare il Ramdac nel chip VSA-100 (e di conseguenza lasciare inutilizzati quelli rpesenti nei chip Slave) è stata presa da 3dfx per motivi puramente economici, in quanto creare un Ramdac esterno sarebbe stato nettamente più costoso.

  • Dal Ramdac le informazioni elaborate vengono inviate al monitor che le visualizza sotto forma di immagini.

vsa100-2.gif (12383 byte)

In quest'altro grafico è rappresentata la struttura del Chip SLI nella Voodoo 5 6000, unica scheda basata su 4 chip VSA-100 in parallelo, che generano un Fill Rate decisamente molto alto, di 1.33 MPixel/Texel/ sec. in questo caso la situazione è simile alla precedente, in cui venivano utilizzati 2 chip grafici:

  • Nel Back Frame Buffer di ogni chip VSA-100 vengono formate le "bands" formate da un determinato numero di linee di pixel.

  • Le fasce di pixel, dopo esser state trasferite nel Frame Buffer del chip Master (anche in questo caso vi è un solo chip Master e tre Slave) vengono unite e formano un frame.

  • Dopo che le informazioni ottenute sono state inviate al Ramdac del VSA-100 Master, esse vengono visualizzate su monitor sotto forma di immagini.

Lo schema sottostante mette in confronto le principali caratteristiche tecniche delle schede 3dfx VooDoo 5 5500 e 6000 con quelle dei chip nVidia GeForce 256 e GeForce 2 GTS:

  GeForce 256 DDR GeForce 2 GTS VooDoo5 5500 VooDoo5 6000
Frequenza core/mem 120Mhz/300Mhz 200Mhz/333Mhz 166Mhz/166Mhz 166Mhz/166Mhz
Pipelines 4 4 2 2
Texture units per pipeline 1 2 1 1
Fill Rate Mpixel/Mtexel/sec 480/480 800/1600 667/667 1328/1328
Ram, Mb/tipologia 32/64 DDR 32/64 DDR 64 SDR 128 SDR
Bandwidth memoria 4,8Gb/sec 5,3Gb/sec 5,3Gb/sec 10,6Gb/sec
FSAA No, software Si, supersampling Si, 2X/4X Si, 2X/4X
T&L/polygon rate Si/15Mtriangoli/sec Si/25Mtriangoli/sec No No
Processo costruttivo 0,22 micron 0,18 micron 0,25 micron 0,25 micron
Supporto DVI Si Si No No
Pixel Shaders No Si No No
DXTC/S3TC/FXT1 Si/Si/No Si/Si/No Si/No/Si Si/No/Si
Features supplementari Cubic Env. Mapping Cubic Env. Mapping, EMBM, NSR, Mblur e DOF via D3D8 Motion Blur, Depth of field, Soft reflectance/shadow Motion Blur, Depth of field, Soft reflectance/shadow

Il chip VSA-100 è in grado di renderizzare 2 pixel per clock, ma in modalità multitexturing il Fill rate viene dimezzato in quanto il nuovo chip grafico 3dfx può renderizzare un solo pixel per clock in tale modalità; per questo motivo, il fill rate in modalità multitexturing Fill Rate sarà di 166MTexel/sec nella Voodoo4 4500, 333MTexel/sec nelle Voodoo5 500 e 5500 e 667MTexel/sec nelle Voodoo5 6000: in multitexturing, per ogni pixel/clock, è necessario l'utilizzo di entrambe le pipeline/texture block presenti in ogni chip VSA-100.

 
^