Hardware Upgrade - il sito italiano sulla tecnologia - www.hwupgrade.it
« Torna all'articolo  -  Stampa
ATI Radeon HD 5870: la prima scheda video per DirectX 11
Gabriele Burgazzi, Paolo Corsini - 23 Settembre 2009
"Con la nuova serie ATI Radeon HD 5800 AMD apre la stagione delle schede video dotate di supporto hardware nativo alle API DirectX 11, al debutto solo dal mese di Ottobre con Windows 7 e Windows Vista."
Pagina 1 - Introduzione

Dopo lunga attesa giungono al debutto sul mercato le prime schede video dotate di architettura nativa DirectX 11, a circa un mese dal lancio ufficiale sul mercato del nuovo sistema operativo Windows 7 assieme alle nuove API. Non sarà solo Windows 7 a  poter sfruttare la potenza elaborativa delle GPU DirectX 11 con la nuova generazione di titoli compatibili con le nuove API: Microsoft rilascerà infatti un aggiornamento al sistema operativo Windows Vista, che guadagnerà quindi supporto DirectX 11.

Radeon HD 5800: questo è il nome della nuova famiglia di GPU ATI destinate al segmento di mercato tra i 300 e i 400 dollari USA di prezzo. Parliamo di una fascia di prezzo medio alta, appena sotto il segmento enthusiast che raggiunge e supera i 500 dollari per singola scheda; è questo un segmento del mercato estremamente importante, da un lato per gli interessanti volumi di vendita e dall'altro per l'impatto marketing che schede di questo tipo possono rappresentare per l'intera gamma di prodotti. La storica rivale di ATI nel segmento delle schede video, l'americana NVIDIA, non ha al momento attuale una propria serie di schede DirectX 11 da poter proporre quale alternativa e stando alle indiscrezioni attuali lo scenario resterà tale almeno sino alla fine dell'anno. AMD preme quindi sull'acceleratore, anticipando il lancio di Windows 7 e confermando come la parabola discendente di alcuni anni fa, culminata con il lancio della GPU R600 nelle schede Radeon HD 2900XT, sia solo un ricordo del passato.

Il debutto odierno è il primo di una serie di annunci di nuovi prodotti che caratterizzeranno i prossimi 6 mesi: la risultante sarà una completa famiglia di schede video DirectX 11 che andranno progressivamente a prendere il posto delle soluzioni Radeon HD 4000 attualmente presenti sul mercato. Anche con queste architetture AMD ha scelto di mantenere invariata la filosofia progettuale seguita sin dal lancio delle schede Radeon HD serie 3000: sviluppare una GPU di elevata complessità ma senza produrre die di dimensioni estremamente elevatei, derivando da questo design proposte semplificate per segmenti di mercato maggiormente orientati al prezzo e proponendo schede con due GPU montate sullo stesso PCB per la fascia enthusiast del mercato.

executing.jpg (42131 bytes)

La roadmap AMD prevede quindi il lancio odierno delle schede Radeon HD serie 5800, basate su architettura nota con il nome in codice di Cypress. A seguire, presumibilmente nella prima metà del quarto trimestre, le schede Juniper di fascia media a prendere il posto delle soluzioni Radeon HD 4600 e le schede Hemlock, ottenute affiancando due GPU della famiglia Cypress sullo stesso PCB (alternativa quindi alle schede Radeon HD 4870 X2). Nel corso dei primi mesi del 2010 ATI completerà la gamma di schede con i modelli Redwood e Cedar, destinate alla fascia più economica del mercato: per tutte queste soluzioni gli elementi comuni sono la tecnologia produttiva a 40 nanometri e ovviamente il supporto hardware alle API DirectX 11.

moore.jpg (40637 bytes)

Ogni volta che una nuova generazione di GPU viene presentata il riferimento alla legge di Moore è immancabile: è evidente come l'incremento di potenza che viene assicurato al debutto di una generazione di GPU top di gamma venga sempre ottenuto con incrementi meno che proporzionali del livelli di consumo complessivo. Rispetto alla precedente generazione di scheda a singola GPU, modello ATI Radeon HD 4870, la nuova ATI Radeon HD 5870 ottiene un valore di GFlops per ogni Watt consumato che è di poco inferiore al doppio; simile comportamento prendendo quale metrica di riferimento il valore di GFlops ottenibile per ogni millimetro quadrato di superficie del chip.

Alla base di ogni GPU troviamo alcuni elementi base che ne delimitano i livelli prestazionali, il consumo e il costo: da un lato la tecnologia produttiva adottata, dall'altra la complessità interna. AMD ha adottato con le schede ATI Radeon HD 5800 la tecnologia produttiva a 40 nanometri, grazie al partner produttore TSMC, riprendendo quindi quanto sviluppato per la scheda ATI Radeon HD 4770 presentata la scorsa primavera: la tecnica produttiva adottata è quindi quanto di meglio sia a disposizione sul mercato per questo tipo di chip. La complessità interna è sensibilmente incrementata: vedremo in seguito come AMD abbia di fatto raddoppiato tutti gli elementi interni della GPU nel passaggio dalla scheda Radeon HD 4870 a quella Radeon HD 5870, incrementando per giunta anche la frequenza di clock.

E' cresciuto quindi il numero complessivo di transistor sino a superare la soglia di 2 miliardi (2,15 per la precisione contro i 956 milioni della scheda Radeon HD 4870), con una potenza elaborativa che raggunge i 2,7 TeraFLOPS di picco (circa 1 TeraFLOP per la scheda Radeon HD 4870). L'utilizzo di tecnologia produttiva a 40 nanometri, oltre ad un affinamento interno dell'architettura, ha permesso di contenere la superficie complessiva del chip entro i 334 millimetri quadrati: di tratta di un incremento del 27% rispetto ai 263 millimetri quadrati della GPU RV770 utilizzata dalle schede Radeon HD 4800, inferiore rispetto al raddoppio degli elementi interni della GPU responsabili delle prestazioni velocistiche.

Pagina 2 - La famiglia Radeon HD 5800

Vediamo ora in dettaglio quali siano le caratteristiche tecniche delle prime due schede video ATI basate su API DirectX 11, modelli Radeon HD 5870 e Radeon HD 5850. La tabella seguente ne riassume i dettagli, a confronto con le soluzioni ATI e NVIDIA top di gamma di precedente generazione.

Specifiche NVIDIA GTX 275 NVIDIA GTX 285 NVIDIA GTX 295 ATI Radeon HD 4890 ATI Radeon HD 4870X2 ATI Radeon HD 5850 ATI Radeon HD 5870
tecnologia produttiva 55nm 55nm 55nm 55nm 55nm 40nm 40nm
tipo GPU G200 G200 G200 RV790 R700 RV870 RV870
numero GPU 1 1 2 1 2 1 1
clock GPU 633 MHz 648 MHz 576 MHz 850 MHz 750 MHz 725 MHz 850 MHz
numero stream processors 240 240 480 800 1600 1440 1600
clock stream processors 1.404 MHz 1.476 MHz 1.242 MHz 850 MHz 750 MHz 725 MHz 850 MHz
ROPs 28 32 64 16 32 32 32
TMU 80 80 160 40 80 72 80
quantitativo memoria 896MB 1.024MB 1.792MB 1.024MB 2.048MB 1.024MB 1.024MB
tipologia memoria GDDR3 GDDR3 GDDR3 GDDR5 GDDR5 GDDR5 GDDR5
clock memoria 2.268 MHz 2.480 MHz 2.200 MHz 3.900 Mhz 3.600 MHz 4.000 MHz 4.800 MHz
interfaccia memoria 448bit 512bit 2x448bit 256bit 2x256bit 256bit 256bit
bandwidth memoria 140,8 GB/s 158,7 GB/s 246,4 GB/s 124,8 GB/s 230,4 GB/s 128 GB/s 153,6 GB/s
connettori alimentazione 2x6pin 1x6pin
1x8pin
1x6pin
1x8pin
2x6pin 1x6pin
1x8pin
2x6pin 2x6pin

Una prima analisi delle specifiche tecniche delle due nuove schede ATI ci permette di evidenziare in dettaglio alcuni elementi di studio:

  • la scheda Radeon HD 5870 integra un quantitativo di stream processors pari a 1.600, doppio del valore delle schede ATI Radeon HD 4890 e allineato a quello delle schede Radeon HD 4870 X2 dotate di due GPU sullo stesso PCB. La frequenza di clock di 850 MHz replica quella della soluzione Radeon HD 4890, evidenziando come il passaggio alla tecnologia produttiva a 40 nanometri abbia permesso di integrare molta più circuiteria senza penalizzazioni in termini di massima frequenza di clock;
  • la scheda Radeon HD 5850 implementa GPU con 1.440 stream processors, valore inferiore del 10% rispetto a quello della soluzione Radeon HD 5870, con una frequenza di clock più contenuta di circa il 17%. Prendendo quale riferimento la strategia utilizzata da AMD per le schede ATI Radeon HD 4800 notiamo come la soluzione 5850 abbia GPU semplificata rispetto al modello 5870, mentre per la scheda Radeon HD 4850 la diversificazione con il modello Radeon HD 4870 aveva riguardato la sola frequenza di clock, restando invariato a 800 il numero di stream processors;
  • se dal punto di vista della potenza di elaborazione della GPU AMD ha operato con un raddoppio delle caratteristiche architetturali (2x per ROPs, TMU e stream processors) lo stesso tipo di incremento non è stato introdotto dal versante memoria video. Rimane la tecnologia GDDR5 in abbinamento ad un bus da 256bit di ampiezza, con un incremento della frequenza di clock massima che passa dai 3.900 MHz delle soluzioni Radeon HD 4890 ai 4.800 MHz della scheda ATI Radeon HD 5870. La bandwidth massima teorica cresce quindi del 23% rispetto a quanto messo a disposizione dalla scheda Radeon HD 4890 (+33% prendendo quale riferimento la scheda Radeon HD 4870), di fatto raggiungendo quanto messo a disposizione dalla scheda NVIDIA GeForce GTX 285 che abbina memoria GDDR3 dal clock elevato ad un bus da 512bit di ampiezza;
  • AMD ha optato per un incremento più ridotto della bandwidth della memoria video rispetto alla capacità di elaborazione degli stream processors. Alcune analisi interne hanno evidenziato come le schede Radeon HD della serie 4800 solo in un limitato numero di scenari risultassero essere limitate dalla bandwidth della memoria, sovrabbondante quindi rispetto alle richieste della GPU. Con l'approccio scelto per Radeon HD 5800 AMD ha voluto quindi ottenere uno scenario maggiormente bilanciato tra GPU e memoria video, tenendo anche in considerazione il livello di consumo massimo della scheda a pieno carico;
  • il quantitativo di memoria video proposto da AMD è pari a 1 Gbyte per ciascuna delle due schede Radeon HD 5800; in opzione i partner proporranno anche versioni con quantitativi pari a 2 Gbytes, potenzialmente utili nel momento in cui si utilizzino risoluzioni molto elevate sfruttando tecnologie di Anti Aliasing superiori a 4x;
  • nel confronto tra ATI Radeon HD 5870 e NVIDIA GeForce GTX 285 notiamo come le due architetture integrino lo stesso numero di ROPs e di Texture Units, differenziandosi sensibilmente per il numero di stream processors. Confrontare questo parametro tra due architetture di GPU così diverse tra di loro non è propriamente corretto: gli stream processors di ATI hanno un'architettura più semplice rispetto a quelli di NVIDIA, caratteristica che ne giustifica l'elevato numero.

ATI dichiara livelli di consumo particolarmente contenuti per le proprie schede Radeon HD 5800; lo schema seguente pone a confronto le due nuove soluzioni con la scheda Radeon HD 4870 utilizzando dati che sono stati forniti da AMD:

Specifiche ATI Radeon HD 4870 ATI Radeon HD 5850 ATI Radeon HD 5870
massimo consumo della scheda 160 Watt 170 Watt 188 Watt
consumo in idle 90 Watt 27 Watt 27 Watt

E' evidente come, a dispetto della superiore complessità architetturale e della maggiore potenza elaborativa, AMD abbia operato in direzione di un contenimento dei consumi complessivi, soprattutto durante il funzionamento in idle della scheda. Dai 90 Watt richiesti dalla scheda ATI Radeon HD 4870 si è infatti passati ai soli 27 Watt richiesti dalle due nuove schede Radeon HD serie 5800. A pieno carico le due nuove proposte ATI Radeon HD 5800 registrano consumi massimi nel peggiore scenario di utilizzo che sono più elevati, ma tale incremento è giustificato dalle prestazioni ottenute rimanendo in ogni caso su valori inferiori a quelli delle soluzioni che integrano due GPU sullo stesso PCB.

Una così elevata riduzione del consumo in idle è stata ottenuta sia affinando le tecniche di clock gating interne alla GPU, sia ottimizzando al meglio il funzionamento della memoria GDDR5. E' stato in particolare verso questi componenti che AMD ha lavorato: a dispetto del ridotto consumo dei moduli GDDR5 infatti analisi interne hanno evidenziato come vi fossero vari margini di riduzione del consumo tra controller memoria, circuiteria di alimentazione della memoria e chip.

Pagina 3 - Radeon HD 5870: uno sguardo alla scheda

scheda_1_s.jpg (25480 bytes)

scheda_2_s.jpg (27053 bytes)

AMD ci ha messo a disposizione un sample di scheda Radeon HD 5870 basato sul reference design, identico per soluzioni di raffreddamento e ingombri a tutte le schede Radeon HD 5870 che i produttori partner di AMD annunceranno a partire dalla giornata odierna. La scheda è competamente ricoperta dal sistema di raffreddamento, basato su una ventola che aspira aria dall'interno dello chassis soffiandola sui radiatori verso l'esterno del case. La parte posteriore è ricoperta da una placca in alluminio, che lascia scoperta solo l'area dietro la GPU: la sua funzione non è quella di dissipare calore in quanto non sono presenti moduli memoria nella parte posteriore della scheda, ma semplicemente di proteggere la componentistica a basso profilo montata sul retro del PCB.

scheda_5.jpg (20423 bytes)

Il pannello posteriore integra due connettori DVI, un connettore HDMI e un connettore Display Port: è possibile utilizzare al massimo 3 connettori contemporaneamente con tecnologia ATI Eyefinity, che analizzeremo in una delle pagine seguenti. A completare la staffa posteriore la griglia per l'evacuazione all'esterno dello chassis dell'aria soffiata dalla ventola sui radiatori. L'ingombro della scheda è di 2 slot, come del resto abituale vedere con le schede video top di gamma sia ATI che NVIDIA.

scheda_3.jpg (22995 bytes)

Nella parte superiore della scheda trovano posto due connettori di alimentazione PCI Express a 6 pin, montati in modo tale che non vadano a interferire con componenti interni dello chassis e soprattutto non contribuiscano ad allungare ulteriormente la scheda.

scheda_4.jpg (23882 bytes)

Sempre nella parte superiore sono presenti i due connettori per tecnologia CrossfireX: la scheda Radeon HD 5870 può infatti essere collegata, sino ad un massimo di 4 schede in parallelo, sfruttando le modalità di tecnologia CrossfireX rese popolari dalle schede Radeon HD della serie 4800. E' evidente come anche una futura scheda della serie Hemlock verrà dotata di questi connettori, rendendo possibile l'utilizzo di 4 GPU in parallelo con due soli Slot PCI Express 16x occupati sulla scheda madre.

scheda_6.jpg (63199 bytes)

Diamo uno guardo alle dimensioni della nuova ATI Radeon HD 5870: posta a confronto con altre proposte dello stesso segmento di mercato la scheda ATI evidenzia una lunghezza superiore a quello che sino ad oggi era il massimo. Le misurazioni sono state effettuate partendo dal PCB, escludendo quindi lo spessore della staffa di serraggio della scheda video allo chassis:

  • Sapphire Radeon HD 4890 Vapor-X: 24cm
  • Gigabyte GeForce GTX 285: 26,7cm
  • NVIDIA GeForce GTX 295: 26,7cm
  • ATI Radeon HD 4870 X2: 26,7cm
  • ATI Radeon HD 5870: 27,7cm

La nuova scheda Radeon HD 5870 è lunga esattamente 1 cm in più rispetto alle proposte top di gamma di precedente generazione; segnaliamo come l'ingombro incrementato sia tutto giustificato dal sistema di copertura della scheda e non da un PCB di dimensioni incrementate. Questa scelta non dovrebbe rappresentare un ostacolo al montaggio nella maggior parte degli chassis ma è opportuno effettuare una verifica dello spazio a disposizione nel proprio sistema così da scongiurare incompatibilità meccaniche.

Pagina 4 - Radeon HD 5870: sotto la scocca

Rimuovendo il sistema di raffreddamento abbiamo accesso al PCB della scheda video e a tutta la componentistica montata; questa manovra è relativamente semplice in quanto è necessario solo intervenire sulle viti che fissano il sistema di raffreddamento al PCB, oltre alle 4 viti poste agli angoli della GPU.

scheda_aperta_1_s.jpg (67183 bytes)

Il dissipatore di calore in alluminio è posto a diretto contatto con la GPU, gli 8 moduli memoria GDDR5 e la circuiteria di alimentazione; notiamo come il più efficace trasferimento termico sia assicurato dalla presenza di materiale termoconduttivo posizionato all'altezza dei chip memoria e dei componenti della circuiteria di alimentazione, mentre sulla GPU è presente della tradizionale pasta siliconica. Dall'immagine è possibile osservare come il punto del dissipatore di calore a diretto contatto con la GPU sia in rame e non in alluminio, così da assicurare un miglior trasferimento del calore.

scheda_aperta_2.jpg (47518 bytes)

La parte posteriore della scheda, una volta rimossa la placca in alluminio, si presenta priva di componenti particolari; lo spessore della placca aveva fatto ritenere che sulla parte posteriore del PCB fossero stati montati dei moduli memoria GDDR5 ma così non è.

scheda_aperta_3.jpg (63257 bytes)

La parte frontale della scheda è occupata dalla circuiteria che gestisce il segnale di output video; onboard sono stati montati due connettori DVI, 1 porta HDMI e una di tipo Display Port, offrendo quindi una notevole flessibilità nella configurazione del tipo di display che può essere abbinato alla scheda. Notiamo anche i due connettori per la tecnologia CrossfireX, montati nella parte superiore del PCB.

scheda_aperta_4.jpg (71120 bytes)

La circuiteria di alimentazione della scheda, di tipo digitale, è montata nella parte posteriore del PCB; l'alimentazione è assicurata sia dallo Slot PCI Express 16x sia dai due connettori PCI Express a 6 pin, soluzione comune alle altre schede video top di gamma a singola GPU disponibili in commercio, sia ATI che NVIDIA. Solo le proposte con due GPU montate sulla stessa scheda richiedono un connettore PCI Express a 6 pin affiancato da un secondo connettore a 8 pin per assicurare funzionamento stabile.

scheda_aperta_5.jpg (98175 bytes)

Uno sguardo alla GPU ATI RV870: il sample a nostra disposizione è stato costruito nella 33-esima settimana del 2009, informazione ricavabile dalle serigrafie presenti sul chip. L'utilizzo di tecnologia produttiva a 40 nanometri ha permesso di dotare questa GPU di 2,15 miliardi di transistor, con una superficie complessiva pari a 334 millimetri quadrati (956 milioni e 263 millimetri quadrati per la GPU RV770 utilizzata nelle schede ATI Radeon HD 4870). Il chip è montato ruotato di 45 gradi rispetto alla posizione del PCB: ATI ha scelto questo tipo di approccio per poter meglio indirizzare alcuni dei segnali verso i moduli memoria, minimizzando le interferenze e permettendo di garantire stabilità operativa anche a frequenze molto elevate.

Ricordiamo come una disposizione del die di questo tipo sia stata in passato adottata da ATI per la GPU R600 (Radeon HD 2900 XT), ma non per quelle RV670 (Radeon HD serie 3800) e RV770 (Radeon HD serie 4800); lo stesso approccio è invece comune all'altra architettura ATI sviluppata con tecnologia produttiva a 40 nanometri, quella RV740 della scheda Radeon HD 4770.

Pagina 5 - RV870: una nuova architettura a confronto

Diamo ora uno sguardo a quelle che sono le caratteristiche architetturali della nuova serie di schede Radeon HD 5800, iniziando da un confronto tra Radeon HD 4890, precedente top di gamma a singola GPU della famiglia ATI Radeon, e Radeon HD 5870, nuova soluzione al vertice della gamma ATI sempre a singola GPU.

Specifiche ATI Radeon HD 4890 ATI Radeon HD 5870 Note
tecnologia produttiva 55nm 40nm il passaggio al processo a 40nm permette, a parità di numero di transistor, di ridurre le dimensioni del die oltre che di incrementare le frequenze di clock
dimensione del die 263 mm² 334 mm² la superficie del die è aumentata del 27% circa, crescita giustificata dal notevole incremento nel numero di transistor integrati nella nuova GPU RV870
numero transistor 0,956 miliardi 2,15 miliardi e' più che doppio il numero di transistor integrati in RV870 rispetto a quanto presente in RV770
clock GPU 850 MHz 850 MHz non cambia la frequenza di clock massima, sempre pari a 850 MHz a dispetto dell'incremento nella complessità della GPU
numero stream processors 800 1600 raddoppia il numero di stream processors, restandone di fatto invariata la struttura di base
clock stream processors 850 MHz 850 MHz nelle architetture di GPU ATI il clock degli stream processors è identico a quello della GPU. Anche in questo caso quindi le due GPU vantano le stesse specifiche a dispetto dell'accresciuta complessità
ROPs 16 32 raddoppiano le ROPs, mantenendo lo stesso rapporto con il numero di stream processors
Texture units 40 80 raddoppio anche per le texture unit, presenti in numero di 4 per ogni SIMD engine
AA resolve 64 128 raddoppia il numero di AA resolve, nuovamente bilanciando il raddoppio degli altri parametri interni della GPU
Z/stencil 64 128 raddoppia anche il numero di Z/stencil
tipologia memoria GDDR5 GDDR5 la tipologia di memoria adottata è sempre quella GDDR5, al momento attuale quanto di meglio sia disponibile per schede video di fascia alta. Il bus memoria rimane a 256bit di ampiezza
clock memoria 3.900 Mhz 4.800 MHz cresce la frequenza di clock della memoria video, incrementando del 23% circa
bandwidth memoria 124,8 GB/s 153,6 GB/s l'aumento nella bandwidth della memoria video è giustificato solo dalla frequenza di clock incrementata, ferma restando l'ampiezza del bus memoria

Il confronto tra Radeon HD 4890 e Radeon HD 5870 evidenzia chiaramente come AMD abbia voluto incrementare la capacità di calcolo degli stream processors con la nuova architettura RV870, intervenendo in misura inferiore sulla bandwidth della memoria video ritenuta in molti casi più che adatta. La risultante è quella di avere un prodotto maggiormente bilanciato nel complesso, con un comportamento che mira ad avere risultati che siano GPU limited tanto quanto lo sono memory bandwidth limited. Confrontiamo ora quelle che sono le differenze esistenti tra Radeon HD 5850 e Radeon HD 5870:

Specifiche ATI Radeon HD 5850 ATI Radeon HD 5870

Note

clock GPU 725 MHz 850 MHz c'è una differenza di clock del 17% tra le due schede Radeon HD 5800. Tra schede Radeon HD 4870 e 4850 la differenza di clock era di poco inferiore al 12% (750 MHz vs 670 MHz)
numero stream processors 1440 1600 AMD ha disabilitato una coppia di SIMD engine interni alla GPU, con la conseguente riduzione nel numero di stream processors del 10%
clock stream processors 725 MHz 850 MHz la frequenza di clock di GPU e stream processors è identica nelle architetture ATI; anche in questo caso quindi differenza del 17% tra le due schede
ROPs 32 32 non cambia il numero di ROPs, sempre pari a 32 a dispetto dell'assenza di 2 SIMD engine nella scheda Radeon HD 5850
Texture units 72 80 sono presenti 4 texture units per ogni SIMD engine; per questo motivo la scheda Radeon HD 5850 ne implementa 72 contro le 80 della soluzione Radeon HD 5870
clock memoria 4.000 MHz 4.800 MHz stessa architettura di memoria, GDDR5, con bus da 256bit per le due schede; la differenza è data dalla frequenza di clock finale, superiore del 20% nella scheda Radeon HD 5870
bandwidth memoria 128 GB/s 153,6 GB/s l'incremento di clock si ripercuote in modo lineare sulla bandwidth massima teorica a disposizione delle due schede
consumo scheda idle 27 Watt 27 Watt identico valore di consumo in idle per le due schede, stando a quanto dichiarato da AMD
consumo scheda full 170 Watt 188 Watt a pieno carico la scheda Radeon HD 5870 sconta le superiori prestazioni velocistiche di cui è capace con un consumo più elevato di circa il 10%

Dallo schema si evince come la scheda ATI Radeon HD 5850 sia ottenuta utilizzando lo stesso chip presente nella soluzione Radeon HD 5870, disabilitando una coppia dei 20 SIMD engines integrati. Per ogni SIMD engine sono presenti 16 threads processors, ciascuno dotato di 5 stream cores o stream processors; da questo se ne ricava un quantitativo complessivo di stream processors di 1.440, inferiore del 10% rispetto alla soluzione Radeon HD 5870. Se con le schede Radeon HD 4850 ATI aveva scelto di mantenere invariato il numero di stream processors implementando un controller memoria GDDR3 a 256bit, contro quello GDDR5 sempre a 256bit della soluzione Radeon HD 4870, con la famiglia Radeon HD 5800 i ruoli si invertono. Oltre alle frequenze di clock le due schede 5850 e 5870 differiscono ora per il numero di stream processors, condividendo invece la tipologia di memoria video e l'architettura del bus.

Confrontiamo ora le specifiche tecniche della scheda Radeon HD 5850 con quelle della soluzione Radeon HD 4850:

Specifiche ATI Radeon HD 4850 ATI Radeon HD 5850

Note

tecnologia produttiva 55nm 40nm anche in questo caso la tecnologia produttiva passa ai 40nm, permettendo un incremento nel numero di transistor e un contenimento dei consumi
dimensione del die 263 mm² 334 mm² la superficie delle due GPU è la stessa dei rispettivi modelli serie xx70: la GPU è la stessa per la scheda Radeon HD 4850 e lo stesso vale per la soluzione Radeon HD 5850, ottenuta disabilitando due SIMD engine fermo restando il die nel suo complesso
numero transistor 0,956 miliardi 2,15 miliardi anche in questo caso non cambia il numero di transistor, superiore del 125% circa nella scheda Radeon HD 5850
clock GPU 670 MHz 725 MHz la frequenza di clock della nuova proposta Radeon HD 5850 è inferiore rispetto a quella della scheda 5870 ma superiore dell'8% rispetto alla scheda Radeon HD 4850
numero stream processors 800 1440 gli stream processors sono incrementati dell'80% nella scheda Radeon HD 5850; sommando a questo l'incremento nella frequenza di clock possiamo stimare un aumento della potenza di elaborazione degli stream processors di poco inferiore al 100%
clock stream processors 670 MHz 725 MHz le frequenze di clock degli stream processors sono invariate rispetto a quella della GPU anche con queste schede
ROPs 16 32 raddoppiano le ROPs nella nuova GPU
Texture units 40 72 l'incremento delle texture units segue quello degli stream processors, pari all'80%
tipologia memoria GDDR3 GDDR5 Radeon HD 5850 utilizza, al pari della versione 5870, memoria GDDR5, permettendo di ottenere un sensibile incremento in termini di bandwidth
clock memoria 2.000 Mhz 4.000 MHz la frequenza di clock effettiva della memoria, complice la differente tecnologia adottata, è pari al doppio, ferma restando l'ampiezza del bus memoria a 256bit
bandwidth memoria 64 GB/s 128 GB/s la bandwidth che si ottiene dalle specifiche tecniche precedenti è doppia nella scheda Radeon HD 5850, superiore del resto anche a quella della scheda Radeon HD 4890

Analizzando le specifiche tecniche delle due schede possiamo sintetizzare la scheda Radeon HD 5850, a livello teorico e architetturale, come capace di prestazioni doppie rispetto alla scheda Radeon HD 4850 sia per quanto riguarda la capacità di elaborazione degli stream processors sia per quanto concerne la bandwidth della memoria video.

Pagina 6 - Le novità architetturali di RV870

Abbiamo segnalato come le nuove soluzioni Radeon HD 5800 abbiano implementato un'architettura della GPU che di fatto raddoppia gli elementi strutturali. Analizzando in dettaglio la GPU RV870 confermiamo questa prima analisi: il passaggio dalle API DirectX 10 al supporto a quelle DirectX 11 non ha portato a cambiamenti radicali nella struttura della GPU, in quanto le novità introdotte dalle API DirectX 11 rappresentano una evoluzione delle DirectX 10, non una novità radicale così come sono state le DirectX 10 rispetto a quelle release 9.

architettura_1.jpg (87586 bytes)

Nella GPU RV870 trovano posto 1.600 stream processors, cifra che diminuisce a 1.440 per l'implementazione adottata con la scheda Radeon HD 5850. La struttura degli stream processors è identica, fatta eccezione per il numero, a quella delle soluzioni Radeon HD 4800: troviamo quindi core SIMD ciascuno dotato di 80 stream processors. Ogni gruppo di 5 stream cores, indicati poi con il nome di stream processors, viene indicato con il termine di Thread processor: per ogni core SIMD sono quindi integrati 16 Thread processors, che danno come risultante gli 80 stream processors di ogni engine SIMD.

Nelle GPU RV870 i core SIMD sono pari a 20, numero doppio rispetto a quanto implementato nelle soluzioni RV770. Per analogia ricordiamo come le schede Radeon HD della famiglia 3800, basate su GPU indicata con il nome in codice di RV670, integrassero 4 core SIMD mantenendo la stessa struttura delle GPU più recenti in termini di struttura dei Thread processors nonchè del loro numero all'interno di ogni core SIMD.

A monte di ogni SIMD engine sono presenti 4 texture unit, con un rapporto tra core SIMD e texture unit che è rimasto invariato in RV870 rispetto a RV770; essendo raddoppiato il numero dei core SIMD è aumentato della stessa misura anche il numero di texture unit, passato dalle precedenti 40 alle attuali 80.

Con questo numero di stream processors, alla frequenza di clock di 850 MHz, una scheda Radeon HD 5870 è capace di una potenza di elaborazione massima teorica che raggiunge i 2,7 TeraFLOPS a singola precisione. Passando ad elaborazioni double precision, importanti in ambiti di GPU Computing, la potenza massima teorica a disposizione di queste schede scende a 544 GigaFLOPS, valore estremamente elevato considerando come non raggiungano i 100 GigaFLOPS in double precision le soluzioni NVIDIA della famiglia Tesla, basate su architettura GT200.

L'architettura base è rimasta di fatto invariata come approccio, ma oltre al raddoppio degli stream processors e delle unità correlate AMD è intervenuta a effettuare varie ottimizzazioni e migliorie nelle stream processing unit, nel layout dei core SIMD, nell'engine grafico, nelle texture units, nelle render Back-Ends e nel display controller, nell'ottica di incrementare il più possibile l'efficienza complessiva della GPU.

architettura_3.jpg (26283 bytes)

L'engine grafico ha visto l'inserimento della nuova logica per la gestione della tessellation, secondo le specifiche implementate da Microsoft nelle API DirectX 11; questa componente è programmabile attraverso le nuove API Microsoft utilizzando Hull Shaders oppure Domain Shaders.

architettura_2.jpg (39116 bytes)

Lo schema di funzionamento di un Thread processor è di fatto identico a quanto visto con le schede RV770: troviamo 4 stream processors di tipo general purpose affiancati da un quinto stream processor con funzionalità speciali, collegati ai quali trovano posto dei registri di tipo general purpose. A completare il Thread processors una unità di Branch

Considerando l'architettura degli stream processors scelta da ATI, il comportamento della GPU in termini prestazionali può variare sensibilmente a seconda del tipo di shader eseguito. Se gli stream processor delle GPU NVIDIA sono unità indipendenti tra di loro che possono eseguire una operazione per ciclo di clock, nell'architettura RV870 di ATI (ma lo stesso del resto valeva per quella RV770 e per quella RV670 prima) gli stream processors possono eseguire un massimo di 5 operazioni per ciclo di clock, nel momento in cui il codice è tale da occupare tutte e 5 le stream processing units integrate in uno stream processor.

La conseguenza diretta di questo è che l'architettura NVIDIA GT200 può sempre eseguire un massimo di istruzioni pari al numero di stream processors a disposizione, mentre per le soluzioni RV870 di ATI si possono avere scenari ideali sino a utilizzare tutti gli stream processors contemporaneamente, oppure un minimo di 320 istruzioni eseguite per volta nel momento in cui queste siano tali da non poter essere accorpate tra di loro. L'architettura degli stream processors utilizzati da ATI nelle proprie GPU, infatti, richiede necessariamente che i 5 stream processing units integrati in uno stream processor siano tutti al lavoro sullo stesso thread.

Da questa analisi si deduce come sia importante utilizzare una corretta terminologia: quelle che NVIDIA indica con il nome di stream processors per AMD siano più correttamente da indicare con il nome di stream processing units. Per convenzione gli stream processing units delle GPU AMD vengono indicate come stream processors, al pari delle soluzioni NVIDIA.

Le texture units, come segnalato, sono raddoppiate in numero mantenendo invariato il rapporto con i core SIMD. AMD è intervenuta ottimizzando queste unità grazie sia ad un incremento della loro bandwidth, sia ampliando la bandwidth delle cache L1 e L2 a queste associate. La cache L2 è inoltre stata raddoppiata, raggiungendo il quantitativo di 128Kbytes.

Da ultimo, il memory controller GDDR5 a 256bit di ampiezza. AMD ha ottimizzato questo componente in modo che potessero venir utilizzate memorie con frequenze di clock molto elevate, sino a 5 GHz. Per garantire funzionamento stabile sono state implementate nuove procedure di check degli errori, oltre a integrare un sistema di misura della temperatura del chip memoria in più punti così che la temperatura non raggiunga mai valori considerati critici per il funzionamento. La tecnica di link retraining applicata alle memorie GDDR5, infine, permette di eseguire switch su tensione di alimentazione e frequenza di clock dei moduli memoria in modo istantaneo, a tutto vantaggio del contenimento dei consumi.

Le schede Radeon HD 5800 sono orientate all'utenza desktop e ai videogiocatori, ma è evidente come l'architettura RV870 verrà utilizzata da AMD quale base per la futura generazione di schede video per workstation grafiche oltre che per elaborazioni di GPU Computing. Abbiamo evidenziato come queste architetture siano capace di 2,7 TeraFLOP in single precision e 544 GigaFLOPS in double precision; RV870 integra piena implementazione hardware delle specifiche DirectCompute 11 e OpenCL 1.0, oltre a rispettare le specifiche IEEE754-2008

Pagina 7 - DirectX 11: in arrivo a Ottobre

Abbiamo avuto occasione di parlare in varie sedi delle nuove API Microsoft DirectX 11, al debutto in concomitanza con il lancio del sistema operativo Windows 7 a partire dal prossimo 22 Ottobre. Quali sono le principali novità che Microsoft ha implementato in queste API? Vediamole in dettaglio:

  • Tessellation: questa tecnica è stata già implementata a livello hardware in varie precedenti GPU sviluppate da ATI, a partire da quella R500 utilizzata nella console Microsoft Xbox 360. Si tratta di una tecnica che permette di migliorare la qualità e la fedeltà di un oggetto 3D grazie ad un progressivo aumento del numero di triangoli utilizzato per la sua riproduzione, con un livello di dettaglio che è variabile a seconda del punto di osservazione (più questo è vicino, maggiori saranno i triangoli generati così da incrementare il realismo dell'oggetto). L'approccio alla Tessellation scelto da Microsoft per le DirectX 11 non è compatibile con quanto sviluppato da ATI per le GPU precedenti la serie Radeon HD 5800; per questo motivo non è possibile sfruttare tecniche di Tessellation implementate in giochi DirectX 11 con schede video ATI di precedente generazione, tantomeno del resto con quelle NVIDIA.
  • Shader Model 5.0: ultima evoluzione dello shader model, dopo quello 4.0 implementato con le API DirectX 10 e lo shader model 3.0 delle prime architetture DirectX 9.0c.
  • DirectCompute 11: è questo il nuovo approccio alle tecniche di DirectCompute, grazie alle quali la GPU viene utilizzata dalle API anche per l'elaborazione di codice non direttamente legato alla generazione di scene 3D. DirectCompute 11 è quindi la via scelta da Microsoft, all'interno delle proprie API DirectX 11, per la gestione delle tecniche di GPU Compute, con le quali avantaggiarsi della capacità di elaborazione parallela propria delle più recenti GPU.
  • Gestione Multi-threading: le nuove API gestiscono in modo più efficiente rispetto alle precedenti processi multithreading. L'applicazione, DirectX runtime e DirectX driver possono ora essere eseguiti in threads separati e non più nello stesso: sarà compito delle display list il sincronizzare operazioni eseguite in tempi differenti dai vari stream processors così che concorrano poi al risultato finale secondo il ruolo spettante a ciascuna. Altre operazioni come il caricamento di una texture o la compilazione di uno shader possono avvenire in parallelo con il principale task di rendering della scena.
  • HDR Texture Compression: questa tecnica permette di eseguire una compressione delle textures HDR a 16bit, sino ad un rapporto di 6:1. Questo approccio permette di ridurre gli artefatti a blocchi tipici delle textures a 8bit compresse.

Una nota sul funzionamento delle tecniche di Tessellation. Nelle API DirectX 11 sono stati implementati 3 nuovi stadi della pipeline specifici per queste funzioni: hull shader, tessellation e domain shader. L'hull shader utilizza il codice dell'applicazione verificando quali siano gli elementi che l'unità di tessellation richiede per poter generare i nuovi punti di controllo, con i quali arricchire la geometria dell'oggetto. L'unità di tessellation genera quindi i punti di controllo, elaborati dal domain shader per generare i dati della nuova geometria, utilizzando se previste dal programmatore anche delle displace texture, con le quali i vertici degli oggetti possono venir spostati rispetto alla geometria iniziale così da conferire maggiore profondità. Una displace texture potrebbe ad esempio venir utilizzata per incrementare il realismo di un vestito, aggiungendo le pieghe che in modo naturale vengono a formarsi lungo il corpo.

tessellation.jpg (41550 bytes)
tecniche di tessellation: sulla sinistra con displace texture, sulla destra senza

Il debutto delle prime architetture video DirectX 10 non ha portato ad una rapida migrazione verso titoli che facessero ampio uso delle nuove API; i games developer sono di fatto rimasti fedeli alle API DirectX 9, dovendo del resto sviluppare giochi che possano essere compatibili con la maggior parte dei sistemi presenti sul mercato. In alcuni casi è stato scritto un codice specifico per le API DirectX 10, ma in generale questa è stata l'eccezione: uno sforzo di questo tipo non era infatti tipicamente giustificabile per uno sviluppatore, in considerazione dei budget sempre ridotti.

Con la commercializzazione delle API DirectX 11 non ci si attende, almeno in teoria, un approccio del mercato simile a quanto riscontrato con le API DirectX 10. Innanzitutto lo sviluppo del codice per queste API rappresenta una evoluzione rispetto a quello delle soluzioni DirectX 10, non un radicale cambiamento come avvenuto nel passaggio da DirectX 9 a DirectX 10. L'estensione della compatibilità alle API DirectX 11 anche ai sistemi operativi Windows Vista, via aggiornamento software che verrà rilasciato da Microsoft, fa in modo che il parco di sistemi potenzialmente compatibile con applicazioni scritte per API DirectX 11 sia sin dal debutto significativamente elevato, fermo restanto che il completo set di funzionalità DirectX 11 può venir sfruttato solo con GPU che supportano in modo nativo queste API.

Quanto tempo dovrà trascorrere prima del debutto di giochi DirectX 11 sul mercato? Il supporto a queste API da parte dei games developer dovrebbe essere sufficientemente rapido: i giochi che includeranno compatibilità con le API DirectX 11 già nel 2009 sono BattleForge, S.T.A.L.K.E.R.: Call of Pripyat e Colin McRae DiRT 2. Il primo è uno strategico in tempo reale prodotto da Electronic Arts e basato sulle micro-transazioni. Il gioco è stato rilasciato nello scorso mese di Marzo, ma il supporto DirectX 11 verrà aggiunto tramite patch che sarà disponibile entro la fine del mese di Settembre. S.T.A.L.K.E.R.: Call of Pripyat è il terzo capitolo della serie di sparatutto in prima persona ambientata in un contesto post-apocalittico e sviluppata dalla software house ucraina GSC GameWorld. Il gioco verrà rilasciato nel prossimo autunno e includerà già nella versione base il supporto DirectX 11. Sempre entro la fine del 2009 ci sarà anche Colin McRae DiRT 2, disponibile nel formato PC da Dicembre e già sul mercato nelle versioni console.

Veniamo al 2010: Turbine sta adattando la sua tecnologia in modo da avere il supporto DX 11 nei suoi MMORPG. Ne beneficeranno, quindi, Il Signore degli Anelli Online e Dungeons & Dragons Online. Due blockbuster del 2010 che supporteranno le DX 11 sono Aliens vs Predator, sviluppato da Rebellion, e Battlefield Bad Company 2 di Digital Illusions CE: entrambi verranno rilasciati nella prima parte dell'anno. Infine si parla di supporto DX 11 anche per il gioco non ancora annunciato ufficialmente Genghis Khan, sviluppato da Kylin, e per il motore grafico Vision, sviluppato da Trinigy.

Pagina 8 - Eyefinity: multidisplay per tutti

Abbiamo già avuto modo, con questo articolo, di anticipare alcune informazioni sulla tecnologia Eyefinity, nome che indica la capacità delle schede Radeon HD serie 5800 di gestire in configurazione standard sino ad un massimo di 3 display contemporaneamente, con applicazioni 2D così come con quelle 3D. La risultante, per il sistema operativo, è quella di avere a disposizione un singolo schermo capace di gestire risoluzioni estremamente elevate, percepito come se si trattasse di un singolo display e non come un aggregato di risoluzioni di pannelli di più ridotte dimensioni.

eyefinity6.jpg (83050 bytes)

AMD ha sviluppato una particolare versione di scheda Radeon HD 5870, chiamata con il nome di Eyefinity 6, capace di gestire contemporaneamente sino a 6 schermi attraverso 6 porte Mini Display Port; 4 di queste schede possono venir affiancate sullo stesso sistema, arrivando a gestire sino a 24 schermi contemporaneamente con una risoluzione video di 2560x1600 pixel. E' evidente come un prodotto di questo tipo abbia ambiti di utilizzo che non possono essere limitati al solo ambiente desktop o del videogaming, nonostante con questa scheda sia ovviamente possibile affiancare 6 schermi su due file e gestire applicazioni 3D.

Una configurazione standard per schede Radeon HD 5800 prevede la presenza di 4 differenti connettori: da un lato due di tipo DVI, dall'altro un connettore HDMI affiancato da uno Display Port. La configurazione di un setup a 3 schermi prevede le seguenti possibili combinazioni:

setup

connettore 1 connettore 2 connettore 3

1

Display Port Display Port Display Port

2

DVI DVI Display Port

3

DVI HDMI Display Port

4

DVI VGA Display Port

La flessibilità di combinazioni tra pannelli con connessioni differenti è complessivamente elevata, ma sussistono alcune limitazioni. Non è possibile ad esempio utilizzare più di uno schermo con connettore VGA, oppure abbinare un display VGA, uno HDMI e uno Display Port contemporaneamente. Ricordiamo inoltre che con queste schede, pur essendo presenti 4 connettori, non è possibile pilotare più di 3 display per volta.

E' differente il comportamento, in termini di display collegabili, con una scheda Eyefinity 6, come sintetizzato dallo schema seguente:

setup

connettore 1 connettore 2 connettore 3 connettore 4 connettore 5 connettore 6

1

Display Port Display Port Display Port Display Port Display Port Display Port

2

DVI DVI Display Port Display Port Display Port Display Port

3

DVI HDMI Display Port Display Port Display Port Display Port

4

DVI VGA Display Port Display Port Display Port Display Port

5

VGA VGA Display Port Display Port Display Port Display Port

Considerando le elevate risoluzioni video che possono venir raggiunte utilizzando 6 display contemporaneamente il quantitativo di memoria video, soprattutto con applicazioni 3D, potrebbe diventare un collo di bottiglia. AMD non ha fornito informazioni specifiche a riguardo ma riteniamo che una delle principali differenze delle schede Eyefinity 6 sarà proprio nella dotazione di memoria video, presumibilmente raddoppiata rispetto a quella standard delle versioni con supporto a 3 schermi.

eyefinity_game_1.jpg (52164 bytes)

eyefinity_game_2.jpg (42150 bytes)

La tecnologia implementata da AMD è indubbiamente molto interessante: il costo di una configurazione con 3 schermi da 1920x1080 pixel di risoluzione non è di certo contenuto, ma la presenza di 3 schermi incrementa in modo sensibile la produttività personale oltre ad essere un elemento di novità nel gaming. Si può pensare che un supporto a 3 schermi contemporanei nel sistema non rappresenti una vera e propria novità: quello che differenzia Eyefinity dagli altri approcci sul mercato è da un lato la facilità di configurazione, dall'altra il comportamento del sistema operativo: quest'ultimo, da driver, riconosce la somma dei 3 schemi come se si trattasse di uno schermo dalla risoluzione somma delle parti, semplificando quindi la compatibilità soprattutto con i giochi 3D.

Eyefinity sarà sicuramente utilizzata da AMD, in particolare nella versione a 6 schede, nelle declinazioni dell'architettura RV870 rivolte all'ambito professionale, le schede della famiglia FirePro che verranno presentate da AMD nel corso dei prossimi mesi.

Tempo alcuni giorni e pubblicheremo una analisi prestazionale del comportamento della scheda Radeon HD 5870 nel momento in cui sono utilizzati 3 monitor con applicazioni 3D, fornendo anche note di esperienza di gioco con riferimento al superiore realismo messo a disposizione da un gaming di tipo surround come quello che Eyefinity permette di avere.

Pagina 9 - Analisi Anti Aliasing: da 0 a 8x

Nel corso delle presentazioni stampa che hanno preceduto il lancio delle schede ATI Radeon HD 5800, AMD ha più volte evidenziato come dai propri test interni emergesse un ridotto impatto prestazionale dall'abilitazione dell'anti aliasing 8x con le nuove schede DirectX 11. Abbiamo quindi eseguito alcuni test con Far Cry 2, sia in modalità DirectX 9 sia in quella DirectX 10, testando Radeon HD 5870 a confronto con GeForce GTX 285 disabilitando aa e abilitando questa tecnica in modalità 4x e 8x.

aa_1.png (53563 bytes)

aa_2.png (52194 bytes)

Sia con API DirectX 9 sia con quelle DirectX 10 la scheda Radeon HD 5870 evidenzia ottimi risultati prestazionali con anti aliasing abilitato; l'unica eccezione è forze alla risoluzione di 2560x1600 con aa 8x, impostazione che spinge i frames lontano dalla soglia dei 50 al secondo raggiunta come media alla stessa risoluzione video con anti aliasing 4x. Alla luce dei nostri test, limitati tuttavia ad un solo titolo pur se con due impostazioni di API differenti, non notiamo evidenti margini di vantaggio per la scheda Radeon HD 5870 in termini di scalabilità al crescere della modalità anti aliasing rispetto a quanto ottenibile con la scheda NVIDIA GeForce GTX 285. Quest'ultima è sempre più lenta, con un divario che tende di fatto a restare costante al crescere della complessità della scena.

Pagina 10 - Consumi e rumorosità

I consumi sono stati rilevati utilizzando un misuratore collegato tra linea di alimentazione e alimentatore; i valori riportato sono quindi quelli del consumo dell'intero sistema, la cui configurazione è identica a quella dei benchmark prestazionali. I test con CPU a full load sono stati eseguiti con l'utility Orthos, occupando tutti e 8 i processori logici messi a disposizione dalla cpu Intel Core i7 965, mentre per stressare la GPU assieme a Orthos è stato eseguito il benchmark di HawX DX10 alla risoluzione di 2560x1600 pixel, mantenendo anti aliasing a 4x.

consumi.png (46503 bytes)

I valori evidenziati confermano come AMD abbia svolto un ottimo lavoro di contenimento del consumo con la scheda Radeon HD 5870. Il consumo rilevato è stato sempre inferiore a quello delle altre schede, in particolare già in idle. Segnaliamo come la versione di scheda Radeon HD 4890 utilizzata in questi test abbia una dotazione di memoria video di 2 Gbytes, elemento che può aver negativamente inciso sui livelli di consumo con questa specifica scheda.

La rumorosità di funzionamento è stata rilevata in ambiente aperto, ponendo il fonometro ad una distanza di circa 10 cm dalla scheda in posizione laterale.

rumore.png (50493 bytes)

La reference board ATI Radeon HD 5870 si comporta molto bene in termini di rumorosità di funzionamento, facendo registrare un valore particolarmente contenuto in idle e di fatto identico a quello della scheda NVIDIA GeForce GTX 295 a pieno carico.

Pagina 11 - Configurazione di test

Per analizzare le prestazioni delle schede video in prova abbiamo utilizzato una piattaforma basata su processore Intel Core i7 965 Extreme, con frequenza di clock di default pari a 3,2 GHz e tecnologia Turbo Mode abilitata. La frequenza di clock effettiva è quindi pari a 3,33 GHz nel momento in cui il processore è utilizzato a pieno carico, in quanto la tecnologia Turbo Mode attiva un moltiplicatore di frequenza in più quando 2 o più core sono utilizzati contemporaneamente.

Di seguito il dettaglio dei componenti utilizzati per i test:

  • Processore: Intel Core i7 965 Extreme, clock 3,2 GHz con tecnologia Turbo Mode attiva;
  • memoria RAM: 3x2 Gbytes Corsair TR3X6G1600C8D; frequenza di clock 1.600 MHz con timings pari a 8-8-8-24;
  • Hard disk: Western Digital WD7500AAKS, 750 Gbytes SATA 7.200 rpm;
  • Scheda madre: MSI Eclipse SLI, chipset Intel X58;
  • Sistema operativo: Windows Vista Ultimate 64bit, con Service Pack 1 e tutti i più recenti fix rilasciati da Microsoft;
  • Driver video NVIDIA: Forceware 191.00 beta
  • Driver video ATI: Catayst 9.9
  • Driver video ATI Radeon HD 5870: Catalyst 8.66 RC6 – 11 Settembre
  • Alimentatore: ToPower 1.10 Watt.

Questi i titoli inseriti in questo confronto, con le differenti configurazioni utilizzate.

  • Crysis
    E' stato utilizzato il tool di benchmarking sviluppato da Hocbench; la mappa è quella di default sviluppata da Crytek, con filtro anisotropico 16x abilitato da benchmark e no anti aliasing. I test sono stati eseguiti con impostazioni qualitative high, sia con API DirectX 9 che con quelle DirectX 10.
  • Crysis Warhead
    E' stato utilizzato il tool di benchmarking sviluppato da Hocbench; la mappa è quella airfield, con filtro anisotropico 16x abilitato da benchmark e no anti aliasing. I test sono stati eseguiti con impostazioni qualitative high, sia con API DirectX 9 che con quelle DirectX 10.
  • Call of Duty 5
    Benchmark eseguito utilizzano il tool Fraps; anti aliasing 4x abilitato e impostazioni qualitative tutte al massimo dal pannello di configurazione del gioco.
  • Enemy Territory Quake Wars
    I test consistono nell'esecuzione di un timenetdemo sviluppato da Hocbench, quello, HOCBench_s, senza servirsi del tool di benchmarking ma direttamente all'interno della console del gioco, abilitando anti aliasing 4x e filtro anisotropico 16x. Le impostazioni qualitative sono state tutte portate al massimo livello, pari a high e dove possibile a ultra.
  • World in Conflict
    Benchmark integrato nel gioco, eseguito selezionando l'impostazione qualitativa molto alta con anti aliasing 4x e filtro anisotropico 16x.
  • The Last Remnant Benchmark
    Tool di benchmarking automatico; non permette di eseguire impostazioni qualitative specifiche che non sia il cambio di risoluzione video.
  • Devil May Cry 4
    Tool di benchmarking eseguito sulla versione demo del gioco; le impostazioni qualitative selezionate sono state quelle di massima qualità, con API DirectX 10 e anti aliasing 4x.
  • Far Cry 2
    Test eseguiti con impostazioni qualitative in high, per tutte le voci, sia con API DirectX 9 che con quelle DirectX 10, con anti aliasing 4x e senza. Ulteriori test sono stati eseguiti in configurazione ultra high, per tutte le voci, con API DirectX 10 e anti aliasing disabilitato.
  • Tom's Clancy HAWX
    Benchmark integrato nel gioco, utilizzato in versione demo, eseguito selezionando tutte le impostazioni qualitative su high fatta eccezione per ambient occlusion basso. I test sono stati eseguiti con API DirectX 10 con anti aliasing 4x abilitato e senza; per le schede video ATI è stato anche eseguito un test con API DirectX 10.1 e anti aliasing disabilitato.
  • Unreal Tournament 3
    E' stato utilizzato il tool di benchmarking sviluppato da Hocbench; il demo è quello ShangriLa, con filtro anisotropico 16x abilitato da benchmark e no anti aliasing.
  • Half Life 2 Episode 2
    E' stato utilizzato il tool di benchmarking sviluppato da Hocbench; la mappa è quella Hoc Demo 1, con filtro anisotropico 16x abilitato da benchmark e no anti aliasing.
  • Grid
    Un simulatore di guida sviluppato per DirectX 10 caratterizzato da una grafica impegnativa e particolarmente ricca di dettagli. Vista l'assenza di un benchmark integrato, nel caso specifico, abbiamo utilizzato Fraps per registrare il framerate.
  • Left 4 Dead
    Left 4 dead è basato sul motore Source, su cui sono stati sviluppati molti lavori Valve, da TF2 a Portal. Prende quindi il posto ad HL2, rappresentando un interessante ambito di testing. Visto il motore grafico su cui è basato risulta piuttosto leggero, a dispetto dell'impatto visivo, anche se meno indulgente del predecessore.
Pagina 12 - Crysis e Crysis Warhead

Crysis e Crysis Warhead sono titoli che storicamente fanno pendere l'ago della bilancia prestazionale in favore delle schede video sviluppate da NVIDIA. Con l'arrivo della nuova generazione di GPU ATI, questa regola viene meno: osservando i quattro grafici sopra riportati è possibile notare come, soprattutto alle risoluzioni più elevate, Radeon HD 5870 sia in grado di raggiungere e in alcuni casi andare oltre all'ammiraglia GeForce GTX 295.

Se da un lato è vero che i titoli sopra proposti non sono ottimizzati correttamente per supportare architettura doppia GPU, dall'altro si dimostrano particolarmente sensibili alla potenza di calcolo pura di ogni scheda video; in questo senso Radeon HD 5870 è in grado di impensierire pesamente le soluzioni top di gamma del rivale.

Pagina 13 - Call of Duty 5 e Devil May Cry

I due titoli analizzati, a differenza di quelli proposti in precedenza, dimostrano di supportare correttamente le tecnologie multi-GPU NVIDIA SLI e ATI CrossFireX, facendo registrare così valori più alti a GeForce GTX 295 e Radeon HD 4870X2. In tutti e cinque i grafici Radeon HD 5870 si posiziona esattamente al di sotto delle offerte basate su due GPU, distaccando sensibilmente GeForce GTX 285, l'attuale offerta top di gamma di NVIDIA su singola GPU. Meritano di essere sottolineati i quasi 80fps raggiunti in Call of Duty 5 alla risoluzione di 2560x1600 con filtri attivati.

Pagina 14 - Far Cry 2

Anche Far Cry 2, come buona parte dei giochi sviluppati recentemente, ha dimostrato di gradire particolarmente e fare buon uso delle soluzioni basate su due GPU. I vantaggi che una proposta dual GPU come la scheda GeForce GTX 295 è in grado di garantire rispetto ad una proposta a singola GPU è tangibile e facilmente riscontrabile dai grafici. Il posizionamento di Radeon HD 4870 X2 mette inoltre in evidenza il buon lavoro che ATI ha portato avanti nel corso degli ultimi mesi con lo sviluppo dei propri driver Catalyst.

Utilizzando DirectX 10 la nuova proposta sviluppata da ATI fa un sensibile balzo in avanti dimostrando, con i fatti, l'efficacia delle modifiche architetturali che il produttore ha implementato in Radeon HD 5870.

Pagina 15 - Enemy Territory Quake Wars, Hawx

Enemy Territory Quake Wars, titolo oramai datato, dimostra una netta e sensibile preferenza per le architetture di derivazione NVIDIA. Alle risoluzioni di 1280x1024, 1680x1050 e 1920x1200 sono evidenti i malfunzionamenti del software con le GPU ATI. Hawx dimostra invece di gradire particolarmente le due proposte dual-GPU, che stanno infatti davanti a Radeon HD 5870 in tutti e tre i grafici seguenti. La rinnovata architettura, sviluppata specificatamente per supportare DirectX 11, evoluzione vera e propria della attuali DirectX 10, dimostra di funzionare efficacemente, distanziando la scheda GeForce GTX 285.

Pagina 16 - Half life 2, Left 4 Dead e Grid

Half Life 2 Episode 2, gioco evergreen oramai con qualche annetto alle spalle, dimostra di apprezzare l'enorme numero di unità shader messe a disposizione dalla nuova proposta di ATI: ad ogni risoluzione infatti riesce a tenere testa e superare le proposte a doppia GPU. Discorso diverso invece per Left 4 Dead, che, pur facendo registrare risultati molto alti con Radeon HD 5870, soprattutto alle risoluzioni più elevate, è in grado di sfruttare al meglio le due GPU messe a disposizione dalla scheda GeForce GTX 295.

Grid, l'unico simulatore di guida utilizzato durante la nostra sessione di testing, posiziona Radeon HD 5870 al vertice prestazionale, registrando valori estremamente elevati a tutte le risoluzioni, superiori anche a quelli delle soluzioni con due GPU.

Pagina 17 - The Last Remnant, Unreal Tournament 3 e World in Conflict

Gli ultimi tre titoli della nostra suite di benchmark parlano invece NVIDIA: GeForce GTX 295 si posiziona come la proposta in grado di occupare il vertice prestazionale dei grafici, che, lo ricordiamo, sono ordinati in base alla risoluzione di 2560x1600 in modo decrescente. Tutti i giochi di questa pagina mostrano un comportamento pressochè identico, che vede Radeon HD 4870 X2 a seguire GeForce GTX 295. La possibilità di sfruttare due GPU in parallelo permette a queste schede di distanziare la soluzione ATI Radeon HD 5870, che si conferma in ogni caso come la scheda più veloce tra quelle in prova.

Pagina 18 - Radeon HD 5870 vs Radeon HD 4890

Dopo aver visto nello specifico i risultati prestazionali di tutte le schede con i titoli presi in esame, mettiamo a confronto le due architetture ATI Radeon HD 4890 e Radeon HD 5870 una contro l'altra, isolando 3 risoluzioni di test (1680x1050, 1920x1200 e 2560x1600) e valutando quale beneficio prestazionale permetta di ottenere il passaggio alla scheda Radeon HD 5870 rispetto al modello Radeon HD 4890.

4890_5870_1680x1050.png (103145 bytes)

4890_5870_1920x1200.png (103696 bytes)

4890_5870_2560x1600.png (103924 bytes)

Questi grafici necessitano onestamente di poche parole di commento: il margine di variabilità dei frames al secondo è molto dipendente dal tipo di titolo scelto ma è evidente come al crescere della risoluzione video utilizzata la scheda ATI Radeon HD 5870 acquisti un margine di vantaggio medio sempre più evidente rispetto alla soluzione basata su GPU RV770, per giunta dotata di 2 Gbytes di memoria video nella versione utilizzata in questi test contro una dotazione di 1 Gbyte per la scheda Radeon HD 5870.

Pagina 19 - Radeon HD 5870 vs GeForce GTX 285

Passiamo ora al confronto tra Radeon HD 5870 e GeForce GTX 285, utilizzando gli stessi criteri visti in precedenza. Alle misure ottenute dalla scheda GeForce GTX 285 è stato dato valore di 100%, ricavando da questo il valore della soluzione Radeon HD 5870.

285_5870_1680x1050.png (101998 bytes)

285_5870_1920x1200.png (102099 bytes)

285_5870_2560x1600.png (102466 bytes)

Nuovamente ogni commento pare superfluo: il margine di vantaggio della nuova scheda ATI è netto a tutte le risoluzioni, inferiore in termini assoluti rispetto a quanto visto con la scheda Radeon HD 4890 ma ben oltre il 30% come media alle due risoluzioni video più elevate. A titolo indicativo riportiamo anche i margini prestazionali medi ottenuti dalla scheda Radeon HD 5870 a confronto con le soluzioni dual GPU, ATI Radeon HD 4870X2 e NVIDIA GeForce GTX 295.

setup

da 4870X2 a 5870 da GTX 295 a 5870

1680x1050

94,9% 93%

1920x1200

92,2% 91%

2560x1600

97,7% 93,5%

La scheda Radeon HD 5870 è mediamente più lenta delle due proposte dual GPU, per le quali abbiamo fornito un valore prestazionale di riferimento pari al 100% così come è stato fatto con i grafici precedenti, ma con divari medi nel complesso molto contenuti.

Pagina 20 - Considerazioni

Il debutto della nuova generazione di GPU ATI è stato atteso per lungo tempo da parte degli utenti appassionati. Sono infatti trascorsi circa 15 mesi dal Giugno 2008, periodo nel quale NVIDIA ha presentato le proprie architetture GeForce GTX 200 basate su GPU G200 mentre ATI ha risposto con le schede Radeon HD 4800 dotate di GPU RV770.

Con il lancio odierno AMD guadagna un chiaro margine di vantaggio sulla rivale NVIDIA: la nuova scheda Radeon HD 5870 distanzia la proposta GeForce GTX 285 a singola GPU di NVIDIA, giungendo a livelli prestazionali che sono mediamente molto vicini a quelli messi a disposizione dalla scheda GeForce GTX 295, proposta dual GPU.

Il vero punto di forza delle schede Radeon HD 5800 è tuttavia dato dal supporto alle API DirectX 11: la loro adozione sul mercato da parte degli sviluppatori di videogiochi è prevista essere ben più rapida di quanto accaduto in precedenza con le API DirectX 10. Da qui alla fine dell'anno vedremo i primi titoli al debutto, con una presumibile maggiore diffusione a partire dalla prima metà del 2010. Per quel periodo NVIDIA, la grande assente della giornata, avrà presumibilmente a disposizione le proprie schede basate sulla nuova architettura DirectX 11, con le soluzioni top di gamma attualmente indicate con il nome di G300.

La vera incognita del lancio odierno rimane quindi NVIDIA; mancano ovviamente conferme ufficiali da parte del produttore americano ma le indiscrezioni attuali non danno come possibile il debutto delle schede video della famiglia G300 prima di quantomeno la fine dell'anno. Questo offre ad AMD un buon vantaggio temporale, e la sicurezza che sarà l'unica azienda presente con soluzioni DirectX 11 durante la stagione di vendite natalizia.

Alcune considerazioni sulla reference board Radeon HD 5870, in quanto tutte le schede presentate dai partner altro non sono che questa soluzione con etichette proprietarie e scatole personalizzate. Le dimensioni di questo prodotto sono leggermente superiori alle schede DirectX 10 più grandi giunte in commercio: la lunghezza incrementale di 1 cm è stata ottenuta solo con il sistema di copertura della scheda e non riguarda il PCB o altri componenti. La finalità estetica sarà anche stata raggiunta ma riteniamo di consigliare AMD di accorciare la parte finale, guadagnando 1 cm così da facilitare l'installazione della scheda anche in chassis che non abbondano in spazio. La silenziosità di funzionamento è molto valida: AMD ha sviluppato un sistema di raffreddamento reference ben strutturato ed efficace.

La disponibilità iniziale delle schede Radeon HD 5870 sul mercato sarà estremente ridotta, stando alle informazioni che abbiamo raccolto tra i partner nei giorni precedenti il lancio. Dovranno trascorrere alcune settimane prima che le schede possano venir proposte sul mercato a volumi interessanti; in considerazione del livello prestazionale fornito crediamo che quelle poche schede che saranno disponibili sin dalla giornata odierna andranno molto rapidamente vendute. Possiamo capire le difficoltà ad avere a disposizione un buon numero di chip a 40 nanometri dalle fabbriche TSMC, ma un lancio di questa portata senza gli adeguati volumi di schede sugli scaffali rischia di perdere buona parte della portata che indubbiamente ha, soprattutto considerando l'impossibilità di NVIDIA di poter rispondere con delle novità.

L'incertezza è così elevata che non ci è stato di fatto possibile avere informazioni precise sui livelli di prezzo nel mercato europeo. AMD indica una cifra di 379 dollari per la scheda Radeon HD 5870 e di 259 dollari per quella Radeon HD 5850, valori che fanno ipotizzare livelli rispettivamente pari a 330,00€ IVA compresa e 240,00€ IVA compresa. Queste cifre non vogliono essere in alcun modo definitive: necessitiamo di una verifica con quello che il mercato metterà a disposizione nei prossimi giorni.

Sul piano tecnologico le nuove schede Radeon HD 5800 confermano il processo evolutivo avviato da AMD sin con il debutto delle schede ATI Radeon HD della serie 3800: se con le soluzioni 4800 si era giunti ad una sostanziale parità con NVIDIA, forti di costi più contenuti, con Radeon HD 5800 AMD guadagna un chiaro vantaggio sia prestazionale sia tecnologico nel segmento delle schede a singola GPU.

La nostra analisi dell'architettura RV870 non si ferma qui. Nei prossimi giorni pubblicheremo un articolo incentrato sulla tecnologia Eyefinity e sull'esperienza di gioco ottenibile con 3 schermi; siamo in attesa anche di una scheda Radeon HD 5850 e, non appena avremo a disposizione una seconda scheda Radeon HD 5870, passeremo ad uno studio del comportamento con tecnologia CrossfireX.