AMD Radeon HD 6870 e 6850: DX 11 di seconda generazione

AMD Radeon HD 6870 e 6850: DX 11 di seconda generazione

Con la famiglia 6800 AMD presenta le prime schede DirectX 11 di seconda generazione, abbandonando del tutto il brand ATI per le proprie soluzioni desktop. Posizionate nella soglia d'ingresso tra le proposte di fascia medio alta, le due nuove schede si distinguono per un ottimo bilanciamento tra consumi e prestazioni velocistiche, in attesa del debutto delle soluzioni Radeon HD 6900.

di pubblicato il nel canale Schede Video
ATIAMDRadeon
 

L'architettura delle GPU Barts

La GPU utilizzata da AMD per le schede video Radeon HD 6800, nome in codice Barts, riprende l'architettura di base delle soluzioni RV870 utilizzate nelle schede Radeon HD 5800. L'azienda americana ha operato una sorta di riconfigurazione della GPU, mirando a due distinte finalità: da un lato incrementare l'efficienza complessiva intervenendo su quegli elementi che possono influire positivamente in questo aspetto; dall'altro ottenere una riduzione della dimensione del chip mantenendo per quanto possibile le stesse prestazioni velocistiche.

Ricordiamo che le schede Radeon HD 6800 sono le prime proposte da AMD destinate al segmento di fascia medio alta del mercato. Nel corso dei prossimi mesi vedremo al debutto anche schede della serie Radeon HD 6900 a singola GPU, destinate a posizionarsi su un segmento di mercato ancora più alto e a distanziare in misura ancora più netta le schede Radeon HD 5800.

La prima evidente novità architetturale implementata da AMD è l'inserimento di due Ultra-Threaded Dispatch Processor, ciascuno dotato di proprie cache per istruzioni e costanti; in RV870 era presente un singolo Ultra-Threaded Dispatch Processor a gestire un più elevato numero di stream processors.. A monte di questi componenti troviamo l'unità di tessellation di nuova generazione, della quale tratteremo le prestazioni velocistiche in un capito seguente.

slide_9.jpg (103167 bytes)

Nelle GPU Barts sono presenti 14 (Radeon HD 6870) oppure 12 (Radeon HD 6850) SIMD Engines, ciascuno dei quali è dotato di 80 stream processors divisi in 20 blocchi di Thread Processors, all'interno dei quali sono presenti 5 stream processors. La divisione interna degli stream processors nelle GPU Radeon HD serie 6800 è quindi identica a quella delle soluzioni RV870 utilizzate nelle schede Radeon HD serie 5800; al differire il numero complessivo, come riassunto in questo schema:

Specifiche ATI Radeon HD 5830 ATI Radeon HD 5850 ATI Radeon HD 5870 AMD Radeon HD 6850 AMD Radeon HD 6870
numero stream processors 1.120 1.440 1.600 960 1.120
clock stream processors 800 MHz 725 MHz 850 MHz 775 MHz 900 MHz
ROPs 16 32 32 32 32
TMU 56 72 80 48 56
clock memoria 4.000 MHz 4.000 MHz 4.800 MHz 4.000 MHz 4.200 MHz
interfaccia memoria 256bit 256bit 256bit 256bit 256bit

La GPU Radeon HD 6870 integra lo stesso numero di stream processors, 1.120, della soluzione Radeon HD 5830; sono identiche anche le specifiche del controller memoria, con una lieve differenza nella frequenza di clock dei moduli GDDR5 che è di 4.000 MHz per 5830 e 4.200 MHz per 6870, mentre cambia la frequenza di clock che è stata portata a 900 MHz. A differenziare le due soluzioni il numero di ROPs, doppio nella GPU Radeon HD 6870 e identico a quello delle altre soluzioni Radeon HD 5850 e Radeon HD 5870. Dal versante TMU troviamo lo stesso rapporto visto con le GPU RV870: il rapporto tra SIMD Engines e TMU è pari a 1 su 4. Con questa nuova serie di GPU AMD ha quindi scelto di mantenere la stessa struttura di base, diminuendo il numero di SIMD Engines ma incrementando la frequenza di clock complessiva della GPU, ottenendo inoltre una diminuzione di consumi e un die più piccolo.

architettura_2.jpg (39116 bytes)

All'interno di ogni Thread Processor troviamo 4 stream processors, o stream cores come vengono indicati da AMD: 4 stream processors di tipo general purpose sono affiancati da un quinto stream processor con funzionalità speciali, collegati ai quali trovano posto dei registri di tipo general purpose e una unità di branching. Il controller memoria mantiene la stessa struttura vista con il chip RV870: bus da 256bit di ampiezza, composto da 4 canali a 64bit indipendenti, collegato a memoria GDDR5. Lo schema fornito è quello riferito ai TP delle soluzioni RV870; nelle GPU Barts AMD ha rimosso la componente di elaborazione a 64bit, utile per elaborazioni in GPU Computing ma non nel gaming, in quanto questa serie di GPU è specificamente indirizzata all'utilizzo videoludico. Saranno le soluzioni Cayman a venir utilizzate anche nella serie FirePro destinata a workstation professionali oltre che a elaborazioni GPU Computing.

La diminuzione nel numero di SIMD Engine ha portato ad una riduzione nella superficie del die; dai 334 millimetri quadrati delle GPU RV870 si è scesi a 255 millimetri quadrati: poco meno del 24% di contrazione quindi, a tutto vantaggio sia delle rese produttive sia dei costi di produzione. Le nuove GPU sono costruite con tecnologia produttiva a 40 nanometri dalla taiwanese TSMC: si tratta, quantomeno al momento attuale, della tecnologia produttiva più sofisticata per la produzione di GPU, la stessa del resto adottata sia per RV870 sia per le GPU NVIDIA della famiglia Fermi.

Una delle novità architetturali inserite nelle GPU Radeon HD 6800 riguarda la nuova generazione di UVD, Universal Video Decoder. Giunto alla terza versione, UDV vede ora integrate nuove funzionalità per l'offloading alla GPU di alcune funzionalità specifiche legate alla riproduzione di flussi video.

slide_6.jpg (47620 bytes)

Rispetto a UVD2, inserito nelle soluzioni Radeon HD serie 5000, i flussi video Blu-ray 3D o multi-view Codec sono ora gestiti dalla GPU, unitamente a quelli MPEG-2 e MPEG-4 part 2 (DivX e xVid). Le operazioni di entropy decoce, inverse trasformation e motion compensation vengono delegate in elaborazione alla GPU, mentre per i Codec Multi-View è delegata alla GPU anche la parte di In-loop deblocking. Quali le implicazioni date dall'utilizzo del modulo UVD 3?

slide_7.jpg (43306 bytes)

AMD ha utilizzato il benchmark HQV 2.0, incentrato sulla corretta riproduzione dei flussi video contenuti nei supporti ad alta definizione, per confrontare la qualità del modulo UVD 3 con quanto fornito dalle concorrenti NVIDIA e Intel. Il risultato, ovviamente trattandosi di una slide fornita dal produttore, è quello di un netto margine di vantaggio per la soluzione AMD, capace di avvicinare il massimo teorico di 210 punti del benchmark. Per sfruttare al meglio queste novità architetturali del modulo UVD è ovviamente necessario il corretto supporto software; AMD ha anticipato collaborazioni in questa direzione con tutti i maggiori produttori di software per la riproduzione di flussi video.

 
^