AMD FX-8350: la seconda generazione di CPU FX

AMD FX-8350: la seconda generazione di CPU FX

AMD introduce l'architettura Piledriver anche per le proprie proposte della famiglia FX, destinate a sistemi desktop socket AM3+, dopo che alcune settimane fa tale passaggio era stato fatto per le soluzioni APU della famiglia Trinity. Frequenze di clock più elevate e migliorie nell'IPC permettono di ottenere un incremento prestazionale rispetto alle proposte FX di prima generazione, tutto con prezzi che rimangono contenuti

di pubblicato il nel canale Processori
AMD
 

Le innovazioni di Piledriver

Le nuove CPU della famiglia FX sono dotate di architettura di processore Piledriver, evoluzione di quella Bulldozer adottata con la prima generazione di queste CPU. L'approccio utilizzato da AMD è quello tipico di una evoluzione, non di una rivoluzione: troviamo infatti lo stesso tipo di design con struttura a moduli, all'interno di ciascuno dei quali convivono due unità di calcolo integer affiancate da una in virgola mobile di tipo condiviso.

die_fx_piledriver.jpg (156600 bytes)

Piledriver rappresenta quindi una evoluzione di Bulldozer, non un cambiamento radicale: sarà con l'architettura nota con il nome in codice di Steamroller, attesa per il 2013, che AMD procederà con una evoluzione più significativa del design delle proprie CPU pur continuando a partire dalle stesse basi implementate in Bulldozer prima e in Piledriver in seguito. Come detto Piledriver prevede un design a moduli dotati al proprio interno di due unità di calcolo integer affiancate da una in virgola mobile con due moduli a 128bit di precisione. Per ogni modulo è presente una cache L2 dedicata, in quantità massima pari a 2 MB per modulo, affiancata da una cache L3 condivisa tra tutti i moduli in quantitativo di 8 Mbytes.

Nello schema seguente dettagliamo quali siano le differenti combinazioni di core, cache L2 e cache L3 nelle differenti versioni di processore FX:

Modello

Moduli Piledriver Core integer Unità FP Cache L2 Cache L3
FX-8350 4 8 4 4x2MB 8MB
FX-8320 4 8 3 4x2MB 8MB
FX-6300 3 6 3 3x2MB 8MB
FX-4300 2 4 2 2x2MB 8MB

L'utilizzo di un design a moduli porta ad avere a disposizione un elevato numero di core integer, pari a 8 nelle versioni FX-83x0, ma un numero di unità di calcolo in virgola mobile che è pari alla metà. Questo approccio, come del resto già indicato nelle prime analisi delle CPU basate su architettura Bulldozer, può rivelarsi controproducente dal punto di vista prestazionale nel momento in cui il codice dell'applicazione in esecuzione sia fortemente dipendente da elaborazioni in virgola mobile. Secondo AMD questo scenario tende a presentarsi poche volte pensando agli scenari di utilizzo tipici dell'utenza consumer, risultando essere più utile avere a disposizione un elevato numero di core così da poter eseguire in parallelo la propria applicazione.

Un design di questo tipo, quando abbinato ad applicazioni che siano per loro natura facilmente parallelizzabili su più core, ha quale limite la potenza di elaborazione a livello di singolo core. Nel confronto con le architetture di processore Intel della famiglia Core oltre che con quelle AMD della serie Phenom II le CPU FX basate su architettura Bulldozer hanno evidenziato un limite a livello di IPC, instruction per clock, cioè nella capacità di eseguire codice a livello di singolo core il più velocemente possibile. La frequenza di clock elevata e la presenza di numerosi core bilanciano questa ridotta efficienza nel momento in cui l'applicazione può sfruttare tutti i core a disposizione, permettendo alla CPU di esprimersi al meglio, ma non sempre il codice eseguito è tale da utilizzare al 100% gli 8 core massimi che alcune delle CPU FX mettono a disposizione.

slide_1.png (67942 bytes)

Con Piledriver AMD è intervenuta cercando di incrementare l'IPC della CPU, attraverso una serie di ottimizzazioni interne che vanno da un miglioramento della logica di hardware prefetcher a un incremento della L1 Translation Look-aside Buffer, a migliorie nel branch prediction sino a un incremento della load queue. In che misura possiamo attenderci un miglioramento delle prestazioni velocistiche con le CPU della famiglia Piledriver rispetto a quelle Bulldozer? Nella tabella seguente abbiamo confrontato i valori ottenuti con il processore FX 8350 a confronto con la CPU FX 8150, delineando la variazione percentuale ottenuta nel passaggio dalla seconda alla prima.

benchmark

FX-8350 FX-8150 variazione
Povray 1523 1306

16,6%

Cinebench 6,95 5,97

16,4%

TrueCrypt - AES 3700 3300

12,1%

TrueCrypt - Twofish 779 648

20,2%

3ds Max 2012 (secondi) 95 110

13,6%

Luxmark v2.0, Benchmark CPU 275 248

10,9%

Euler 3D 4391 3764

16,7%

AutoMVK (secondi) 240 284

15,5%

x264 HD- first pass 58,4 51,4

13,6%

x264 HD - second pass 15,1 13

16,2%

Media Espresso faster convertion (secondi) 181 210

13,8%

Media Espresso better quality (secondi) 200 229

12,7%

ProShow Gold (secondi) 650 679

4,3%

Handbrake 55,6 47,2

17,8%

Winrar 7096 6218

14,1%

7-Zip - compressione 22833 19818

15,2%

7-Zip - decompressione 24231 21787

11,2%

Entrambe queste CPU operano con una frequenza di clock massima, via Turbo Core, pari a 4.200 MHz; di default però i valori sono ben differenti, pari a 4 GHz per la nuova FX-8350 e a 3,6 GHz per la CPU FX-8150. Nel confronto tra i risultati ottenuti dobbiamo quindi l'incidenza dell'incremento nella frequenza di clock, che in caso di non intervento della tecnologia Turbo Core è quale massimo dell'11% a favore del modello FX-8350 mentre se entrambe abilitano Turbo Core alla massima impostazione è pari a zero.

Considerando un'incidenza media del 10% per la frequenza di clock, in considerazione della tipologia di test eseguiti che sono per la maggiore in grado di saturare tutti e 8 i core messi a disposizione da questi processori, possiamo ricavare un miglioramento delle prestazioni in media del 5% grazie alle novità introdotte con l'architettura Piledriver, nulla di eclatante nel complesso ma comunque non da disprezzare visto che si accompagna, nel caso della CPU top di gamma, ad un altrettanto valido incremento della frequenza di clock di default.

 
^