AMD Trinity: tutto cambia nella APU per sistemi notebook

AMD Trinity: tutto cambia nella APU per sistemi notebook

Al debutto la seconda generazione di APU AMD, nella quale componente CPU e GPU sono integrate in un singolo chip. Evoluzione delle proposte Llano, le APU Trinity implementano novità architetturali tanto per la componente CPU come per quella GPU, grazie da un lato ai core Piledriver e al sottosistema video della famiglia Nothern Island

di Paolo Corsini pubblicato il nel canale Portatili
 

Componente CPU: architettura Piledriver

Abbiamo evidenziato come con le APU Trinity AMD introduca, a parità di processo produttivo utilizzato che rimane quello a 32 nanometri, importanti novità sia per la componente CPU come per quella GPU. Se le proposte della famiglia Llano hanno rappresentato per AMD la prima incarnazione del concetto di APU per sistemi di fascia medio alta, Trinity ne è a pieno titolo la matura evoluzione, nella quale sono stati integrati vari affinamenti miranti a incrementare le prestazioni complessive diminuendo l'impatto in termini di consumi.

Poniamo la nostra attenzione sulla componente CPU, lasciando alla pagina seguente l'analisi sulla GPU integrata. Llano vedeva, per la parte CPU, l'architettura nota con il nome in codice di Husky: è direttamente derivata da quella utilizzata per i processori Athlon II e Phenom II, ancora oggi disponibili sul mercato, e non da quella Bulldozer che AMD ha introdotto con i processori della famiglia FX. Una scelta di questo tipo è stata dettata dalla volontà di proporre un approccio al design che partisse da alcuni punti fermi e noti internamente all'azienda, la microarchitettura di base, andando a diversificare sulla parte di risparmio energetico e sulla GPU integrata, cioè sugli elementi che caratterizzano il design di una APU.

La scelta portata avanti da AMD con Llano, includendo in questo anche l'utilizzo della tecnologia produttiva a 32 nanometri, è stato indubbiamente corretto lo scorso anno: ha permesso ad AMD di assicurarsi una componente CPU di fatto classica per design e prestazioni, potendo puntare l'attenzione nel design alla componente GPU che per la prima volta è stata integrata in un processore AMD destinato a questo segmento di mercato. Questa scelta architetturale ha di fatto rappresentato anche il vero limite delle proposte Llano, tanto valide dal versante GPU integrata quanto deboli nel confronto diretto con i processori Intel della famiglia Sandy Bridge in termini di prestazioni velocistiche dal versante CPU.

LabelledDie.jpg (76680 bytes)

Con Trinity AMD ha scelto di rivedere del tutto la componente CPU integrata abbandonando i core Husky integrati in Llano, a favore dell'architettura nota con il nome in codice di Piledriver. In questo caso si tratta di una vera e propria novità per l'azienda americana: Piledriver è infatti il nome in codice che contraddistingue la seconda generazione di architettura della famiglia Bulldozer, evoluzione di quanto implementato da AMD all'interno dei primi processori della famiglia FX. I core Piledriver verranno utilizzati anche con la seconda generazione di processori FX, attesi al debutto in sistemi desktop nel corso della seconda metà dell'anno.

Piledriver rappresenta una evoluzione di Bulldozer, non un cambiamento radicale: troviamo quindi lo stesso design di base con moduli x86 dotati al proprio interno di due unità di calcolo integer affiancate da una in virgola mobile con due moduli a 128bit di precisione; per ogni modulo è presente una cache L2 dedicata, in quantità massima che raggiunge i 2 MB per modulo a seconda del tipo di processore, mentre manca una cache L3 unificata presente invece nelle CPU della famiglia FX. Le versioni di APU Trinity integreranno due oppure quattro core: mancherà una declinazione triple core per via della particolare architettura con moduli Piledriver dual core, mentre le versioni a 6 e 8 core saranno destinate alle sole CPU della famiglia FX e non alle APU.

All'interno dei core Piledriver troviamo alcune ottimizzazioni rispetto a quanto adottato in Bulldozer; in particolare AMD ha migliorato l'unità di branch prediction, l'efficienza della cache L2 e implementato un miglior hardware prefetch. La L1 Translation Look-aside Buffer, o TLB, è stata incrementata di dimensione rispetto a Bulldozer, altra modifica che punta ad assicurare a parità di microarchitettura di base una più elevata efficienza complessiva dei core.

Al pari di Llano e delle CPU desktop basate su architettura Bulldozer in Trinity troviamo implementata la tecnologia Turbo Core, grazie alla quale la frequenza di clock della CPU è gestita dinamicamente ove possibile portandola oltre il valore di default predefinito per la specifica versione utilizzata sino ad un picco massimo. Al pari della tecnologia Turbo Boost implementata da Intel nei propri processori, Turbo Core porta ad un overclock automatico della CPU in funzione del carico di lavoro istantaneo del processore, del numero di core occupati, della temperatura di funzionamento e dei requisiti di alimentazione. L'implementazione adottata per Trinity viene indicata come Turbo Boost 3.0: agisce in overclock tanto sulla componente CPU come su quella GPU, dando priorità all'overclock di uno o dell'altro componente a seconda del tipo di applicazione che viene eseguita.

Platform.jpg (44173 bytes)

La piattaforma nel complesso non ha subito significative variazioni rispetto a quanto visto in Llano: troviamo due componenti, con APU affiancata dal chipset della serie A che opera di fatto come Input/Output hub gestendo i collegamenti con le periferiche esterne. La APU integra come noto CPU e GPU, oltre a controller memoria DDR3 e a quello PCI Express con 24 linee quale massimo. Non manca ovviamente la circuiteria per supportare l'output video, con compatibilità HDMI e DVI oltre che Display Port. Completano le caratteristiche della piattaforma quanto integrato nel chipset: controller SATA 6 Gbps capace di gestire un massimo di 6 canali contemporaneamente, con compatibilità Raid 0 oppure Raid 1, oltre a controller USB anche di tipo 3.0 nel caso del chipset AMD A70M per un massimo di 4 canali, affiancati da un massimo di 10 porte USB 2.0.

Segnaliamo come la tecnologia PCI Express abbia sostituito quella HyperTransport per il collegamento tra APU e l'interconnessione con le periferiche di I/O; questa scelta è dettata dalla massiccia adozione di collegamenti PCIe tra le periferiche, portando ad una semplificazione ulteriore nel design delle interfacce di collegamento.

Il controller memoria è di tipo dual channel DDR3 ma supporta tipologie di memorie differenti a seconda del tipo di APU. Per sistemi desktop, al pari di quanto visto in Llano, è compatibile sino alla frequenza di clock di 1.866 MHz mentre in versioni mobile si limita a 1.600 MHz di clock, risultando però compatibile anche con le memorie DDR3 a basso consumo ( LVDDR3 a 1.35V oppure ULVDDR3 a 1.25V) così da incrementare l'autonomia nel funzionamento a batteria.