AMD Llano: la nuova piattaforma notebook

AMD Llano: la nuova piattaforma notebook

AMD porta al debutto la seconda famiglia di prodotti Fusion con le soluzioni APU note con il nome in codice di Llano. CPU e GPU integrate in un singolo componente con proposte specificamente sviluppate per i sistemi notebook; grande attenzione alle prestazioni e all'autonomia con batteria. Update con nuovi benchmark a confronto con le soluzioni Core i3 e Core i5 di Intel

di pubblicato il nel canale Portatili
IntelAMD
 

L'architettura della APU Llano: CPU e GPU

Il design delle APU Llano è stato sviluppato da AMD tenendo in considerazione alcune ben precise esigenze:

  • fornire nelle declinazioni mobile la più elevata autonomia possibile;
  • integrare una GPU di buona potenza elaborativa, di fatto tale da rendere superflua una scheda video discreta di fascia entry level;
  • assicurare buone prestazioni non solo con giochi 3D ma anche con tutto quello che riguarda la riproduzione di flussi video, soprattutto ad alta definizione.

Per ottenere questi risultati AMD ha sfruttato tecnologie in proprio possesso ottimizzandole al meglio nell'ottica di contenere i consumi complessivi; quale elemento base e di fatto necessario per ottenere tale risultato dobbiamo menzionare la tecnologia produttiva a 32 nanometri del partner Globalfoundries.

schema_apu_1.jpg (66722 bytes)

I core della famiglia "Stars", pari a 2 oppure 4 a seconda delle versioni, sono abbinati ciascuno a una cache L2 da 1 Mbyte; a differenza del design sviluppato per le soluzioni Phenom II attualmente in commercio manca del tutto una cache L3 unificata tra i processori, mentre il quantitativo di cache L2 è raddoppiato. Il controller memoria DDR3 è di tipo dual channel, compatibile con memorie DDR3-1333 oppure DDR3-1600 sia di tipo standard come di tipo low power; per questi ultimi la massima frequenza di clock è di 1.333 MHz. Il controller PCI Express integrato gestisce un massimo di 24 linee indipendenti: sino a 16 possono venir utilizzate per una scheda video discreta, 4 vengono adottate per collegare via Unified Media Interface (UMI) la APU al Fusion Controller Hub (FCH) mentre le ultime 4 possono venir utilizzate per porte general purpose attraverso le quali viene scaricato del traffico di I/O ad elevato consumo di bandwidth da quello che passa via UMI tra APU e FCH.

Non mancano ovviamente le interfacce di collegamento per i display digitale, oltre al modulo UVD (Universal Video Decoder) di terza generazione che si occupa di gestire numerosi calcoli legati alla riproduzione di flussi video così da lasciare quanto più possibile i core in idle e ridurre il consumo complessivo della piattaforma. Il Fusion Controller Hub (FCH) opera come south bridge: è proposto in versione A70M con 4 canali USB 3.0 oppure A60M, con solo controller USB 2.0. Entrambi i modelli integrano al proprio interno controller SATA 6 Gbps, ormai uno standard per le soluzioni chipset di AMD.

schema_apu_2.jpg (54579 bytes)

I singoli core mutuano il design da quanto implementato da AMD nei core delle soluzioni Phenom II; non ci troviamo quindi di fronte ad un'architettura nuova come lo è stata quella Bobcat per le soluzioni della famiglia Brazos e come saranno le proposte desktop Bulldozer. Alcune ottimizzazioni interne hanno permesso di ottenere, a parità di frequenza di clock, un aumento dell'IPC (Instruction per Clock) del 6%, stando a quanto dichiarato da AMD. Tale risultato è stato raggiunto attraverso il raddoppio nella dimensione della cache L2, ad un incremento della window size (reorder e load/store buffers ingranditi), ad un prefetcher hardware migliorato nella gestione e all'hardware divider. Di fatto, quindi, possiamo attenderci dalle APU Llano livelli prestazionali per la sola componente CPU che sono allineati, se non lievemente superiori, a quelli delle soluzioni Phenom II con pari frequenza di clock, fatta eccezione per quei pattern di utilizzo che beneficiano della presenza di cache L3 unificata implementata in queste ultime CPU.

schema_apu_3.jpg (48542 bytes)

Il controller memoria DDR3 dual channel è compatibile con memorie DDR3-1600 nella declinazione per sistemi notebook; utilizzando moduli low voltage a 1.35V la massima frequenza di clock supportata scende a 1.333 MHz. Per le APU Llano destinate a sistemi desktop il controller memoria permetterà di utilizzare moduli anche DDR3-1866, sempre con tensione di alimentazione pari a 1.5V. L'implementazione del memory controller è tale da permettere un netto incremento della bandwidth a disposizione della GPU rispetto a quanto implementato nella precedente generazione di architettura AMD; anche la latenza di accesso è stata ridotta, parallelamente al consumo che è stato fortemente ottimizzato proprio in funzione della necessità di incrementare tangibilmente l'autonomia di funzionamento dei notebook.

schema_apu_4.jpg (68701 bytes)

Proprio per ridurre ai minimi termini i consumi AMD ha adottato alcune precise strategie di design. La CPU opera in power gating utilizzando un rail VDD unificato; l'introduzione della modalità Core C6 permette a ogni singolo core di venir completamente spento, mentre la modalità Package C6 permette di diminuire l'alimentazione sull'intero rail. Una opzione di power gating è stata ovviamente implementata anche a livello della GPU: il core grafico può essere completamente spento nel momento in cui l'intervallo di idle misurato sia superiore a quello che può essere programmato a livello driver, mentre il consumo del controller memoria per la componente grafica può essere gestito dinamicamente. Non manca ovviamente un controllo dinamico del consumo generato dal modulo UVD, grazie alla cui presenza diventa possibile ridurre ai minimi termini il consumo di molti componenti nel momento in cui si esegue la riproduzione di flussi video.

AMD ha implementato una singola linea di alimentazione VDDNB condivisa tra GPU, UVD, controller memoria grafico e northbridge; con questa è possibile gestire dinamicamente sia la tensione sia la frequenza di clock, con il primo elemento che viene selezionato in funzione dello stato nel quale si trovano questi componenti. Ulteriore ottimizzazione al consumo dell'intero sistema è implementata con la tecnologia adaptive backlight modulation: l'immagine riprodotta a schermo viene analizzata in modo da ridurre gradualmente l'intensità della backlight incrementando la luminosità dei pixel, riducendo il consumo complessivo dello schermo senza che questo porti ad una variazione percepibile da parte dell'utente della luminosità complessiva dell'immagine a video.

schema_apu_5.jpg (41358 bytes)

Non manca nelle soluzioni Llano la tecnologia Turbo Core, che interviene gestendo dinamicamente la frequenza di clock dei singoli core e della GPU integrata in funzione del livello di consumo massimo accettato oltre ovviamente al tipo di elaborazione eseguta. La tecnologia prevede la misurazione digitale dell'attività del processore così da stimarne il livello di consumo istante per istante, derivandone il TDP; la risultante è un livello di intervento più preciso, stando ad AMD, rispetto a quanto fornito da Intel con la propria tecnologia Turbo Boost in quanto quest'ultima si basa su un metodo di rilevazione analogico. Utilizzando applicazioni cosiddette power virus, cioè che spingono al massimo livello di consumo possibile, su GPU e CPU contemporaneamente si eccede il TDP della piattaforma nel complesso; il sistema porta la CPU ad uno stato inferiore a quello P0 così da mantenere il TDP complessivo entro il valore massimo di specifica evitando che la APU possa raggiungere temperature troppo elevate. In questo scenario il budget di TDP viene dato con priorità alla GPU e non alla CPU.

schema_apu_6.jpg (58955 bytes)

La componente GPU è indicata internamente da AMD con il nome in codice di "Sumo"; si tratta di un design derivato da quello "Redwood" adottato per le schede Radeon HD delle serie 5500 e 5600 con alcune importanti modifiche specifiche per l'utilizzo in una APU. Da un lato una nuova interfaccia memoria, necessaria in quanto viene utilizzata quella della APU e non una dedicata per la sola GPU; dall'altro l'integrazione del modulo UDV 3 accanto alle funzionalità di power gating necessarie per ridurre il consumo complessivo. La tabella seguente riassume le caratteristiche tecniche delle 3 tipologie di GPU integrate nelle APU A8, A6 e A4:

APU A8 A6 A4
GPU Radeon HD 6620G Radeon HD 6520G Radeon HD 6480G
Stream processors 400 320 240
SIMDs 5 4 3
Texture units 20 16 8
ROPs 8 8 4
Interfaccia memoria 2x64bit 2x64bit 2x64bit
Frequenza di clock max della memoria 1.600 MHz 1.600 MHz 1.333 MHz
Clock GPU 444 MHz 400 MHz 444 MHz
Potenza di elaborazione di picco 355 GFLOPS 256 GFLOPS 142 GFLOPS

Se dal versante memoria tutto dipende da quanto implementato a livello di APU e piattaforma, per l'architettura degli stream processors ritroviamo un approccio identico a quanto già visto in passato con le architetture di GPU AMD Radeon HD serie 5000 e 6000. Per ogni SIMD troviamo 16 thread processors, all'interno dei quali trovano posto 5 stream processors con architettura WILW5 divisi in 4 general purpose e un quinto dedicato a special functions.

Segnaliamo anche l'implementazione della tecnologia AMD Steady Video, grazie alla quale l'utilizzo combinato di GPU e CPU permette di intervenire in tempo reale su flussi video che siano caratterizzati da una notevole vibrazione della ripresa (ad esempio, videocamera amatoriale con focale molto spinta) così da migliorarne tangibilmente la qualità di riproduzione. Questo tipo di effetto di post produzione è accessibile anche con altre soluzioni software ma nell'implementazione AMD opera in tempo reale, sfruttando la disponibilità contemporanea di GPU e CPU.

 
^