AMD fornisce nuovi dettagli sull'architettura delle CPU Zen

AMD fornisce nuovi dettagli sull'architettura delle CPU Zen

Si avvicina il debutto della prossima generazione di processori AMD, appartenenti alla famiglia Zen: l'azienda americana fornisce nuovi dettagli sull'architettura alla conferenza Hot Chips, ma per le versioni e le frequenze c'è da attendere ancora

di pubblicata il , alle 15:31 nel canale Processori
AMDZen
 

In occasione della conferenza Hot Chips, che si sta svolgendo in questi giorni a Stanford, AMD ha fornito ulteriori informazioni sull'architettura alla base dei propri processori della famiglia Zen. Con questo nome vengono indicate le CPU di prossima generazione, attese al debutto commerciale all'inizio del 2017 ferma restando la possibilità che alcune di questi processori vengano venduti in un primo lotto già entro la fine del 2016.

zen_hot_chips_2.jpg (58500 bytes)

La scorsa settimana l'azienda americana ha effettuato una dimostrazine pubblica di questi processori mostrando un sistema desktop dotato di CPU a 8 core, oltre ad una soluzione per server rack basata su due processori della famiglia Naples entrambi dotati al proprio interno di 32 core. Tutti i dettagli su quella prima presentazione sono disponibili online a questo indirizzo.

zen_hot_chips_1.jpg (95115 bytes)

In termini estremamente semplici, con Zen AMD ha l'obiettivo di mettere a disposizione un incremento dell'IPC cioè del numero di istruzioni che vengono processate per ogni ciclo di clock dalla CPU superiore del 40% rispetto a quanto offerto con l'attuale generazione di CPU della famiglia Excavator.

zen_hot_chips_3.jpg (70063 bytes)

L'architettura alla base prevede l'utilizzo di core che vengono raggruppati 4 per volta in quello che viene definito come CPU-Complex o CCX: in un CCX i 4 core condividono tra di loro una cache L3 da 8 Mbytes di capacità, mentre ogni core è dotato di una propria cache L2. La cache L1 cambia approccio rispetto alle architetture ora in commercio in quanto è di tipo write-back e non più write-through.

zen_hot_chips_4.jpg (98535 bytes)

Le prime novità riguardano la parte front end della CPU, nella quale trovano spazio 4 unità di tipo integer con 2 unità per load/store, mentre la componente in virgola mobile è gestita da 2 FMACs a 128bit che possono venir abbinati così da fornire supporto alle istruzioni AVX2 a 256bit. La branch prediction è stata ovviamente migliorata utilizzando per la prima volta in un'architettura AMD una Op cache che velocizza le operazioni di decode delle istruzioni senza che il decoder debba necessariamente passare per la memoria di sistema.

La cache L3 da 8 Mbytes per ogni blocco di 4 core ha un approccio che è simile a quello adottato da Intel per le proprie soluzioni quad core della famiglia Core destinate a sistemi desktop e notebook. La bandwidth della cache L3 è superiore di 5 volte rispetto a quella adottata per le CPU AMD della famiglia Excavator in commercio. Tra le novità di Zen, già segnalate da tempo, evidenziamo il supporto al simultaneous multi-threading: questo permette ad ogni core di gestire in parallelo due thread, che operano di fatto in competizione tra di loro così da sfruttare le risorse a disposizione del sistema al massimo.

zen_hot_chips_12.jpg (56244 bytes)

Non manca, a concludere, il set di istruzioni di accelerazione di vari compiti di elaborazione che AMD ha inserito nelle soluzioni Zen. Segnaliamo tra le varie le istruzioni AVX e AVX2, oltre a quelle CLzero e PTE Coalescing che rappresentano delle esclusive per le CPU AMD basate su questa nuova architettura.

Possiamo sintetizzare le informazioni fornite da AMD segnalando come varie migliorie a livello architetturale puntino a fare in modo che il front end della CPU sia sempre occupato nelle elaborazioni contemporaneamente, così che operazioni di tipo ridondante vengano bypassate e in questo modo migliorare l'efficienza complessiva. AMD vuole superare buona parte delle limitazioni incontrate in precedenza con l'architettura Bulldozer di precedente generazione, carente in termini di IPC e non così efficiente nel complesso come le proposte concorrenti di Intel.

In questa fase iniziale AMD non ha fornito indicazioni sulle differenti versioni di processore Zen che verranno presentate al debutto. Ci attendiamo sicuramente una declinazione a 8 core, indicata con il nome di Summit Ridge, oltre a CPU per sistemi server della famiglia Naples dotate al proprio interno di 32 core ciascuna. Nessun dettaglio anche sulle frequenze di clock: sappiamo che il sistema demo mostrato la scorsa settimana in un evento a San Francisco utilizzava processore Summit Ridge con frequenza di clock di 3 GHz. Con l'avvicinarsi del debutto ufficiale sul mercato AMD fornirà ulteriori informazioni sulle soluzioni Zen, completanto quando anticipato la scorsa settimana all'evento di San Francisco e nella presentazione tenuta alla conferenza Hot Chips.

51 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
demon7724 Agosto 2016, 16:06 #1
Originariamente inviato da: UltimateBou
non siate timidi... ve la suggerisco io, slide !


Perchè si è visto altro?
Ah no, è vero. C' anche un fimato dell'oste che assaggia il suo vino e dice che è buono come quello dell'altro.

Solito discorso. Si parlerà di roba concreta davanti a dettagliati benchmark comparativi VERI.

Per adesso SLIDE!
bongo7424 Agosto 2016, 16:15 #2
un ipc +40% ? mi sembra un po' tanto, lo spero ma ho paura che nel mondo reale non sarà così..
Piedone111324 Agosto 2016, 17:25 #3
Originariamente inviato da: gridracedriver
giusto per informazione, il +25% è quello fatto in MEDIA da Intel passando da Sandy Bridge a Skylake, fonte anandtech.

Sandy Bridge to Ivy Bridge: Average ~5.8% Up
Ivy Bridge to Haswell: Average ~11.2% Up
Haswell to Broadwell: Average ~3.3% Up
Broadwell to Skylake (DDR3): Average ~2.4% Up
Broadwell to Skylake (DDR4): Average ~2.7% Up

se non sbaglio da Nehalem a SB c'era un +15% MEDIO di IPC.

quindi +40% da excavator non è affatto tanto, è il minimo che potessimo sperare in realtà

Ma se intel sta facendo solo +3% a nuova cpu, come farebbe AMD a fare +40% scusami?

Comunque dovremmo essere vicini al rilascio, magari si scopre che il +40% è il massimo e non il medio, oppure potrebbe essere anche segato dall'ipc int (dove amd andava comunque discretamente) e ritrovarsi con un +20 in calcoli int e +60 in fpu, buh....
Rubberick24 Agosto 2016, 17:26 #4
Li buttassero in mercato, li compriamo e loro si fanno i soldi.

Manco un engineering sample..
demon7724 Agosto 2016, 17:45 #5
Originariamente inviato da: Piedone1113
Ma se intel sta facendo solo +3% a nuova cpu, come farebbe AMD a fare +40% scusami?

Comunque dovremmo essere vicini al rilascio, magari si scopre che il +40% è il massimo e non il medio, oppure potrebbe essere anche segato dall'ipc int (dove amd andava comunque discretamente) e ritrovarsi con un +20 in calcoli int e +60 in fpu, buh....



Penso sia proprio così.
lucusta24 Agosto 2016, 18:27 #6
Originariamente inviato da: gridracedriver
giusto per informazione, il +25% è quello fatto in MEDIA da Intel passando da Sandy Bridge a Skylake, fonte anandtech.

Sandy Bridge to Ivy Bridge: Average ~5.8% Up
Ivy Bridge to Haswell: Average ~11.2% Up
Haswell to Broadwell: Average ~3.3% Up
Broadwell to Skylake (DDR3): Average ~2.4% Up
Broadwell to Skylake (DDR4): Average ~2.7% Up

se non sbaglio da Nehalem a SB c'era un +15% MEDIO di IPC.

quindi +40% da excavator non è affatto tanto, è il minimo che potessimo sperare in realtà


normalizzato sulla frequenza (IPC)?
perche' mi sembra davvero tanto su int e FPU, evitando di usare le SIMD.
davo piu' o meno un +15-20%.

per chi invece critica sempre e comunque, se invece di farlo si leggessero le slide, si capirebbe anche il perche'.
l'aumento rispetto ad excavator deriva semplicemente dal fatto che ora usa SMT, e fa' 2 thread simultanei rispetto a uno (in realta' il 40% in piu' non e' probabilmente IPC, ma istruzioni totali, in quanto gira a frequenze piu' basse, di 3/4; diversamente avrebbero la stessa computazione finale tra' un quad ed un octacore).
nulla di piu', nulla di meno di quello che fa' intel da SB.
(e HT non e' SMT, ma si puo' sommare a questo).

di queste slide a me interessa principalmente la parte "Aggresive clock gating with multi-livel regions", che indica probabilmente che se gira con un solo core avra' una frequenza alta, con due un po' piu' bassa, con 4 ancora piu' bassa e con 8 si piazzerà a 2.8/3.2ghz, sempre rimanendo in un power limit dato dal TDP;
con queste premesse in single thread dovrebbe clockare a 4.0ghz per stare dietro ad un 6700K che ragiunge i 4.2 in turbo, a 3.6-3.7 per ugualiarlo in quad thread e anche se facesse 3ghz con tutti gli 8 core attivi, andrebbe il 40% in piu' (ecco la corsa di kaby lake ai 6 core nel mainstream).
non credo che inizialmente saranno quelle le frequenza (piu' propenso a pensare a 2.8x8/3.2x4/3.4x2/3.6x1 per rimanere sotto i 95W nell'uso normale e non sotto torture test, il che lo farebbe confrontare, in perdita, con un 6700), ma... processori a 140W si possono sempre tirare fuori, non sono certo uno scandalo, e una BE uno se la dovrebbe anche aspettare.

in pratica con 4 thread non sfigurerà, ed i monothread sono comunque garantiti con un'esecuzione ai giusti livelli, mentre nei programmi adatti puo' sfruttare tutte le risorse a disposizione, rendendolo molto piu' versatile delle CPU attuali.
se poi si da' retta ai grafici, sapere che a pari frequenza consuma la metà, mentre mantiene la stessa efficienza per ciclo di excavator garantendone il 40% in piu', fa' capire che ci hanno messo il doppio delle cose, e che questa volta sono in grado di usarle come fa' intel (altra cosa che fa' pensare questo e' l'integer rename ed il FPU point rename; a che scopo rinominare istruzioni se non le devi cambiare in qualche modo?)

si puo' vedere Zen come un dual BD, in cui le ALU di un cluster sono state accoppiate dal decode per eseguire 2 istruzioni a ciclo.
Piedone111324 Agosto 2016, 20:21 #7
Originariamente inviato da: gridracedriver
eppure segui il thread di Zen

è molto chiaro, Zen non è altro che l'architettura Core come approccio, rivista e con aggiunta di tweak vari.

ragazzi fare +40% da 100 è come fare +20% da 200. il risultato è che hai sempre un +40 assoluto.

quindi devi considerare da dove parti, e parti da excavator che è CMT, mentre sandy bridge cos' come Zen sono SMT.

Link ad immagine (click per visualizzarla)

come vedi skylake è +58% MEDIO in ST su excavator.


Vabbe, se non capisci l'ironia non ne ho colpa.
Comunque il valore di ipc è un dato statistico, e non è matematica (come la media di dati)
La statistica non è scienza
Piedone111324 Agosto 2016, 20:46 #8
Originariamente inviato da: lucusta
normalizzato sulla frequenza (IPC)?
perche' mi sembra davvero tanto su int e FPU, evitando di usare le SIMD.
davo piu' o meno un +15-20%.

per chi invece critica sempre e comunque, se invece di farlo si leggessero le slide, si capirebbe anche il perche'.
l'aumento rispetto ad excavator deriva semplicemente dal fatto che ora usa SMT, e fa' 2 thread simultanei rispetto a uno (in realta' il 40% in piu' non e' probabilmente IPC, ma istruzioni totali, in quanto gira a frequenze piu' basse, di 3/4; diversamente avrebbero la stessa computazione finale tra' un quad ed un octacore).
nulla di piu', nulla di meno di quello che fa' intel da SB.
(e HT non e' SMT, ma si puo' sommare a questo).

di queste slide a me interessa principalmente la parte "Aggresive clock gating with multi-livel regions", che indica probabilmente che se gira con un solo core avra' una frequenza alta, con due un po' piu' bassa, con 4 ancora piu' bassa e con 8 si piazzerà a 2.8/3.2ghz, sempre rimanendo in un power limit dato dal TDP;
con queste premesse in single thread dovrebbe clockare a 4.0ghz per stare dietro ad un 6700K che ragiunge i 4.2 in turbo, a 3.6-3.7 per ugualiarlo in quad thread e anche se facesse 3ghz con tutti gli 8 core attivi, andrebbe il 40% in piu' (ecco la corsa di kaby lake ai 6 core nel mainstream).
non credo che inizialmente saranno quelle le frequenza (piu' propenso a pensare a 2.8x8/3.2x4/3.4x2/3.6x1 per rimanere sotto i 95W nell'uso normale e non sotto torture test, il che lo farebbe confrontare, in perdita, con un 6700), ma... processori a 140W si possono sempre tirare fuori, non sono certo uno scandalo, e una BE uno se la dovrebbe anche aspettare.

in pratica con 4 thread non sfigurerà, ed i monothread sono comunque garantiti con un'esecuzione ai giusti livelli, mentre nei programmi adatti puo' sfruttare tutte le risorse a disposizione, rendendolo molto piu' versatile delle CPU attuali.
se poi si da' retta ai grafici, sapere che a pari frequenza consuma la metà, mentre mantiene la stessa efficienza per ciclo di excavator garantendone il 40% in piu', fa' capire che ci hanno messo il doppio delle cose, e che questa volta sono in grado di usarle come fa' intel (altra cosa che fa' pensare questo e' l'integer rename ed il FPU point rename; a che scopo rinominare istruzioni se non le devi cambiare in qualche modo?)

si puo' vedere Zen come un dual BD, in cui le ALU di un cluster sono state accoppiate dal decode per eseguire 2 istruzioni a ciclo.


Non c'ho capito una parola, ma:
Non sappiamo se quel +40% sia riferito all'ipc ST, o all'ipc per core (quindi core0 + core1), alla velocità di clock, al prapporto performance watt, alle pere della nonna o alle banane del fruttivendolo. Si presume che si tratti di ipc (e l'ipc si misura in istruzioni per clock su singolo th) altrimenti potrebbero essere Gflops o qualche altro valore.
Una cosa però che dimentichi di considerare (non so se dimentichi o vuoi coscientemente dimenticare) è che BD aveva 8 core int, ma solo quattro fpu.
Dalle mie parti, ma anche come recitava una vecchia pubblicità, si dice che dos is mejo che one, guia questo da solo dovrebbe permettere un ipc superiore del 25% sul singolo th.
Quindi l'ipc medio in st deve essere almeno il 25% più alto di excavator.
Magari mi sbaglio, sia ben chiaro, ma penso che Intel al contrario dei suoi utenti non dorme tranquilla, sopratutto considerando che (da mie personali fonti interne in intel) gli RMA dei 6700k sono 10 volte superiori a quelle delle precedenti cpu k, segnale che sono al limite superiore della commercializzazione insieme al fatto che nelle prossime cpu contrariamente a quanto immaginabile hanno ulteriormente alzato il tdp (e non facciamo una filippica sul fatto che 97w di tdp potrebbero non essere 97w di dissipazione etc, etc)

La parte in grasseto poi non l'ho capita, ero certo che HT è il nome commerciale (e registrato) che Intel ha dato alla sua implementazione dell'smt.
Piedone111324 Agosto 2016, 20:51 #9
Originariamente inviato da: Bivvoz
Di base è perchè Intel ha affinato il tutto nel cosrso di anni mentre negli stessi anni AMD non ha fatto una cippa.


Sono anni che AMD non fa una cippa sul silicio, ma credo che gli ingegneri IBM abbiamo lavorato sodo e hanno tirato fuori cpu dal loro silicio da far paura a tutti, intel inclusa. E non lavorando su una sola tipologia di cpu ma su diverse di diverso tipo e caratteristiche, cosa che fa pensare che abbiano molta più familiarità sulle implementazioni ad alte prestazioni rispetto quelli di intel.
Guarda caso gli stessi ingegneri e la stessa fonderia (fab 8 Malta ex ibm ora GF) che dovrà produrre ZEN
MaxFabio9324 Agosto 2016, 21:24 #10
Originariamente inviato da: gridracedriver
E' molto chiaro, Zen non è altro che l'architettura Core come approccio, rivista e con aggiunta di tweak vari.


E che avranno prestazioni più elevate con la metà del prezzo. Io intanto sono arrivato a quest'anno come sempre contento, con il processore in firma e un Phenom II X6 che ancora vanno alla grande e non deludono, e non ho speso 1000€ per una CPU.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^