[Thread Ufficiale] Aspettando ZEN [Archivio] - Pagina 5

Grizlod®

28-03-2016, 14:04

monterà ddr4 2400@1200mhzIntese come max installabile, ma non è imperativo montare DIMMs @ 2400 MHz.

Se veramente, come annunciato dagli ingegneri AMD, non vi sono significativi colli di bottiglia, e l'utente non ricerca le super prestazioni da benchmark/record, non è detto che installerà DIMMs DDR4 @ 2400 MHz e/o salirà di sysbus.

Non sono a conoscenza della frequenza operativa stock del CPU/NB di Zen, ma sarà sicuramente adeguata alla CPU, senza bisogno di overclockare. Probabilmente in sede progettuale hanno risolto i problemi architetturali che aveva Bulldozer (altrimenti bisogna prenderli a pesci in faccia IMO).

Ad ogni modo, in ballo sono le due componenti (PHY/NB) che un tempo erano integrate nel northbridge saldato sulla mainboard:

http://s26.postimg.org/xtu935t1l/DDR_PHY_NB_data_flows.jpg (http://postimage.org/)

tuttodigitale

28-03-2016, 14:09

Ecco, ora mi trovo! :D Ma non capisco perchè il wattmetro misura di più... :confused:
misteri dell'ingegneria cinese :Prrr:

cerco di dare una spiegazione:
la perdita si ripercuote sul valore di tensione all'ingresso dell'alimentatore, con conseguente aumento della corrente assorbita: da qualche parte l'energia dovrà pur prenderla il PC

L'alimentatore dovrebbe essere in grado di gestire anche questa drastica riduzione della tensione di alimentazione (si passa a 150V, nel caso in cui la Ri del wattmetro fosse effettivamente quella)

Ovviamente se ci fosse un voltmetro a valle, il wattmetro potrebbe correggere l'anomalia...ma se fosse un semplice amperometro camuffato?:read: (lo stesso gridracedriver aveva dubbi sulla qualità dello strumento)

Ren

28-03-2016, 21:05

Per quelli che avevano chiesto il voltaggio degli intel, eccovi la curva di ivybridge :

http://images.anandtech.com/doci/5763/Max%20OC%20Voltage_575px.png

tuttodigitale

28-03-2016, 21:42

si l'efficienza intesa come consumo effettivo si, ma di picco inteso come TDP della cpu, sarebbe comunque 106,3/69,1 = +54% passando da [email protected] a [email protected] (e sono vcore ottimizzati, fosse anche solo [email protected] vs [email protected] il divario sarebbe ancora più ampio)

Non fare il furbo

conta che da 4 a 3ghz mediamente raddoppi quasi l'efficienza di una cpu
Ps il confronto ovviamente va fatto mele vs mele, quindi entrambi con vcore ottimizzati, e ci mancherebbe

Una c@zzat@ nel forum la DOVEVI comunque sparare. Benvenuto nel club :sofico: (il rischio è che anche bjt2 venga contagiato :stordita: )

mi spiegheresti i calcoli che hai fatto? :help:
Le mie conoscenze di elettrotecnica ti hanno impressioinato :sbonk: o credi (più probabile) che ci sia un errore e vuoi smascherarlo?:ncomment: :grrr: :

@REN
perfetto ora ho la "certezza" che ZEN possa avere un turbo core abbondantemente oltre i 4 GHz :D

digieffe

28-03-2016, 22:37

credo che abbiate un malinteso tra "efficienza e consumo" ovvero da 3 a 4 ghz il consumo raddoppia e l'efficienza diminuisce dal' ~8 al ~15% a seconda dei casi :)

Ren

28-03-2016, 23:35

@REN
perfetto ora ho la "certezza" che ZEN possa avere un turbo core abbondantemente oltre i 4 GHz :D

Il problema non è la frequenza, ma il consumo\temp per il clock base.

Sempre dalla stessa analisi, il consumo passa da 115 a 185 con picchi di +200w dettati da una temperatura fuori controllo che fa schizzare il leakage.

Sopra 1.1v le temperature decollano alla svelta...

Come volevasi dimostrare i finfet sono già al limite ad 1 volt. (0.8 è l'ideale)

credo che abbiate un malinteso tra "efficienza e consumo" ovvero da 3 a 4 ghz il consumo raddoppia e l'efficienza diminuisce dal' ~8 al ~15% a seconda dei casi :)

Sul finfet è peggio. Stimando i TDP intel, passa da 10-11 a 20-22w per un salto del 33% di frequenza.

paolo.oliva2

29-03-2016, 00:18

Il problema non è la frequenza, ma il consumo\temp per il clock base.

Sempre dalla stessa analisi, il consumo passa da 115 a 185 con picchi di +200w dettati da una temperatura fuori controllo che fa schizzare il leakage.

Sopra 1.1v le temperature decollano alla svelta...

Come volevasi dimostrare i finfet sono già al limite ad 1 volt. (0.8 è l'ideale)

Sul finfet è peggio. Stimando i TDP intel, passa da 10-11 a 20-22w per un salto del 33% di frequenza.

Credo sia impossibile confrontare il 14nm GF vs il 14nm Intel senza conoscere l'esatto Vcore/frequenza del 14nm GF. Facendo un esempio, il mio 5500U necessita di 1,155V per 3GHz (ed essendo mobile, presumo che abbia il Vcore più basso possibile per la stessa frequenza vs un desktop), magari il 14nm GF potrebbe raggiungere i 3GHz a 0,8V (sparo), quindi confrontare lo stesso comportamento considerando solamente la tensione, non mi sembra possibile.

Poi volevo aggiungere una cosa... quello che sappiamo è che AMD punterà su un X8+8 con Zen con il modello desktop. Mi sembra commercialmente corretto ipotizzare che AMD in primis cercherà di essere competitiva vs il socket 1155 (che rappresenta la stragrande maggioranza del desktop). Se AMD/GF avessero problemi di frequenza/TDP, che senso avrebbe un X8+8 a frequenza bassa quando per competere vs un 6700k basterebbe già un Zen X6+6? Meglio produrre un Zen X6 nativo (quindi pure meno costoso) e da X6 fare i multipli per server... perchè comunque un X8+8 di partenza penalizzato in frequenza segherebbe comunque anche un multiplo di X8 (X16/X32) poichè avrebbe frequenze ancor più basse. Ad esempio... da un BD FX 4GHz desktop, si passa ad un Opteron X16 2,7/2,8GHz. Se un Zen X8 dovesse avere frequenze sotto i 3GHz, vorrebbe dire che un Opteron Zen X16 avrebbe una frequenza def attorno ai 2GHz... quindi il +65% di incremento IPC di Zen su PD sarebbe penalizzato da un -40% di frequenza? E avrebbe senso parlare di 32 core? A che frequenza? da idle BD?

Poi... da qualche parte avevo letto che il 14nm GF avrebbe un Vcore di gran lunga inferiore rispetto al 32nm SOI.
Un 5500U necessita di 1,155V per 3GHz, Isoman con il 32nm SOI a 3GHz necessita solamente di 0,005V in più... certamente il 14nm Intel ha un TDP basso, ma non mi sembra basso il Vcore in rapporto alla frequenza.

Ren

29-03-2016, 00:33

Credo sia impossibile confrontare il 14nm GF vs il 14nm Intel senza conoscere l'esatto Vcore/frequenza del 14nm GF. Facendo un esempio, il mio 5500U necessita di 1,155V per 3GHz (ed essendo mobile, presumo che abbia il Vcore più basso possibile per la stessa frequenza vs un desktop), magari il 14nm GF potrebbe raggiungere i 3GHz a 0,8V (sparo), quindi confrontare lo stesso comportamento considerando solamente la tensione, non mi sembra possibile.

Il 14nm di intel è il migliore, punto:( . Più denso e veloce(del 15% si stima).

Io non volevo avanzare nessun confronto, ho postato soli i dati richiesti.

Per il resto il trend sui finfet è noto da parecchio. Le prestazioni miracolose sono solo sui bassi voltaggi.

paolo.oliva2

29-03-2016, 08:54

Il 14nm di intel è il migliore, punto:( . Più denso e veloce(del 15% si stima).

Io non volevo avanzare nessun confronto, ho postato soli i dati richiesti.

Per il resto il trend sui finfet è noto da parecchio. Le prestazioni miracolose sono solo sui bassi voltaggi.

Sbaglio o il processo 14nm finfet GF dovrebbe essere LPe e non LP?

Facendo un confronto sul 14nm Intel... si ipotizza che dai 3GHz di un 5960X il 14nm possa concedere 3,5GHz sempre a 140W TDP. AMD ha postato Zen X8 a 95W TDP. Che frequenza avrebbe un 5960X 14nm (ammesso e concesso che il 14nm possa spingerlo a 3,5GHz) ma a 95W TDP? credo sia già ottimistico ipotizzare 2,5GHz. Se il 14nm GF fosse peggiore, Zen X8 desktop che frequenza avrebbe? 2GHz? Sarebbe invendibile... (a parte che pur con il +65% di IPC su PD e pure l'SMT, con una frequenza dimezzata rispetto ad un 8350, sarebbe già un miracolo che offrirebbe la stessa potenza di un 8350... qualche cosa non torna.

E' anche vero che con BD AMD aveva sempre dichiarato 95W, poi è successo quello che è successo... ma quello che non riesco a comprendere, è che se il 14nm GF fosse miracoloso solo fino a determinati voltaggi, tanto varrebbe che AMD non tiri fuori Zen X86 ma direttamente APU, così da coprire immediatamente la parte mobile e stravolgere quella server, perchè ambedue le varianti in comune hanno la massima efficienza in termini di consumi vs prestazioni (il mobile in primis, poi il discorso server trova la potenza perchè con il minimo TDP a core può aumentare il numero dei core). Che senso avrebbe allora che AMD commercializzi subito Zen come desktop se il 14nm finfet non raggiungerebbe le frequenze desktop proprio per tipologia silicio?

bjt2

29-03-2016, 09:35

Il 14nm di intel è il migliore, punto:( . Più denso e veloce(del 15% si stima).

Io non volevo avanzare nessun confronto, ho postato soli i dati richiesti.

Per il resto il trend sui finfet è noto da parecchio. Le prestazioni miracolose sono solo sui bassi voltaggi.

Questo indica che la Vt (tensione di soglia) è bassa, perchè il leakage va esponenzialmente come exp (Vcore/Vt) e come exp(Tcore), quindi all'aumentare della tensione la corrente assorbita esplode ed essendo la Vt più bassa esplode prima... Ma Vt più bassa significa anche molto più guadagno di corrente a parità di tensione, ossia serve meno tensione per la stessa frequenza a parità di FO4, anche considerando la transconduttanza dei transistors probabilmente migliorata dato il canale più piccolo e la struttura 3D. Quindi se la Vt è ad esempio 0,2V più bassa, anche se la transconduttanza fosse la stessa, si avrebbe che un ipotetico BD andrebbe a 4GHz con ALMENO 0,2V in meno, con tutto quello che ne consegue sul consumo... Quindi per avere consumi umani, si devono abbassare di 0,2V i Vcore umani... Poichè dal grafico di Ren si deduce che oltre 1,3V sul processo Intel non è consigliabile andare, supponiamo che il processo Samsung sia peggio e la tensione max sia 1,2V. Mi servirebbe sapere la Vt del processo 32nm SOI, 28nm Bulk e 14nm FF... :D Così possiamo fare due calcoli... Se ho tempo li cerco io... :D

digieffe

29-03-2016, 11:38

Sbaglio o il processo 14nm finfet GF dovrebbe essere LPe e non LP?

Facendo un confronto sul 14nm Intel... si ipotizza che dai 3GHz di un 5960X il 14nm possa concedere 3,5GHz sempre a 140W TDP. AMD ha postato Zen X8 a 95W TDP. Che frequenza avrebbe un 5960X 14nm (ammesso e concesso che il 14nm possa spingerlo a 3,5GHz) ma a 95W TDP? credo sia già ottimistico ipotizzare 2,5GHz. Se il 14nm GF fosse peggiore, Zen X8 desktop che frequenza avrebbe? 2GHz? Sarebbe invendibile... (a parte che pur con il +65% di IPC su PD e pure l'SMT, con una frequenza dimezzata rispetto ad un 8350, sarebbe già un miracolo che offrirebbe la stessa potenza di un 8350... qualche cosa non torna.

"credo sia già ottimistico ipotizzare 2,5GHz", no se fosse 140w a 3,5, a 95w andrebbe tranquillamente a 2,9-3,0ghz

tuttodigitale

29-03-2016, 12:58

ne ho detto altre ben più grosse in passato :asd:
le mie perle di saggezza non tardano ad arrivare :ciapet:
ho omesso un doppio prodotto nelle prime equazioni....(si il procedimento non è cortissimo, anche se banale)

EDIT
ti ho spedito un MP

digieffe

29-03-2016, 13:17

cut

ehmmm... no :)

...

in effetti io intendevo tutt'altro errando... :(

tuttodigitale

29-03-2016, 18:05

Il problema non è la frequenza, ma il consumo\temp per il clock base.
Personalmente avevo (ho) dubbi anche sulla frequenza turbo. Avevo ipotizzato 4,7GHz a 1,1V, a vedere quei valori, c'è il serio rischio che sia stato persino troppo conservativo (Sempre nell'ipotesi di FO4 uguale a XV)....
4,7GHz default per un quad-core potrebbe non essere fuori dal mondo.:sofico: , da valutare la complessità di un core ZEN, ma per quello c'è bjt2.

Sempre dalla stessa analisi, il consumo passa da 115 a 185 con picchi di +200w dettati da una temperatura fuori controllo che fa schizzare il leakage.
la temperatura dipende fortemente dal vcore e ZEN potrebbe girare a vcore ridicoli

Rispetto al passato recente, vedi 32 e 28nm, i 14nm permettono di ridurre, a parità di condizioni, la densità per unità di superficie della potenza del 20% (mi mantengo basso)...e questo potrebbe certamente dare una mano nel cercare un qualcosa in più nel singolo transistor.

paolo.oliva2

29-03-2016, 18:19

"credo sia già ottimistico ipotizzare 2,5GHz", no se fosse 140w a 3,5, a 95w andrebbe tranquillamente a 2,9-3,0ghz

Dici? Il 6700K ha guadagnato il 15% di frequenza lforse aumentando di qualche cosa il TDP. Mantenere le stesse frequenze di un 5960X e nel contempo abbassare il TDP a 95W, significherebbe guadagnare un 35%.
Mi sembra alto considerando il 15% di un 6700K.

Guardando il mio Broadwell vs l'altro Intel a 22nm, è vero che ha guadagnato 500MHz a parità di TDP, ma comunque parliamo di X2... la piattaforma i7 2011 è più esosa...

Ren

29-03-2016, 19:09

Personalmente avevo (ho) dubbi anche sulla frequenza turbo. Avevo ipotizzato 4,7GHz a 1,1V, a vedere quei valori, c'è il serio rischio che sia stato persino troppo conservativo (Sempre nell'ipotesi di FO4 uguale a XV)....
4,7GHz default per un quad-core potrebbe non essere fuori dal mondo.:sofico: , da valutare la complessità di un core ZEN, ma per quello c'è bjt2.

Speriamo;) . Hai visto quanto voltaggio in più vuole carrizo(0.2:doh: ) rispetto a kaveri per girare sui 3.5 ?

Sopra i 3ghz si siede velocemente con le HDL, bruciando tutto il vantaggio in efficienza per dei miseri 500-800mhz...

Riporto i valori (ibt delta watt, così eliminiamo il turbo) della review che avete postato :

Carrizo 3ghz 28w (1.175v)
3.5-3.8 78w (1.43v)

Kaveri 3ghz 55w (1.175)
3.5-3.8 76w (1.25)

paolo.oliva2

29-03-2016, 22:13

Speriamo;) . Hai visto quanto voltaggio in più vuole carrizo(0.2:doh: ) rispetto a kaveri per girare sui 3.5 ?

Sopra i 3ghz si siede velocemente con le HDL, bruciando tutto il vantaggio in efficienza per dei miseri 500-800mhz...

Riporto i valori (ibt delta watt, così eliminiamo il turbo) della review che avete postato :

Carrizo 3ghz 28w (1.175v)
3.5-3.8 78w (1.43v)

Kaveri 3ghz 55w (1.175)
3.5-3.8 76w (1.25)
Praticamente nei 3GHz allo stesso Vcore Carrizo dimezza praticamente il TDP.
Invece per i 3,5/3,8GHz ha un pelo in più di TDP massimo nonostante 0,18V in più.
Ok che il Vcore sale esponenzialmente, ma comunque non porta una esplosione del TDP (rispetto a Kaveri, Carrizo vs Carrizo si).

Bisognerà vedere quale frequenza ottimale potrà concedere il 14nm finfet... perchè 3GHz comunque non sarebbero male se poi Zen fosse 95W X8, perchè ci sarebbe lo spazio per un X12 a 3GHz e/o un X8 che con un margine di 45W potrà salire di frequenza.

tuttodigitale

29-03-2016, 23:30

@REN
infatti se Carrizo avesse avuto la possibilità di girare a 4GHz+ con <1,2V, avrebbe raggiunto efficienze molto alte anche alle alte frequenze...invece...

se davvero il processo produttivo Samsung mettesse ZEN nelle condizioni di lavorare a poco più di un volt a 4GHz+, potrebbe davvero succedere un Hammer-BIS :O

paolo.oliva2

29-03-2016, 23:42

Io la paura che ho è che AMD pure con BD aveva dato la notizia di un BD X8 95W TDP... ed anche quella volta AMD si è abbottonata e non faceva trapelare nulla.

Ma... il problema principale di AMD rimane sempre il silicio... se il silicio c'è, allora architetturalmente non ha nessun problema... anche XV sarebbe super competitivo... Ma CMT, SMT, e pippo/pluto/paperino non contano una mazza se poi il silicio ti fa perdere il 90% di efficienza.

Non mi è chiara sta faccenda di Zen X86 settembre 2016 e dopo solamente 4 mesi (mese + mese -) Zen APU. Sarebbe come se GF avesse realizzato un PP per Zen X86 e gli APU un altro... Potrebbe essere che abbiano PP differenti? Uno a più frequenza e l'altro più al TDP? Altrimenti non si spiegherebbe... in fin dei conti AMD ultimamente ha sempre dato priorità agli APU... ed un silicio non affinato, prendendo come caratteristiche 14nm finfet, penso risulti più facile ricercare il minimo TDP a frequenze che comunque ben si aggradano al mobile. Quindi mi sembra una vaccata un Zen X86, in anticipo su APU, se poi il 14nm fuinfet avesse problemi di frequenze massime...

Ren

30-03-2016, 00:40

Facendo un esempio, il mio 5500U necessita di 1,155V per 3GHz

Mi sono dimenticato di scrivere che lo stock voltage è appunto 1.140-1.155 ed il grafico tiene conto del under-volting su cpu scelta.

cmq ecco il resto del articolo, dove ci sono altri grafici interessanti.

http://www.anandtech.com/show/5763/undervolting-and-overclocking-on-ivy-bridge

paolo.oliva2

30-03-2016, 07:55

post doppio, sorry

paolo.oliva2

30-03-2016, 08:05

Mi sono dimenticato di scrivere che lo stock voltage è appunto 1.140-1.155 ed il grafico tiene conto del under-volting su cpu scelta.

cmq ecco il resto del articolo, dove ci sono altri grafici interessanti.

http://www.anandtech.com/show/5763/undervolting-and-overclocking-on-ivy-bridge

Bisogna tenere conto anche di altre cose.
Intel, a parte il 6700K offerto a 4GHz, ha un range di frequenza sui 3GHz/3,5GHz. E' ovvio che Intel ricerchi l'affinamento silicio su questo range di frequenza, quindi non ci è possibile capire perfettamente quanto lo scaling del 14nm Intel Vcore/frequenza dipenda da un limite fisico o da un limite affinamento per determinate frequenze inquadrato da Intel.

Oltre a questo, un altro esempio è che un 8350/8370, con Vcore ottimizzati, possa equivalere per TDP/frequenza un 6700K. Mi sembra ovvio che la risposta non sia che il 32nm SOI equivalga il 14nm Intel, ma perchè sono architetture differenti con frequenze/TDP differenti.

Se GF avesse il 14nm Intel (ipotizzo), credo che comunque a parità di TDP l'architettura AMD (che sia XV che Zen) concederebbe comunque una frequenza superiore alla controparte Intel, e ovviamente l'affinamento GF avrebbe frequenze diverse su cui incentrare lo sforzo.

el-mejo

30-03-2016, 10:45

così come dicevano che l'ipc sarebbe stato del +20% sul phenom se per quello quando in realtà se spegnevi un integer per modulo era lo stesso ipc :D

a questo punto data la scelta dell'smt e a vedere il core nel complesso colli grossolani non ci dovrebbero essere e sono uscite pure notizie a riguardo mesi fa era fine 2015 o prima ancora, resta da vedere se il debug è passato liscio o meno, ma toppare nell'ipc mi sembra l'ultimo dei problemi in effetti

sul discorso tdp/silicio, ho paura che i 95watt per X8 non li vedremo affatto, più probabile i 125 o addirittura i 140, ma è una mia supposizione non ci sono news a riguardo.

per il discorso apu, amd ha dichiarato apertamente di tornare a concorrere nel settore server e che conta, per tanto gli sforzi principali sono incentrati su x86 da almeno 8~16 core a salire

per la famosa apu hpc per me se ne riparlerà nel H2-2017, quindi Q3-Q4 e non prima, tieni presente che sarà un die monolitico più grande del x86 liscio, con tutto ciò che ne consegue in termini di rese, ecc

I 14nm se non sbaglio sono i primi FinFet di Samsung, inizialmente saranno grezzi come rese e prestazioni ma si affineranno durante il loro ciclo vitale.

Probabilmente sarà come con i 45nm e i Phenom II:

Gennaio 2009 : Phenom II x4 940 @ 3ghz / 125w tdp (su Am2+)

Agosto 2009: Phenom II X4 965 @ 3,4ghz /140w tdp

Novembre 2009: Phenom II X4 965 @ 3,4ghz /125w tdp

Aprile 2010 : Phenom II X6 1090T @ 3,2ghz / 125w tdp

Gennaio 2011: Phenom II X4 975 Black Edition @ 3,6ghz /125w tdp

Imho la vera bomba non sarà Zen ma Zen+, sopratutto se produranno e commercializzeranno un Die 12+12 nativo su un 14nm rodato!

tuttodigitale

30-03-2016, 12:29

per la famosa apu hpc per me se ne riparlerà nel H2-2017, quindi Q3-Q4 e non prima, tieni presente che sarà un die monolitico più grande del x86 liscio, con tutto ciò che ne consegue in termini di rese, ecc
Tra tutti i modelli hai preso proprio quello che potrebbe fare a meno del die monolitico, per la presenza obbligatoria dell'interposer..:D
io sapevo, che potrebbe essere comercializzato nel q1....

sul discorso tdp/silicio, ho paura che i 95watt per X8 non li vedremo affatto, più probabile i 125 o addirittura i 140, ma è una mia supposizione non ci sono news a riguardo.
sei controcorrente con gli ultimi rumors che vogliono il debutto del x8 95W ad Ottobre.

Spero che ti sbagli.

Mister D

30-03-2016, 12:36

I 14nm se non sbaglio sono i primi FinFet di Samsung, inizialmente saranno grezzi come rese e prestazioni ma si affineranno durante il loro ciclo vitale.

Probabilmente sarà come con i 45nm e i Phenom II:

Gennaio 2009 : Phenom II x4 940 @ 3ghz / 125w tdp (su Am2+)

Agosto 2009: Phenom II X4 965 @ 3,4ghz /140w tdp

Novembre 2009: Phenom II X4 965 @ 3,4ghz /125w tdp

Aprile 2010 : Phenom II X6 1090T @ 3,2ghz / 125w tdp

Gennaio 2011: Phenom II X4 975 Black Edition @ 3,6ghz /125w tdp

Imho la vera bomba non sarà Zen ma Zen+, sopratutto se produranno e commercializzeranno un Die 12+12 nativo su un 14nm rodato!

Non penso proprio che il processo bulk finfet abbia lo stesso miglioramento del SOI che ha sempre avuto il CTI (continuum transistor improvement) come tanta decantata capacità intrinseca. Anche vedendo intel il bulk nasce con delle caratteristiche e se mai devi poi farne proprio un altro step produttivo. Il soi anche all'interno delle stesso step migliora, tanto che gli ultimi esemplari di FX 8350 tengono quasi le stesse tensioni degli fx8320e/fx8370e/fx8370 con silicio con più layer metallici.
Però spero di essere contraddetto da qualcuno o dai fatti:sofico:

digieffe

30-03-2016, 13:47

sul discorso tdp/silicio, ho paura che i 95watt per X8 non li vedremo affatto, più probabile i 125 o addirittura i 140, ma è una mia supposizione non ci sono news a riguardo.

2 conti dozzinali:
prendendo XV da 28w@3ghz e pareggiando 1 modulo ad 1 core di Zen,
abbiamo che un 8 core Zen a 28nm@3ghz consuma senza L3 112w, diciamo pure 125w tutto compreso.

ora con un processo produttivo avanti di 2 nodi (da 28 a 14nm, ma due nodi pessimi tanto da rendere per uno) + il finfet, il consumo si abbatte, a frequenze vicino alle ottimali, almeno al 70%, che di 125 è 87,5w.

Zen X8 3ghz in 95w c'è tutto.

il problema è quando triplica il consumo da 3 a 3,5ghz!!!

tuttodigitale

30-03-2016, 16:12

Più postate dati relativi a Carrizo e più sono convinto che ZEN farà il botto. State alimentando indirettamente le mie aspettative :eek:

tuttodigitale

30-03-2016, 17:38

riprendendo i conti di @tuttodigitale sulla perdita del wattmetro

avresti dovuto usare le formule che ti ho fornito. Questi dati devi considerarle Perle (== CAZZATE). In settimana (o stasera chi lo sa) rifaccio i calcoli.

PS Ho il sospetto che tu lo faccia apposta, a rimarcare i miei errori :stordita: (detto da me, fa ridere :))

Adesso lo sanno tutti che non sono un genio :sbonk: :ciapet: . Mi hai smascherato :cry:

el-mejo

30-03-2016, 17:39

Non penso proprio che il processo bulk finfet abbia lo stesso miglioramento del SOI che ha sempre avuto il CTI (continuum transistor improvement) come tanta decantata capacità intrinseca. Anche vedendo intel il bulk nasce con delle caratteristiche e se mai devi poi farne proprio un altro step produttivo. Il soi anche all'interno delle stesso step migliora, tanto che gli ultimi esemplari di FX 8350 tengono quasi le stesse tensioni degli fx8320e/fx8370e/fx8370 con silicio con più layer metallici.
Però spero di essere contraddetto da qualcuno o dai fatti:sofico:

Non c'erano stati affinamenti sui 22nm da Haswell a Haswell refresh (4770k vs 4790k), al netto del miglioramento dell'HIS e del tdp leggermente aumentato?

E restando sul bulk, seppur non finfet, anche il chip Thaiti dalla prima 7970 alla r9 280x ha avuto miglioramenti, seppur non eclatanti.

E riguardo i layer metallici degli fx8320e/fx8370e/fx8370 avete altre info a riguardo? E perchè quei mentecatti non hanno pubblicizzato questa cosa?:doh:
Passino le versioni da 95w, ma il 8370 l'ho sempre visto come una presa in giro con il 8350 a 30€ in meno...

tuttodigitale

30-03-2016, 17:59

ho usato le tue formule e mi veniva 52.5w :stordita:
P=(2*i_delta*i_idle + i_delta^2)*R , con R=90

controlla la R, è da li che ho scoperto che c'era qualcosa che non andava, poi ho preso il mio bel pezzo di carta e ho realizzato, che sono troppo vecchio per elaborare senza l'aiuto dell'inchiostro.

La formula è questa: R= P/(2*i_delta*i_idle + i_delta^2) con P=61 (per calcolarti la i_delta dovresti prendere quale riferimento la i_full del fx8350 stock)

tuttodigitale

30-03-2016, 19:03

ho usato le tue formule e mi viene 50.47w usando p.full 179w e p.idle 70w, da li ho ricavato le varie "I" :stordita:
P=(2*i_delta*i_idle + i_delta^2)*R , con R=90
allora sono andato per logica :sofico: e l'ho moltiplicato per 0.495 :banned: come se da qualche parte ci fosse questo fattore di troppo rispetto agli altri P.perse
neanche a farla apposta, hai dimezzato la resistenza applicando le formule che ti ho fornito. Ho il sospetto che gli errori si siano annullati che botta di :sofico:

la P.persa scala allo stesso modo e quindi per nulla in modo lineare ma esponenziale

mi pare normale, la potenza dissipata per effetto joule è pari al quadrato della corrente...

ho spedito mp

PS ma nel manuale del wattmetro per caso non è riportato il valore della resistenza interna?....

Mister D

30-03-2016, 19:04

]Non c'erano stati affinamenti sui 22nm da Haswell a Haswell refresh (4770k vs 4790k), al netto del miglioramento dell'HIS e del tdp leggermente aumentato?[/B]

E restando sul bulk, seppur non finfet, anche il chip Thaiti dalla prima 7970 alla r9 280x ha avuto miglioramenti, seppur non eclatanti.

E riguardo i layer metallici degli fx8320e/fx8370e/fx8370 avete altre info a riguardo? E perchè quei mentecatti non hanno pubblicizzato questa cosa?:doh:
Passino le versioni da 95w, ma il 8370 l'ho sempre visto come una presa in giro con il 8350 a 30€ in meno...

Prova a rileggere, pensavo di essere stato chiaro. Il SOI con il CTI porta miglioramenti anche se il silicio non subisce step o modifiche: vedi gli ultimi FX8350 che reggono meglio le frequenze con meno vcore fino quasi ad avvicinarsi ai king vishera (quei tre). Considera che mi pare Isomen abbia un fx8370 o fx8370E che regge i 4 Ghz con 1,16volt. Prova te un fx8350 o fx8320 a vedere se parte con quella tensione. Per dire che effettivamente qualcosa di nuovo nel silicio devono averlo fatto.
Per i layer metallici in più l'avevo letto su bitandchips e la fonte era estera, non mi ricordo se era un forum di oc o no.
Anche il passaggio tra phenomII 965 c3 e 975/980 sempre c3 (non è cambiato nulla apparentemente) però ha garantito qualche centinaia di MHz in più senza step. I phenomII x6 invece avevano step E0 (con le bollicine d'aria by IBM) altrimenti con il cavolo che ci regalavano un X6 con quelle frequenze e quel tdp;)

Per il bulk invece haswell - haswell refresh è proprio una bella revisione con step nuovo di silicio sia per aumentare le frequenze in oc e no (+ pasta del capitano raffinata + condensatori migliorati nel package cpu) sia per aumentare le rese dello stesso pp. Se prendi invece uno stesso modello appartenente ad uno stesso step vedrai che i risultati sono sempre gli stessi e anzi alcune volte leggendo sui thread intel ho pure visto di diversi utenti che lamentavano che i primi esemplari andavano pure meglio degli ultimi, a riprova che il silicio bulk per me non ha il CTI.

Anche per le gpu vale lo stesso, il silicio tra 7970, r9 280x, r9 290x e r9 390x è cambiato, non solo come step ma mi sembra anche come tipo (non mi chiedere quali delle sigle di tutti quei 28 di TMSC perché non lo so e non lo voglio mettere a memoria:D )

Per me quindi il bulk richiede proprio uno step successivo (che non vuol dire passaggio a nodo più avanzato) per introdurre miglioramenti affinamenti mentre il SOI anche a parità di step con il tempo migliorava le proprietà elettriche detto CTI.

EDIT:
http://www.xtremesystems.org/forums/showthread.php?289461-A-little-birdie-told-me/page3

bjt2

30-03-2016, 20:16

allora, test 8320e 1.14v 3.7ghz

idle= 90->65 watt HUMonitor 33w
occt= 208->179 watt HUMonitor 74w
cb15= 178->148 watt HUMonitor 60w

differenze idle-occt= 114 watt
differenze idle-cb15= 83 watt

riprendendo i conti di @tuttodigitale sulla perdita del wattmetro

abbiamo che:

test------3.7GHz 1,14V----4GHz 1,25V
occt------0,495A-----------0,664A
P.Persa--25,0W------------39,7W

delta idle-load occt
totale-----118w-------------146w
cpu--------93w-------------106,3w

per @bjt2: +14.3% di efficienza da [email protected] a [email protected] in OCCT :read:
devo arrivare a +25% giusto? proverò a scendere a 3.5ghz con 1.10v o poco più

...se non ho sbagliato il calcolo della perdita dovuto al wattmetro

Se i calcoli non sono errati vuol dire che l'impennata di frequenza non comporta un aumento di potenza cubica, ma inferiore, anche a quella quadratica!

Dimostrazione: per un +8% di frequenza serve un +14.3 di potenza. Per la relazione quadratica, a un +8% di frequenza corrisponderebbe a poco meno del +17% di incremento di potenza.

Com'è possibile? Ricordiamo che i transistors hanno una tensione di soglia Vt che è più o meno costante, mentre quello che deve aumentare all'aumentare della frequenza è la parte in più oltre la soglia. Qui siamo in un punto di funzionamento in cui le componenti esponenziali non sono ancora esplose, tanto è vero che le cpu che avete salgono ben oltre i 4 GHz, e quindi l'incremento è addirittura inferiore al quadrato, ma ovviamente superiore al fattore lineare, perchè avete dovuto incrementare il Vcore...

Arrivare al 25% a questo punto è una curiosità giusto per vedere quanto siamo sotto al punto critico.
Quello che è importante è che un processo più avanzato ha una Vt minore, una transconduttanza maggiore e quindi a parità di FO4 e frequenza richiede una tensione inferiore, cosa che allontana ulteriormente il punto di esplosione delle correnti.

Se Zen ha lo stesso FO4 di BD, prevedo che arrivi a 4GHz attorno a 1V, max 1.1V (considerando che in stock si prendono dei margini sulle tensioni), con una potenza assorbita per un X8 circa pari a questa di 4 moduli, forse un po' meno se la CPU che è stata usata come confronto non ha l'HDL... Insomma... I margini per un Zen x8 4GHz 95W @1.05V ci sono. Se non sarà 95W e/o sarà meno di 4Ghz potrà essere per vari motivi:
1) processo ancora non maturo e/o che non guadagna il 50% rispetto al 32nm SOI
e/o
2) numero di transistors di Zen superiore a quello di un modulo BD
e/o
3) FO4 superiore a quello di BD

Mister D

30-03-2016, 20:24

Se i calcoli non sono errati vuol dire che l'impennata di frequenza non comporta un aumento di potenza cubica, ma inferiore, anche a quella quadratica!

Dimostrazione: per un +8% di frequenza serve un +14.3 di potenza. Per la relazione quadratica, a un +8% di frequenza corrisponderebbe a poco meno del +17% di incremento di potenza.

Com'è possibile? Ricordiamo che i transistors hanno una tensione di soglia Vt che è più o meno costante, mentre quello che deve aumentare all'aumentare della frequenza è la parte in più oltre la soglia. Qui siamo in un punto di funzionamento in cui le componenti esponenziali non sono ancora esplose, tanto è vero che le cpu che avete salgono ben oltre i 4 GHz, e quindi l'incremento è addirittura inferiore al quadrato, ma ovviamente superiore al fattore lineare, perchè avete dovuto incrementare il Vcore...

Arrivare al 25% a questo punto è una curiosità giusto per vedere quanto siamo sotto al punto critico.
Quello che è importante è che un processo più avanzato ha una Vt minore, una transconduttanza maggiore e quindi a parità di FO4 e frequenza richiede una tensione inferiore, cosa che allontana ulteriormente il punto di esplosione delle correnti.

Se Zen ha lo stesso FO4 di BD, prevedo che arrivi a 4GHz attorno a 1V, max 1.1V (considerando che in stock si prendono dei margini sulle tensioni), con una potenza assorbita per un X8 circa pari a questa di 4 moduli, forse un po' meno se la CPU che è stata usata come confronto non ha l'HDL... Insomma... I margini per un Zen x8 4GHz 95W @1.05V ci sono. Se non sarà 95W e/o sarà meno di 4Ghz potrà essere per vari motivi:
1) processo ancora non maturo e/o che non guadagna il 50% rispetto al 32nm SOI
e/o
2) numero di transistors di Zen superiore a quello di un modulo BD
e/o
3) FO4 superiore a quello di BD

E con questi ragionamenti direi proprio che ci siamo giocati un andamento lineare dei prossimi 6 mesi che ci attendono per l'arrivo di Zen:sofico:
Sento già il rumore di tastiere, Paolo che costruisce altre due camere sotto terra per ampliare il raffreddamento per i futuri Zen:sofico: Insomma sento proprio le urla delle scimmie che reclamano nuove cpu:D

digieffe

30-03-2016, 20:48

Se i calcoli non sono errati vuol dire che l'impennata di frequenza non comporta un aumento di potenza cubica, ma inferiore, anche a quella quadratica!

Dimostrazione: per un +8% di frequenza serve un +14.3 di potenza. Per la relazione quadratica, a un +8% di frequenza corrisponderebbe a poco meno del +17% di incremento di potenza.

Com'è possibile? Ricordiamo che i transistors hanno una tensione di soglia Vt che è più o meno costante, mentre quello che deve aumentare all'aumentare della frequenza è la parte in più oltre la soglia. Qui siamo in un punto di funzionamento in cui le componenti esponenziali non sono ancora esplose, tanto è vero che le cpu che avete salgono ben oltre i 4 GHz, e quindi l'incremento è addirittura inferiore al quadrato, ma ovviamente superiore al fattore lineare, perchè avete dovuto incrementare il Vcore...

Arrivare al 25% a questo punto è una curiosità giusto per vedere quanto siamo sotto al punto critico.
Quello che è importante è che un processo più avanzato ha una Vt minore, una transconduttanza maggiore e quindi a parità di FO4 e frequenza richiede una tensione inferiore, cosa che allontana ulteriormente il punto di esplosione delle correnti.

Se Zen ha lo stesso FO4 di BD, prevedo che arrivi a 4GHz attorno a 1V, max 1.1V (considerando che in stock si prendono dei margini sulle tensioni), con una potenza assorbita per un X8 circa pari a questa di 4 moduli, forse un po' meno se la CPU che è stata usata come confronto non ha l'HDL... Insomma... I margini per un Zen x8 4GHz 95W @1.05V ci sono. Se non sarà 95W e/o sarà meno di 4Ghz potrà essere per vari motivi:
1) processo ancora non maturo e/o che non guadagna il 50% rispetto al 32nm SOI
e/o
2) numero di transistors di Zen superiore a quello di un modulo BD
e/o
3) FO4 superiore a quello di BD

ogni guadagno oltre il 30% sarà buono, ma tieni conto che il salto effettivo è solo di un nodo quindi - ~30%

bjt2

30-03-2016, 20:52

E con questi ragionamenti direi proprio che ci siamo giocati un andamento lineare dei prossimi 6 mesi che ci attendono per l'arrivo di Zen:sofico:
Sento già il rumore di tastiere, Paolo che costruisce altre due camere sotto terra per ampliare il raffreddamento per i futuri Zen:sofico: Insomma sento proprio le urla delle scimmie che reclamano nuove cpu:D

La condizione ESSENZIALE per avere Zen x8 a 95W è che i 4GHz si raggiungano a 1,05 MAX 1,1Volt. Perchè oltre ovviamente vorrebbe dire che il processo produttivo non è tanto migliore, oppure Zen è molto più complesso di BD (FO4 o numero di transistor).

Per avere Zen a 4Ghz con 1.05V si deve avere che la Vt del processo 14nm FF DEVE essere più bassa del 32nm SOI di ALMENO 0,15V e che la transconduttanza differenziale sia più alta, credo di almeno un 50% o in alternativa che la Vt sia inferiore di 0,2V, ma con transconduttanza uguale. Infatti con Vt inferiore di 0,2V invece di 1,25V per 4Ghz come la CPU di cui sopra, ne servono 1,25-0,2=1,05V... ovviamente se la transconduttanza differenziale è superiore, allora servono anche meno volt per 4Ghz, rispetto alla differenza di Vt, perchè a parità di Vcore un transistor può erogare più corrente. Questo a parità di capacità parassite. Non so se il processo FF ha capacità parassite inferiori (meglio: serve meno corrente)

bjt2

30-03-2016, 20:54

ogni guadagno oltre il 30% sarà buono, ma tieni conto che il salto effettivo è solo di un nodo quindi - ~30%

Se aggiungi un 15% dell'HDL arrivi al 50%... :D

Comunque se quello che ricordo di aver letto è giusto, ossia che il 14nmFF ha una Vt di 0,2V inferiore a quella di altri processi bulk, allora IMHO il guadagno è più del 30%... Se non altro perchè con tensioni più basse il leakage è inferiore...

digieffe

30-03-2016, 21:04

Se aggiungi un 15% dell'HDL arrivi al 50%... :D

Comunque se quello che ricordo di aver letto è giusto, ossia che il 14nmFF ha una Vt di 0,2V inferiore a quella di altri processi bulk, allora IMHO il guadagno è più del 30%... Se non altro perchè con tensioni più basse il leakage è inferiore...

pensavo che tu partissi dal 28nm bulk invece parti dal 32soi... :doh:

allora ~1,5 nodi = ~ -41% da aggiungere il -15% e si arriva a -50%

ma attenzione ricordiamoci come le hdl fanno esplodere i consumi oltre i 3 ghz
speriamo che le hdl impiegate siano fatte in modo diverso, altrimenti, forse, potrebbe essere meglio senza

Mister D

30-03-2016, 21:05

La condizione ESSENZIALE per avere Zen x8 a 95W è che i 4GHz si raggiungano a 1,05 MAX 1,1Volt. Perchè oltre ovviamente vorrebbe dire che il processo produttivo non è tanto migliore, oppure Zen è molto più complesso di BD (FO4 o numero di transistor).

Per avere Zen a 4Ghz con 1.05V si deve avere che la Vt del processo 14nm FF DEVE essere più bassa del 32nm SOI di ALMENO 0,15V e che la transconduttanza differenziale sia più alta, credo di almeno un 50% o in alternativa che la Vt sia inferiore di 0,2V, ma con transconduttanza uguale. Infatti con Vt inferiore di 0,2V invece di 1,25V per 4Ghz come la CPU di cui sopra, ne servono 1,25-0,2=1,05V... ovviamente se la transconduttanza differenziale è superiore, allora servono anche meno volt per 4Ghz, rispetto alla differenza di Vt, perchè a parità di Vcore un transistor può erogare più corrente. Questo a parità di capacità parassite. Non so se il processo FF ha capacità parassite inferiori (meglio: serve meno corrente)

All'epoca (quando si parlava dei futuri pp finfet) mi sono visto un paper di IBM con diversi studi (con alette dappertutto, non solo 2 o 3 superfici alzando source e drain ma anche sotto il gate) e mi pare che il finfet fosse fatto proprio per diminuire le capacità parassite (o forse era il leakage o tutti e due). Dovrei riguardarci, l'ho salvato da qualche parte;)
EDIT: trovato. Più tardi lo carico da qualche parte.
FinFet: Challenges or Opportunities
Parasitic resistance: a raised source/drain structure can be used to reduce the parasitic resistance.
However, the overlap capacitance is increased.

Prasitic resistance is the main adverse factor which prevents finfets’ application, which leads to lower speed and high noise.

e ancora:
FinFet: big advantages

1. Having excellent control of short channel effects in submicron regime and making transistors still scalable. Due to this reason, the small- length transistor can have a larger intrinsic gain compared to the bulk counterpart.
2. Much Lower off-state current compared to bulk counterpart.
3 . Promising matching behavior.

bjt2

30-03-2016, 21:32

All'epoca (quando si parlava dei futuri pp finfet) mi sono visto un paper di IBM con diversi studi (con alette dappertutto, non solo 2 o 3 superfici alzando source e drain ma anche sotto il gate) e mi pare che il finfet fosse fatto proprio per diminuire le capacità parassite (o forse era il leakage o tutti e due). Dovrei riguardarci, l'ho salvato da qualche parte;)
EDIT: trovato. Più tardi lo carico da qualche parte.
FinFet: Challenges or Opportunities
Parasitic resistance: a raised source/drain structure can be used to reduce the parasitic resistance.
However, the overlap capacitance is increased.

Prasitic resistance is the main adverse factor which prevents finfets’ application, which leads to lower speed and high noise.

e ancora:
FinFet: big advantages

1. Having excellent control of short channel effects in submicron regime and making transistors still scalable. Due to this reason, the small- length transistor can have a larger intrinsic gain compared to the bulk counterpart.
2. Much Lower off-state current compared to bulk counterpart.
3 . Promising matching behavior.

Ok, 3 cose buone e una cattiva:
Buone:
1) Guadagno (transconduttanza differenziale) maggiore: non ne ero sicuro.
2) Bassa off state current: minore leakage
3) Bassa resistenza parassita: migliore come spiegato sopra (rumore minore e velocità superiore)
Cattive:
4) However, the overlap capacitance is increased.
Io intendevo le capacità parassite, ma questa potrebbe essere comunque deleteria, ma può essere bilanciato dal basso leakage.

In sostanza:
1) guadagno maggiore significa minore tensione necessaria a parità di frequenza
2) minore leakage: minore potenza dissipata
3) minore resistenza parassita => minore rumore => minore margine richiesto ai segnali => maggiore frequenza possibile a parità di altre condizioni (ad esempio Vcore)
4) Questa capacità non so che effetti abbia, ma nel peggiore dei casi serve più corrente (e quindi tensione) a parità di frequenza, probabilmente più che bilanciato dai precedenti 3 punti

Resta solo da vedere il Vt...

La 1 e la 2 se sono veramente LARGE come dicono sono un BEL vantaggio! :D Il primo alle alte frequenze e il secondo per le basse potenze (mobile)... :D

tuttodigitale

30-03-2016, 21:46

pensavo che tu partissi dal 28nm bulk invece parti dal 32soi... :doh:

allora ~1,5 nodi = ~ -41% da aggiungere il -15% e si arriva a -50%

ma attenzione ricordiamoci come le hdl fanno esplodere i consumi oltre i 3 ghz
speriamo che le hdl impiegate siano fatte in modo diverso, altrimenti, forse, potrebbe essere meglio senza
questo succede oltre i 1,2V, ma nell'ipotesi tutt'altro che azzardata che ZEN possa girare a 1,1 a 4GHz, quello dei consumi che esplodono, potrebbe essere un falso problema, visto che staremmo nelle prossimità dei 5GHz..:read: . Nella mia "analisi" avevo considerato la possibilità di usare transistor a più basso leakage, che poi credo che sia naturale per un processo low power.

ogni guadagno oltre il 30% sarà buono, ma tieni conto che il salto effettivo è solo di un nodo quindi - ~30%
Considera che i 22nm finfet di Intel è solo un mezzo nodo più piccolo dei 32nm...uno dei vantaggi dei finfet rispetto ai processi planari è la riduzione del consumo per mmq a parità di condizioni, ovvero il risparmio energetico è maggiore di quello spaziale (Fonte TSMC). E ha interessanti ripercussioni, sia sulle capacità parassite delle interconnessioni e sia sulla impronta termica, rispetto ad un die shrink classico: sembra essere fatto apposta per le alte frequenze...

comunque TSMC riporta consumi ridotti del 55% o clock superiori del 35% a parità di consumo per i 16nm FF rispetto ai 28nm.

35%*3 GHz = 4,05GHz
28W (consumo di quattro core XV a 3GHz) == consumo di 2 core ZEN 4GHz (ipotesi che 1 core ZEN = 1 modulo XV)
8core ZEN = 28*4 = 112W.

in effetti, sembra non rientrarci, ma basterebbe che ZEN fosse più piccolo di un modulo XV del 15%, e rientrerebbe alla grande. L'incognita più grande rimane la complessità (e l'ipc) di questi core..
a parità di frequenza
x8 ZEN 3GHz = 50W

Mentre estendendo a Carrizo 15W abbiamo
2,1*1,35 = 2,8GHz
ZEN x8 2,8GHz 60W
ZEN x8 2,1 GHz 27W

addirittura, se prendiamo i rumors di bristol ridge abbiamo
2,7*1,35 = 3,6GHz
ZEN x8 3,6GHz 60W...
ZEN x8 2,7 GHz 27W

tutt nell'ipotesi che un core ZEN abbia complessità pari a quella di un modulo XV.

PS, TSMC riporta una frequenza massima superiore del 20% (Con riduzione del vcore). In teoria sarebbe possibile un 4,8GHz in turbo mode...

Attenzione quindi, potrebbe far paura...

digieffe

30-03-2016, 23:27

questo succede oltre i 1,2V,...

ok, alzo le mie previsioni della frequenza minima per Zen da 3,0 a 3,2ghz,
quella probabile da 3,2 a 3,4
e quella nella quale spero da 3,5 a 3,7 :stordita:

Grizlod®

30-03-2016, 23:50

.........
Se Zen ha lo stesso FO4 di BD, prevedo che arrivi a 4GHz attorno a 1V, max 1.1V (considerando che in stock si prendono dei margini sulle tensioni), con una potenza assorbita per un X8 circa pari a questa di 4 moduli, forse un po' meno se la CPU che è stata usata come confronto non ha l'HDL... Insomma... I margini per un Zen x8 4GHz 95W @1.05V ci sono. Se non sarà 95W e/o sarà meno di 4Ghz potrà essere per vari motivi:
1) processo ancora non maturo e/o che non guadagna il 50% rispetto al 32nm SOI
e/o
2) numero di transistors di Zen superiore a quello di un modulo BD
e/o
3) FO4 superiore a quello di BD
Direi quasi impossibile, altrimenti Zeppelin non esisterebbe o non avrebbe ragione d'esistere, anche se probabilmente si vedrà esclusivamente su socket G34. Oltre a strategie ambidextrous o cmq personalizzate per i clienti.
IMO saranno un quantitativo sensibilmente inferiore rispetto Bulldozer, complice la totale rivisitazione (anzi riprogettazione) del core.

el-mejo

30-03-2016, 23:52

Prova a rileggere, pensavo di essere stato chiaro. Il SOI con il CTI porta miglioramenti anche se il silicio non subisce step o modifiche: vedi gli ultimi FX8350 che reggono meglio le frequenze con meno vcore fino quasi ad avvicinarsi ai king vishera (quei tre). Considera che mi pare Isomen abbia un fx8370 o fx8370E che regge i 4 Ghz con 1,16volt. Prova te un fx8350 o fx8320 a vedere se parte con quella tensione. Per dire che effettivamente qualcosa di nuovo nel silicio devono averlo fatto.
Per i layer metallici in più l'avevo letto su bitandchips e la fonte era estera, non mi ricordo se era un forum di oc o no.
Anche il passaggio tra phenomII 965 c3 e 975/980 sempre c3 (non è cambiato nulla apparentemente) però ha garantito qualche centinaia di MHz in più senza step. I phenomII x6 invece avevano step E0 (con le bollicine d'aria by IBM) altrimenti con il cavolo che ci regalavano un X6 con quelle frequenze e quel tdp;)

Per il bulk invece haswell - haswell refresh è proprio una bella revisione con step nuovo di silicio sia per aumentare le frequenze in oc e no (+ pasta del capitano raffinata + condensatori migliorati nel package cpu) sia per aumentare le rese dello stesso pp. Se prendi invece uno stesso modello appartenente ad uno stesso step vedrai che i risultati sono sempre gli stessi e anzi alcune volte leggendo sui thread intel ho pure visto di diversi utenti che lamentavano che i primi esemplari andavano pure meglio degli ultimi, a riprova che il silicio bulk per me non ha il CTI.

Anche per le gpu vale lo stesso, il silicio tra 7970, r9 280x, r9 290x e r9 390x è cambiato, non solo come step ma mi sembra anche come tipo (non mi chiedere quali delle sigle di tutti quei 28 di TMSC perché non lo so e non lo voglio mettere a memoria:D )

Per me quindi il bulk richiede proprio uno step successivo (che non vuol dire passaggio a nodo più avanzato) per introdurre miglioramenti affinamenti mentre il SOI anche a parità di step con il tempo migliorava le proprietà elettriche detto CTI.

EDIT:
http://www.xtremesystems.org/forums/showthread.php?289461-A-little-birdie-told-me/page3

Hai ragione, avevo dimenticato il fattore stepping!:doh:
Infatti i primissimi Phenom II x4 erano C2, poi dopo circa 10 mesi sono usciti i primi modelli C3, sempre su SOI 32nm "standard".
I Phenom II x6, oltre ad un sucessivo stepping se ricordo ben usavano il SOI 32nm HKMG, di fatto un altro tipo di PP ed è quello che ha fatto la differenza e ha permesso di avere 6 core a 3,3ghz su 125w di tdp.

Resta il fatto che per AMD i maggiori boost di efficenza e prestazioni sono dovuti ai stepping, con buona pace del CTI, quindi di fatto cambia poco :D

Riguardo Haswell pare invece (fonte wikipedia) che sia il 4770k che il 4790k siano entrambi stepping C0, quindi è cambiato solo il package più un eventuale maggiore selezione dei die.

george_p

31-03-2016, 00:17

paolo.oliva2

31-03-2016, 00:39

E con questi ragionamenti direi proprio che ci siamo giocati un andamento lineare dei prossimi 6 mesi che ci attendono per l'arrivo di Zen:sofico:
Sento già il rumore di tastiere, Paolo che costruisce altre due camere sotto terra per ampliare il raffreddamento per i futuri Zen:sofico: Insomma sento proprio le urla delle scimmie che reclamano nuove cpu:D

Allora spariamo dei prb "logistici":

Ipotesi:

SE Zen avesse 4GHz def, sarebbe un mostro, perchè anche con un -20% di IPC su Intel, un 5960X avrebbe il -33% di clock, quindi potrebbe stare lì lì con il 5960X versione 14nm (se avrà una frequenza di 3,5GHz def)

Se per i 4GHz occorresse un TDP di 140W, dubito in OC sopra i 4,5GHz, ma tutto sommato non inferiori agli OC (umani) Intel, mentre se quella frequenza abbisognasse di 125W o addirittura 95W, penso che avremmo problemi circa il prezzo richiesto (500€ o addirittura di più)... :sofico:

Comunque, tornando con i piedi per terra... io spererei più su un Zen X8 3GHz 95W occabile e nei 170W possa raggiungere almeno i 4GHz. Siccome il prezzo sarà proporzionato alla frequenza/potenza def, in sto modo per me costerebbe 300€, massimo 400€.

Speriamo che si possa occare, altrimenti ho fatto il laboratorio sotterraneo per nulla....

paolo.oliva2

31-03-2016, 00:59

Hai ragione, avevo dimenticato il fattore stepping!:doh:
Infatti i primissimi Phenom II x4 erano C2, poi dopo circa 10 mesi sono usciti i primi modelli C3, sempre su SOI 32nm "standard".
I Phenom II x6, oltre ad un sucessivo stepping se ricordo ben usavano il SOI 32nm HKMG, di fatto un altro tipo di PP ed è quello che ha fatto la differenza e ha permesso di avere 6 core a 3,3ghz su 125w di tdp.

Resta il fatto che per AMD i maggiori boost di efficenza e prestazioni sono dovuti ai stepping, con buona pace del CTI, quindi di fatto cambia poco :D

Riguardo Haswell pare invece (fonte wikipedia) che sia il 4770k che il 4790k siano entrambi stepping C0, quindi è cambiato solo il package più un eventuale maggiore selezione dei die.

Il 45nm SOI E0 aveva il low-k, non l'HKMG (ma comunque ambedue riducono il Vcore e quindi il TDP)

Hai perfettamente ragione per il CTI, ma lo stepping risulta necessario semplicemente perchè la distanza dei transistor è proporzionata alla frequenza def. Una volta che il CTI abbassa il TDP e quindi aumenta la frequenza a parità di TDP, aumenta la frequenza def e di qui bisogna modificare la distanza tra i transistor altrimenti si perderebbe efficienza.
Poi è chiaro che il procio con posizionamento transistor a frequenze maggiori, dovrebbe essere più incline all'OC perchè aumenta il margine.
Con BD, dall'8150 all'8350 è stato implementato l'RCM, ma penso che il silicio non abbia avuto chissà quale cambio PP... dico questo perchè l'8150 aveva una frequenza def di 3,6GHz per 125W, ed un OC di poco superiore a 5GHz, mentre l'8350, a fronte di +400MHz def, al più ha guadagnato solamente 300MHz in OC massimo (senza contare che l'8150 sforava i 125W TDP già con un OC di 100MHz, mentre l'8350 un OC di +400MHz restando sotto i 125W direi che è una prassi.
L'8370 secondo me ha un RCM molto spinto e ottimizzato sui 4GHz, a tal punto che con 1,35V si superano i 4.6GHz (ed è un Vcore inferiore a quello def di un 8350 per 4GHz), ma oltre sale meno di un 8350.

bjt2

31-03-2016, 08:43

Cos'è RCM? :stordita:

bjt2

31-03-2016, 09:14

Mister D

31-03-2016, 09:54

post di Dresdenboy, dove dice che BD ha lo stesso numero di stadi dei primi Pentium 4, e che Zen avrà probabilmente più stadi del k10, quindi non sarà un chip "grasso e lento"
http://semiaccurate.com/forums/showpost.php?p=258949&postcount=2339

Post di un altro utente dove si evince che forse Zen avrà ancora più stadi di BD (e quindi potrà salire ulteriormente di clock)
http://semiaccurate.com/forums/showpost.php?p=258949&postcount=2344

Se hanno ragione, altro che 4GHz... :D

Se veramente fosse così e amd è riuscita ad aumentare l'ipc del 40% come da dichiarazioni ufficiali, beh:
1) keller è veramente un mostro,
2) gli studi di IBM sul miglior FO4 non erano così caccosi come qua tutti i detrattori di BD pensavano. Alla fine sarebbe invece la dimostrazione che si può fare un'ottima cpu (architettura) anche con un FO4 di 17 e che quindi quello che più ha limitato BD, oltre l'IPC basso e sotto le aspettative di tutti, era proprio il silicio (va beh questo l'avevamo capito subito :sofico: )
3) le cpu zen 8 core / 16 thread saranno dei mostri rispetto agli FX83xx perché a parità di frequenza avranno più ipc, più FPU e più thread. (i calcoli che avevo fatto all'epoca quindi andrebbero presi così com'erano senza la riduzione dovuta alla frequenza che avevo ipotizzato in 3,2 Ghz 4 in turbo).

Io incrocio le dita e spero che dopo un pp di puro sterco equino stavolta sia non dico perfetto ma buono;)

Mister D

31-03-2016, 09:59

Cos'è RCM? :stordita:

RCM sta per Resonant clock mesh.
http://www.cyclos-semi.com/technology/
http://www.globalfoundries.com/newsroom/press-releases/2013/12/28/globalfoundries-and-cyclos-semiconductor-partner-to-develop-high-performance-low-power-arm-cortex-a15-processors-using-resonant-clock-mesh-technology
e come ciliegina.... articolo tecnico su come funziona questa tecnologia:
http://vlsi.ee.washington.edu/files/2014/09/resonant_clock_design_for_a_power_efficient_high_volume_x86-64_microprocessor.pdf
Bisognerebbe chiedere su semiaccurate se anche Zen userà tale tecnologia o già il pp a 14 nm non necessita;)

bjt2

31-03-2016, 10:07

peccato che anche i 32nm dovevano essere migliori da questo punto di vista, ma hanno caratteristiche come i 45nm D0 :cry:

con il Bulk è vero che ci sono minori margini di miglioramento ed in più contiamo che sono pure FF e non Planari ma c'è di buono che è difficile toppare al contrario del SOI

ti aggiorno :cool:

"TSMC's 16FF+ (FinFET Plus) technology can provide above 65 percent higher speed, around 2 times the density, or 70 percent less power than its 28HPM technology. Comparing with 20SoC technology, 16FF+ provides extra 40% higher speed and 60% power saving. By leveraging the experience of 20SoC technology, TSMC 16FF+ shares the same metal backend process in order to quickly improve yield and demonstrate process maturity for time-to-market value."

TSMC ha unito i 16ff ai 16ff+, prima sembrava fossero due PP differenti con il + ancora in fase di sviluppo, probabilmente hanno perso un po di tempo per quello

però è difficile che i 14nm ff LPP siano pari di questi 16ff+

Cyclos resonant clock mesh (RCM) technology

http://www.bit-tech.net/news/hardware/2012/02/21/amd-packs-cyclos-piledriver/1

che io ricordi i primi P4 non aveva qualcosa come 32 stadi? altro che 20 e all'epoca di BD si diceva che avesse 22 stadi

dal link di anantech:
"Secondly, the Pentium 4's pipeline was 28 ("Willamette") to 39 ("Prescott") cycles. Bulldozer's pipeline is deep, but it's not that deep. The exact number is not known, but it's in the lower twenties. Really, Bulldozer's pipeline length is not that much higher than Intel's Nehalem or Sandy Bridge architectures (around 16 to 19 stages). The big difference is that the introduction of the µop cache (about 6KB) in Sandy Bridge can reduce the typical branch misprediction to 14 cycles."

Parla della branch mispredicition. Quella peggiore di BD è 20 cicli. Northwood aveva 20, nel caso migliore, immagino, perchè aveva la trace cache...

bjt2

31-03-2016, 10:11

peccato che anche i 32nm dovevano essere migliori da questo punto di vista, ma hanno caratteristiche come i 45nm D0 :cry:

con il Bulk è vero che ci sono minori margini di miglioramento ed in più contiamo che sono pure FF e non Planari ma c'è di buono che è difficile toppare al contrario del SOI

ti aggiorno :cool:

"TSMC's 16FF+ (FinFET Plus) technology can provide above 65 percent higher speed, around 2 times the density, or 70 percent less power than its 28HPM technology. Comparing with 20SoC technology, 16FF+ provides extra 40% higher speed and 60% power saving. By leveraging the experience of 20SoC technology, TSMC 16FF+ shares the same metal backend process in order to quickly improve yield and demonstrate process maturity for time-to-market value."

TSMC ha unito i 16ff ai 16ff+, prima sembrava fossero due PP differenti con il + ancora in fase di sviluppo, probabilmente hanno perso un po di tempo per quello

però è difficile che i 14nm ff LPP siano pari di questi 16ff+

Cyclos resonant clock mesh (RCM) technology

http://www.bit-tech.net/news/hardware/2012/02/21/amd-packs-cyclos-piledriver/1

che io ricordi i primi P4 non aveva qualcosa come 32 stadi? altro che 20 e all'epoca di BD si diceva che avesse 22 stadi

dal link di anantech:
"Secondly, the Pentium 4's pipeline was 28 ("Willamette") to 39 ("Prescott") cycles. Bulldozer's pipeline is deep, but it's not that deep. The exact number is not known, but it's in the lower twenties. Really, Bulldozer's pipeline length is not that much higher than Intel's Nehalem or Sandy Bridge architectures (around 16 to 19 stages). The big difference is that the introduction of the µop cache (about 6KB) in Sandy Bridge can reduce the typical branch misprediction to 14 cycles."

ps.
non capisco perché se apro il link del post 2344 mi riporta al 2339, intendevi questo post giusto?
http://semiaccurate.com/forums/showpost.php?p=258954&postcount=2344

:eek: 70% meno potenza del 28nm?!?!?! Qualcuno ha una CPU a 28nm sottomano per testarne la potenza assorbita a 4GHz? Perchè anche prendendo il caso pessimistico di 1 core Zen=1 modulo, basta raddoppiare il consumo e togliergli un 70% ed abbiamo il consumo di uno Zen 8 core...

Mister D

31-03-2016, 10:35

:eek: 70% meno potenza del 28nm?!?!?! Qualcuno ha una CPU a 28nm sottomano per testarne la potenza assorbita a 4GHz? Perchè anche prendendo il caso pessimistico di 1 core Zen=1 modulo, basta raddoppiare il consumo e togliergli un 70% ed abbiamo il consumo di uno Zen 8 core...

Prendendo per buoni i test di tom's hardware (e sappiamo tutti quanto vogliono bene ad amd - così tutti i disfattisti della domenica non possono dire nulla-):
http://www.tomshw.it/articoli/recensione-apu-amd-a10-7890k-75493-p2
126,1 watt sotto prime95.
126,1*2*0,3= 75,66 watt. Ecco fatto.
E voglio vedere bristol ridge che è excavator ma con tpd a 65 watt.:D
Incomincio a pensare anche io che 8 core /16 thread in 95 watt di TDP ci stiano tutti, a meno proprio che i rumors siano sbagliati (FO4 molto più alto) o che ancora un'altra volta il pp sia di puro sterco equino :D (non ci voglio pensare:banned: )

EDIT: era troppo bello per essere vero. l'a10 ha solo 2 moduli se moltiplico per 2 arrivo a 4 moduli cioè un fx attuale. E poi non ho tenuto conto dei 17 watt della gpu in idle. Rifacciamo:
126,1-17,1=109*4*0,3= 130,8 watt con frequenza 4,1 GHz. Mi sa che devono limare ancora quelli di amd:D

paolo.oliva2

31-03-2016, 10:52

Cos'è RCM? :stordita:

La gestione dei clock, Risonant Clock Mash (non sono sicuro che è scritto così:D ).
Praticamente era stato introdotto dall'8350/Piledriver, per diminuire il TDP e per poter aumentare le frequenze (8150/Zambesi).
Allora la voce era che l'RCM era ottimizzato fino a 3GHz, ma già Piledriver aveva 4GHz e l'8370 idem ma abbassando ancor più il TDP a parità di frequenza.

E' per questo che ho riserve (positive) circa i dubbi su frequenze massime di determinati accorgimenti... perchè l'RCM lo si dava max 3GHz e nella realtà assolve la sua funzione anche a frequenze ben superiori, ed ancor più con le HDL, perchè se ricordo bene all'inizio si diceva che andavano bene per le VGA perchè il clock era su 1GHz... ma Carrizo direi che ha un comportamento ottimale anche a 3GHz... quindi sono tutti tabù ampiamente superati.

bjt2

31-03-2016, 10:56

Prendendo per buoni i test di tom's hardware (e sappiamo tutti quanto vogliono bene ad amd - così tutti i disfattisti della domenica non possono dire nulla-):
http://www.tomshw.it/articoli/recensione-apu-amd-a10-7890k-75493-p2
126,1 watt sotto prime95.
126,1*2*0,3= 75,66 watt. Ecco fatto.
E voglio vedere bristol ridge che è excavator ma con tpd a 65 watt.:D
Incomincio a pensare anche io che 8 core /16 thread in 95 watt di TDP ci stiano tutti, a meno proprio che i rumors siano sbagliati (FO4 molto più alto) o che ancora un'altra volta il pp sia di puro sterco equino :D (non ci voglio pensare:banned: )

EDIT: era troppo bello per essere vero. l'a10 ha solo 2 moduli se moltiplico per 2 arrivo a 4 moduli cioè un fx attuale. E poi non ho tenuto conto dei 17 watt della gpu in idle. Rifacciamo:
126,1-17,1=109*4*0,3= 130,8 watt con frequenza 4,1 GHz. Mi sa che devono limare ancora quelli di amd:D

Beh, 130W per 8 core Zen a 4.1GHz non è male se teniamo conto che è Tom's ( :D ) e poi c'è la questione HDL (scusate se chiedo, ma mi sono disinteressato delle CPU negli ultimi tempi...): la APU testata ha le HDL o no?

Perchè oltre al fattore tom's ( :D ) allora ci sarebbe anche questa cosina... :stordita:

Mister D

31-03-2016, 10:57

La gestione dei clock, Risonant Clock Mash (non sono sicuro che è scritto così:D ).
Praticamente era stato introdotto dall'8350/Piledriver, per diminuire il TDP e per poter aumentare le frequenze (8150/Zambesi).
Allora la voce era che l'RCM era ottimizzato fino a 3GHz, ma già Piledriver aveva 4GHz e l'8370 idem ma abbassando ancor più il TDP a parità di frequenza.

E' per questo che ho riserve (positive) circa i dubbi su frequenze massime di determinati accorgimenti... perchè l'RCM lo si dava max 3GHz e nella realtà assolve la sua funzione anche a frequenze ben superiori, ed ancor più con le HDL, perchè se ricordo bene all'inizio si diceva che andavano bene per le VGA perchè il clock era su 1GHz... ma Carrizo direi che ha un comportamento ottimale anche a 3GHz... quindi sono tutti tabù ampiamente superati.

Vai a vedere i link che ho postato tra cui la pagina del produttore del RCM e già lì davano 4GHz+ per il RCM ergo non so perché all'epoca si diceva 3 GHz max. Mah:boh:

Mister D

31-03-2016, 10:59

Beh, 130W per 8 core Zen a 4.1GHz non è male se teniamo conto che è Tom's ( :D ) e poi ci sono due cose (scusate se chiedo, ma mi sono disinteressato delle CPU negli ultimi tempi...):

1) La APU testata è 32nm SOI o 28nm Bulk?
2) La APU testata ha le HDL o no?

Perchè oltre al fattore tom's ( :D ) allora ci sarebbero anche quegli altri due fattori... :stordita:

L'apu testata è 28 nm bulk e non penso abbia le HDL perché partono con core excvator per ora solo mobile e due cpu (athlon 835 e 845 su FM2+) e fra poco anche desktop con bristol ridge su AM4 e ddr4.

paolo.oliva2

31-03-2016, 11:09

Prendendo per buoni i test di tom's hardware (e sappiamo tutti quanto vogliono bene ad amd - così tutti i disfattisti della domenica non possono dire nulla-):
http://www.tomshw.it/articoli/recensione-apu-amd-a10-7890k-75493-p2
126,1 watt sotto prime95.
126,1*2*0,3= 75,66 watt. Ecco fatto.
E voglio vedere bristol ridge che è excavator ma con tpd a 65 watt.:D
Incomincio a pensare anche io che 8 core /16 thread in 95 watt di TDP ci stiano tutti, a meno proprio che i rumors siano sbagliati (FO4 molto più alto) o che ancora un'altra volta il pp sia di puro sterco equino :D (non ci voglio pensare:banned: )

EDIT: era troppo bello per essere vero. l'a10 ha solo 2 moduli se moltiplico per 2 arrivo a 4 moduli cioè un fx attuale. E poi non ho tenuto conto dei 17 watt della gpu in idle. Rifacciamo:
126,1-17,1=109*4*0,3= 130,8 watt con frequenza 4,1 GHz. Mi sa che devono limare ancora quelli di amd:D

Dici? A me andrebbe più che bene. :sofico:
Praticamente avrebbe le stesse frequenze def Piledriver nei 125W, ma con tutta probabilità un turbo ben più alto dei 200/300MHz applicati da PD su metà dei core.
Senza contare che alle stesse frequenze praticamente Zen risulterebbe del 65% più potente a core (+40% zen --> XV e XV con IPC superiore su PD), con l'aggiunta dell'SMT che praticamente renderebbe un Zen in MT quanto un X16 PD.
Se venduto ad un prezzo umano, per un uso desktop avrebbe sempre una riserva di elaborazione fantastica (16 TH), tanto che nell'uso non intensivo sarebbe un procio con un'abbondanza di L3 superlativa...

paolo.oliva2

31-03-2016, 11:12

Vai a vedere i link che ho postato tra cui la pagina del produttore del RCM e già lì davano 4GHz+ per il RCM ergo non so perché all'epoca si diceva 3 GHz max. Mah:boh:

K, è la prassi... già la vita per AMD è tutto un problema, bisogna trovarne pure di inesistenti.

Mister D

31-03-2016, 11:22

K, è la prassi... già la vita per AMD è tutto un problema, bisogna trovarne pure di inesistenti.

D'accordissimo.
Basta vedere anche nelle gpu:
quando amd progetta una gpu piccola ed efficiente e il competitor invece il contrario tutti a dire: ma chi se ne frega del calore/consumi voglio una fornace che mi sciolga il case e mi faccia esplodere il monitor di fps!!! Gli ingegneri amd leggono e fanno. Dai d'accordo prossima volta puntiamo sulla forza bruta.
Arriva quel giorno:
amd forza bruta ma chiaramente consumi e calore non sono più come prima.
Il competitor invece (sembra farlo apposta effettivamente) cambia improvvisamente strada e tutti a dire: no no consuma troppo, scalda troppo, ma siamo pazzi?!? Voglio la gpu green.
E sono gli stessi che prima volevano il suv 8 cilindri 8 litri da mezzo km al litro. Ma daaiiiiii!!! Santa coerenza

Amd a sentire in giro ha ingegneri capre, incompetenti dell'ultimo minuto, scellerati del marketing e ceo giullari. Ah non so mica, non ne fanno mai una giusta.
Però se poi gli altri in tempi diversi ricalcano le idee: bravissimi, geni!!!

Sarà che Golia fa più cool di essere Davide:D

Mister D

31-03-2016, 11:26

Dici? A me andrebbe più che bene. :sofico:
Praticamente avrebbe le stesse frequenze def Piledriver nei 125W, ma con tutta probabilità un turbo ben più alto dei 200/300MHz applicati da PD su metà dei core.
Senza contare che alle stesse frequenze praticamente Zen risulterebbe del 65% più potente a core (+40% zen --> XV e XV con IPC superiore su PD), con l'aggiunta dell'SMT che praticamente renderebbe un Zen in MT quanto un X16 PD.
Se venduto ad un prezzo umano, per un uso desktop avrebbe sempre una riserva di elaborazione fantastica (16 TH), tanto che nell'uso non intensivo sarebbe un procio con un'abbondanza di L3 superlativa...

Anche a me andrebbe bene se nei 130 watt si avessero ottime prestazioni, ma in giro vedo tutte Prius. Tutti ecologici:D
Poi però arriverà il giorno in cui il competitor ritornerà sulla forza bruta e se ne sbatterà del green e tutti a gridare al miracolo, buttare via la prius e prendere una bel dogde v10. Ma non avevi prima la prius???? :doh:

davo30

31-03-2016, 11:54

Scusate se interrompo le vostre "elucubrazioni" (ps, complimenti a tutti), ma di BR e AM4 si sa piu qualcosa? Teoricamente dovevano essere presentati in questo periodo.... :cry:

capitan_crasy

31-03-2016, 13:19

Mister D

31-03-2016, 13:36

Ok per Dresdenboy che come affidabilità è al top, ma a che pro cercare ancora una volta la frequenza al posto dell'efficienza?
Inoltre davvero AMD ha ri-chiamato Jim Keller per fare un altra architettura "lunga" anche più di BD???:mbe:
Non mi convince...:wtf:

Capitano non tieni conto della sfida per Keller (non stai ragionando quadrimensionalmente :D). Ritorni e trovi un architettura che tutti dicono un buco nell'acqua proprio per la propensione alle alte frequenze, basso ipc e quindi scarsa efficienza.
Beh cos'era scontato per Keller? Rivedere tutto e fare l'ennesima architettura ad alto IPC con pipe corte e complesse, alta efficienza e frequenza medio-bassa.
Pensa se invece in lui non sia venuta fuori la pazza idea di dimostrare al mondo non solo le sue capacità (indiscusse direi) ma il riuscire a fare una cpu a pipe lunghe con tanto IPC e tanta frequenza. Il mito, la cosa impossibile ed essere ricordati per questo per sempre. Visto che poi è andato in Tesla e lì non progetterà più cpu o soc (almeno a quanto si legge).
Sai che figata riuscire dove manco INTEL è riuscita con netburst???:sofico:

Nessuno davvero ci ha pensato?
Ma la storia ci insegna che sono le idee ambiziose a fare le rivoluzioni;)

Chiudo con:
"A volte sono le persone che nessuno immaginava che possano fare certe cose, quelle che fanno cose che nessuno può immaginare" Cit. dal film di uno dei papà degli elaboratori.

Beh dopo questo post "benzina" su fuoco, ti toccherà chiamare i pompieri:sofico:

Grizlod®

31-03-2016, 14:09

Capitano non tieni conto della sfida per Keller (non stai ragionando quadrimensionalmente :D). Ritorni e trovi un architettura che tutti dicono un buco nell'acqua proprio per la propensione alle alte frequenze, basso ipc e quindi scarsa efficienza.
Beh cos'era scontato per Keller? Rivedere tutto e fare l'ennesima architettura ad alto IPC con pipe corte e complesse, alta efficienza e frequenza medio-bassa.
Pensa se invece in lui non sia venuta fuori la pazza idea di dimostrare al mondo non solo le sue capacità (indiscusse direi) ma il riuscire a fare una cpu a pipe lunghe con tanto IPC e tanta frequenza. Il mito, la cosa impossibile ed essere ricordati per questo per sempre. Visto che poi è andato in Tesla e lì non progetterà più cpu o soc (almeno a quanto si legge).
Sai che figata riuscire dove manco INTEL è riuscita con netburst???:sofico:

Nessuno davvero ci ha pensato?
Ma la storia ci insegna che sono le idee ambiziose a fare le rivoluzioni;)

Chiudo con:
"A volte sono le persone che nessuno immaginava che possano fare certe cose, quelle che fanno cose che nessuno può immaginare" Cit. dal film di uno dei papà degli elaboratori.

Beh dopo questo post "benzina" su fuoco, ti toccherà chiamare i pompieri:sofico:Sarà!? Ma uso subito l'estintore :O

Alla fine di questo articolo, l'autore trae qualche conclusione in merito alla discussione avuta con Sam Naffziger:
http://www.extremetech.com/gaming/203898-amd-details-new-power-efficiency-improvements-update-on-25x20-project

per cui, lo ritengo più attendibile, anche se mi rendo conto sia facile farsi prendere dall'entusiasmo. Resta il fatto concreto per il quale, se AMD stecca pure stavolta, se la (ri)compra Intel...

tuttodigitale

31-03-2016, 14:14

bjt2

31-03-2016, 14:37

Ok per Dresdenboy che come affidabilità è al top, ma a che pro cercare ancora una volta la frequenza al posto dell'efficienza?
Inoltre davvero AMD ha ri-chiamato Jim Keller per fare un altra architettura "lunga" anche più di BD???:mbe:
Non mi convince...:wtf:

Beh, se chi ha scritto le patch di GCC non si buca, almeno per la FP c'è l'aumento di latenza di alcune operazioni, segno che sono stati aumentati gli stadi almeno in FP. A che pro? Solo per salire di più... E le IMUL potrebbero essere scese buttando più hardware in campo come dissi giorni fa...
Poi come detto più volte, un alto numero di pipeline perde efficienza se non riesci a salire in frequenza e per il branch misprediction. Per quello hai cache L0 e checkpointing.
Netburst fu un disastro perchè c'era troppo poco hardware e fu fatta una ricerca del massimo clock per abbindolare i gonzi... Poi INTEL è rimasta shockata ed è tornata ad architetture monstre...

Ma IBM ha determinato tramite paper e dimostrato tramite le CPU Power, che il FO4 ottimale si aggira attorno a 17, da cui poi derivi il numero di stadi di pipeline per l'architettura in oggetto... Non si scappa.

capitan_crasy

31-03-2016, 15:04

capitan_crasy
l'errore è pensare che BD e derivati abbiano problemi a livello di architettura, come se fosse scritto sulla pietra che Sandy Bridge e derivati, siano meglio:read: ...
se prendiamo quale riferimento le evoluzioni di IBM, dal power7 e power7+, scopriamo che tra aumenti di ipc e clock, l'efficienza è aumentata del 5-10% con un die shrink....
ci voleva solo un miracolo per AMD per raggiungere il +80% ottenuto da Intel dal passaggio dai 45 ai 32nm.

Sono uno dei pochi sostenitori di BD in questo forum e del suo concetto di architettura "semplice" e quindi facilmente upgradabile.
Tuttavia come si sono spese fiumi di parole non vai da nessuna parte se non hai il silicio che ti permette di raggiungere determinate frequenze con un valore accettabile tra produzioni in volumi, costi di produzione e TDP accettabili.
Meyer e Bergman hanno pagato i loro errori, uno sulla architettura basata sulla (sola:muro: ) frequenza e l'altro per non aver rispettato i valori promessi dai 32nm SOI...

Se il problema fosse stato BD, avrebbero accantonato, non avremmo visto certo steamroller e excavator, e certamente AMD non avrebbe venduto agli OEM un fx8300 per anni a meno di 80 dollari per lotti di 1000..

Steamroller e Excavator sono figli dei 28nm bulk, non sarebbero mai esistiti (e infatti non esistono sui 32nm SOI) senza quel silicio.
Per BD se tutto andava secondo i piani doveva esserci Komodo un aumento dei core e frequenza sempre con i 32nm SOI...

se hai transistor che non viaggiano, questo si ripercuote sulle frequenze relative, e non massime, qualora il problema non è dovuto alle capacità parassite delle interconnessione. E si badi bene, che abbiamo la CERTEZZA, che il low-k, non è stato l'artefice del debacle, visto che i core excavator nonostante la riduzione delle dimensioni del die, non hanno grossi problemi a raggiungere i 4GHz: i vcore alti sembrano essere dovuti visto le tensioni in idle estremamente basso, anche ad una diversa geometria dei transistor.

Anche i dati, pubblicati da Samsung sui 28nm fd-soi, fanno riflettere su quanto facciano pena il HMKG: +50% di clock a parità di leakage, per un amplissimo range operativo... visto che sembrerebbero disponibile i 20nm fd-soi, mi aspetto quanto meno prestazioni in linea per i 14nm finfet...:sofico:
Anzi la stessa GF, aveva pubblicizzato i 20nm fd-soi come aventi prestazioni in linea con i 14nm finfet....se tanto mi da tanto il rischio concreto di vedere uno ZEN con un turbo core superiore ai 5GHz c'è. Inutile nasconderlo. Potrebbe offrire le migliori prestazioni nel ST, pur non avendo un ipc straordinario.

Senza andare oltre, la domanda è:
Siamo sicuri che i 14nm finfet di Samsung siano in grado di tenere quelle frequenze???
No perchè fino ad un anno fa molti erano convinti che ZEN era una architettura estremamente efficiente ma legata come priorità al mondo dei tablet e derivati, proprio per la natura del mercato di Samsung che sicuramente non frega niente di CPU (in generale) multisupermega core a frequenza più alte della luna...:rolleyes:

per fare k12...credo che le cache di ZEN siano frutto del lavoro fatto sull'architettura Arm, e non il contrario, anche per il maggior peso dell'ISA...probabilmente non c'era tutta questa necessità per l'architettura x86.

Si parlava di un architettura X86 nuova di pacca, dove Keller aveva quasi carta bianca (limiti di badget/silicio permettendo); nome in codice ZEN!
Se il K12 rientrava nelle competenze di Keller era comunque una cosa a se...
Secondo me siamo un pochettino perdendo di vista quello che veramente è ZEN, ricordando che il progetto FUSION2 non è stato abbandonato ma solamente rivisto e rinominato.
Il futuro saranno le APU e ZEN+ potrebbe essere la svolta in questo senso...:read:

bjt2

31-03-2016, 15:12

digieffe

31-03-2016, 18:09

digieffe

31-03-2016, 18:13

non potrebbero essere le stesse pipeline int di XV ottimizzate ed aumentate in numero (da 4 a 6) ?

eventualmente hanno rifatto quelle FP per consentirgli di salire meglio?

tuttodigitale

31-03-2016, 18:53

E' stata l'esplosione del leakage a limitare le frequenze... Con un FO4 sufficientemente basso puoi avere 10GHz a frequenze umane, ma ci vorrebbero tipo 2 Volt e li se le temperature non sono sottozero, il leakage è enorme...

Ti ricordo che sotto azoto (o elio?) e con circa 2V AMD è arrivata a 8,6GHz... Non ricordo se era K10 o BD ma è comunque impressionante...
il record era di 8,8 GHz con "solo" 1,86 V di vcore (ma è un caso fortunato).
per contro il record di llano di 6GHz è stato fatto a 2,36V...
D'altra parte llano ha bisogno di Vcore da FX9590, per raggiungere i 3,6GHz :read:, come d'altra parte è lecito aspettarsi dalle enormi differenze di FO4 .

Tuttavia come si sono spese fiumi di parole non vai da nessuna parte se non hai il silicio che ti permette di raggiungere determinate frequenze con un valore accettabile tra produzioni in volumi, costi di produzione e TDP accettabili.
Ma le frequenze, almeno fino a 5GHz, sono dettate dalla velocità di scarica del gate del transistor e relativo FO4.
Se hai una stadio con tante porte in cascata, è chiaro che a parità di clock RICHIEDI prestazioni al silicio. Prestazioni ottenibili solo per mezzo di transistor veloci ad alto leakage e/o Vdd alta.

Senza andare oltre, la domanda è:
Siamo sicuri che i 14nm finfet di Samsung siano in grado di tenere quelle frequenze???
No perchè fino ad un anno fa molti erano convinti che ZEN era una architettura estremamente efficiente ma legata come priorità al mondo dei tablet e derivati, proprio per la natura del mercato di Samsung che sicuramente non frega niente di CPU (in generale) multisupermega core a frequenza più alte della luna...:rolleyes:
Appunto!
Le slide Samsung riportano frequenze superiori del 50% per il 28nm Fd-soi, che sarebbero 6GHz, e ne volevo solo 5GHz in turbo boost...
visto che GF, non ha messo enfasi sulle di prestazioni per i 20nm, ma solo sui minori costi, deduco che la concorrenza sia messa meglio con i 14nm finfet. Ergo mi pare di non pretendere la luna....

PS Parto dalla presunzione che se per praticamente tutto il range, a parità di leakage va il 50% meglio, non è merito del fd-soi, ma sono i 28nm bulk di GF a fare...:Puke: Sbaglio?

non potrebbero essere le stesse pipeline int di XV ottimizzate ed aumentate in numero (da 4 a 6) ?
Non penso...AMD avrebbe potuto portare le ALU da da 2 a 4, aumentando solo marginalmente il numero di transistor, non facendo eseguire le operazioni di DIV e MUL alle ALU aggiuntive.

O mantenere una complessità tutto sommato simile e aumentare la potenza delle ALU0 e ALU1, eseguendo ad esempio le operazioni di moltiplicazioni in minori cicli, come suggerito da bjt2.
Senza trascurare la mancanza di 2 AGU, è comunque un risparmio di spazio.

io non ho dubbi che se ZEN fosse grande, in termini di transistor, quanto un modulo XV, andrebbe di più

george_p

31-03-2016, 18:59

Però Llano non aveva il RCM.

tuttodigitale

31-03-2016, 19:05

Però Llano non aveva il RCM.
Neppure bulldozer sotto azoto liquido...(il record è del fx8150), e anzi il RCM potrebbe addirittura essere limitante alle frequenze del fx9590.

E comunque il vcore di llano era di circa 1,4V contro 1,25-1,3V del FX8150, 3 GHz vs 3,6 GHz...come volevasi dimostrare

capitan_crasy

31-03-2016, 19:45

Ma le frequenze, almeno fino a 5GHz, sono dettate dalla velocità di scarica del gate del transistor e relativo FO4.
Se hai una stadio con tante porte in cascata, è chiaro che a parità di clock RICHIEDI prestazioni al silicio. Prestazioni ottenibili solo per mezzo di transistor veloci ad alto leakage e/o Vdd alta.

Anche se ZEN avrebbe le capacità di reggere i 6.00Ghz a livello di architettura e il silicio sulla carta lo regge, alla fine si deve scontrare con il lato produttivo; se non è economicamente sostenibile per produrre in volumi sufficienti per giustificare la messa in commercio non ci sarà mai...
Per la serie "mutandine di ghisa e babbucce di piombo"...:D

Appunto!
Le slide Samsung riportano frequenze superiori del 50% per il 28nm Fd-soi, che sarebbero 6GHz, e ne volevo solo 5GHz in turbo boost...

Quante CPU/APU AMD hai visto con i 28nm FD-SOI???:rolleyes:

visto che GF, non ha messo enfasi sulle di prestazioni per i 20nm, ma solo sui minori costi, deduco che la concorrenza sia messa meglio con i 14nm finfet. Ergo mi pare di non pretendere la luna....

Komodo sulla carta doveva avere 10 core e sulla carta doveva avere frequenze superiori, ma alla fine è stato cancellato...
Il fattore "sulla carta" conta come il 2 di picche in una partita a briscola a tre giocatori.

davo30

31-03-2016, 19:54

bjt2

31-03-2016, 20:11

scrivi ossimori? da quando ti sei dato alla letteratura? :p

E' colpa dell'amaro del capo... :ops: :hic:

bjt2

31-03-2016, 20:13

non potrebbero essere le stesse pipeline int di XV ottimizzate ed aumentate in numero (da 4 a 6) ?

eventualmente hanno rifatto quelle FP per consentirgli di salire meglio?

Probabilmente le pipeline INT non hanno bisogno di essere ottimizzate (a parte int e div) perchè le operazioni sono quasi banali e il fattore limitante in BD era la FPU...

bjt2

31-03-2016, 20:21

il record era di 8,8 GHz con "solo" 1,86 V di vcore (ma è un caso fortunato).
per contro il record di llano di 6GHz è stato fatto a 2,36V...

In realtà ho detto una piccola bugia... La transconduttanza differenziale dei MOS aumenta al calare della temperatura (al contrario dei BJT) ed è per questo che possono essere messi in parallelo... Se non ci fosse il leakage, a temperature umane (60-70 gradi) ci vorrebbe una tensione maggiore che sotto azoto... Anche per il maggior rumore elettrico...

devil_mcry

31-03-2016, 20:43

per spezzare una lancia a favore di intel ti chiedo:

davvero era uno specchietto per allodole, o le possibilità di arrivare fino a ~10ghz con PP futuri, per l'epoca, era cosa fattibile? ... c'erano studi dietro?

riguardo a Zen: quanto meno mantenere la lunghezza Pipe di XV dato che con tutte le chicche su cache inclusiva, L0, check ed ALTRO (che ricorderai fosse ancora incognito nel GCC), hai voglia ad alzare l'IPC :read:

Che serve chiedersi se c'erano studi?

Magari a 14nm Netburst riesce anche a funzionare a 10GHz senza pensare a evoluzioni architetturali e d'altro canto con a 90nm c'erano CPU a 3.8GHz commerciali ed ES a 4GHz (le architetture Conroe a 65 e poi Core a PP più spinti sono arrivati solo oggi a quelle frequenze di base). Senza considerare che in OC massimo quelle architetture con quei PP "preistorici" hanno raggiunto record di 8GHz senza nemmeno usare l'azoto se mi ricordo bene, roba che è impensabile oggi.

Sicuramente qualcuno ci credeva davvero perché l'architettura precedente, Tualatin, era molto più performante e dopo poco tempo tirarono fuori i Pentium M altrettanto veloci da un punto di vista architetturale (usciti solo 2 anni dopo i P4) quindi non è tanto una questione che di meglio non sapevano fare.

Il punto è che non avevano la tecnologia per realizzare quel silicio, speculare sul futuro è stato stupido. Questo gli ha anche insegnato a provare i nuovi PP su architetture già conosciute per vedere cosa capita e aggiustare il tiro (tick-tock).

Ren

31-03-2016, 23:15

Per Paolo

Ecco gli Xeon a 14nm.
http://www.hwupgrade.it/articoli/cpu/4608/processori-xeon-e5-2600-v4-e-nuovi-ssd-per-il-datacenter-da-intel_index.html

P.s. Magari sarebbe ora che AMD battesse qualche colpo....

Occhio che quei modelli consumano più delle varianti E, perchè hanno router e più bus qpi.

Se i rumor sulla cache sono veri, AMD ha un bel vantaggio nei server...

paolo.oliva2

01-04-2016, 00:08

Per Paolo

Ecco gli Xeon a 14nm.
http://www.hwupgrade.it/articoli/cpu/4608/processori-xeon-e5-2600-v4-e-nuovi-ssd-per-il-datacenter-da-intel_index.html

In particolare penso ti interessino questi:

Modello Clock LL Cache Core Threads TDP

Xeon E5-2620 v4 2,1GHz 20 8 16 85W

Xeon E5-2667 v4 3,2GHz 25 8 16 135W

Xeon E5-2687W v4 3GHz 30 12 24 160W

L'ultimo è il top frequenza/tdp/core raggiungibile dall'architettura imho

http://cdn.wccftech.com/wp-content/uploads/2016/03/Intel-Broadwell-EP-Xeon-E5-2600-V4_Non_AVX.png

Qui anche il comportamento dei turbo.

P.s. Magari sarebbe ora che AMD battesse qualche colpo....

Io avevo riportato il 5960X sul 14nm a 3,5GHz perchè qui avevano postato che con tutta probabilità avrebbe guadagnato quel 15%... ma come al solito le previsioni sono rose e fiori per Intel mentre per AMD addirittura si era stravolto Zen da X8 a X4 per via dei 95W e se X8 sotto i 3GHz.

Se devo essere sincero... dalle ultime info Zen sembra MOLTO più vicino a BD di quanto si pensi... e per riprendere quello che ha scritto il Capitano, BD ha una architettura snella (troppo) affidandosi unicamente alla frequenza, e con il 32nm SOI molto al di sotto delle aspettative, non ha fatto il botto. Zen mi sembra a livello di core molto simile a XV (almeno a livello di pipeline), è stato tolto il CMT a favore dell'SMT, sono state potenziate le entrate/uscite, potenziata la cache, messa una FP a core... e così via.

Resta il dubbio di come sarebbe stato Zen (con gli interventi) ma sulla strada di BD (modulo senza CMT) anzichè il passaggio all'SMT... ed idem anche di come sarebbe stato un XV sullo stesso silicio di Zen.

Mi sorge una domanda... se il 14nm Intel si dice sia il migliore sulla piazza... se Zen riuscirà ad ottenere prestazioni/consumo migliore di Intel, di chi sarebbe la colpa?

tuttodigitale

01-04-2016, 00:23

Anche se ZEN avrebbe le capacità di reggere i 6.00Ghz a livello di architettura e il silicio sulla carta lo regge, alla fine si deve scontrare con il lato produttivo; se non è economicamente sostenibile per produrre in volumi sufficienti per giustificare la messa in commercio non ci sarà mai...

ma a livello di silicio i 5GHz di BD sono equivalenti ai 3,8 di k10, nel senso che sono richieste le stesse velocità da parte dei transistor.
llano è stato l'esempio concreto che un silicio mediocre massacra il clock anche ad architetture ad alto ipc.

Perchè poi inizia la storia, che k10 sarebbe andato meglio, e questo non sta nè in cielo nè in terra...

Quante CPU/APU AMD hai visto con i 28nm FD-SOI???:rolleyes:

resta pur sempre il fatto che hanno pubblicizzato prestazioni nettamente migliori rispetto al loro 28nm HMKG. Sono loro stessi consapevoli che non è sto granchè...

Komodo sulla carta doveva avere 10 core e sulla carta doveva avere frequenze superiori, ma alla fine è stato cancellato...
Il fattore "sulla carta" conta come il 2 di picche in una partita a briscola a tre giocatori.
appunto, se loro stessi hanno praticamente ammesso la superiorità dei 14nm finfet dei concorrenti sui 20nm fd-soi, mi pare assai strano che un'aumento 5/4,3GHz, del 16% non sia nel loro potenziale...

Cioè devo credere che nel 2016-17 AMD deve accontentarsi di 3,2GHz come clock massimo per un fo4 22, quando aveva raggiunto i 3,8GHz con i 45nm? :muro:

spero che ti sbagli :(

Ren

01-04-2016, 00:32

ma a livello di silicio i 5GHz di BD sono equivalenti ai 3,8 di k10, nel senso che sono richieste le stesse velocità da parte dei transistor.
llano è stato l'esempio concreto che un silicio mediocre massacra il clock anche ad architetture ad alto ipc.

Come ti ho detto più volte llano è stato ammazzato da altro, dato che il 32nm dai dati strumentali è superiore al 45nm.

tuttodigitale

01-04-2016, 00:33

Come ti ho detto più volte llano è stato ammazzato da altro, dato che il 32nm dai dati strumentali è superiore al 45nm.
da cosa?

Ren

01-04-2016, 00:40

da cosa?

trovati i test ufficiali sul silicio...;)

ps. ha più o meno la stessa velocità con metà del leakage...

tuttodigitale

01-04-2016, 00:54

trovati i test ufficiali sul silicio...;)
potresti essere così gentile da postarmi un link :D

davo30

01-04-2016, 01:50

http://www.bitsandchips.it/english/52-english-news/6811-first-zen-benchmarks-the-next-amd-uarch-is-a-major-step-forward

Visto che è il primo aprile tendo a non fidarmi, in ogni caso la riporto

Inviato dal mio XT1092 utilizzando Tapatalk

capitan_crasy

01-04-2016, 02:01

digieffe

01-04-2016, 02:13

...eppure non mi sembrano così insensati quei valori...

l'ES Zen avrebbe un ipc del 91,6% di quello del 4930k
senza turbo ecc

tuttodigitale

01-04-2016, 07:50

ci sono 2 non notizie interessanti sui 14nm (nel senso che si sapeva da tempo bastava essere attenti):
1) i 14nm non erano generici, ma si riferiva ai 14nm LPP di Samsung...: prestazioni superiori ai 22 fd-SOI

2) IBM riporta frequenze operative massime per i 14nm finfet (BULK? Samsung?) di 6GHz contro i 5GHz dei 22nm PD-SOI.

Comunque i vantaggi di pipeline lunghe si ottengono anche a 3-4GHz.....che poi è quello che permetterebbe di raggiungere un buon aumento dell'efficienza, e/o fermarsi a soli 95W...

tuttodigitale

01-04-2016, 09:31

...eppure non mi sembrano così insensati quei valori...

l'ES Zen avrebbe un ipc del 91,6% di quello del 4930k
senza turbo ecc
Quei test mi sembra che scalino male con i core/threads e anche con la frequenza...ho il sospetto che diano peso eccessivo sul bandwidth della cache l3 e sulla RAM...
Non mi sento di trarre nessuna conclusione.
Giusto per mettere le cose in prospettiva: in cpu hash un phenom x4 e un i5 2500k, hanno lo stesso ipc, e la metà di un fx8150, con questo penso di aver detto tutto.

paolo.oliva2

01-04-2016, 09:35

Come ti ho detto più volte llano è stato ammazzato da altro, dato che il 32nm dai dati strumentali è superiore al 45nm.

Ti chiedo...

c'è il 45nm liscio (C1, C2, C3) ed il 45nm + low-k (E0)

Siccome il 32nm SOI ha l'HKMG e l'evoluzione dal low-k a ULK, direi che il 45nm E0 sia quello che si avvicini di più al 32nm.

Ora... un Thuban con 1,6V arriva a 4,5V (come riportato in basso), un Llano per 4,5GHz necessita di 2,2V... cosa c'è di altro?

BD arriva a 4GHz def nei 125W non perchè ha un super-silicio, ma non arriva a 5GHz perchè non ha un silicio "normale", come dimostra il fatto (se mai ce ne fosse ancora bisogno) che lo stesso Phenom II sul 32nm non è riuscito a raggiungere le frequenze che aveva sul 45nm.

digieffe

01-04-2016, 11:12

l'autore ha confermato che è un pesce d'aprile al 50% http://semiaccurate.com/forums/showpost.php?p=259047&postcount=2356

allora cosa è vero e cosa no?

digieffe

01-04-2016, 11:24

hai preso il test raytrace è hai fatto:

5599*3.4/3*6/8/5198=91.56% :)

però così si valuta il throughput dell'intero Core e non del singolo thread, nel senso che non sappiamo quanto è dato dall'IPC del singolo Core e quanto dalla funziona SMT :read:
per tanto l'IPC potrebbe essere addirittura più basso se ipotizziamo un SMT del +50% :stordita:

però attenzione, su un test solamente, in quello hash polverizza qualsiasi altra cpu:
17238*3.4/3*6/8/4368= 335.45% :sofico:

chissà se è un bel pesce d'aprile o meno

hai ragione, ma a quell'ora non distinguevo tra throughput ed ipc

certo sarebbe bassino, spero non sia vero anche se temo di si

capitan_crasy

01-04-2016, 11:59

ma a livello di silicio i 5GHz di BD sono equivalenti ai 3,8 di k10, nel senso che sono richieste le stesse velocità da parte dei transistor.
llano è stato l'esempio concreto che un silicio mediocre massacra il clock anche ad architetture ad alto ipc.

Perchè poi inizia la storia, che k10 sarebbe andato meglio, e questo non sta nè in cielo nè in terra...

Per Llano non lo prenderei proprio come esempio.
AMD ha dovuto ridisegnare il K10 sui 32nm (che non è stata comunque una passeggiata) ma il vero problema è stata la GPU (compresa la sua integrazione) dove la transizione sulla tecnologia SOI è stata tutt'altro che semplice.
Essendo poi la prima vera APU sono scesi a compromessi più o meno importanti ma alla fine hanno semplicemente abbassato la frequenza a livello generale; considera che Llano come mercato andava a sostituire i K10 propus con chipset 785 e derivati, quindi in quel caso i 32nm ha centrato l'obbiettivo...

appunto, se loro stessi hanno praticamente ammesso la superiorità dei 14nm finfet dei concorrenti sui 20nm fd-soi, mi pare assai strano che un'aumento 5/4,3GHz, del 16% non sia nel loro potenziale...

Cioè devo credere che nel 2016-17 AMD deve accontentarsi di 3,2GHz come clock massimo per un fo4 22, quando aveva raggiunto i 3,8GHz con i 45nm? :muro:

spero che ti sbagli :(

Solo gli sciocchi credono di non sbagliare mai...;)

capitan_crasy

01-04-2016, 13:13

però se hanno fatto apu da 100w a 32nm e cpu da 125w perché non hanno fatto cpu da 125w a 28nm se le apu steamroller le hanno fatto ed addirittura da 95w? per non parlare di bristol ridge da 65w, anche se in forte ritardo...

non perché non si poteva ed il silicio a 28nm SHP non era idoneo, ma perché non hanno voluto...
hanno risparmiato il più possibile per arrivare prima a Zen come cpu high-end

O potuto...:fagiano:
Forse in una fase precedente al 2015 c'era il progetto di uno steamroller per sostituire le CPU Piledriver ma il declino del mercato PC e quindi la vera motivazione per investire soldi nel progetto si è scontrato con la resa ottima dei 32nm SOI e la presentazioni di obbrobri con TDP a 220W a costo 0...:rolleyes:

Grizlod®

01-04-2016, 14:11

Certo che questo come fake sembra realizzato abbastanza bene:
http://www.overclockers.ru/lab/75317_3/32-norma-pervoe-znakomstvo-s-amd-zen.html#10

Asus centurion Dual socket con 2 CPUs 16 cores (sembra, senza SMT) @ 1700 MHz. 12 fasi, 8 + 4 sul dorso della MB.

Lascia ben sperare il risultato di WPrime (tempo), mentre lascia perplesso Fritz Chess Benchmark IMO.
Non considero i videogiochi, in quanto non sfruttano affatto il multicore, figuriamoci @ 1700 MHz.

Non so, ma analizzando le immagini, sembrano realistiche...che AMD cambi politica commerciale multisocket al di fuori di Opteron?!
Sarebbe una figata IMO!

EDIT: osservando i dati EXIF delle foto del socket, delle 2 CPU (pins pseudo specchiati) e delle fasi della MB, sembrano scattate con una Nikon D5100

tuttodigitale

01-04-2016, 14:32

Per Llano non lo prenderei proprio come esempio.
AMD ha dovuto ridisegnare il K10 sui 32nm (che non è stata comunque una passeggiata) ma il vero problema è stata la GPU (compresa la sua integrazione) dove la transizione sulla tecnologia SOI è stata tutt'altro che semplice..
Mi permetto di dissentire...prove di oc dimostrano che la gpu aveva un margine importante per le frequenze (800-900MHz era frequenze tipiche in oc)... E sulla gpu AMD poteva accontentarsi anche di meno, visto che era già bandwith limited.....devo credere che con uno ulteriore step, un ritardo di crica metà anno, hanno guadagnato 300-400 MHz PIU' del necessario?

Essendo poi la prima vera APU sono scesi a compromessi più o meno importanti ma alla fine hanno semplicemente abbassato la frequenza a livello generale; considera che Llano come mercato andava a sostituire i K10 propus con chipset 785 e derivati, quindi in quel caso i 32nm ha centrato l'obbiettivo...
il tuo discorso è valido soprattutto (solo?) per la gpu, visto che era un chip abbastanza potente rispetto agli standard dell'epoca anche se girava a metà del clock. Poteva accontentarsi anche di 300MHz, imho, invece aveva un oc (per lo più inutile grazie alla bandwidth ridotta) oltre gli 800 MHz...
ti inviterei a dare un occhiata al clock dei k10 propus mobile...:
1,8 GHz vs 1,5-2,5GHz , 25W vs 35W, tutto questo progresso non lo vedo...

quindi in quel caso i 32nm ha centrato l'obbiettivo...

l'obiettivo non è stato raggiunto (i famosi 3GHz+ e <1,3V), che sono appunto valori conservativi già di loro...
credo che un pò ci aspettavamo i 4GHz, considerando che Intel ha aumentato la frequenza di 300MHz (+9%), pur limando di 35W invece di 25W, il tdp, pur integrando anch'essa una gpu (la maggior complessità è ampiamente compensata dai 10W di differenza).

infatti phenom 980 3,7GHz *3,5/3,2 = 4,04GHz frequenza base. Questo senza mettere sul piatto i 45nm low k.

non perché non si poteva ed il silicio a 28nm SHP non era idoneo, ma perché non hanno voluto...
sul piatto c'è, lo scarso aumento prestazionale, una probabile regressione nelle prestazioni nel ST (vedi chland vs Kaveri), e soprattutto il costo nettamente inferiore di un wafer a 32nm SOI (mi pare circa 3 volte meno, ma non ne sono sicuro, ma la differenza era assai notevole).
Steamroller è un progresso se e solo se il silicio permette un minimo risparmio a parità di clock...cosa che non sembra (va) verificarsi a 4GHz+...

quindi si, il 28nm SHP non era idoneo per un SR x8 che andasse più di un PD x8. Poi che pensavano di debuttare con un die XV 16 core monolitico, non è segreto, ma non lo è neanche il fatto che stando alla slide (credo vera) confidenziale di AMD, si aspettavano e si aspettano tutt'altro da excavator, a livello di frequenza e prestazioni/watt (se riescono a raggiungere gli obiettivi...)

.338 lapua magnum

01-04-2016, 14:43

EDIT: osservando i dati EXIF delle foto del socket e delle fasi della MB, sembrano scattate con una Nikon D5100

con anche un elaborazione software con photoshop cs5

http://i.imgur.com/nWsqIds.jpg

non vuol dire nulla, perché prima di essere postata può subire una post-produzione, ma vista la data di oggi :sofico:

tuttodigitale

01-04-2016, 15:00

32 soi che costa 3 volte meno di un 28 bulk che lo usano anche per livellare i tavoli? :confused:
a sto punto allora perché non saltare SR e passare subito ad XV se tanto era: già in scaletta, progettato su carta e per giunta messo su silicio?

3 è quello che mi ricordo (potrei sbagliare), ma che costa molto meno in termini di wafer si, tanto che saranno almeno 2 anni che amd vende (o meglio regala) il fx8300 agli OEM...nonostante ciò il mercato preferisce i Pentium (gli i3 sono in un altra categoria di prezzo...)

Su XV, credo che il problema sia solo temporale (la versione desktop era prevista per il q1 2015), e addirittura ci si attende un ulteriore step per aumentare le frequenze base da 2,1 a 2,7GHz. C'erano anche riferimenti di un 16core monolitico, abbastanza chiaro quale fosse il mercato di destinazione...
Praticamente Carrizo è poco più di una beta..:sofico: La versione RC, uscirà quando ZEN sarà pronto, anche se mi attendo ampi margini di miglioramento (è fatto documentato che i finfet hanno una variabilità maggiore....)

Grizlod®

01-04-2016, 15:05

con anche un elaborazione software con photoshop cs5

http://i.imgur.com/nWsqIds.jpg

non vuol dire nulla, perché prima di essere postata può subire una post-produzione, ma vista la data di oggi :sofico:Si ok, appunto come dici, avrà tolto il contorno per lasciarlo bianco, oppure solo per correggere l'esposizione.

La mia premessa, era appunto in virtù della data odierna :)
Chissà per quale motivo le ha postate oggi, avendole scattate una decina di giorni fa...forse doveva completare i tests oppure fare una sorta di contropesce :D

bjt2

01-04-2016, 15:27

allora, test 8320e 1.10v 3.5ghz

idle= 90->65 watt HUMonitor 33w
occt= 185->158 watt HUMonitor 72w
cb15= 165->138 watt HUMonitor 53w

differenze idle-occt= 93 watt
differenze idle-cb15= 73 watt

riprendendo i conti di @tuttodigitale sulla perdita del wattmetro abbiamo che:

test------3.5GHz 1,10V----4GHz 1,25V
occt------0,441A-----------0,664A
P.Persa--22,7W------------44,1W

con Rwattmetro = 50 ohm
in pratica ogni +50% di I_Delta corrisponde al +100% di P.Persa

delta idle-load occt
totale-----93w-------------146w
cpu--------70,3w-------------101,9w

per @bjt2: +45% di efficienza da [email protected] a [email protected] in OCCT

a questo punto direi che a STIMA per avere il +25% servono al massimo -400mhz partendo dai [email protected], e quindi 3.6ghz con vcore approssimato a 1.12~1.13v

[email protected] VS [email protected]~1.13v sul 32nm SOI con 8320e = +25% TDP

per conferma domani posso provare i [email protected] o 1.10v se regge OCCT

Se regge è un +11% in frequenza, con un +25% in potenza, circa quadratico.

Speriamo solo che Zen abbia lo stesso FO4 di BD...

arturobelo

01-04-2016, 15:29

Ma le schede madri AM4 non sarebbero dovute uscire nel primo quarto 2016? Da oggi siamo ufficialmente nel secondo quarto e ancora niente.

Grizlod®

01-04-2016, 15:50

La foto è vera è stata editata per rimuovere i codici impressi sui processori.
Si capisce che è un fake perché la scritta "centurion" è stata applicata successivamente.

La mobo è una asus L1N64-SLI a cui hanno aggiunto la scritta centurion e il simbolino sul dissipatore.

http://www.tomshardware.com/reviews/brute-force-quad-cores,1371-6.htmlOK, tutto risolto...l'ha postato compatibilmente col 1° aprile.
In effetti il sospetto di nessuna schermata dei risultati benchmark, ma solamente grafici, lasciava il dubbio cmq...

capitan_crasy

01-04-2016, 15:54

Ma le schede madri AM4 non sarebbero dovute uscire nel primo quarto 2016? Da oggi siamo ufficialmente nel secondo quarto e ancora niente.

Primo quarto???:confused: :asd:
Si va a trimestre e comunque non ce una data precisa ufficiale ma un generico prima parte del 2016...

stefanonweb

01-04-2016, 16:38

arturobelo

01-04-2016, 17:53

probabilmente si è confuso con la dicitura Q = quarter che sta per "un quarto" 1/4, ergo 3 mesi "three-month period" ed ufficialmente siamo nel Q2 in effetti :D
Esattamente

digieffe

01-04-2016, 18:10

Per quello che riguarda il sochet si sa qualcosa? Nel senso se i dissipatori aftermarket precedenti vanno bene? Almeno quelli con la placca posteriore proprietaria.... In sintesi i 4 fori rimarrebbero sulla mobo nello stesso punto oppure avranno interasse differente? Grazie.... :mc:

purtroppo sono differenti... più stretti nel lato lungo e più larghi nel lato corto

alcuni produttori quali Noctua, ecc forniranno degli adattatori

davo30

01-04-2016, 18:25

Ma le schede madri AM4 non sarebbero dovute uscire nel primo quarto 2016? Da oggi siamo ufficialmente nel secondo quarto e ancora niente.
Anche BR doveva uscire/essere presentato in questo periodo.... Invece abbiamo avuto il refresh del refresh di Kaveri (escludendo l'845)

Inviato dal mio XT1092 utilizzando Tapatalk

bjt2

01-04-2016, 19:53

fresco fresco...

FX-8320e ottimizzato a 3.6ghz

core 1.12v 3.5ghz
nb 1.12 2.0ghz
ram 1.50 1.60ghz

idle ~90->65w HWMonitor min 33w
occt ~200->170w HWMonitor max 73w
cb15 ~171->146w HWMonitor max 56w

differenza idle-occt = 105w
differenza idle-cb15 = 81w

riprendendo i conti di @tuttodigitale sulla perdita del wattmetro abbiamo che:

test------3.6GHz 1,12 (1.116 lettura)V----4GHz 1,25V
occt------0,477A-----------0,664A
P.Persa--25,5W------------44,1W

con Rwattmetro = 50 ohm
in pratica ogni +50% di I_Delta corrisponde al +100% di P.Persa

delta idle-load occt
totale------105w-------------146w
cpu--------79,5w-------------101,9w

per @bjt2: +28% di efficienza da [email protected] a [email protected] in OCCT

per arrotondamento si può dire che fosse stato sui 1.12 trovavamo il +25% quasi spaccato

per cui +25% passando da [email protected] a [email protected] in OCCT -400mhz per Vishera sui 32nm SOI

ps. invece di giocare a MGS4 (la mia futura moglie per il momento è da un amica) mi sono messo a fare il test... sto invecchiando :help:

In ogni caso 101W per 4 moduli a 4GHz sul 32nm SOI, significa che 8 core Zen a 4GHz sul 32nm SOI avrebbero consumato circa 200W e a 3.6GHz 160W... (considerando 1 modulo=1 core Zen), considerando HDL+nuovo processo 14nm FF e facciamo il caso peggiore di solo un -50% abbiamo 80 e 101W... Quindi probabilmente fattibile (a regime) 3.8GHz a 95W e 4.1-4.2GHz a 125W... Per il turbo max sono fiducioso per i 4.8-5GHz per il 125W e 4.3-4.4GHz per il 95W...

Questo nell'ipotesi di Zen con FO4 minore o uguale a quello del BD, HDL o comunque ottimizzazioni sul clock gating migliori rispetto a vishera e 1 core Zen con stesso numero di transistors di un modulo BD...

Siccome poi dal 32nm SOI al 14nmFF+HDL si dovrebbe guadagnare più del 50% in efficienza, allora queste previsioni potrebbero essere valide anche adesso fin da subito.

Dato che avete detto che il 14nmFF ha alta variabilità, magari inizialmente non riusciranno ad avere alti volumi sulle frequenze elevate e li marcheranno più basso, facendo la felicità degli occatori...

paolo.oliva2

01-04-2016, 21:20

Per Llano non lo prenderei proprio come esempio.
AMD ha dovuto ridisegnare il K10 sui 32nm (che non è stata comunque una passeggiata) ma il vero problema è stata la GPU (compresa la sua integrazione) dove la transizione sulla tecnologia SOI è stata tutt'altro che semplice.
Ricordo che AMD aveva riportato problemi con l'IGP per giustificare lo slittamento di 6 mesi.

Essendo poi la prima vera APU sono scesi a compromessi più o meno importanti ma alla fine hanno semplicemente abbassato la frequenza a livello generale; considera che Llano come mercato andava a sostituire i K10 propus con chipset 785 e derivati, quindi in quel caso i 32nm ha centrato l'obbiettivo...

Però, Capitano, Llano aveva 100W TDP come massimo, divisi a metà per la parte X86 e la parte IGP. Ora... abbassare le frequenze in modo generale ci può stare, però per la parte X86 abbiamo un riscontro di 50W per 3GHz... (e senza L3 se ricordo bene).
Ora, sul 45nm c'era già il Thuban a 95W (X6 con tanto di L3) con modello a 95W mi sembra a 2,8GHz o 3GHz (non ricordo perfettamente la frequenza).
Facendo dei conti a spannella (molto a spannella), 95W / 6 core * 4 core = 63,33W, IVI COMPRESA la L3.
Mi sembra ovvio che una volta che togliamo il TDP assorbito dalla L3, frequenza/TDP tra 45nm E0 e 32nm SOI io non ci vedo granchè di differenza.

Poi ricordo una cosa... la scena di quela wow alla conferenza quando hanno presentato Llano, ricordi? Era lo stesso periodo in cui JF anticipava potenze BD a core uguali al Phenom II. Io interpreto il fatto che in ambedue i casi AMD aveva sicurezze da parte di GF che i prototipi di Llano/BD avrebbero avuto frequenze ben più alte ad affinamento silicio avvenuto.
Dopodichè è crollato sia Llano che BD...
Inoltre... fai un passo indietro. All'epoca 45nm SOI, AMD aveva fissato la roadmap per il 32nm SOI HKMG/ULK e relativo passaggio al 22nm. Quandomai (se non forzatamente) AMD avrebbe preso in considerazione di abbandonare il SOI per passare al Bulk? Posso capire da un 32nm SOI a magari un 22nm Bulk... ma da un 32nm ad un 28nm, di cui certamente il 28nm Bulk non rappresenta di certo il top, è ovvio che il SOI in quel 32nm non ha i vantaggi che sempre il SOI ha avuto sul Bulk.

digieffe

01-04-2016, 21:37

In ogni caso 101W per 4 moduli a 4GHz sul 32nm SOI, significa che 8 core Zen a 4GHz sul 32nm SOI avrebbero consumato circa 200W e a 3.6GHz 160W... (considerando 1 modulo=1 core Zen), considerando HDL+nuovo processo 14nm FF e facciamo il caso peggiore di solo un -50% abbiamo 80 e 101W... Quindi probabilmente fattibile (a regime) 3.8GHz a 95W e 4.1-4.2GHz a 125W... Per il turbo max sono fiducioso per i 4.8-5GHz per il 125W e 4.3-4.4GHz per il 95W...

Questo nell'ipotesi di Zen con FO4 minore o uguale a quello del BD, HDL o comunque ottimizzazioni sul clock gating migliori rispetto a vishera e 1 core Zen con stesso numero di transistors di un modulo BD...

Siccome poi dal 32nm SOI al 14nmFF+HDL si dovrebbe guadagnare più del 50% in efficienza, allora queste previsioni potrebbero essere valide anche adesso fin da subito.

Dato che avete detto che il 14nmFF ha alta variabilità, magari inizialmente non riusciranno ad avere alti volumi sulle frequenze elevate e li marcheranno più basso, facendo la felicità degli occatori...

da conti basati sui tuoi, considerando, però, un +10% di variabilità di produzione di consumo in più mentre un -40% (senza utilizzo delle HDL), esce una frequenza base di 3.4ghz, alla quale non sono in grado di calcolare un eventuale frequenza del turbo... che potrebbe essere abbastanza alta

i 3.8ghz da te calcolati, con le HDL (-50%), potrebbero essere considerati 3.7 dando un po' di variabilità di produzione, ciò che però non mi torna, è come con le HDL si possano raggingere le frequenze turbo da te indicate

tuttodigitale

01-04-2016, 23:25

vedo che sono l'unico che ancora dà credito a GF/Samsung :cry:
da 28nm HMKG a 22 FD-SOI = -70% di consumo.
22 PD-SOI a 14nm FF = +20% di clock
da 14 LPE a 14 LPP = +15% di clock &&-15% di consumo.....

se mantiene solo la metà di quanto detto sopra, un -50% a parità di frequenza ci arriva facile...

e diciamolo, indirettamente anche le gpu Polaris, danno credito alla bontà dei 14nm LPP di Samsung. AMD ha fatto già sapere che consumeranno il 60% in meno a parità di prestazioni...

PS ma l'uso delle HDL,si scontrano e non poco con il turbo core a 5GHz, soprattutto se siete cos' pessimisti sul silicio.

Posso azzardare un ipotesi, suggestiva, anche se dai costi non indifferenti...
APU e 16 core monolitico saranno fatti con le HDL
octa core, con le HPL...
sono fiducioso sul silicio. Non fate l'errore di confondere i 14nm LPE con i 14nm LPP: dopo tanti processi mediocri, saltati eccetera eccetera, è uscito uno estremamente competetivo :cool:
Se AMD, non si è rivolta a TSMC (nonostante diverse fonti riferiscono che il tape out di ZEN è stato fatto anche nelle fonderie taiwanesi, quindi ha più che valutato la possibilità...), c'è da stare tranquilli...:D , persino più rispetto se si fosse rivolta a TSMC..

Anzi il fatto che l'ES ZEN A0 giri ad una frequenza di 3GHz, superiore a quella dello step B0 di bulldozer (2,8GHz), dovrebbe portare tranquillità..

Male che vada fa uscire un bel 16core XV da 3GHz (4GHz turbo) su 28nm e fa contento almeno Paolo..:sofico:

Però, Capitano, Llano aveva 100W TDP come massimo, divisi a metà per la parte X86 e la parte IGP..
questa divisione a metà me la devi spiegare :D
La HD5670, alias 400sp vliw, 40nm aveva un tdp di 15-19W @650MHz....
Fa ancora più schifo.. :(
poi la mancanza del turbo-core dice tutto, d'altra parte si era già oltre i 1,4V a 3GHz, quindi il problema prima ancora di essere di margine termico era della velocità offerta dal silicio con vcore umani,. L'unica scusante è che AMD non ha curato la sezione CPU, ma dubito assai che hanno rifatto più e più volte il silicio, senza toccare la CPU che aveva evidenti problemi (non rispettava il target dei progettisti).
Poi ognuno è libero di pensarla come vuole.

davo30

01-04-2016, 23:35

http://www.semiaccurate.com/forums/showpost.php?p=259097&postcount=2373

Inviato dal mio XT1092 utilizzando Tapatalk

Ren

01-04-2016, 23:54

http://www.jagatoc.com/wp-content/uploads/2016/03/Athlon_X4_845.jpg
http://www.jagatoc.com/wp-content/uploads/2016/03/OC2_BCLK.jpg
http://www.jagatoc.com/wp-content/uploads/2016/03/screen030-377x375.jpg

Fatevi du risate...:( (tra un pò esplode con tutto quel vcore)

digieffe

02-04-2016, 00:04

digieffe

02-04-2016, 00:05

http://www.semiaccurate.com/forums/showpost.php?p=259097&postcount=2373

Inviato dal mio XT1092 utilizzando Tapatalk

dicono più di 3.4 base e 3.8 turbo... ma sono informazioni o supposizioni?

digieffe

02-04-2016, 00:08

...
PS ma l'uso delle HDL,si scontrano e non poco con il turbo core a 5GHz, soprattutto se siete cos' pessimisti sul silicio.

Posso azzardare un ipotesi, suggestiva, anche se dai costi non indifferenti...
APU e 16 core monolitico saranno fatti con le HDL
octa core, con le HPL...

non male come idea

Ren

02-04-2016, 00:08

forse le HDL necessitano di quel voltaggio per salire?

Forse :p non sono adatti per salire (base clock)...

Aggiungo un kaveri fortunello (credo), ne ho trovati altri che necessitano di 1.5v per 4.6ghz.

http://www.bitsandchips.it/images/2014/11/25/860KG3258/Athlon860K.png

Metto anche un trinity.

http://www.bitsandchips.it/images/2013/02/15/750K/2690380.png

ps. ditemi voi se come media vanno bene, o postatene di altri...

bjt2

02-04-2016, 00:34

da conti basati sui tuoi, considerando, però, un +10% di variabilità di produzione di consumo in più mentre un -40% (senza utilizzo delle HDL), esce una frequenza base di 3.4ghz, alla quale non sono in grado di calcolare un eventuale frequenza del turbo... che potrebbe essere abbastanza alta

i 3.8ghz da te calcolati, con le HDL (-50%), potrebbero essere considerati 3.7 dando un po' di variabilità di produzione, ciò che però non mi torna, è come con le HDL si possano raggingere le frequenze turbo da te indicate

Qualcuno aveva postato il confronto tra CPU HDL e non HDL, facendo vedere che il consumo era nettamente inferiore, circa la metà, a 2,5GHz (o giù di li) e circa uguale (leggermente superiore) attorno ai 3,8GHz (o 3,6, non ricordo)... Con il nuovo processo anche queste frequenze IMHO si spostano verso l'alto, magari non del 35% come annunciato (-50% di consumo o +35% di frequenza), ma comunque dovrebbero essere rimarcabilmente superiori, quindi anche almeno fino a 4GHz le versioni HDL dovrebbero consumare di meno delle versioni non HDL. Forse sono stato troppo ottimista con le frequenze di turbo, ma quelle base sono ampiamente fattibili.

bjt2

02-04-2016, 00:40

vedo che sono l'unico che ancora dà credito a GF/Samsung :cry:
da 28nm HMKG a 22 FD-SOI = -70% di consumo.
22 PD-SOI a 14nm FF = +20% di clock
da 14 LPE a 14 LPP = +15% di clock &&-15% di consumo.....

se mantiene solo la metà di quanto detto sopra, un -50% a parità di frequenza ci arriva facile...

e diciamolo, indirettamente anche le gpu Polaris, danno credito alla bontà dei 14nm LPP di Samsung. AMD ha fatto già sapere che consumeranno il 60% in meno a parità di prestazioni...

PS ma l'uso delle HDL,si scontrano e non poco con il turbo core a 5GHz, soprattutto se siete cos' pessimisti sul silicio.

Posso azzardare un ipotesi, suggestiva, anche se dai costi non indifferenti...
APU e 16 core monolitico saranno fatti con le HDL
octa core, con le HPL...
sono fiducioso sul silicio. Non fate l'errore di confondere i 14nm LPE con i 14nm LPP: dopo tanti processi mediocri, saltati eccetera eccetera, è uscito uno estremamente competetivo :cool:
Se AMD, non si è rivolta a TSMC (nonostante diverse fonti riferiscono che il tape out di ZEN è stato fatto anche nelle fonderie taiwanesi, quindi ha più che valutato la possibilità...), c'è da stare tranquilli...:D , persino più rispetto se si fosse rivolta a TSMC..

Anzi il fatto che l'ES ZEN A0 giri ad una frequenza di 3GHz, superiore a quella dello step B0 di bulldozer (2,8GHz), dovrebbe portare tranquillità..

Male che vada fa uscire un bel 16core XV da 3GHz (4GHz turbo) su 28nm e fa contento almeno Paolo..:sofico:

Con me sfondi una porta aperta... :D Ma sono ingegnere e amo tenermi un ampio margine ed evitare figure barbine del tipo fatte da JF-AMD... :asd:

Quindi qual'e la tua ipotesi di variazione di consumo a frequenza costante e di variazione di frequenza a potenza costante diciamo di un 32nm SOI VS 14nm FF LPP, SENZA CONSIDERARE LE HDL che sono un'altra incognita nell'equazione... -70%/+40%? -75%/+45%? :D
Facci salire la scimmia a tutti! :asd: :sofico:

bjt2

02-04-2016, 00:41

http://www.semiaccurate.com/forums/showpost.php?p=259097&postcount=2373

Inviato dal mio XT1092 utilizzando Tapatalk

Le scimmie sono partite... :asd:

digieffe

02-04-2016, 01:03

Qualcuno aveva postato il confronto tra CPU HDL e non HDL, facendo vedere che il consumo era nettamente inferiore, circa la metà, a 2,5GHz (o giù di li) e circa uguale (leggermente superiore) attorno ai 3,8GHz (o 3,6, non ricordo)... Con il nuovo processo anche queste frequenze IMHO si spostano verso l'alto, magari non del 35% come annunciato (-50% di consumo o +35% di frequenza), ma comunque dovrebbero essere rimarcabilmente superiori, quindi anche almeno fino a 4GHz le versioni HDL dovrebbero consumare di meno delle versioni non HDL. Forse sono stato troppo ottimista con le frequenze di turbo, ma quelle base sono ampiamente fattibili.

con le HDL@28nm carizzo consuma 28w@3ghz come dire 2 core Zen.
quindi 8 core 112w + L3 + pci aggiuntivi, ecc = almeno 125w

ora sapendo che dal 28HDL al 14FinfetDHL -30% di consumi = 88w@3ghz

ma lo stesso carizzo HDL@28nm consuma [email protected] e rifacendi i conti si avrebbe che Zen x8 312w + accessori 320w, -30% = [email protected].

a quanti ghz credi che si sia spostato questo comportamento?
dato che da 3 a 3.5 il consumo triplica, ipotizando un comportamento esponenziale, anche ogni 100 mhz c'è un impressionante incremento del consumo, se non utilizzano delle HDL un po' meno H, probabilmente, il problema anche se si sposta in alto non si attenua

digieffe

02-04-2016, 01:15

paolo.oliva2

02-04-2016, 08:44

paolo.oliva2

02-04-2016, 08:55

Forse :p non sono adatti per salire (base clock)...

Aggiungo un kaveri fortunello (credo), ne ho trovati altri che necessitano di 1.5v per 4.6ghz.

http://www.bitsandchips.it/images/2014/11/25/860KG3258/Athlon860K.png

Metto anche un trinity.

http://www.bitsandchips.it/images/2013/02/15/750K/2690380.png

ps. ditemi voi se come media vanno bene, o postatene di altri...

Io non ho provato il 28nm Bulk, ma il 32nm SOI si raffredda ancora ad aria a 1,475V... anche se Zen volesse 1,5V per i 4,6GHz, vorrebbe dire @4,5GHz ancora ad aria, OTTIMO.

paolo.oliva2

02-04-2016, 09:07

modificavo il post precedente ma ne ho perso il contenuto, continuo qui

non credo a +35% non lo ricordo per nessun cambio di nodo di recente: è sempre stato 2-400mhz e contemporaneamente, in genere, si sono anche allungate le pipeline con probabile diminuzione del FO4, conumque considero + 2-400mhz ipotizzando stesse pipeline e FO4
mente
il salto reale (da 28 a 14) è di solo 1 nodo +finfet, quindi si possono ipotizare quei 2-300mhz canonici ma abbondanti per via del finfet: 500mhz
quindi il comportamento che carizzo ha a 3ghz si avrà a 3.5, ma anche 3.6, ed oltre? stesso comportamento di carizzo?

Comunque oramai mi sembra pressochè assodato un Zen X8 95W TDP per @3GHz.. e per me è un'ottima base per arrivare ALMENO nei 3,5GHz 125W.
Il resto è un terno al lotto... perchè secondo me ci sono TROPPE variabili.
Facciamo vari esempi:
facciamo i calcoli sul 28nm Bulk + Carrizo (comprese HDL e features), ma in realtà NON SAPPIAMO quanto incide il silicio e quanto le features...
A seguire, se il 28nm Bulk è mediocre (e Kaveri non è che era tanto meglio del 32nm SOI con Trinity), allora il salto al 14nm inciderebbe in percentuale molto superiore a quanto ipotizzato.
Anche il discorso HDL e features è presumibile sia migliorato con Zen, mi sembra ovvio che Zen sia stato progettato nei limiti del 14nm FinFet e non come BD a livello architetturale su studi IBM e poi implementato su un 32nm SOI che non rispettava le aspettative.
Se Zen avrà pipeline simili a BD, ovvero a frequenze alte, non sarebbe incompatibile con un silicio che girerebbe a frequenze basse?

Per me Zen partirà ALMENO da @3GHz come X8 nei 95W, dubito fortemente i @4GHz nei 95W, ma su un TDP superiore, 125W, 140W, i 3,5GHz sarebbero superabili come frequenza def.

bjt2

02-04-2016, 10:35

con le HDL@28nm carizzo consuma 28w@3ghz come dire 2 core Zen.
quindi 8 core 112w + L3 + pci aggiuntivi, ecc = almeno 125w

ora sapendo che dal 28HDL al 14FinfetDHL -30% di consumi = 88w@3ghz

ma lo stesso carizzo HDL@28nm consuma [email protected] e rifacendi i conti si avrebbe che Zen x8 312w + accessori 320w, -30% = [email protected].

a quanti ghz credi che si sia spostato questo comportamento?
dato che da 3 a 3.5 il consumo triplica, ipotizando un comportamento esponenziale, anche ogni 100 mhz c'è un impressionante incremento del consumo, se non utilizzano delle HDL un po' meno H, probabilmente, il problema anche se si sposta in alto non si attenua

modificavo il post precedente ma ne ho perso il contenuto, continuo qui

non credo a +35% non lo ricordo per nessun cambio di nodo di recente: è sempre stato 2-400mhz e contemporaneamente, in genere, si sono anche allungate le pipeline con probabile diminuzione del FO4, conumque considero + 2-400mhz ipotizzando stesse pipeline e FO4
mente
il salto reale (da 28 a 14) è di solo 1 nodo +finfet, quindi si possono ipotizare quei 2-300mhz canonici ma abbondanti per via del finfet: 500mhz
quindi il comportamento che carizzo ha a 3ghz si avrà a 3.5, ma anche 3.6, ed oltre? stesso comportamento di carizzo?

Varie considerazioni:
1) come diceva Paolo, la potenza che indichi è quella totale? Quindi con IGP, NB e SB (mi pare sia un SoC)?
2) Il processo 28nm bulk fa notoriamente schifo. I finfet incrementano esponenzialmente la penetrazione della zona di svuotamento: da un solo lato del bulk, a 3 dei finfet: questo comporta minore leakage (meno potenza dissipata) e maggiore guadagno (maggiore frequenza o minore tensione necessaria e quindi di nuovo minore leakage), ma a questo devi aggiungere ANCHE il passaggio 28-14nm! L'unica prossima evoluzione è mettere il gate sui 4 lati (mi pare si chiami configurazione omega:http://www.realworldtech.com/intel-10nm-qwfet/ EDIT: questa cosa degli omega fet l'ho letto su PC professionale, purtroppo non ho pezze di appoggio... :D), perchè gli altri due devono rimanere liberi per source e drain, arrivando ancora più in profondità...
3) La soglia a cui succede il casino con le HDL IMHO dipende solo dalla tensione: poichè a parità di frequenza e di FO4 prevedo che ci vogliano almeno 0,2V in meno con il 14nm FF, se il numero di transistors fossero gli stessi allora basterebbe aumentare le frequenze di Carrizo per cui succede il patatrac del 35%, ma considerando la maggiore variabilità del processo 14nm FF e considerando che 8 core Zen potrebbero avere 4 volte il numero di transistors di Carrizo (solo CPU), di più se consideri la l3, e che con più transistors è maggiore la probabilità di una zona sfortunata che ti costringe ad abbassare il tutto, e che 4 volte il numero di transistors dissipano il quadruplo, spero che possiamo parlare almeno di un +30-+35% sulle frequenze turbo di Carrizo@78W, con target di 125W su Zen (con un solo core i transistors attivi sono pochini) e +35%-+40% sulle frequenze base di Carrizo@28W, per arrivare ai 125W, arrivando ad una frequenza base di almeno 4.05GHz (3GHz+35%) e turbo max di almeno 4,94GHz (3.8+30%) forse quest'ultima un po' meno perchè un core Zen dovrebbe consumare come un modulo carrizo e quest'ultimo, anche se non può essere spento per metà, con un solo thread consumerà probabilmente di meno di un core Zen...

Il motivo di quelle percentuali è che ho supposto uno Zen 125W: quindi dobbiamo ipotizzare un carrizo che dissipa 125W che frequenza max in turbo può avere, con 1 solo thread e quindi mezzo modulo attivo, stessa situazione di uno Zen con un solo thread e per le frequenze di carrizo a 28W, 28*4 fa 112, considerando che IMC e NB non sono duplicati per 4 e che vogliamo arrivare a 125W, ecco perchè sono andato oltre il 35%... Poi ci ho messo del margine considerando la percentuale inferiore...
Insomma a 125W dico che 4.1-4.9GHz sono fattibilissimi e a 95W probabilmente 3.8-4.6GHz anche...

bjt2

02-04-2016, 10:45

Se questo Fottemberg non ci vuole fottemberg, allora ho ragione io... :D

http://semiaccurate.com/forums/showpost.php?p=259126&postcount=2389

Rispondendo a un altro utente:

Originally Posted by Stuckey
8core/16Thread, 3.7 base, 4.1 turbo. 65W

^That. If we're guessing.
You are very near the theorical expetations of AMD (TDP 95W), in my humble opinion. But, if 14nm of Samsung/GloFo will be good enough, we can see a base frequency of 4 GHz (4,3-4,4 GHz with Turbo?). I don't know the real performance of Zen (however, I think at Broadwell IPC level with videogames), it was an April's Fool (did you say?), but Zen is an High Frequency and High Perfomance uArch, like Skylake and Kaby Lake. The overclockers will have a lot of fun with Zen (IHS soldered!). Also, the part of the news about Intel is true: Intel will commercialize a Broadwell-E 10 cores due to their internal Zen estimated performances. Are Athlon64 times come back?

However, don't hype too much. Zen is in the hands of SS/GF and their Fabs.

Forse ho esagetrato un pochino con i turbo, ma le base potrebbero essere meglio di quello che pensavo: 3.7-4GHz base a 95W (!!!)

tuttodigitale

02-04-2016, 11:34

Con me sfondi una porta aperta... :D Ma sono ingegnere e amo tenermi un ampio margine ed evitare figure barbine del tipo fatte da JF-AMD... :asd:
il fatto epico, che ufficialmente AMD non ha mai parlato di aumenti di ipc
Direi che JF-AMD aveva meno informazioni di noi e parlava a sproposito per conto dell'azienda. Se spari una cazzata su AMD in questo forum non succede niente, puoi stare tranquillo.

C'è un'equivoco, non contestavo i valori in sè, ma il fatto che questo fosse possibile con un silicio che riduce solo del 30% i consumi, e quindi guadagni di clock inevitabilmente risicati.

Quindi qual'e la tua ipotesi di variazione di consumo a frequenza costante e di variazione di frequenza a potenza costante diciamo di un 32nm SOI VS 14nm FF LPP, SENZA CONSIDERARE LE HDL che sono un'altra incognita nell'equazione... -70%/+40%? -75%/+45%? :D
Facci salire la scimmia a tutti! :asd: :sofico:
Non ho la vaga idea di cosa aspettarmi. Come ho detto sopra ufficialmente, i 14LPP di Samsung sono superiori per prestazioni, ai 14nm FINFET SOI, e addirittura a quelli SiGe, e per i primi (credo, c'è un generico finfet 14nm) IBM fa riferimento ai 6 GHz contro i 5GHz PD-SOI a 22nm...
IN effetti, sempre ufficialmente, è il processo produttivo di gran lunga più costoso, anche rispetto al 14m siGe SOI. Quel low-power fosse ci ha portato fuori strada, o meglio non si puà trascurare il fatto che sempre ufficialmente la velocità dei transistor HVT sia aumentata di 2,5x, passando da 0,95 a 2,4GHz, ma quella delle prestazioni eccellenti in condizioni di bassa tensione, potrebbe essere solo una delle tante qualità del silicio. :read:

Sono scoperte recenti, per il sottoscritto (ho sempre pensato che i 14nm LPP non era un processo ad alte prestazioni), quindi devo ancora metabolizzare il tutto.
Non mi aspetto che si arrivi a livelli di Intel, tuttavia non possiamo sottovalutare il livello infimo del silicio dal quale si parte. (il capitano la pensa diversamente:O )
Più che i livelli di consumi, diventati ottimi con le HDL, se consideriamo che siamo su 28nm, mi preoccupano le prestazioni in termini di clock.
La mia ipotesi è -60% a 3GHz/+25%,

il salto reale (da 28 a 14) è di solo 1 nodo +finfet

i 14nm Samsung sono dei 18nm, quindi 1 nodo e 1/3 dai 28nm e 1 nodo e 2/3 dai 32nm. E comunque la vera differenza li fanno i finfet...infatti non diresti che la differenza tra i 32 nm e i 22nm finfet è solo 2/3 di nodo..

il salto reale (da 28 a 14) è di solo 1 nodo +finfet, quindi si possono ipotizare quei 2-300mhz canonici ma abbondanti per via del finfet: 500mhz

i miglioramenti delle frequenze di clock possono essere anche notevoli per transistor a bassi leakage, non a caso, le GPU che utilizzano i transistor RVT a media-alta velocità, hanno subito nel corso degli anni aumenti importanti di clock, pur tuttavia consumando meno a parità di transistor.

Considerando che Carrizo raggiunge quelle frequenze con le HDL, e che dai vcore MOLTO bassi in idle, e perchè no anche dal fatto che a 1,4V sia ancora "fresco", è ipotizzabile l'uso di transistor di fascia prestazionale inferiore, che rispondono meglio al miglioramento della litografia.

PS secondo me, INtel con il passaggio dai 45 ai 32nm, poteva benissimo aumentare il clock dai 3,2GHz di Nehalem a 4 GHz per SB, se non si fosse fermata a 3,5GHz-95W:read: mentre ha aumentato il clock di 266MHz ed passata da 4 a 6 core:eek:

capitan_crasy

02-04-2016, 11:50

Ricordo che AMD aveva riportato problemi con l'IGP per giustificare lo slittamento di 6 mesi.
Esatto...
Llano doveva uscire presumibilmente con lo step Ax, ma per un/una prodotto/produzione decente ci volle lo step B0 che appunto costò quasi 6 mesi di tempo e non era comunque un gran che...

Però, Capitano, Llano aveva 100W TDP come massimo, divisi a metà per la parte X86 e la parte IGP. Ora... abbassare le frequenze in modo generale ci può stare, però per la parte X86 abbiamo un riscontro di 50W per 3GHz... (e senza L3 se ricordo bene).
Ora, sul 45nm c'era già il Thuban a 95W (X6 con tanto di L3) con modello a 95W mi sembra a 2,8GHz o 3GHz (non ricordo perfettamente la frequenza).
Facendo dei conti a spannella (molto a spannella), 95W / 6 core * 4 core = 63,33W, IVI COMPRESA la L3.
Mi sembra ovvio che una volta che togliamo il TDP assorbito dalla L3, frequenza/TDP tra 45nm E0 e 32nm SOI io non ci vedo granchè di differenza.

Llano aveva bisogno di uno step più evoluto oltre al B0, destinato ai soli modelli A8.
Gli eventuali A10 Llano (step C?) dovevano aggiungere la frequenza che mancava ai precedenti modelli, ma il posticipo e la "facilità" evolutiva di BD, cioè Trinity, hanno cancellato un progetto già in ritardo.
In linea generale sono d'accordo che come prodotto a 32nm Llano deluda un po ma non c'era tempo per migliorarlo ulteriormente...

Poi ricordo una cosa... la scena di quela wow alla conferenza quando hanno presentato Llano, ricordi? Era lo stesso periodo in cui JF anticipava potenze BD a core uguali al Phenom II. Io interpreto il fatto che in ambedue i casi AMD aveva sicurezze da parte di GF che i prototipi di Llano/BD avrebbero avuto frequenze ben più alte ad affinamento silicio avvenuto.
Dopodichè è crollato sia Llano che BD...
Inoltre... fai un passo indietro. All'epoca 45nm SOI, AMD aveva fissato la roadmap per il 32nm SOI HKMG/ULK e relativo passaggio al 22nm. Quandomai (se non forzatamente) AMD avrebbe preso in considerazione di abbandonare il SOI per passare al Bulk? Posso capire da un 32nm SOI a magari un 22nm Bulk... ma da un 32nm ad un 28nm, di cui certamente il 28nm Bulk non rappresenta di certo il top, è ovvio che il SOI in quel 32nm non ha i vantaggi che sempre il SOI ha avuto sul Bulk.

AMD ha deciso di abbandonare definitivamente il SOI dopo la cancellazione di Komodo.
Dopo il disastro totale dei 65nm e i problemi seri con i 32nm, ha preferito rischiare con il bulk piuttosto che affidarsi ancora al SOI o derivati...

capitan_crasy

02-04-2016, 12:01

il fatto epico, che ufficialmente AMD non ha mai parlato di aumenti di ipc
Direi che JF-AMD aveva meno informazioni di noi e parlava a sproposito per conto dell'azienda. Se spari una cazzata su AMD in questo forum non succede niente, puoi stare tranquillo.

JF lavorava per AMD ed era o meglio doveva essere un collegamento tra gli eventuali rumors e qualcosa di ufficiale; Meyer anche in questo caso era (troppo?:asd:) avanti.
Il problema era l'atteggiamento non adatto al classico utente da forum ma più da presentatore stile "televendite americane"!!!:stordita:

tuttodigitale

02-04-2016, 12:32

Il problema era l'atteggiamento non adatto al classico utente da forum ma più da presentatore stile "televendite americane"!!!:stordita:
in effetti avrebbe dovuto mantenere un profilo basso. Mi pare strano che sia stato messo all'oscuro dei problemi REALI, a quanto pare incolmabili di bulldozer. Ma allo stesso tempo mi pare strano che sapesse qualcosa...:doh:
Credo che tutti sapessero quello che sarebbe successo da li a poco: Gennaio 2011 dimissioni di Meyer, appena 2 mesi dopo dalla famosa slide +50% su 1100T...

Esatto...
Llano doveva uscire presumibilmente con lo step Ax, ma per un/una prodotto/produzione decente ci volle lo step B0 che appunto costò quasi 6 mesi di tempo e non era comunque un gran che...
che poi quella della igp, è l'unica scusa utilizzabile per giustificare il ritardo di llano senza aggiungere ulteriori allarmismi sulla CPU di punta. Il cui sviluppo, se non fosse per date di rilascio puntualmente disattese, sembrava scorrere senza problemi (grazia anche a JF-AMD)

Llano aveva bisogno di uno step più evoluto oltre al B0, destinato ai soli modelli A8.
Gli eventuali A10 Llano (step C?) dovevano aggiungere la frequenza che mancava ai precedenti modelli, ma il posticipo e la "facilità" evolutiva di BD, cioè Trinity, hanno cancellato un progetto già in ritardo.
In linea generale sono d'accordo che come prodotto a 32nm Llano deluda un po ma non c'era tempo per migliorarlo ulteriormente...
in teoria si attendeva anche uno step B3 per BD, ma considerando le lievi differenze tra B2 e B0 (ipc identico), per i quali ci sono testimonianze di modelli portati in OC ad aria a 4,7GHz, probabilmente erano più tentativi dettati dalla disperazione, che non dalla ragione, e questo secondo me vale anche per lo step B0 di llano...(per kaveri, e Carrizo è bastato un a1 e probabilmente anche per BD si attendeva lo stesso)

Mister D

02-04-2016, 13:51

il problema è che molt (anche su semiaccurate) fanno fatica a concepire l'aumento di ipc affiancato al mantenimento o addirittura aumento di frequenza a parità di consumo, quando comunque ci sarà un salto netto di silicio.
da come ci è stato più volte spiegato da @tuttodigitale , @bjt2 e @ren se hanno mantenuto lo stesso fo4 di bd e derivati o da come sembra addirittura diminuito seppur di poco non vedo perché le frequenze dovrebbero essere inferiori (e sbagliavo pure io a pensarla così).
mantenere lo stesso fo4 di bd e quindi pipe lunghe non vuol dire affatto aumentare in modo scarso l'ipc, i colli di bottiglia di bd sono un po ovunque non è certo tutta colpa delle pipe...

Beh non lo si concepisce perché di solito è difficile, se non impossibile, avere la botte piena e la moglie ubriaca. In questo caso IPC alto con pipe lunghe (FO4 basso) ma questo non vuol dire che uno come keller come sua ultima architettura non possa aver deciso la strada più difficile e cioè trovare il modo di far coesistere entrambe le cose: CPU ad alto ipc con alta frequenza! Il santo gral delle cpu.
Cioè vedo per uno come lui che ha sempre preferito cpu ad alto ipc, sacrificando così la frequenza, una scelta conservativa fare ancora un'ennesima cpu ad alto ipc e frequenze medio-basse, stile athlon 64 per intenderci. Vedo invece più stimolante perché una sfida con se e con tutto il resto degli altri progettisti, riuscire dove gli altri non sono riusciti.
E la vedo anche probabile proprio perché forse questa sarà la sua ultima creatura. Ma volete mettere essere ricordati per aver trovato la chimera delle cpu x86 rispetto ad aver fatto un'ottima architettura stile athlon64 o gli odierni i5/i7?
Per me Keller la farà (l'ha fatta) in barba a tutti:sofico:

fatantony

02-04-2016, 14:18

Sottoscritta! Leggo con molto interesse questa discussione, con interventi dal contenuto molto tecnico!! :) continuate così!!
Speriamo non rimandino troppo la data di presentazione...:rolleyes:

tuttodigitale

02-04-2016, 16:31

Mi piace ricordare che il padre di Bulldozer è lo stesso di k7, tanto male questa architettura non deve essere.... ma come è successo con k7, ci vuole il tocco magico di JIM :read:

se bjt2, ha buttato su numeri "bassi" è perchè c'è, da parte sua, ancora un certo pessimismo sul processo 14nm LPP. Se sistematicamente, chi più chi meno, i processi SUPER :( HP, hanno deluso, ora come fa un umile LowPower, ad essere competitivo?
E no, la strada più difficile era abbandonare del tutto BD, e cercare di replicare quanto fatto da Intel, ma senza il silicio di Intel, e con solo 3 anni di sviluppo, con il rischio di un fail clamoroso. Sulla carta una strategia perdente.

Intel con il precotto :D è riuscita a mantenere sostanzialmente invariato l'ipc passando da 20 a 31 stadi...(il risultato fu disastroso sul piano dei consumi :( )

Keller deve fare un pò meno, ma molto meglio.

Ren

02-04-2016, 17:20

Intel con il precotto :D è riuscita a mantenere sostanzialmente invariato l'ipc passando da 20 a 31 stadi...(il risultato fu disastroso sul piano dei consumi :( )

Ci dimostra che la corsa alle frequenze è al palo da parecchio(basta frignare sul silicio), quindi puntare su pipe lunghe senza HDL non ha molto senso...

Il 14nm LPP, sembra al massimo equivalente al HPL del vecchio 28nm.

Se keller ha sfornato un sistema di cache efficace, il 32core sarà una bella spina nel fianco di intel sul lato efficienza/perf.

Considerando che sono +4000 dollaroni per cpu, fossi in AMD punterei tutto sui server...

davo30

02-04-2016, 17:47

http://www.bitsandchips.it/52-english-news/6815-speculations-about-zen-after-our-april-s-fool

Inviato dal mio XT1092 utilizzando Tapatalk

tuttodigitale

02-04-2016, 18:17

Ci dimostra che la corsa alle frequenze è al palo da parecchio(basta frignare sul silicio), quindi puntare su pipe lunghe senza HDL non ha molto senso...
in realtà pare che non abbia senso usare transistor veloci anche per raggiungere i 4 GHz con un'architettura da 17 stadi (ogni riferimento ad Intel è puramente casuale :p ) visto che i vantaggi maggiori si hanno con quelli a bassa perdita, quelli usati da excavator per intenderci :D

La cosa che può sembrare strana, ma il FO4 ridotto è la strategia vincente per ottenere le più alte prestazioni nel ST con le cpu desktop...

Il 14nm LPP, sembra al massimo equivalente al HPL del vecchio 28nm.
non riesco invece a capire come hai tratto questa conclusione, se solo il LPP dovrebbe migliorare le prestazioni del transistor del 15% unito ad una riduzione dei consumi di pari entità, rispetto al non certo scarso LPE...

http://img.deusm.com/eetimes/2015/10/1327935/rcj_SOI_Soitec_2.png
Notare quanto sia costoso il processo low power plus di samsung. :cool:

bjt2

02-04-2016, 18:25

http://www.bitsandchips.it/52-english-news/6815-speculations-about-zen-after-our-april-s-fool

Inviato dal mio XT1092 utilizzando Tapatalk

:sofico: Sono un genio... 3.7-4.0GHz base clock (a seconda del silicio) per uno Zen 8 core 95W... :sofico:

ES step A0, 8 core 3.0GHz senza turbo...

Ren

02-04-2016, 18:36

in realtà pare che non abbia senso usare transistor veloci anche per raggiungere i 4 GHz con un'architettura da 17 stadi (ogni riferimento ad Intel è puramente casuale :p ) visto che i vantaggi maggiori si hanno con quelli a bassa perdita, quelli usati da excavator per intenderci :D

La cosa che può sembrare strana, ma il FO4 ridotto è la strategia vincente per ottenere le più alte prestazioni nel ST con le cpu desktop...

non riesco invece a capire come hai tratto questa conclusione, se solo il LPP dovrebbe migliorare le prestazioni del transistor del 15% unito ad una riduzione dei consumi di pari entità, rispetto al non certo scarso LPE...

PS secondo Ohara, Carrizo è su 28nm SLP. :sofico:

Ovvio, ma l'efficienza è il problema, altrimenti di che stiamo parlando...
Se usi un basso F04, preferisco l'approccio efficiente di carrizo, piuttosto che puntare su frequenze potenziali che non raggiungerai mai.

Di solito la differenza tra un LP ed un HP è maggiore (la tua slide dice 30% sul 28nm), quindi per logica credo sia una via di mezzo, come era per l'appunto HPL di TSMC.

Più che altro mi domando. Ora che IBM è fuori dai giochi, si accontenterà del LPP o si farà sviluppare una versione ad hoc da GF, magari FD-SOI ?

ps. Se magari ! Dopo che hanno fatto una versione apposta per AMD (HPP) usano la variante SLP caccosa...:sofico:

tuttodigitale

02-04-2016, 18:47

:sofico: Sono un genio... 3.7-4.0GHz base clock (a seconda del silicio) per uno Zen 8 core 95W... :sofico:

ES step A0, 8 core 3.0GHz senza turbo...
io sono quello incompreso, sarà da almeno 6 mesi che dico che avrà una frequenza di 4 GHz :rolleyes:

tuttodigitale

02-04-2016, 18:55

Più che altro mi domando. Ora che IBM è fuori dai giochi, si accontenterà del LPP o si farà sviluppare una versione ad hoc da GF, magari FD-SOI ?

ma guarda sempre da slide GF, i 14 LPP di Samsung risultano superiori al FD-SOI a 14nm finfet e pari a quello a SiGe :read:
Quindi a quanto pare ha ragione il capitano, il FD-SOI è stato sovravvalutato...:cool:

Ren

02-04-2016, 18:55

:sofico: Sono un genio... 3.7-4.0GHz base clock (a seconda del silicio) per uno Zen 8 core 95W... :sofico:

ES step A0, 8 core 3.0GHz senza turbo...

Non ti emozionare troppo che alla fine è un rumor alla "mi ha detto mio cugino" :sofico:

Vuoi vedere che alla fine non usano nessuna HDL...:confused:

Ren

02-04-2016, 18:58

ma guarda sempre da slide GF, i 14 LPP di Samsung risultano superiori al FD-SOI a 14nm finfet e pari a quello a SiGe :read:
Quindi a quanto pare ha ragione il capitano, il FD-SOI è stato sovravvalutato...:cool:

Non sapevo ci fosse un 14nm fin-fet FD-SOI in sviluppo...:sofico:

Metti il link please.

bjt2

02-04-2016, 18:59

Non ti emozionare troppo che alla fine è un rumor alla "mi ha detto mio cugino" :sofico:

Vuoi vedere che alla fine non usano nessuna HDL...:confused:

Se alle frequenza che interessano a noi (>3.5 GHz) le HDL rompono le palle e abbassano l'overclock, si possono fare anche due versioni: HDL per mobile e servers ad alta densità e non HDL per performance...

Ren

02-04-2016, 19:02

Se alle frequenza che interessano a noi (>3.5 GHz) le HDL rompono le palle e abbassano l'overclock, si possono fare anche due versioni: HDL per mobile e servers ad alta densità e non HDL per performance...

Non sarebbe male, ma sono i pochi soldini di AMD che mi fanno dubitare.

ps. Già hanno il vizio di accumulare ritardi su ritardi...

bjt2

02-04-2016, 19:04

Non sarebbe male, ma sono i pochi soldini di AMD che mi fanno dubitare.

ps. Già hanno il vizio di accumulare ritardi su ritardi...

Non devono mica uscire insieme! :D

Hint: escono prima gli x8 performance e poi le APU e le versioni servers, dunque... :sofico:

tuttodigitale

02-04-2016, 19:06

Non sapevo ci fosse un 14nm fin-fet FD-SOI in sviluppo...:sofico:

Metti il link please.

dici che non c'è....:D (in effetti sulla slide c'è sempre un SiGe, una svista capita)
Allora quando IBM fa riferimento ai 14nm finfet e illustra un aumento della frequenza da 5 a 6 GHz :read: , si riferisce ai 14 nm LPP Samsung? :sofico:

Lo sai che ora persino 5GHZ in turbo rischiano di diventare pochi :stordita:

Ren

02-04-2016, 19:09

Non devono mica uscire insieme! :D

Hint: escono prima gli x8 performance e poi le APU e le versioni servers, dunque... :sofico:

I proclami di AMD credo puntino verso i Server, ma chissà:confused: ...

@tuttodigitale

Versione low-cost senza FinFet. fail:D :(
Metti cmq le slide che mi mancano.

https://www.semiwiki.com/forum/attachments/content/attachments/11817d1408038759-stm2-jpg

tuttodigitale

02-04-2016, 19:25

Versione low-cost senza FinFet. fail:D :(
Metti cmq le slide che mi mancano.
era un grafico che si riferiva ai nanotubi (grafene :D ).
c'erano i valori assoluti della frequenza. 6GHz per i 14nm FINFET (ora tu mi dice che è il bulk Samsung :eek: ) e 5 GHz per il PD-SOI a 22nm, ed n-mila per il grafene..
il vantaggio del FF era più o meno costante alle altre frequenze.

Poi lo cerco, perchè a questo punto è interessante :sofico:

Non sarebbe male, ma sono i pochi soldini di AMD che mi fanno dubitare.

ps. Già hanno il vizio di accumulare ritardi su ritardi...
Con una sola architettura, sono in grado di coprire mercati differenti, sulla falsa riga di quanto fa Intel con i Core M e ix..
in pratica risparmiano i costi di un'architettura specifica per tablet...poi certo se girano solo con le HDL, vuol dire che il processo di samsung è inadeguato. Ma secondo se ci sarà questa differenziazione, avverrà solo con ZEN+..

Ren

02-04-2016, 19:39

Con una sola architettura, sono in grado di coprire mercati differenti, sulla falsa riga di quanto fa Intel con i Core M e ix..
in pratica risparmiano i costi di un'architettura specifica per tablet...poi certo se girano solo con le HDL, vuol dire che il processo di samsung è inadeguato. Ma secondo se ci sarà questa differenziazione, avverrà solo con ZEN+..

Dal punto di vista economico(soprattutto x AMD) non ha molto senso avere due versioni, sopratutto perché i settori che tirano sono mobile/server. Non credo che il settore HP desktop, anche se sorretto dal gaming faccia numeri da giustificare una versione apposita.

tuttodigitale

02-04-2016, 20:10

Dal punto di vista economico(soprattutto x AMD) non ha molto senso avere due versioni, sopratutto perché i settori che tirano sono mobile/server. Non credo che il settore HP desktop, anche se sorretto dal gaming faccia numeri da giustificare una versione apposita.
credo, magari sbaglio, i z196 4core 5,2GHz 250W (su 45nm) non erano per il gaming...
E comunque tutto è relativo all'aumento di clock...se saranno appena 200-300 MHz come oggi non ne varrà certo la pena.

paolo.oliva2

02-04-2016, 20:34

Nel link postato precedentemente...

"If 14nm LPP will be good, Zen base frequency (8 cores version, TDP 95W) will be 3.7-3.8 GHz. Turbo 4.1-4.2 GHz. If 14nm LPP will be very good (or if AMD will commercialize a limited edition, like the Athlon Slot A 1GHz during the good old times), Zen will have a base frequency of 4 GHz (Turbo 4.2-4.3 GHz). Also, the overclockers will have a lot of fun, because of the soldered IHS!"

La cosa buona è che non ci sono info al basso ma giorno dopo giorno il clock di Zen (presunto) sale e scende il TDP :sofico:, e anche loro rimarcano il fatto di Intel X10 desktop non in roadmap.

Però... secondo me ha ragione Bjt2... il pensiero di 2 release di Zen, uno con HDL e l'altro no, può essere vera.

Io parto da questo punto... se AMD uscirebbe con un Zen X8+8 95W con una frequenza def più vicina ai 4GHz che ai 3,5GHz, non penso ci sia bisogno di aumentare i core oltre 16, invece si parla di un Zen X32.
Allora potrebbe essere che la prima sfornata di Zen possa essere senza HDL semplicemente perchè si sono ritrovati un 14nm che permette a Zen di viaggiare oltre i 3,5GHz in 95W.
Se accorpiamo questo alle info di Zen APU X16 (mi sembra) e di X32 per server, allora un die Zen con HDL abbasserebbe di tanto il TDP, ma idoneo per frequenze >3GHz e la diminuzione del TDP porterebbe ad un aumento consistente di core.

davo30

02-04-2016, 21:37

:sofico: Sono un genio... 3.7-4.0GHz base clock (a seconda del silicio) per uno Zen 8 core 95W... :sofico:

ES step A0, 8 core 3.0GHz senza turbo...
Sei tu il misterioso informatore, di la verità..... :p

Inviato dal mio XT1092 utilizzando Tapatalk

tuttodigitale

02-04-2016, 23:08

Sei tu il misterioso informatore, di la verità..... :p

Inviato dal mio XT1092 utilizzando Tapatalk

i diritti d'autore sul fo4 ZEN e la frequenza di 4GHz base sono miei :read: , nonostante i vari scontri che ci sono stati :ncomment: :cincin: ho mantenuto il mio pensiero.

Però... secondo me ha ragione Bjt2... il pensiero di 2 release di Zen, uno con HDL e l'altro no, può essere vera.
anche quella è una genialata partorita dalla mia mente...:cool:

Pare che ogni mio pensiero scritto da bjt2, acquisti valore.. :sofico:

mi fa piacere che la pensiamo più o meno allo stesso modo:banned: , ma se tutti ti danno ragione, e quindi la danno anche a me:nonsifa: , mi tocca andare sul forum degli intellisti per litigare un poco--:eek:

W BJT2 :yeah:

bjt2

02-04-2016, 23:43

i diritti d'autore sul fo4 ZEN e la frequenza di 4GHz base sono miei :read: , nonostante i vari scontri che ci sono stati :ncomment: :cincin: ho mantenuto il mio pensiero.

anche quella è una genialata partorita dalla mia mente...:cool:

Pare che ogni mio pensiero scritto da bjt2, acquisti valore.. :sofico:

mi fa piacere che la pensiamo più o meno allo stesso modo:banned: , ma se tutti ti danno ragione, e quindi la danno anche a me:nonsifa: , mi tocca andare sul forum degli intellisti per litigare un poco--:eek:

W BJT2 :yeah:
Scusa... :D Quando ho ripreso a seguire il forum ho letto solo superficialmente il thread... C'era già troppa roba... :D Mi deve essere sfuggito... :D
Comunque possiamo essere ottimisti... Il fatto che ipotizzano clock turbo così bassi mi fa sospettare che usino le HDL... Altrimenti non vedo perché non ipotizzare 4.6-4.8GHz con solo un ottavo del chip in funzione...

davo30

03-04-2016, 01:06

Faccio una domanda ignorante. Agli effetti quale differenza c'è tra un processo LP e uno HP? Voglio dire, se i 14nm sono LP come fanno ad andare bene per CPU e sopratutto gpu con tdp BEN pih elevati di soc arm o CPU mobile? Magari lo avete già detto è me lo sono perso, ma se riuscite a spiegarmelo in parole (molto) povere mi tolgo sto dubbio. Anche perché è ciò di cui ho più terrore riguardo a Zen, ossia che ho la certezza che è una ottima aechitettura, ma che data in mano a dei geni quali GF e i loro magici pp, rischia di essere un fail.....

Inviato dal mio XT1092 utilizzando Tapatalk

bjt2

03-04-2016, 09:22

Tapeout, un mese fa, a TSMC, per AMD di una CPU (e ripeto CPU) su interposer, con due stack di memoria HBM2...

Con 2 canali si può arrivare fino a 16GB di RAM e 500GB/s di banda (10 volte un dual channel DDR4 medio). Considerando che molti portatili e ultraportatili hanno già la RAM saldata, potrebbero anche non implementare il controller della memoria e buttare tutto in HBM...

http://semiaccurate.com/forums/showpost.php?p=259198&postcount=2421

Per chi pensa che le HBM vanno bene solo per la grafica, hanno alta latenza, ecc... Ricordo che un SOLO chip di memoria HBM2 ha 8 e dico 8 canali a 128 bit e 2GT/s, equivalente a 16 canali DDR3/4 a 2000MHz... Il protocollo è molto simile a quello DDR4, solo che è 1GHz DDR, ossia 2000MHz equivalenti ed ha granularità di 128 bit e non 64 bit, quindi è come avere 8 controller DDR4 ganged... Se vi ricordate nelle prime CPU (e credo anche adesso) c'era la possibilità da BIOS di avere ganged o unganged e c'era differenza... Forse ora non più, ma questi controller non possono fare 2 transazioni a 64 bit in parallelo... Però no problem: tanto ce ne sono 8 per chip... :D

paolo.oliva2

03-04-2016, 09:26

Faccio una domanda ignorante. Agli effetti quale differenza c'è tra un processo LP e uno HP? Voglio dire, se i 14nm sono LP come fanno ad andare bene per CPU e sopratutto gpu con tdp BEN pih elevati di soc arm o CPU mobile? Magari lo avete già detto è me lo sono perso, ma se riuscite a spiegarmelo in parole (molto) povere mi tolgo sto dubbio. Anche perché è ciò di cui ho più terrore riguardo a Zen, ossia che ho la certezza che è una ottima aechitettura, ma che data in mano a dei geni quali GF e i loro magici pp, rischia di essere un fail.....

Inviato dal mio XT1092 utilizzando Tapatalk

Aspettando che ti rispondano :D, io credo che di base rimanga sempre il concetto di affinamento con priorità consumo o massime frequenze, però la miniaturizzazione sempre più spinta ha in primis aumentato comunque la potenza e diminuendo il consumo permette ugualmente di ottenere frequenze più alte.
Inoltre con CPU multi-core, ben si abbina il fatto che una volta affinato il silicio per ottenere il minimo consumo, si possa aumentare il numero di core.
Se a questo si unisce il fatto che (sembra) il 14nm GF abbia limiti di freqquenza massima uguali o addirittura superiori rispetto a equivalenti HP...
Poi, la ciliegina sulla tota, sarebbe che unendo il discorso HDL, che a spannella ricordo sia stato pubblicizzato come equivalente ad un nodo ulteriore, sarebbe come se il 14nm GF risulti un 9nm, quindi tutto il discorso sopra, conumo a core, frequenza, potenza a die, risulterebbe ancor più sostanzioso.

vegitto4

03-04-2016, 13:44

AceGranger

03-04-2016, 13:57

digieffe

03-04-2016, 14:30

piu che altro cozza alla grande con "copriremo l'80% del mercato Xeon", visto che cosi lo coprirebbero tutto e anche oltre.

ipotizzando uno zen [email protected] 95w si potrebbe avere uno [email protected] 140w con prestazioni maggiori di un intel [email protected]

george_p

03-04-2016, 14:40

ragazzi scusatemi, lungi da me voler far polemica o creare flame, ma secondo quello che state ipotizzando, AMD avrebbe creato un'architettura con l'ipc di haswell/broadwell e con delle frequenze molto superiori a broadwell-e (visto che l'8 core broadwell-e è dato a 3.2 ghz), in 95w di tdp e magari venduto a 300€. Scusate ma a me sembra assolutamente irrealistico un salto di queste dimensioni. Se fosse davvero così, tutta la linea intel HEDT sarebbe spazzata via e non avrebbe più nessuna convenienza. Se AMD avesse fatto una cosa del genere ne avremmo avuto "conferme" ufficiose con qualche leak. Io personalmente non ci credo, contento di essere smentito.

Per te può essere irrealistico come per altri realistico. Punti di vista.
Però ti dico che non verrà spazzata via nessuna linea della concorrenza.
Non è capitato in passato quando con l'athlon amd aveva già sfornato una cpu che stracciava completamente tutti i pentium.
Per intel è bastato agire di pratiche scorrette a tutto campo per continuare il suo monopolio.
Questa è stata la realtà.

Semplicemente per Zen, se risultano vere le informazioni a riguardo, amd ha solo risolto le "lacune" dell'attuale architettura con la prima versione della quale (BD) ha fatto qualche passo indietro rispetto alla precedente.

Quando ZEN uscirà sul mercato, finiremo tutti di speculare sia sulle prestazioni che sul prezzo :)

tuttodigitale

03-04-2016, 15:23

piu che altro cozza alla grande con "copriremo l'80% del mercato Xeon", visto che cosi lo coprirebbero tutto e anche oltre.

se ti piacerebbe: :p
Lisa Su, ha detto che zen coprirà l'80% del mercato server...che se diamo credito alle parole significa l'intero mercato server x86...., l'altro 20%, statistica vuole, che sia coperto dalle soluzioni RISC..

affiu

03-04-2016, 17:31

Per te può essere irrealistico come per altri realistico. Punti di vista.

OK, pero all'atto pratico se domani volessi cambiare pc avrei 2 scenari:
Da un lato la potenza pura x86 e dall'altro la ''potenza'' cpu-gpu come bilanciamento.

Ora se si immagina una futura evoluzione apu amd di adesso nel desktop a 32nm migrando verso i 14nm, potremo avere quasi certamente un 8 core + la componente gpu ; partendo da questo a che risoluzione-prezzo ci potrebbe essere un confronto tra i due scenari?
Cioè potrebbe accadere che giochi ottimizzati al linguaggio adatto si potrebbero giocare in 4k un pò più che accettabilmente.
Non è uno scenario, secondo me, di ampia e facile previsione, perchè si avrebbe uno scenario differente dal passato, senza aggiungere anche un pizzico di fortuna, che di certo avverrà, in ambito HSA.
Non farebbe piacere a chi magari vorrà giocare senza la gpu su giochi magari ottimizzati....a me una APU amd dentro un TDP di 250w con un bel kit liquido ed il gioco è fatto!....solo silenzio:Prrr: 4K:read:
In fondo mi aspetto da amd solo una cosa: che possa dimenticare la GPU esterna in un futuro prossimo(che poi sarebbe il contrario, che la gpu soppianterà la cpu inglobandola definitivamente :mc: )...almeno nel dopo 2020 speriamo che ci arrivino in maniera piena, l'ottimizzazione software potrebbe a sto colpo contribuire alla ''potenza'' che si vuole attribuire.
Poi volendo potrebbe subire un ulteriore potenziamento sul dopo 14nm, ad esempio il 10nm, un altro pezzo in più componente gpu dentro lo stesso tdp dovrebbe arrivare, quindi un processore di almeno, e credo di non essere troppo di fantasia, a piu di 4 TFLOPS.
Partendo da questa notizia:
http://www.gamemag.it/news/cerny-spiega-come-la-grafica-di-ps4-si-evolvera-nel-corso-del-tempo_47865.html è facile farsi dei viaggi:eek: :D....

AceGranger

03-04-2016, 17:56

se ti piacerebbe: :p
Lisa Su, ha detto che zen coprirà l'80% del mercato server...che se diamo credito alle parole significa l'intero mercato server x86...., l'altro 20%, statistica vuole, che sia coperto dalle soluzioni RISC..

bè si, non mi dispiacerebbe che lo coprissero tutto.

il fatto è che ogni settimana che passa Zen diventa sempre piu potente :D

sgrinfia

03-04-2016, 18:03

paolo.oliva2

03-04-2016, 19:23

Quello che dici tu, lo praticavano i romani per far sapere al nemico quanti erano forti (e lo erano), ma chi non è forte come i romani (amd) non ha motivo di far sapere il suo potenziale eventualmente acquisito.;)

Simpatica quella dei rmani, e comunque quello che hai scritto è vero.

Oggi abbiamo un 8370 sul 32nm come procio AMD desktop (lasciamo stare il 9590). AMD ha la disponibilità del 14nm, ha il modulo XV, l'incremento di IPC di XV su PD ammortizzerebbe QUALSIASI calo di frequenza (quasi 1GHz), e l'abbassamento del TDP permetterebbe un X16 da un X8.

Quindi il passaggio dal 32nm SOI al 14nm FF da solo permetterebbe un raddoppio delle potenze a parità di TDP.

Secondo me l'errore che si fa di valutazione è quello di considerare Zen successore di Piledriver. AMD è rimasta ferma sul desktop perchè obbligata dalla mancanza di un silicio idoneo. Dall'8370 Piledriver, c'è il salto a Steamroller, a Excavator e poi a Zen, ed ogni salto apporta incrementi che vanno sommati. Al tutto va aggiunto il salto del silicio, che dai 32nm si passa al 14nm, il che non rappresenta un salto di uno step, ma 2 (considerando 32nm-->22nm--->14nm).

tuttodigitale

03-04-2016, 20:13

Faccio una domanda ignorante. Agli effetti quale differenza c'è tra un processo LP e uno HP? Voglio dire, se i 14nm sono LP come fanno ad andare bene per CPU e sopratutto gpu con tdp BEN pih elevati di soc arm o CPU mobile?
Le GPu sono notoriamente più low power, delle CPU.. le seconde usano transistor LVT o S-LVT, più veloci nella commutazioni (leggasi presentano un minor consumo dinamico) ma con più leakage, (consumo statico).
Fermo restando che entrambi i fattori possono essere limitanti alle alte frequenze, almeno di non utilizzare sistemi di raffreddamento estremi, viene da sé che più si abbassa la frequenza di funzionamento, più ci si può permettere di sacrificare il consumo dinamico a favore di quello statico.

Ora la denominazione LP, sta a indicare che il processo produttivo è adatto ai prodotti a "basso" clock, che generalmente sono quelli che consumano poco (ecco da dove esce il low power), quindi caratterizzato da un più basso leakage e/o a basso costo...

purtroppo quel basso dipende dall'architettura in estrema sintesi:

un FO4 maggiore richiede transistor veloci =leakage elevato

frequenze maggiori con un FO4 più basso = consumo teoricamente aumenta in modo proporzionale = aumento temperatura = aumento del leakage (che può essere difficilmente contenibile, se era già alto)

PS come avrai intuito, ma voglio conferme su quanto dico da bjt2 :muro: , la temperatura è un problema maggiore per i prodotti che hanno transistor caratterizzati da un alto leakage..

Detto questo 4 GHz per una architettura sulla carta progettata per superare i 5,5GHz non sono molti, e i 14nm LPP non sono a buon mercato, costando di più persino il transistor: in pratica sarebbe più conveniente produrre uno ZEN x10 su 28 nm che non un x8 su 14nm..

il fatto è che ogni settimana che passa Zen diventa sempre piu potente :D

sai sapere che l'A0 gira già a 3GHz, alimenta la fiducia...:cool:
ragazzi scusatemi, lungi da me voler far polemica o creare flame, ma secondo quello che state ipotizzando, AMD avrebbe creato un'architettura con l'ipc di haswell/broadwell e con delle frequenze molto superiori a broadwell-e (visto che l'8 core broadwell-e è dato a 3.2 ghz), in 95w di tdp e magari venduto a 300€. Scusate ma a me sembra assolutamente irrealistico un salto di queste dimensioni. Se fosse davvero così, tutta la linea intel HEDT sarebbe spazzata via e non avrebbe più nessuna convenienza. Se AMD avesse fatto una cosa del genere ne avremmo avuto "conferme" ufficiose con qualche leak. Io personalmente non ci credo, contento di essere smentito.
La cosa irrealistica che questo sia l'ennesimo processo produttivo spazzatura per GlobalFoundries. Le teste al vertice sono cambiate. :read:
Per l'ipc, qui un pò tutti ci siamo mantenuti cauti, anche se persone, notoriamente più informate di altre, su altri lidi, dichiarano un ipc pari nel gioco, che poi per molti è dove conta l'ipc....:D

Io credo, che ci saranno notevoli differenze lato FP, a favore di Intel, con l'esecuzione delle AVX 256

Anche perché è ciò di cui ho più terrore riguardo a Zen, ossia che ho la certezza che è una ottima aechitettura, ma che data in mano a dei geni quali GF e i loro magici pp, rischia di essere un fail.
visto che AMD ha fatto il tape out anche sui 16 FF+ di TSMC, il fail dovrebbe essere evitato: se ha speso MOLTI soldi apparentemente inutili, è perchè lei stessa non si è fidata...:read:

Se AMD avesse fatto una cosa del genere ne avremmo avuto "conferme" ufficiose con qualche leak. Io personalmente non ci credo, contento di essere smentito.
amd in assoluto silenzio ha annullato il gap, nel GPGPU. Anzi si è saputo a pochissimi mesi che le soluzioni grafiche avevano abbandonato l'architettura vliw...e in assoluto baccano, ha pubblicizzato il maggior fallimento della sua storia...
E' meglio che stiano zitti...:sofico:, e lasciano a noi forumisti il compito di spararle... :ciapet:

bjt2

03-04-2016, 20:50

Riguardo le AVX 256... Se non mi sbaglio, comunque l'architettura INTEL può fare 2 letture per ciclo di clock a 128 bit, come Zen, perciò il maggior throughtput per AVX 256 se lo fa fritto... Se vai sulle addizioni, che sono semplici, dove in teoria INTEL è superiore ad AMD, sei limitato dalla banda verso la L1... Se vai su situazioni complicate, come le MUL, dove in teoria puoi guadagnare, perchè non sei limitato dalla banda L1, perchè sono operazioni complicate, mi sembra che ci sia una sola unità AVX 256 che può fare le mul e 2 a 128 bit per Zen, quindi siamo pari...

Ren

03-04-2016, 21:39

shellx

03-04-2016, 22:02

https://hardware.slashdot.org/story/16/02/08/0753255/linux-kernel-patch-hints-at-at-32-core-support-for-amd-zen-chips

http://www.kitguru.net/components/cpu/anton-shilov/amd-begins-to-enable-zen-processor-architecture-support-in-linux/

http://www.phoronix.com/scan.php?page=news_item&px=amd-zen-cpu-znver1

Già negli ultimi kernel Debian ho personalmente intravisto codice compilato di gestione cpu diverso dai precedenti kernel. Sicuramente attualmente non c'è niente di mirato per Zen, ma qualcosa nel kernel stanno già pianificando per la next_architecture di amd all'interno del suo compilato.

Inoltre anche in ambito gpu...
https://www.gamingonlinux.com/articles/the-most-popular-linux-steamos-gaming-articles-for-march-2016-174-in-total.6951

Tutto questo è dedicato a chi ama I Sistemi Operativi ovviamente, a tutto il resto dell'utenza: buon w..w... uff no mi esce neppure più... ;)

Ne approfitto per fare un saluto a tutto il thread ;)

Ren

03-04-2016, 22:17

Ren

03-04-2016, 22:42

come avrai intuito, ma voglio conferme su quanto dico da bjt2 :muro: , la temperatura è un problema maggiore per i prodotti che hanno transistor caratterizzati da un alto leakage..

Con le HDL non si aumenta il rischio di hotspot(alzando il clock ovviamente), dato la riduzione di area ?

tuttodigitale

03-04-2016, 23:26

Non sei il solo...;)
Io credo che 125w sia proprio il minimo per quel clock.
.
se ci pensi anche Carrizo è pazzesco...3GHz e 28W :read: su 28nm == 14 core XV 3 GHz 95W.
Se consideriamo la natura low power del processo di Carrizo, lo stesso utilizzato da Jaguar, con la notevole differenza delle frequenze turbo: 2,4GHz per la cpu a 15 stadi contro i 3,2-3,4GHz di excavator....la differenza sarebbe stata notevole, in termini di frequenza, anche nei confronti di Skylake...:read:

ps. intel ha due vantaggi non da poco, ossia il silicio ed i compilatori...
PEr questo non ci siamo illusi dei 6 GHz (esagerato :) ), e abbiamo pensato alle HDL ... il tizio che dice che ZEN ha lo stesso ipc di skylake, dice anche che sono orientati al clock allo stesso modo....il che fa abbastanza ridere.. e farebbe non poco a cazzotti con i 4GHz, pochi per XV, ma tanti per skylake..
il FO4 di BD è a metà strada tra un z196 fo4 15 -5,2GHz e un power 7 fo4 18-4,24GHz, sempre su 45nm, e a quanto pare ZEN è simile:
4GHz considerando le enormi differenze di litografia, la considero una frequenza raggiungibile con una buona efficienza: dai 45 ai 14nm finfet sarà cambiato qualcosa immagino....

Con le HDL non si aumenta il rischio di hotspot(alzando il clock ovviamente), dato la riduzione di area ?
oltre le HDL in Carrizo sono stati usati transistor a basso leakage, fonte Ohara. (credo che le due cose siano interconnesse). Hanno risolto il problema all'origine. :D
inoltre uno dei vantaggi pubblicizzati dai finfet è che permettono una riduzione dell'energia maggiore di quella spaziale...E' poco più di un salto di nodo, eppure si parla di -60,-70% di energia a parità di frequenza..

http://images.anandtech.com/doci/9762/P1030606.jpg
come vedi la potenza per unità di superficie è pari al 60% dei 28nm, c'è un ampio margine per salire di frequenza :cool:

PS per me l'ipc nel ST di skylake sarà del 25-30% superiore..

Ren

03-04-2016, 23:44

inoltre uno dei vantaggi pubblicizzati dai finfet è che permettono una riduzione dell'energia maggiore di quella spaziale...E' poco più di un salto di nodo, eppure si parla di -60,-70% di energia a parità di frequenza..

http://images.anandtech.com/doci/9762/P1030606.jpg
come vedi la potenza per unità di superficie è pari al 60% dei 28nm, c'è un ampio margine per salire di frequenza :cool:

Si ma vi dimenticate sempre che quei test sono su processori mobile che vengono cloccati (scusate il termine) intorno ai 2-2.5ghz, anche meno se prendiamo A53, cioè l'ideale per il finfet.

Ti ricordi la curva del 22nm FF di intel ? Ad un volt già annaspava...

Non dico che non ci sarà miglioramento, ma non aspettatevi chissà che ad alte frequenze. (soprattutto con le HDL)

PS per me l'ipc nel ST di skylake sarà del 25-30% superiore..

Io "spero" che non si arrivi al 30% in ST...:cry:

tuttodigitale

04-04-2016, 00:18

Si ma vi dimenticate sempre che quei test sono su processori mobile che vengono cloccati (scusate il termine) intorno ai 2-2.5ghz, anche meno se prendiamo A53, cioè l'ideale per il finfet.
ma il valore della frequenza dipende dall'architettura...infatti dici "anche meno se prendiamo a53", forse perchè ha un fo4>30 :cool: , 8 stadi vs 15 stadi del a57.
io ti potrei rispondere: "anche MOLTO di più se prendiamo Bulldozer, cioè l'ideale per il finfet" visto le pipeline nettamente più lunghe (20 stadi circa)...facendo le proporzioni (non è esatto, ma tanto per avere un numero su quale ragionare) 20/15 * 2,5GHz = 3,3GHz....
stai dicendo che a 3,3GHz i finfet permettono a excavator di ridurre i consumi del 70%...
Ma hai visto quanti core XV entrerebbero oggi in 95W, moltiplica per 3,3x = 46 core XV 3GHz 95W,
SVENGO :)
Finiscila di dare da mangiare alla scimmia.:D

ps credo che i vantaggi sia in termini di area e di consumo, saranno più bassi, già AMD si è pronunciata ad un molto più ragionevole -50% (la differenza tra -50 e -70% è notevole) a parità di frequenza dovuta al processo produttivo. Hanno il brutto vizio di spararle grosse..

digieffe

04-04-2016, 00:24

a questo punto mi son formato la convizione che non avrà un clock più basso dell'intel 6900, ovvero 3.2 base clock e 3.7 turbo, inoltre l'ipc di skylake non sarà superiore al 20% (probabilmente meno del 10%)

FO4 più basso di intel e pipeline più lunghe, perché dovrebbe avere un clock più basso?
per il consumo, ovvero 95w? credo che il 6900 consumi ~120w... ma ha anche più throughput

Ren

04-04-2016, 00:28

ma il valore della frequenza dipende dall'architettura...infatti dici "anche meno se prendiamo a53", forse perchè ha un fo4>30 :cool: , 8 stadi vs 15 stadi del a57.
io ti potrei rispondere: "anche MOLTO di più se prendiamo Bulldozer, cioè l'ideale per il finfet" visto le pipeline nettamente più lunghe (20 stadi circa)...facendo le proporzioni (non è esatto, ma tanto per avere un numero su quale ragionare) 20/15 * 2,5GHz = 3,3GHz....
stai dicendo che a 3,3GHz i finfet permettono a excavator di ridurre i consumi del 70%...Finiscila di dare da mangiare alla scimmia.:D

Ca**o hai scritto, sembra aramaico in stato emozionale...:D

Stiamo parlando di consumi non di frequenze massime ideali.

Quei test sul finfet sono fatti su processori che operano a basse frequenze e spesso sui 20-30C (nel test). Per questo sparano quei numeroni sull'efficienza. Non è una situazione da processore desktop a 3ghz o più...:(

Ren

04-04-2016, 00:33

digieffe

04-04-2016, 00:35

Il 10core intel sputa 140w con soli 3-3.2ghz.

il 12 sputa 160w con le stesse frequenze(3.0ghz)... quindi l'8 a 3.0ghz ~107w, quanti a 3.2 ?

Ren

04-04-2016, 00:42

il 12 sputa 160w con le stesse frequenze(3.0ghz)... quindi l'8 a 3.0ghz ~107w, quanti a 3.2 ?

Mi ero dimenticato degli E5 appena usciti:doh:

Io ho trovato questo, però ha qualche link QPi di troppo che assorbe watt.

E5-2667 v4 8/16 135W 3.2GHz

cmq guardano gli xeon, è plateale quanto sperperi energia ogni 200mhz in più

E5-2643 v4 6/12 135W 3.4GHz :Puke:

Il silicio è proprio alla frutta...

digieffe

04-04-2016, 00:46

Mi ero dimenticato degli E5 appena usciti:doh:

Io ho trovato questo, però ha qualche link QPi di troppo che assorbe watt.

E5-2667 v4 8/16 135W 3.2GHz

non solo ha i QPi ma ha anche il turbo dal 3° all 8° core @3.5 invece che 3.4 come il 6900 da 140w

vuol dire che sul 6900 sono conservativi

Ren

04-04-2016, 00:52

non solo ha i QPi ma ha anche il turbo dal 3° all 8° core @3.5 invece che 3.4 come il 6900 da 140w

vuol dire che sul 6900 sono conservativi

Togli tutto l'ambaradan ed ecco 10core, invece che 8 per 135-140w. Il margine di errore non è molto.

digieffe

04-04-2016, 00:52

Mi ero dimenticato degli E5 appena usciti:doh:

Io ho trovato questo, però ha qualche link QPi di troppo che assorbe watt.

E5-2667 v4 8/16 135W 3.2GHz

cmq guardano gli xeon, è plateale quanto sperperi energia ogni 200mhz in più

E5-2643 v4 6/12 135W 3.4GHz :Puke:

Il silicio è proprio alla frutta...

probabilmente il 6/12 consuma meno del 8/16 ma è nella stessa fascia di tdp da 135w
guarda anche il 4/8 sempre 135... ecco perchè dico che il 6900 sta vicino ai 120w

tuttodigitale

04-04-2016, 01:05

Il 10core intel sputa 140w con soli 3-3.2ghz dai rumor.
la frequenza naturale dell'architettura Intel è circa il 70-75% di quella AMD.
A 2,2 GHz l'athlon XP era un fornetto, il northwood era fresco come una rosa, nonostante la maggior complessità...

prendo Carrizo : 3GHz 28W
95W abbiamo: 14 core 3GHz 95W
-50% finfet: 28core 3GHz 95W
consumo quadratico 3-4GHz
16 core 4GHz 95W
1 modulo XV= 1 core ZEN (solo così possiamo sperare in un ipc nel MT pari al 80-90% di skylake, imho)

8 core ZEN 4GHz 95W..fa paura, ma non dimentichiamo che anche Excavator sembra consumare la metà di kaveri a 3GHz, e non era certo un disastro...

Stiamo parlando di consumi non di frequenze massime ideali.
(
stavamo parlando dei miglioramenti dei consumi in rapporto alle frequenze relative delle diverse architetture, o meglio alla velocità di scarica assoluta del gate, uguale per tutti :read: poi che un -70% sia irrealistico sono d'accordo, ma dire che non ci saranno miglioramenti MOLTO ESTESI no.

Ren

04-04-2016, 01:18

prendo Carrizo : 3GHz 28W
95W abbiamo: 14 core 3GHz 95W

Magari aggiungici un pò di watt per un sistema di cache L3 decente (e qualche fpu), invece di moltiplicare i pani senza pesci... :sofico: :sofico: :yeah:

Secondo me i 4ghz (base clock) in 95watt li vediamo col caspio su 8core...:(

Passo e chiudo;)

bjt2

04-04-2016, 08:57

Magari aggiungici un pò di watt per un sistema di cache L3 decente (e qualche fpu), invece di moltiplicare i pani senza pesci... :sofico: :sofico: :yeah:

Secondo me i 4ghz (base clock) in 95watt li vediamo col caspio su 8core...:(

Passo e chiudo;)

Ma nei 28W non c'è il NB? Se moltiplichi la potenza per 3,5 devi sottrarre la potenza di quello che non è CPU, che non viene moltiplicata... Altrimenti 95W sono 7 moduli XV + 7 canali DDR3...

E il calcolo di tuttodigitale diventa questo:

prendo Carrizo : 3GHz 28W 2 moduli + 2 canali DDR3
95W abbiamo: 14 core 3GHz 95W 7 moduli + 7 canali DDR3
-50% finfet: 28core 3GHz 95W 14 moduli + 14 canali DDR3
consumo quadratico 3-4GHz 14 moduli@3GHz + 14 canali DDR3 alla stessa frequenza=8 moduli@4GHz+8 canali [email protected] volte la frequenza = 16 core XV 4GHz 95W con 8 canali DDR3
1 modulo XV= 1 core ZEN (solo così possiamo sperare in un ipc nel MT pari al 80-90% di skylake, imho)

8 core ZEN 4GHz 95W = 8 moduli@4GHz+8 canali [email protected] volte la frequenza

Ma i canali sono sempre 2 e il NB non è stato aumentato...

bjt2

04-04-2016, 09:42

però manca la L3 da 8mb per 4 core Zen, ma c'è da considerare che Zen non è XV, sarà sicuramente più efficiente in modo intrinseco anche vuoi per la cache che diventa inclusiva :sofico:

comunque al link francese che avevi messo l'altro giorno:

"TSMC a également indiqué avoir réalisé le tapeout le mois dernier d'un "CPU" accompagné de deux piles de mémoire HBM2."
tradotto:
TSMC ha anche detto di aver realizzato il tapout lo scorso mese di una "CPU" con due celle di memoria HBM2. :read:
però non cita direttamente AMD :boh:

Non sono sicuro, ma mi pare che nei 28W di carrizo siano compresi anche la GPU, che compensa ulteriormente per la L3... :D

Per TSMC... Beh, CPU+HBM2... Chi può mai essere? NVIDIA con una nuova versione di Tegra? Apple? Può essere... Ma non menziona APU o SoC, che sarebbe il termine corretto per Tegra o il SoC Apple, probabilmente per qualche iPad o iPhone, ma dice CPU...

tuttodigitale

04-04-2016, 09:53

Secondo me i 4ghz (base clock) in 95watt li vediamo col caspio su 8core...:(

Ma la corsa ai GHz di questi giorni, è dovuta alle patch di ZEN, dove abbiamo, inaspettatamente, un allungamento ulteriore delle pipeline, un piccolo segno che il FO4 potrebbe essere lo stesso di BD, come aveva teorizzato tuttodigitale (che sarei io :D ) almeno 6 mesi fa. :sofico:

a mio giudizio è più difficile, con le pipeline lunghe che si ritrova avere l'ipc allo stesso livello di skylake, peraltro con dichiarazioni di AMD lato ipc molto più pessimistiche: +40% di ipc è "solo" l'ipc di SB.:cry:

quoto te ma parlo a tutti :D ma chi ve lo ha detto che useranno le HDL?
per me non le useranno.
gridracedriver...HDL e HPL sono librerie e queste dipendono dal particolare processo. Proseguite nella lettura che quello che dirò è interessante. :p

i 14nm finfet permetterebbero ad una non specificata architettura ARM (Credo l'a72) di poter raggiungere i 4,8GHz :read: e attenzione utilizzando transistor RVT (quelle delle GPU per intenderci) 3,3GHz con le HPL (ma oltre i 3 GHZ è da considerarsi d'emergenza).

Con le HDL i valori scendono rispettivamente a 4,1 e 2,9GHz :read:
Solo a titolo di curiosità il livello di consumo a 2 GHz (HVT+HPL) e 2,5 GHz (RVT+HDL) è il medesimo..un SoC per tablet potrebbe usare con proficuo i transistor RVT :read:

Ecco se un ARM A72 raggiunge i 4,1GHz con le HDL, ma il punto di pareggio con le HPL è a 4GHz, non vedo come un'architettura con un FO4 più basso, del 20%, e mi mantengo basso :read: , debba utilizzare i transistor LVT+HPL (librerie ad alte prestazioni), se la frequenza massima è di appena 4,4 GHz :sofico: (bjt2 potrebbe aver azzeccato la frequenza turbo)

Le informazioni sui finfet di Samsung sono estremamente positive..

EDIT
Ho scritto un inesattezza. In verità sono le prestazioni dei hvt ad aver subito un rialzo imponente. Che non li rendevano adatti agli smartphone

AceGranger

04-04-2016, 10:01

Ma nei 28W non c'è il NB? Se moltiplichi la potenza per 3,5 devi sottrarre la potenza di quello che non è CPU, che non viene moltiplicata... Altrimenti 95W sono 7 moduli XV + 7 canali DDR3...

E il calcolo di tuttodigitale diventa questo:

prendo Carrizo : 3GHz 28W 2 moduli + 2 canali DDR3
95W abbiamo: 14 core 3GHz 95W 7 moduli + 7 canali DDR3

si ma non credo che sia un art attack di questo tipo...

Intel nei 15 Watt dell' i7 6600U 2,6 GHz ( turbo 3,4 GHz ) ci mette

2 core+HT
2 canali DDR4
HD520 ( 24 EUs )
12 linee PCI-EX

vorrebbe dire che in 120 W dovrebbe metterci

16 core a 2,6 GHz
16 canali DDR4
GPU con 192 EUs, tipo una GPU di fascia media....
96 linee PCI-EX

e invece in 120W i nuovi 16 core arrivano solo a 2,1 GHz e senza tutto il resto, mentre per 16 core a 2,6 GHz servono 145W e sempre senza tutto il resto.

quando iniziano ad affiancarsi i core e i canali di memoria il TDP credo salga esponenzialmente e non linearmente.

tuttodigitale

04-04-2016, 10:09

c'è anche da considerare che i finfet hanno una variabilità molto ampia, riportata anche in documenti tecnici e la scelta di usare die enormi potrebbe rivelarsi contro producente..

SSLazio83

04-04-2016, 10:32

quando usciranno questi zen?
saranno + potenti degli attuali intel?

bjt2

04-04-2016, 10:39

c'è anche da considerare che i finfet hanno una variabilità molto ampia, riportata anche in documenti tecnici e la scelta di usare die enormi potrebbe rivelarsi contro producente..

Infatti IMHO useranno MCM 4x e faranno die massimo x8 per il 32 core... Che è giusto un octachannel...

bjt2

04-04-2016, 10:41

si ma non credo che sia un art attack di questo tipo...

Intel nei 15 Watt dell' i7 6600U 2,6 GHz ( turbo 3,4 GHz ) ci mette

2 core+HT
2 canali DDR4
HD520 ( 24 EUs )
12 linee PCI-EX

vorrebbe dire che in 120 W dovrebbe metterci

16 core a 2,6 GHz
16 canali DDR4
GPU con 192 EUs, tipo una GPU di fascia media....
96 linee PCI-EX

e invece in 120W i nuovi 16 core arrivano solo a 2,1 GHz e senza tutto il resto, mentre per 16 core a 2,6 GHz servono 145W e sempre senza tutto il resto.

quando iniziano ad affiancarsi i core e i canali di memoria il TDP credo salga esponenzialmente e non linearmente.

Può darsi che sia l'effetto del die più grande, oppure del maggior margine sia di Vcore, che di TDP che si da sulle versioni server vs le versioni consumer... Oltre ad essere die più selezionati, mi ricordo che gli Opteron, ad esempio, avevano Vcore più alti e frequenze più conservative, in modo da ridurre la probabilità di failure...

capitan_crasy

04-04-2016, 11:15

quando usciranno questi zen?

Forse fine 2016...

saranno + potenti degli attuali intel?

Non si sa ancora niente, ma non ti aspettare quali miracoli...

Free Gordon

04-04-2016, 11:52

Infatti IMHO useranno MCM 4x e faranno die massimo x8 per il 32 core... Che è giusto un octachannel...

E' proprio ciò che ha detto il tizio del CERN.. :)

capitan_crasy

04-04-2016, 12:07

capitano, capisco che ultimamente ti piace volare basso :D , ma da (metà, fine?) marzo c'è in giro un A0 da 3ghz quanto sempre facendo un parallelo con bulldozer a giugno 2011 era in giro un B0/B1 poi commercializzato ad ottobre come B2g...

se non lo commercializzano per fine Q3 o inizio Q4 quindi settembre/ottobre sarà solo per una scelta VOLUTA e non forzata

Diciamo che l'altitudine media di questo thread è moooolto alta, io resto in quota di crociera.:read:
Guardo con la coda dell' occhio i rumors e con tutto il resto le notizie ufficiali, quindi in mancanza d'altro fine 2016 rimane il punto di riferimento e sono stato anche ottimista...;)

capitan_crasy

04-04-2016, 12:27

paolo.oliva2

04-04-2016, 13:43

Ma la corsa ai GHz di questi giorni, è dovuta alle patch di ZEN, dove abbiamo, inaspettatamente, un allungamento ulteriore delle pipeline, un piccolo segno che il FO4 potrebbe essere lo stesso di BD, come aveva teorizzato tuttodigitale (che sarei io :D ) almeno 6 mesi fa. :sofico:

a mio giudizio è più difficile, con le pipeline lunghe che si ritrova avere l'ipc allo stesso livello di skylake, peraltro con dichiarazioni di AMD lato ipc molto più pessimistiche: +40% di ipc è "solo" l'ipc di SB.:cry:

Si, però l'IPC da solo non dice nulla se non rapportato alla frequenza.
A spannella, ci farei la firma se Zen avesse un -20% di IPC ma frequenze def superiori del 33%.
Già mi immagino le varie testate a postare i bench di confronto con gli Intel occati alla stessa frequenza di Zen per far vedere che Intel è più potente a parità di frequenza:doh:

@Acegranger
Non lo so fino a che punto Intel possa spingere di più il clock in rapporto al TDP (se non affinando ulteriormente il 14nm, cosa comunque che reputo possibilissima, visto che non aveva bisogno di spenderci più del dovuto). Fino ad oggi AMD con il consumo predittivo doveva per forza essere conservativa... Intel invece con il consumo istantaneo praticamente è vicina al 100% delllo sfruttamento TDP nominale (ricordi che poteva permettersi pure lo sforamento per x secondi?).

Secondo me assisteremo ad un confronto architetturale con Zen di 2 correnti ben diverse. Se il 14nm Intel è riconosciuto come il migliore sulla piazza, ma Zen potrebbe offrire un TDP/potenza migliore, allora tornerebbe in campo la valutazione IBM sull'FO4, che con BD ha toppato ma non per BD, per il 32nm SOI. E se è vero che Zen avrebbe la lunghezza del pipeline come BD, sarebbe un'ulteriore conferma. Se poi il progetto è di Kelner, non penso si sia rimbecillito pure lui.

Comunque penso che fare confronti architettura AMD sul 28nm e 14nm abbia un senso, ma confrontare l'architettura Intel sul suo 14nm ed estrapolare l'impennata di TDP all'aumentare della frequenza attribuendola al solo silicio ignorando che la curva di rendimento dell'architettura Intel ha un clock ben più basso di quello che può essere l'architettura AMD... in fin dei conti abbiamo visto tutti che TDP ridicoli ha Piledriver a frequenze a cavallo di 4GHz (seppur sul 32nm)...

AceGranger

04-04-2016, 14:02

@Acegranger
Non lo so fino a che punto Intel possa spingere di più il clock in rapporto al TDP (se non affinando ulteriormente il 14nm, cosa comunque che reputo possibilissima, visto che non aveva bisogno di spenderci più del dovuto). Fino ad oggi AMD con il consumo predittivo doveva per forza essere conservativa... Intel invece con il consumo istantaneo praticamente è vicina al 100% delllo sfruttamento TDP nominale (ricordi che poteva permettersi pure lo sforamento per x secondi?).

eh ma appunto per quello non so quanto possa valere l'usare le CPU inferiori come "modulo" da moltiplicare per stimare le TOP; credo che affiancando tanti core in poco spazio il TDP aumenti piu che linearmente, anche senza aumentare la frequenza.

magari la nuova architettura di AMD riuscira a distribuire meglio il calore e ad avere minori problemi in questo senso; ma guardando le CPU di Intel deve essere un problema abbastanza rilevante.

bjt2

04-04-2016, 14:51

E' proprio ciò che ha detto il tizio del CERN.. :)

Mi sa che l'ho sentito da lui... :asd:

bjt2

04-04-2016, 14:52

Credo che sia legata al mondo delle console e credo che sia una sorda di APU custom destinata a Nintendo oppure a Sony se le voci di una super PS4 sono reali...

Ma sempre CPU+GPU AMD, no? Altrimenti cosa? Tegra?

tuttodigitale

04-04-2016, 15:31

la PS4k non penso in quanto sarebbe tutto un altro hardware e non un potenziamento e cozza con la notizia che verrà lanciata per la stagione holiday 2016 e quindi dicembre.
Che Nintendo si sia data una mossa finalmente per fare qualcosa di competitivo, questa si che sarebbe una notizia :D
credo se mantengono jaguar,che comunque prima o poi ad un die shrink deve comunque essere sottoposto, e GCN, grossi problemi di compatibilità non dovrebbero averli...
la strada è percorribile, da ignorante, a livello tecnico, ma a livello di costi, assolutamente NO, non credo che vedremo HBM2.0 nella fascia mainstream...:read:, estremamente più probabile, se mai ci sarà la ps4k, che utilizzino GCN 1.2 e gddr5 ad alta velocità(7Gbps)
Deve esserci dell'altro.:cool:

Mi sa che l'ho sentito da lui... :asd:
Non vorrei dirlo, ma io il tizio del Cern non l'ho sentito, chi l'ha sentito ha detto che la soluzione x32 avrà 2 die da 16 core. (vedi news prima pagina. che a proposito dovrò aggiornarla :stordita: ).

La domanda è: l'ha detto sul serio?:doh:
credo che siamo restati i soli a credere in un MCM x4.. :fuck:

Credo che sia legata al mondo delle console e credo che sia una sorda di APU custom destinata a Nintendo oppure a Sony se le voci di una super PS4 sono reali...
o la CPU da 64 core qualcomm o k12,.:sbavvv:, da non escludere, visto che il loro "parente" (il power8) ha anche la edram off chip...e non certo per aiutare la gpu..

assunto nuovo ingegnere
http://www.extremetech.com/computing/225564-amd-appoints-former-broadcom-intel-engineer-to-head-cpu-development

Free Gordon

04-04-2016, 16:10

Ma sempre CPU+GPU AMD, no? Altrimenti cosa? Tegra?

Certo.

Ma questa APU con HBM non può essere il Nintendo NX perchè dev'essere già andato un tape out diverso tempo fà.. ;) (E' in uscita per quest'anno).

Non so se possa essere la PS4K...ma dubito fortemente.

La cosa più probabile è che sia un'APU Zen in uscita nel 2017 oppure roba per Apple come dice Grid..

xk180j

04-04-2016, 21:06

http://www.overclockers.ru/lab/75317/32-norma-pervoe-znakomstvo-s-amd-zen.html

potrebbe essere tutto falso è datato 1 aprile

capitan_crasy

04-04-2016, 21:24

http://www.overclockers.ru/lab/75317/32-norma-pervoe-znakomstvo-s-amd-zen.html

potrebbe essere tutto falso è datato 1 aprile

infatti è un pescione...

paolo.oliva2

05-04-2016, 11:38

Quesito (Bjt2/Tuttodigitale) :sofico:

Tempo fa feci delle prove sul mio 8350 e praticamente c'era una differenza di Vcore nell'OC/frequenza a seconda dei moduli attivi, da circa 1,6V@5,2GHz 4m a 1,525V@5,2GHz 1M, e addirittura RS a 5,150GHz.

Ho fatto la medesima prova con l'8370 con 1 modulo attivo/2 core (5' OCCT4.4.1)
1,28V 4,6GHz (48° con dissi stock, 23X).
1,31V 4,7GHz (50° con dissi stock 23,5X).

La mia domanda... non è che il 32nm SOI con 4M, aumentando il numero di transistor, aumenta il leakage e quindi il Vcore in generale? Se così fosse... la richiesta del Vcore a X frequenza del 32nm SOI la si dovrebbe calcolare senza l'interferenza del leakage... anche perchè il 14nm lo dovrebbe avere molto più basso e quindi ininfluente nel confronto.

paolo.oliva2

05-04-2016, 12:55

eh eh, purtroppo non ci sarà mai un Keller tris tra 10 anni, ha un età avanzata per fare 12~14 ore di lavoro al giorno :asd:

ps. dimenticavo un altro fattore a favore di Zen, la L2 doppia a Core rispetto le cpu Intel: 512KB vs 256KB tutte e due inclusive
L3 2MB a Core per Zen vs 2.5MB a Core per BW-E e IMC DC vs QC, 8c vs 10c e per tanto area più piccola a Die

questo dovrebbe bastare a sopperire lo scaling inferiore dei 14nm ss/gf vs intel

Secondo me non conta tanto la differenza di silicio tra quello GF e Intel ad una determinata frequenza, perchè comunque l'architettura Intel è più potente ma produce anche un TDP maggiore all'aumentare della frequenza rispetto a Zen.
Quello che determinerà il risultato vero e proprio sarà di quanto Zen avrà un IPC inferiore ad Intel e per contro quanta frequenza concederà in più l'architettura Zen a parità di TDP rispetto ad Intel.
Partiamo dal fatto che Zen ES ha raggiunto i 3GHz sembra nei 95W alla prima sfornata, contro un BD che aveva dato 2,8GHz a 125W. Se l'affinamento di Zen fosse simile a BD, BD dai 2,8GHz ha concesso i 3,6GHz e poi 4GHz in 125W, Zen potrebbe concedere 200MHz in più e 30W TDP in meno.
SE (sottolineo se) ci ritrovassimo anche solamente 4GHz ie non in 95W ma 140W (tanto per mettere un TDP uguale ad Intel), l'X6 Intel avrebbe il 33% in meno di core, 15% in meno di frequenza, ed un 5960X lo stesso numero di core ma ben 33% in meno di frequenza. Il 6700K avrebbe la stessa frequenza ma con la metà dei core... che valore avrebbe di parlare di IPC?

P.S.
Su quello che hai scritto... c'è anche un altro vantaggio di Zen.
Nel procio Intel, quando l'SO "salta" da un core all'altro, il core successivo deve andare a pescare i dati nella L3 (che è inclusiva) perchè nella propria L2 non li ha (sarebbero nella L2 dell'altro core). Se Zen ha una L2 condivisa stile modulo, se il TH si sposta nel core dello stesso modulo, praticamente i dati sarebbero nella L2 condivisa tra i 2 core. La condizione in cui Zen sarebbe obbligato ad andare a prendere i dati nella L3 (come Intel), praticamente sarebbe ridotta del 50%. Non mi sembra un vantaggio da poco...

AceGranger

05-04-2016, 15:16

è già guerra aperta?
http://www.bitsandchips.it/9-hardware/6825-core-i7-6950x-un-derivato-xeon-come-lo-furono-i-pentium-ee-gallatin

bha, mi sembra un articolo da "scoperta dell'acqua calda"...

è da Sandy Brodge-E che usano gli Xeon per fare le CPU -E; il fatto di avere o meno i core disabilitati è sempre dipeso dal tipo di "pattern" usato per gli Xeon;
Anzi, volendo guardare, direi che praticamente ogni CPU Intel è "ricavata" dagli Xeon, perchè anche gli i3-i5 e i7 quad-core hanno le corrispettive varianti Xeon....

http://www.anandtech.com/show/5091/intel-core-i7-3960x-sandy-bridge-e-review-keeping-the-high-end-alive

Free Gordon

05-04-2016, 15:22

Effettivamente è strana questa decisione di Intel di buttare fuori un DECAcore da 140W per il mercato desktop..

AceGranger

05-04-2016, 15:28

el-mejo

05-04-2016, 16:47

Effettivamente è strana questa decisione di Intel di buttare fuori un DECAcore da 140W per il mercato desktop..

di strano c'è solo che l'8 core sia arrivato con una generazione di ritardo; ed è piu che normale che arrivino nel mercato consumer per 3 ragioni:

1 - sono pubblicita gratuita
2 - riescono a vendere anche i die che non vanno bene per gli Xeon
3 - le vendono bene sia agli utenti enthusiast, sia agli utenti prosumer sia agli utenti pro.

Intel è costretta ad uscire con questa cpu perchè Amd a fine anno esce un 8 core su una piattaforma snella ed relativamente economica come quella AM4: alla fine a pochi servono 40 linee pci-e e controller di memoria quad channel, ma a più di qualcuno farebbe piacere a gestire più dei canonici 8 thread elaborari dagli i7 dei vari socket 115x o dai vecchi Amd FX, in particolare con la scarsissima obsolescenza delle piattaforme attuali.

Ad esempio una macchina con Zen x8 top di gamma, 32gb ddr4 su due moduli e mobo con supporto nativo m.2 magari il tutto su piattaforma mini itx, con i dovuti aggornamenti di vga credo mi permetterebbe di fare qualsiasi cosa fino al 2025 inoltrato.:sofico:

tuttodigitale

05-04-2016, 17:18

eh eh, purtroppo non ci sarà mai un Keller tris tra 10 anni, ha un età avanzata per fare 12~14 ore di lavoro al giorno :asd:

ps. dimenticavo un altro fattore a favore di Zen, la L2 doppia a Core rispetto le cpu Intel: 512KB vs 256KB tutte e due inclusive
L3 2MB a Core per Zen vs 2.5MB a Core per BW-E e IMC DC vs QC, 8c vs 10c e per tanto area più piccola a Die

questo dovrebbe bastare a sopperire lo scaling inferiore dei 14nm ss/gf vs intel
ti dirò che la maggior cache l2, io non lo vedo come vantaggio, ma come una cosa necessaria per via delle pipeline lunghe. Nella logica inclusive, sono i MB disponibili nella l3, quelli che effettivamente hanno informazione, pertanto in ZEN, sulla carta, la ram dovrebbe avere un peso maggiore.
Salvo l'eventualità non remota di memorie HBM off chip. (vedi sotto)

Su quello che hai scritto... c'è anche un altro vantaggio di Zen.
Nel procio Intel, quando l'SO "salta" da un core all'altro, il core successivo deve andare a pescare i dati nella L3 (che è inclusiva) perchè nella propria L2 non li ha (sarebbero nella L2 dell'altro core). Se Zen ha una L2 condivisa stile modulo, se il TH si sposta nel core dello stesso modulo, praticamente i dati sarebbero nella L2 condivisa tra i 2 core. La condizione in cui Zen sarebbe obbligato ad andare a prendere i dati nella L3 (come Intel), praticamente sarebbe ridotta del 50%. Non mi sembra un vantaggio da poco...

No, Paolo, la L2 è dedicata per singolo core.

Non mi è chiaro invece se le due cache l3, possono comunicare tramite un bridge (stile xeon da 18 core, per intenderci), o invece deve necessariamente passare per la RAM...le HBM potrebbero addirittura rivelarsi "necessarie" per il 32 core, dotato di 8 cache l3 distinte.. le versioni server di ZEN, potrebbero essere state progettate con le HBM in mente (ma ho notevoli dubbi al riguardo...)

AceGranger

05-04-2016, 17:33

Ci sono tante possibili ragioni per cui Intel si appresti a lanciare un 10 core.

Si una di queste potrebbe essere l'arrivo di Zen, ma secondo me è la più remota.
Un'altra potrebbe essere una naturale evoluzione della linea Intel.
E infine mi viene in mente che potrebbe essere una mossa per contrastare la stagnazione del mercato, sono troppi anni che il top è composto da 4c/8t forse Intel vuole spingere per far diventare il 6c/12t il nuovo standard e spingere le vendite e questo richiede cpu ancora superiori nel High-End.

anche perchè mantenere le 1000 euro, se non addirittura metterla a 1500 come si vocifera, non mi sembra molto da preoccupazione;
puo anche tranquillamente avere un discreto numero di chip non adatti agli Xeon che riesce cosi a rivendere in altro modo.

oltretutto non credo avra particolari problemi a lanciare il 12 core con la Skylake-E.

tuttodigitale

05-04-2016, 17:43

anche perchè mantenere le 1000 euro, se non addirittura metterla a 1500 come si vocifera, non mi sembra molto da preoccupazione;
puo anche tranquillamente avere un discreto numero di chip non adatti agli Xeon che riesce cosi a rivendere in altro modo.

oltretutto non credo avra particolari problemi a lanciare il 12 core con la Skylake-E.

credo che il deca-core sia solo a scopo precauzionale...infatti se viene proposto a 1500 euro, non è certo per invogliare la vendita o una mossa per contrastare la stagnazione del mercato..:cool:

bjt2

05-04-2016, 19:01

Confronto tra CPU, con informazioni preliminari di Zen...

https://pbs.twimg.com/media/CfSZWQgUYAI3aW3.jpg:large

Varie cose: AMD è più veloce di INTEL nella divisione, ma Jaguar è il più veloce, segno che Zen e BD sono disegni a FO4 più basso, perchè jaguar può calcolare più bit per clock di Zen e BD, segno di un FO4 più elevato. La latenza aumenta rispetto a BD, segno che c'è un leggero abbassamento del FO4, ma è circa il doppio di Jaguar, che è del tipo K10... Ciò vuol dire che il divisore di Zen (e BD) calcola la metà di bit per ciclo di clock (probabilmente 2 Zen e BD e 4 Jaguar, visto che è per la divisione 128->64 bit), quindi ha circa la metà del FO4, altrimenti non vedo altro motivo per avere un divisore PEGGIORE del progetto low budget e low power di AMD...

La mul INT AMD è più lenta, segno che ha un FO4 più basso... AMD recupera nelle MUL AVX, perchè le untià AMD sono a 128 bit (infatti ne può fare una per ciclo) mentre quelle INTEL sono 256 bit, e per rientrare con area e consumi le hanno fatte più lente, ma ne può fare 2 per ciclo... La radice quadrata in AMD è molto lenta, segno che è microcodificata.

Rispetto ai core vecchi (jaguar e BD), hanno migliorato molto le divisioni floating point, facendole più veloci di quelle INT e andando quasi in pari con INTEL, ma di nuovo, qui il numero di cicli è più alto di INTEL, segno che il FO4 potrebbe essere minore... Qualche miglioria nelle istruzioni AVX per raggiungere (e in alcuni casi superare) INTEL, ma credo che ci siano riusciti rimanendo nel basso FO4...

Il divisore è il più indicativo: indica FO4 circa la metà di Jaguar, quindi clock massimo (se non ci fossero limiti di TDP) quasi del doppio...
Qual'è il clock massimo di Jaguar? 2.5GHz? Quindi clock massimo di 5GHz... A 28nm (o 32nm?)... Quasi raggiunti almeno in OC da BD...
Potenzialmente il FO4 di Zen potrebbe anche essere minore di BD...

AceGranger

05-04-2016, 20:16

beh ma esce prima, cosa dovrebbe fare mettere le mani avanti e piazzare il 10 core a 500€? sarebbe da stupidi, fin che c'è solo quello, fa bene a piazzarlo al prezzo che vuole...

bha non so è, se riescono a vendere 8 core a 1000 non vedo perchè non riuscire a vendere 10 core a 1500, fra gli enthsiast disposti a prenderli e la fascai semi-pro e pro che comuqnue ha convenienza, è un prezzo elevato ma non fuori mercato.

beh ma esce prima, cosa dovrebbe fare mettere le mani avanti e piazzare il 10 core a 500€? sarebbe da stupidi, fin che c'è solo quello, fa bene a piazzarlo al prezzo che vuole...

si, ma non si è mai nemmeno visto Intel tagliare il prezzo di tutta la linea pochi mesi dopo l'uscita...

imho, la linea di CPU uscira prezzata in base alle prestazioni delle CPU AMD; io non ci credo che gia non sappiano quanto vanno... se ci sono in giro ES, credo proprio che Intel gia li abbia provati...

tutto il post precedente non vale più in quanto i die di BW-E saranno da 10-16-22 Core, per tanti il 6950x sarà già a pieno regime!

"Questa informazione pervenutaci si va a sposare perfettamente con la possibilità che il nuovo i7-6950X non sia altro che un core Xeon da 10 Core con tutti i core abilitati. Solitamente Intel commercializza i Core i7 con due core disabilitati (Sandy Bridge-E e Ivy Bridge-E) o con tuttini core abilitati solo con l'utilizzo di un nodo rodato (Haswell-E). In questo caso Intel spara la cartuccia migliore fin da subito."

"Ho chiesto ad un amico che lavora con queste cose, e gli Xeon Broadwell sono derivati da tre die diversi: 10, 16 e 22 core (avevo sbagliato quando avevo supposto fossero da 12-18-22). Questo significa che Intel ha cambiato la scaletta del 2014 (passando da un 8 ad un 10 core), e che cambia il modus operandi, sparando subito la propria cartuccia migliore con un nodo nuovo."

però...

bha mi sembra una sparata tanto quanto l'articolo prima.

i die NON li fanno pensando agli i7, li fanno pensando solo e soltanto agli Xeon; il 10-16-22 è evidentemente la tripletta piu conveniente a coprire l'offerta Xeon ricavata dalle stime di chip fallati. Se non hanno fatto i 12 monolitici evidentemtne avevano svariati chip da 16 fallati, e hanno optato per un pattern monolitico ogni 6 core.
le ananlisi sui pattern si fanno basandosi sugli Xeon, non sugli i7... anche perchè gli Xeon li fa uscire o meno anche in base alla concorrenza...

io credo che comunque Zen andra, ma da li a ricamare su tutta queste storie...

tuttodigitale

05-04-2016, 22:47

Potenzialmente il FO4 di Zen potrebbe anche essere minore di BD...
il punto di pareggio tra le HDL e le HPL è passato da:
3,2 GHz excavator -> 28nm
4GHz ARM (a72?) -> 14nm.
stimando un bassissimo (stime pessimistiche), per un soc mobile, FO4 21, abbiamo

4,94 GHz excavator ->14nm
ci sono ottime possibilità di raggiungere i 5GHz (in turbo o addirittura default:D ) HDL comprese...mi sa che hai ragione:read:
con possibilità di concreta di vedere i 5,8 GHz con le HPL, raggiungibili, con vcore "bassi" :read:

Ma attenzione nella slide di AMD c'è scritto 40% di ipc, che secondo me è da intendere complessivo (sto ricambiando idea). Si legge infatti che il confronto è core to core. E tu lo saprai meglio di me che di solito per intendere l'ipc nel ST, si scrive appunto ST ipc...

allora fantasticando su quello che doveva essere i 32nm abbiamo:
octa core 4,8-5,6 GHz 125W
-50% dovuto al salto di nodo..
octa core 4,8-5,6GHz 62,5W
+40% (ipc complessivo)
ZEN x8 4,8-5,6GHz 87,5W

una cpu del genere andrebbe poco più di un 6900K e circa 84% di un i7 6950x.

Cerco di ritrovare le informazioni relative sulle prestazioni dei 14nm finfet, c'è anche l'andamento dei consumi, e ti dico subito che mi è apparso straordinariamente buono fino a 4,6GHz (sempre relativo all'ignota architettura ARM)...

devo ancora decidere (ho idee molto confuse come puoi vedere)

digieffe

05-04-2016, 23:39

george_p

06-04-2016, 00:22

Free Gordon

06-04-2016, 00:41

Mister D

06-04-2016, 00:41

Mister D

06-04-2016, 00:45

Quindi...
Detto in soldoni...

Zen sarebbe di nuovo un'architettura a basso IPC, che fa leva sulle frequenze per recuperare prestazioni?

5ghz base clock??? :confused: :stordita: :mbe:

Ma a questo punto, con transistor più veloci e PP migliori...: cosa vieta ad Intel di produrre CPU a clock più elevato, facendo salire un pò i consumi, in..:ciapet:...ndo nuovamente AMD dal lato prestazionale puro? :doh:

No perché se no non ci sarebbe stato keller. Per me tutti ormai pensano che sia impossibile avere contemporaneamente ipc alto e frequenza alta. E se Keller avesse trovato il modo? D'altronde le slide su Zen sono chiare 40% in più di IPC ergo poco sotto haswell secondo me. Ti pare una architettura a basso IPC?:D
A meno che non abbiano mentito spudoratamente su quelle slide:muro:

Free Gordon

06-04-2016, 00:54

Mister D

06-04-2016, 00:59

Ora non resta che calcolare che prestazioni avrebbe un Sandy Bridge 3970x a 5ghz... :sofico:

Io io calcoli li ho fatti a suo tempo e mi ero tenuto conservativo con le frequenze perché non erano uscite tutte queste info. Cmq mi pare di ricordare che erano venuti bene 1300 punti in cinebench con zen 8c/16th a 3,2 Ghz. Se poi questo girerà di base sui 4 Ghz ti lascio immaginare quanto va:sofico:

http://www.hwupgrade.it/forum/showpost.php?p=43413092&postcount=614

Quelli non li tocco più perché se qualcosa andrà male nel silico e quindi nelle frequenze, le considero i minimi risultati di ZEN

george_p

06-04-2016, 01:03

Quindi...
Detto in soldoni...

Zen sarebbe di nuovo un'architettura a basso IPC, che fa leva sulle frequenze per recuperare prestazioni?

Carrizo ha recuperato praticamente le mancanze di BD rispetto ai phenom, Bristol Ridge dovrebbe guadagnare ipc rispetto a Carrizo e Zen ha +40% di ipc rispetto a Excavator, inteso quest'ultimo come sua ultima incarnazione ossia la settima ossia Bristol Ridge.
Quindi dove sarebbe il basso ipc soprattutto rispetto a BD prima incarnazione?

La mia è anche una domanda provocatoria ma tengo anche conto che non è il solo FO4 l'unico fattore a incidere sulle prestazioni come non lo è il solo ipc.

BD e varianti peccavano anche nelle cache, sia nel tipo che nelle velocità, risolte in excavator e ancor più sicuramente in Zen.

E' come viene armonizzata l'architettura in tutti i suoi componenti che fa la vera differenza.
Per Zen? Lo sapremo appena esce;)

Jaguar64bit

06-04-2016, 01:08

Io io calcoli li ho fatti a suo tempo e mi ero tenuto conservativo con le frequenze perché non erano uscite tutte queste info. Cmq mi pare di ricordare che erano venuti bene 1300 punti in cinebench con zen 8c/16th a 3,2 Ghz. Se poi questo girerà di base sui 4 Ghz ti lascio immaginare quanto va:sofico:

Ho come la vaga sensazione che i nuovi Zen sui prezzi non saranno poi a così buon mercato come gli attuali FX :D :asd:

Sarebbe una goduria se fossero degli octa ad alte performance di ipc e con consumi bassi... , poi vedo che hanno l'HT attivo slurp!!!!

Mister D

06-04-2016, 01:09

Carrizo ha recuperato praticamente le mancanze di BD rispetto ai phenom, Bristol Ridge dovrebbe guadagnare ipc rispetto a Carrizo e Zen ha +40% di ipc rispetto a Excavator, inteso quest'ultimo come sua ultima incarnazione ossia la settima ossia Bristol Ridge.
Quindi dove sarebbe il basso ipc soprattutto rispetto a BD prima incarnazione?

La mia è anche una domanda provocatoria ma tengo anche conto che non è il solo FO4 l'unico fattore a incidere sulle prestazioni come non lo è il solo ipc.

BD e varianti peccavano anche nelle cache, sia nel tipo che nelle velocità, risolte in excavator e ancor più sicuramente in Zen.

E' come viene armonizzata l'architettura in tutti i suoi componenti che fa la vera differenza.
Per Zen? Lo sapremo appena esce;)

Infatti le cache possono influenzare l'IPC a parità di FO4. Se come sembra hanno rivisto tutto nelle cache e queste rendono molto di più probabilmente sarà proprio questo ad aver permesso l'aumento di IPC senza toccare al rialzo il FO4, quindi con pipe più complesse e corte. Poi hanno aggiunto quella cache L0 che mi pare veramente una genialata insieme ai checkpoint per ridurre le latenze in caso di cache miss. Speriamo bene e chissà quale diavoleria ha trovato quel "pazzo" di Keller.:ciapet:

Mister D

06-04-2016, 01:13

Ho come la vaga sensazione che i nuovi Zen sui prezzi non saranno poi a così buon mercato come gli attuali FX :D :asd:

Sarebbe una goduria se fossero degli octa ad alte performance di ipc e con consumi bassi... , poi vedo che hanno l'HT attivo slurp!!!!

Se saranno competitivi, no di sicuro ma devi considerare che prezzi troppo alti non lo saranno perché devono anche recuperare quote di mercato su intel. Non mi aspetto né i 250 euro degli FX8xxx né i 1000 e passa degli FX su socket 939;)

Per me se andranno alla pari di intel nelle rispettive fascie le piazzeranno poco sotto, in modo da avere un miglior rapporto prezzo/prestazioni che convinca l'utenza a comprarli;)

bjt2

06-04-2016, 07:30

potresti cortesemente spiegare come si interpretano i dai dalla riga ALU r32 in giù

(ho una mezza idea che siano cicli di clock ma quando scrive 0.25 significa 4 in un ciclo?)
e poi perché 2 valori es "4|1"?

E' scritto nella nota 6: il primo numero è la latenza in cicli di clock, il secondo è l'inverso del numero di istruzioni contemporanee. 0.25 significa 4 istruzioni per ciclo, ecc... Entrambi più bassi sono, meglio è... :D

bjt2

06-04-2016, 07:43

FO4 di zen simile a quello di BD non implica che avremo una architettura lenta come la seconda (BD), giusto?

Quindi in zen possono aver aumentato l'ipc ma tenendo, allo stesso tempo, la possibilità di funzionare a frequenze elevate. Vuol dire questo?

Non era meglio un FO4 di media tra BD e Jaguar?

Se vedi sono riusciti a ridurre le latenze sopratutto delle istruzioni AVX, nonostante siano sempre spezzate in 2 parti da 128 bit (infatti ci mette almeno un ciclo in più di INTEL proprio dovuto al fatto che deve spezzare e riunire)... Tieni presente che è vero che INTEL esegue la maggior parte delle istruzioni in meno cicli, ma le istruzioni FP si contendono le porte INT, mentre in AMD NO: se c'è un salto, uno shift, un confronto, un inc o dec (sto pensando ai cicli: ogni calcolo complicato è fatto con i cicli), queste andranno in competizione con le istruzioni FP... E' per questo che INTEL ha fatto unità a 256 bit. Con il codice nuovo e ottimizzato, complice l'ottimo compilatore intel NO PROBLEM (e guadagna anche AMD perchè una istruzione a 256 bit è meglio di 2 a 128 bit dal punto di vista del decoding e dell'occupazione di spazio in memoria), mentre sul codice vecchio, con le SSE o AVX a 128 bit, AMD dovrebbe recuperare, se non addirittura superare INTEL...

Quindi...
Detto in soldoni...

Zen sarebbe di nuovo un'architettura a basso IPC, che fa leva sulle frequenze per recuperare prestazioni?

5ghz base clock??? :confused: :stordita: :mbe:

Ma a questo punto, con transistor più veloci e PP migliori...: cosa vieta ad Intel di produrre CPU a clock più elevato, facendo salire un pò i consumi, in..:ciapet:...ndo nuovamente AMD dal lato prestazionale puro? :doh:

Guardando le latenze delle istruzioni direi di NO: Jaguar ci mette 43 cicli per fare una divisione intera a 128/64 bit. Ed è una architettura low cost e low power. Zen ci mette circa il doppio e un po' di più di BD. Perchè l'architettura di punta dovrebbe metterci di più di una a basso consumo? L'unica spiegazione è che il FO4 di Zen è al massimo pari a quello di BD...

Infatti le cache possono influenzare l'IPC a parità di FO4. Se come sembra hanno rivisto tutto nelle cache e queste rendono molto di più probabilmente sarà proprio questo ad aver permesso l'aumento di IPC senza toccare al rialzo il FO4, quindi con pipe più complesse e corte. Poi hanno aggiunto quella cache L0 che mi pare veramente una genialata insieme ai checkpoint per ridurre le latenze in caso di cache miss. Speriamo bene e chissà quale diavoleria ha trovato quel "pazzo" di Keller.:ciapet:

Ma ci sono tante di quelle migliorie, che anche con il FO4 dei P4 Keller sarebbe riuscito a fare un'ottima CPU! :D :sofico: Basta mettere un po' di hardware e non avere un silicio orrendo et voilà!

Ovviamente era una esagerazione... Si stima che il P4 abbia FO4 7-8, mentre le nuove CPU intel superino la ventina di poco... E sappiamo che i paper IBM e le CPU power più performanti dicono che 17 è il numero ottimale...

paolo.oliva2

06-04-2016, 08:49

beh ma esce prima, cosa dovrebbe fare mettere le mani avanti e piazzare il 10 core a 500€? sarebbe da stupidi, fin che c'è solo quello, fa bene a piazzarlo al prezzo che vuole...

non succede, ma se succede, voglio vedere come venderanno un die da 12 core BW-E cutterato x10 a certi prezzi o rinominare uno Xeon 12 core e venderlo come X12 a pieno regime...
sarà paradossale ma si invertiranno le parti, l'8 core AMD più piccolo e quindi dai margini migliori per mmq/€ che viaggia come il chippone da 8/10/12 core.

non succede, ma se succede :asd: ... ci sarà da ridere

ps. e sembra succederà pure nel settore gpu...

edit.

tutto il post precedente non vale più in quanto i die di BW-E saranno da 10-16-22 Core, per tanti il 6950x sarà già a pieno regime!

"Questa informazione pervenutaci si va a sposare perfettamente con la possibilità che il nuovo i7-6950X non sia altro che un core Xeon da 10 Core con tutti i core abilitati. Solitamente Intel commercializza i Core i7 con due core disabilitati (Sandy Bridge-E e Ivy Bridge-E) o con tuttini core abilitati solo con l'utilizzo di un nodo rodato (Haswell-E). In questo caso Intel spara la cartuccia migliore fin da subito."

"Ho chiesto ad un amico che lavora con queste cose, e gli Xeon Broadwell sono derivati da tre die diversi: 10, 16 e 22 core (avevo sbagliato quando avevo supposto fossero da 12-18-22). Questo significa che Intel ha cambiato la scaletta del 2014 (passando da un 8 ad un 10 core), e che cambia il modus operandi, sparando subito la propria cartuccia migliore con un nodo nuovo."

però...

Comunque il 5960X ha +33% di core rispetto ad un i7 X6 ma anche -17% di frequenza def. Il 6960X ha un +25% di core alla stessa frequenza def di un 5960X.

Zen X8 dovrebbe avere appunto 8 core come die nativo... quindi soluzioni con meno core dovrebbero provenire dai fallati, ma non so fino a che punto ci sia una quantità tale da reggere la richiesta se il prezzo fosse di molto inferiore all'X8.

Anche perchè... Carrizo al massimo è X4/4 TH, quindi Zen comunque deve risultare competitivo (non come prestazioni ma come prezzo) all'offerta Intel X4+4... sarebbe illogico pensare che AMD voglia riconquistare fette del mercato desktop con Zen che per prezzo fosse l'alternativa unicamente al socket 2011.

Infine, quoto, il 6960X ha ragione di avere quel prezzo finchè Zen non sarà lanciato... ma dubito che AMD possa prezzare Zen sopra 500€, anche se risultasse X8 4GHz (che tutto sommato avrebbe il +33% di clock rispetto al 6960X e il -25% di core, a cui andrebbe valutato la differenza di IPC), come dubito che Intel possa giustificare un prezzo 3 volte superiore per prestazioni di quanto superiori?

tuttodigitale

06-04-2016, 08:53

No perché se no non ci sarebbe stato keller. Per me tutti ormai pensano che sia impossibile avere contemporaneamente ipc alto e frequenza alta. E se Keller avesse trovato il modo? D'altronde le slide su Zen sono chiare 40% in più di IPC ergo poco sotto haswell secondo me. Ti pare una architettura a basso IPC?:D
A meno che non abbiano mentito spudoratamente su quelle slide:muro:

Voglio solo ricordare che è solo la nostra interpretazione, magari viziata dagli ottimi risultati dell'architettura Intel, ci ha portato a credere fin da subito ad un aumento di tale entità nel ST.. Ma chi l'ha detto? AMD? Certo che no!

+40% di ipc core to core, da che mondo è mondo, significa che un core esegue complessivamente +40% di istruzioni per ciclo di clock. E, guarda caso, il SMT è una tecnica utile ad aumentare l'ipc attraverso il parallelismo a livello di thread (TLP).
Siamo noi, che abbiamo interpretato questo fatto come Single Threaded IPC, quello ottenuto mediante il parallelismo a livello di istruzione (ILP).

occhio. che 4GHz +40% di ipc complessivo, siamo già a livello di un esacore, e in 95W non è male. A 5GHz, cosa tutt'altro che remota (viste le latenze sembrerebbe raggiungibile in piena efficienza addirittura con le HDL :O) , siamo a livelli superiori dell'octa-core :read: (prestazioni core to core più alte :cool: )

Ho qualche perplessità sull'ipc, ma le prestazioni, con un clock di SOLI 4GHz, saranno estremamente positive, soprattutto considerando i 95W, in tutti i casi, anche quello di ipc basso...

paolo.oliva2

06-04-2016, 08:59

si, ma non si è mai nemmeno visto Intel tagliare il prezzo di tutta la linea pochi mesi dopo l'uscita...
E' già successo :sofico:, non era con i Penrin (non ricordo il modello) ma ricordo perfettamente che il listino calò dall'oggi al domani dal -17% a punte del -50%.

AMD non può assolutamente pensare di vendere un Zen sopra i 500€ qualsiasi potenza possa avere (perchè nasce come X8 e quindi non può avere una fascia di prezzo quanto Intel da i7 X6/X8/X10), ma per quanto possa andare Zen X8, dubito che Intel possa vendere un 6960X a 1500€...

AMD offrirà un X8/16TH come modello popolare... penso proprio che Intel sarà costretta a modificare l'offerta non più vendendo TH a prezzo di core.

paolo.oliva2

06-04-2016, 09:07

Voglio solo ricordare che è solo la nostra interpretazione, magari viziata dagli ottimi risultati dell'architettura Intel, ci ha portato a credere fin da subito ad un aumento di tale entità nel ST.. Ma chi l'ha detto? AMD? Certo che no!

+40% di ipc core to core, da che mondo è mondo, significa che un core esegue complessivamente +40% di istruzioni per ciclo di clock. E, guarda caso, il SMT è una tecnica utile ad aumentare l'ipc attraverso il parallelismo a livello di thread (TLP).
Siamo noi, che abbiamo interpretato questo fatto come Single Threaded IPC, quello ottenuto mediante il parallelismo a livello di istruzione (ILP).

occhio. che 4GHz +40% di ipc complessivo, siamo già a livello di un esacore, e in 95W non è male. A 5GHz, cosa tutt'altro che remota (viste le latenze sembrerebbe raggiungibile in piena efficienza addirittura con le HDL :O) , siamo a livelli superiori dell'octa-core :read: (prestazioni core to core più alte :cool: )

Ho qualche perplessità sull'ipc, ma le prestazioni, con un clock di SOLI 4GHz, saranno estremamente positive, soprattutto considerando i 95W, in tutti i casi, anche quello di ipc basso...

Considerando Zen +40% su XV, ipotizzando che questo 40% possa includere l'SMT, vorrebbe dire meno del +10% di IPC di Zen su XV.
Va bene che Zen abbia più transistor per l'SMT, ma se 1 intero modulo XV equivarrebbe tanto quanto 1 core Zen, allora credo sarebbe convenuto lasciar pedere l'SMT e avere 2 TH pieni su 2 core, no?

bjt2

06-04-2016, 09:11

Voglio solo ricordare che è solo la nostra interpretazione, magari viziata dagli ottimi risultati dell'architettura Intel, ci ha portato a credere fin da subito ad un aumento di tale entità nel ST.. Ma chi l'ha detto? AMD? Certo che no!

+40% di ipc core to core, da che mondo è mondo, significa che un core esegue complessivamente +40% di istruzioni per ciclo di clock. E, guarda caso, il SMT è una tecnica utile ad aumentare l'ipc attraverso il parallelismo a livello di thread (TLP).
Siamo noi, che abbiamo interpretato questo fatto come Single Threaded IPC, quello ottenuto mediante il parallelismo a livello di istruzione (ILP).

occhio. che 4GHz +40% di ipc complessivo, siamo già a livello di un esacore, e in 95W non è male. A 5GHz, cosa tutt'altro che remota (viste le latenze sembrerebbe raggiungibile in piena efficienza addirittura con le HDL :O) , siamo a livelli superiori dell'octa-core :read: (prestazioni core to core più alte :cool: )

Ho qualche perplessità sull'ipc, ma le prestazioni, con un clock di SOLI 4GHz, saranno estremamente positive, soprattutto considerando i 95W, in tutti i casi, anche quello di ipc basso...

Mi pare di aver letto da qualche parte (forse proprio una slide ufficiale di AMD) che il +40% si riferisce all'IPC in ST...

tuttodigitale

06-04-2016, 09:13

Considerando Zen +40% su XV, ipotizzando che questo 40% possa includere l'SMT, vorrebbe dire meno del +10% di IPC di Zen su XV.
potrebbe anche avere un FO4 più basso di BD: i numeri sulla latenza lasciano aperta questa possibilità. La cache l0, è una tecnica utile anche per aumentare l'efficienza :read:

Va bene che Zen abbia più transistor per l'SMT, ma se 1 intero modulo XV equivarrebbe tanto quanto 1 core Zen, allora credo sarebbe convenuto lasciar pedere l'SMT e avere 2 TH pieni su 2 core, no?
in quel caso mi aspetto una complessità NETTAMENTE inferiore ad un modulo XV :read:

tuttodigitale

06-04-2016, 09:34

Mi pare di aver letto da qualche parte (forse proprio una slide ufficiale di AMD) che il +40% si riferisce all'IPC in ST...
nella slide non c'è nessun riferimento al single thread.

http://www.techpowerup.com/img/15-05-06/Capture31.jpg

Nella nota c'è scritto:
Based on internal AMD estimates for “Zen” x86 CPU core compared to “Excavator” x86 CPU core

Certo le frecce sembrano suggerire altro...

bjt2

06-04-2016, 09:41

http://semiaccurate.com/2016/04/05/amd-announces-its-7th-generation-of-a-series-apus/

Leggendo l'anteprima di bristol Ridge, si possono fare alcune considerazioni:

1) Carrizo è un SoC, comprensivo di SB... I famosi 28W a 2.5GHz sono la differenza idle-CPU full? O includono anche GPU e SB? Perchè questo incide sulla stima del consumo di Zen.
2) bristol ridge migliora le prestazioni (e quindi immagino il clock) dal 5% al 12% rispetto a Carrizo, a parità di TDP. Per il miglior risparmio energetico. Non abbiamo nessun motivo di ritenere che queste migliorie non ci siano in Zen, quindi in ogni caso ai 28W vanno sottratti dal 5% al 12% di potenza (in realtà dovremmo dire che a parità di clock calcolato per Zen, basandosi sui 28W di Carrizo, andrebbe aggiunto da 5% a 12%)

bjt2

06-04-2016, 09:44

nella slide non c'è nessun riferimento al single thread.

http://www.techpowerup.com/img/15-05-06/Capture31.jpg

Nella nota c'è scritto:
Based on internal AMD estimates for “Zen” x86 CPU core compared to “Excavator” x86 CPU core

Certo le frecce sembrano suggerire altro...

Non ricordo dove l'ho letto, comunque mi sembra plausibile l'IPC ST, perchè non si può confrontare mele (SMT) con pere (CMT) e se intentevano throughput, scrivevano throughput e non IPC...

ma dove l'hai trovata questa tabella? l'hai fatta tu?

ma il "peak x86 decode rate" di skylake non dovrebbe essere di 6 e non di 4 :stordita:

Tweet di Dresdenboy... (link (https://twitter.com/InstLatX64/status/717366849458057217)) In realtà è un retweet... Anzi ora inizio a seguire anche il tizio originale... :D

bjt2

06-04-2016, 09:49

bjt2

06-04-2016, 10:11

Per chi è pessimista sul +40% di IPC... Ho trovato, e inizierò a leggere, un thread su anandtech di Dresdenboy su Zen, dove il primo post fuga proprio i dubbi... :D

http://forums.anandtech.com/showthread.php?t=2465645

Una cosa che non sapevo: 4 cicli di latenza ipotizzati per la L1... Una tale alta latenza vuol dire o che AMD fa schifo nel fare caches, oppure che Zen è una CPU ad alto clock... :D Scegliete pure...

bjt2

06-04-2016, 10:13

da semiaccurate
Seronx:
Zen-L/Zen-LX = GF22FDX
ZenPlus-L/ZenPlus-LX = GF14HP

Zen-L(+LX)/ZenPlus-L(+LX) = 256 KB L2, Half-clocked 4MB L3. Only quad-core and dual-core(two cores disabled). Four shader engines each with 4 CUs, dual-core version has 2 CUs disabled in each.

LX model has 6? GMI(32 Gb/s (SerDes 25.6 Gb/s??)) links in (2X?, 2Y, 2Z) config. LX model is purely LP dense server.

No architectural modifications other than above changes compared to Raven Ridge.

No online sources freely available, you are welcome.

questo post l'hai visto? :confused:

ma h17, il nome della famiglia Zen, non è che magari si riferisce proprio al fo4 :read:

Non ho capito se sfotte un utente, che si è rivelato affidabile e che dice di avere fonti affidabili, oppure se sono ipotesi vecchie sul 22nm... :asd: