PDA

View Full Version : [Thread Ufficiale] CPU serie FX: AMD Bulldozer/Piledriver - Aspettando Steamroller


Pagine : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 [121] 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145

ciciolo1974
24-07-2015, 11:44
Buongiorno a tutti, scusate se faccio domande banali ma è il primo 8320 (su M5A97EVO r 2.0 e 4*2Gb 1333) con cui ho a che fare. E' per un collega uso CAD, Photoshop e qualche render, onde per cui no OC. Un Mugen 2 rev. B basta a tenerlo buono? Immagino di si visto che prima lo avevo su un 1090 e non faceva una piega, ma chiedo conferma a voi. Un buon (seasonic G e simili) ali da 550w dovrebbe bastare, anche in ottica di cambiare la 5770 con una 960 o AMD equivalente?
Scusate ancora per la banalità, ma non essendo mio vorrei avitare di sentirmi dire "te l' ho detto che intel era meglio:D "
Grazie ;)

Ale1992
24-07-2015, 12:32
Buongiorno a tutti, scusate se faccio domande banali ma è il primo 8320 (su M5A97EVO r 2.0 e 4*2Gb 1333) con cui ho a che fare. E' per un collega uso CAD, Photoshop e qualche render, onde per cui no OC. Un Mugen 2 rev. B basta a tenerlo buono? Immagino di si visto che prima lo avevo su un 1090 e non faceva una piega, ma chiedo conferma a voi. Un buon (seasonic G e simili) ali da 550w dovrebbe bastare, anche in ottica di cambiare la 5770 con una 960 o AMD equivalente?
Scusate ancora per la banalità, ma non essendo mio vorrei avitare di sentirmi dire "te l' ho detto che intel era meglio:D "
Grazie ;)

Se non fai OC va benissimo anche quello. Quanto all'ali 550W anche con una 960 vanno bene. Io lo tengo a 4.5Ghz con una 970 e ho un bequiet 500W.

ciciolo1974
24-07-2015, 12:39
Se non fai OC va benissimo anche quello. Quanto all'ali 550W anche con una 960 vanno bene. Io lo tengo a 4.5Ghz con una 970 e ho un bequiet 500W.

Grazie ;)

tuttodigitale
24-07-2015, 19:47
Peccato che il basso ipc sia dato dalle pipeline troppo lunghe e la compensazione richiesta per aumentare la frequenza non ha portato ad avere consumi ridotti che in amd invece vantavano proprio per aver creato in tal modo (e) tale architettura..

troppo lunghe? Sono circa (dati ufficiali non ci sono) 22 stadi vs 19 di Intel, nulla di così esasperato. Siamo ben distanti dalla lunghezza delle pipeline del Prescott.

Sui consumi ridotti, ma siamo davvero convinti che tutti questi vantaggi non li abbia portati, l'architettura Bulldozer. Perchè onestamente mi pare di ricordare che con sandy bridge, intel si sia fermato ad un dual core+ht a 1,8 ghz mentre AMD propone con 2 watt di tdp in meno un quad core a 2,1 GHz con tanto south bridge e igp da 512 sp.... I 32nm Bulk di Intel e i 28nm di GF sulla carta non dovrebbero avere prestazioni molto differenti o no? Eppure effettivamente i core di SB sembrano richiedere più energia di un modulo BD (in effetti già con steamroller/kaveri c'è stato il sorpasso per efficienza al i3 2100).

paolo.oliva2
24-07-2015, 20:53
Non posso risponderti sia perché non sono ingegnere/competente sulla materia e sia perché ancora zen sta nell'ombra.
BD ha i suoi vantaggi dati dal cmt seppur pochissimi visto che il cmt poteva venire implementato meglio, però alla fine forse contano tanti altri aspetti che hanno decretato la vittoria di intel su amd dove quest'ultima cheché se ne voglia dire ha perso quote in ogni settore grazie a questa architettura in primis, quindi ok che BD non si siede rispetto agli altri processori o lo fa molto dopo ma tutto il resto dove servono le altre features dove le mettiamo?
Velocità e ridotti consumi dove in una azienda con decine o centinaia di server si nota non certo con l'unico computerino domestico di utenza comune.

Non sappiamo proprio nulla di nulla di Zen a parte una molto ambigua slide dove evidenzia il 40% di ipc in più rispetto ad excavator e visto che anche di excavator si conosce ben poco dato che "in giro" c'è (forse) la sola versione mobile mancano dati certi (a noi) se questo aumento del 40% sia riferito, come personalmente penso, ad una ipotetica (mica tanto per loro che lo hanno in laboratorio) versione desktop senza limitazioni da versione mobile.

Meyer era un patito del CMT e Keller dell'altissimo ipc, posso solo presumere che una volta tornato in amd Keller abbia analizzato tutti i pro (per pochi che fossero) e i contro dell'architettura BD e penso anche che sappia del discorso a cui ti riferisci sempre tu e altri che hanno questa cpu relativo ai carichi pesanti o almeno me lo auspico.

Però se l'approccio Kelleriano è SMT e non CMT questo vantaggio potrebbe venir meno ma tanto noi non lo sappiamo ancora e magari invece si comporta pure meglio ma tanto ancora non lo possiamo sapere, ci tocca aspettare a settembre oppure a febbraio diretramente con i prossimi eventi amd.
Godiamoci gli ultimi periodi dell'architettura Meyeriana, un evento da non dimenticare :D

Che gli FX X8 supportino carichi a livello degli i7 X6 è una cosa, ma poi alla fine stanno dietro agli i7 X4 purtroppo è la realtà. Comunque la mia posizione non è quella di difendere BD, perché indubbiamente AMD le sue colpe le ha, ma il silicio era ed è il vero problema. Se 100 transistor con un silicio ti danno 1W e con un altro 5W, puoi metterli a destra, a sinistra sopra o sotto ma non ci cavi una tozza.

george_p
24-07-2015, 22:41
Che gli FX X8 supportino carichi a livello degli i7 X6 è una cosa, ma poi alla fine stanno dietro agli i7 X4 purtroppo è la realtà. Comunque la mia posizione non è quella di difendere BD, perché indubbiamente AMD le sue colpe le ha, ma il silicio era ed è il vero problema. Se 100 transistor con un silicio ti danno 1W e con un altro 5W, puoi metterli a destra, a sinistra sopra o sotto ma non ci cavi una tozza.

Verissimo, infatti per quello BD era, anacronistica come architettura, hanno fatto male i calcoli perché progettata così non andava bene per il silicio di quei tempi (scritto così sembra che si parla di decenni fa ma tanto in informatica il tempo scorre sempre molto veloce e un mese può essere troppo). Con un silicio adeguato a partire dai prossimi 22 nm o a16 FF avrebbe avuto modo di dire la sua anche nel tempo e confermare quello che il marketing amd sparava a riguardo del CMT verso l'HT.

george_p
24-07-2015, 23:15
troppo lunghe? Sono circa (dati ufficiali non ci sono) 22 stadi vs 19 di Intel, nulla di così esasperato. Siamo ben distanti dalla lunghezza delle pipeline del Prescott.

Sui consumi ridotti, ma siamo davvero convinti che tutti questi vantaggi non li abbia portati, l'architettura Bulldozer. Perchè onestamente mi pare di ricordare che con sandy bridge, intel si sia fermato ad un dual core+ht a 1,8 ghz mentre AMD propone con 2 watt di tdp in meno un quad core a 2,1 GHz con tanto south bridge e igp da 512 sp.... I 32nm Bulk di Intel e i 28nm di GF sulla carta non dovrebbero avere prestazioni molto differenti o no? Eppure effettivamente i core di SB sembrano richiedere più energia di un modulo BD (in effetti già con steamroller/kaveri c'è stato il sorpasso per efficienza al i3 2100).


Come ho scritto a Paolo l'architettura così progettata aveva bisogno di ben altro silicio per sopperire a consumi e altre mancanze.
Ma poi scusa se in amd stessa avevano pure previsto (Paolo si ricorderà di) nuovi processori a 10 e più cores in realtà mai usciti è segno che qualcosa con i consumi è andato storto... solo silicio? Certo se mi fai un architettura che non può reggere quelli attuali qualche calcolo sballato c'è.

L'aumento delle pipeline (che secondo uno studio di ibm l'ideale teorico era appunto quel numero scelto da amd) porta ad un abbassamento di ipc (difatti le precedenti architetture rullavano rispetto alla concorrenza proprio per avere sempre pipeline molto corte fino a che intel ha tolto fuori l'HT) ma se diminuisce l'ipc devo riuscire a riportare la potenza e velocità di elaborazione ad un livello tale da compensare questa perdita e uno dei modi per farlo è l'aumento di frequenza operativa, ma abbiamo visto che così facendo i consumi erano davvero elevati.
E infatti alla sua uscita BD non poteva andare oltre i 3600 mhz mentre i phenom X6 con i 45 andavano a 3300 e con due core in meno quasi battevano l'octa core (octa...) ...ma come, con i core reali ti vanti di battere quelli misti mentre non riesci a farlo nemmeno con due in più rispetto alla vecchia architettura prodotta peraltro su un silicio a miniaturizzazione più vecchia?

Come spieghiamo il tdp così tanto elevato dei processori FX 9xxx? Stiam parlando di 220 w di tdp per una frequenza operativa fino a 4.700 mhz ...ma non dovevano partire con questa frequenza da subito? Ma soprattutto, non dovevano garantire frequenze alte per rimediare al basso ipc delle lunghe pipeline rientrando alla fine in un normale consumo?

Però visto che il tuo post è riferito anche alla lunghezza delle pipeline rispetto alla concorrenza allora dico a maggior ragione se questa lunghezza è "normale" come spieghiamo i consumi elevatissimi e l'ipc scarsissimo?
Intel ha un ipc molto elevato in single thread e in single thread l'HT non si attiva quindi la loro architettura è molto ben progettata e quella BD molto mal progettata.

Ma l'ingegnere che l'ha realizzata a cosa pensava? A tirar fuori dai casini l'azienda per cui lavorava o solo realizzare un suo sogno nel cassetto con i soldi di amd?
Perché posso capire che mi falli una cosa, ma alla fine ci sono tante cose che non tornano niente in quel progetto. Parlo da non ingegnere e forse non dovrei dire niente per la mia ignoranza, però non si possono negare tante evidenze che han fatto solo danni.


E ok che una architettura va a braccetto con il silicio ma proprio per questo fai in modo che l'architettura abbia consumi che rientrano nella norma, velocità di elaborazione il più alte possibile, e maggior numero di cores con minor perdita di ipc nel MT ecc ecc ecc il tutto dentro un silicio adottato in quel tempo in cui l'architettura vedrà la luce, non in silici del futuro perché così anche io mi improvviso ingegnere studiando una triennale e aspettando il silicio del 2035 tanto avrò progettato alla carlona.

Immagino Keller che ha un peso non indifferente sulle spalle (magari anche no, forse lui progetta divertendosi) visto che con Zen stanno puntando tutto ma proprio tutto in amd. La situazione non è proprio delle più rosee a questo punto.

paolo.oliva2
25-07-2015, 16:04
Come ho scritto a Paolo l'architettura così progettata aveva bisogno di ben altro silicio per sopperire a consumi e altre mancanze.
Ma poi scusa se in amd stessa avevano pure previsto (Paolo si ricorderà di) nuovi processori a 10 e più cores in realtà mai usciti è segno che qualcosa con i consumi è andato storto... solo silicio? Certo se mi fai un architettura che non può reggere quelli attuali qualche calcolo sballato c'è.

L'aumento delle pipeline (che secondo uno studio di ibm l'ideale teorico era appunto quel numero scelto da amd) porta ad un abbassamento di ipc (difatti le precedenti architetture rullavano rispetto alla concorrenza proprio per avere sempre pipeline molto corte fino a che intel ha tolto fuori l'HT) ma se diminuisce l'ipc devo riuscire a riportare la potenza e velocità di elaborazione ad un livello tale da compensare questa perdita e uno dei modi per farlo è l'aumento di frequenza operativa, ma abbiamo visto che così facendo i consumi erano davvero elevati.
E infatti alla sua uscita BD non poteva andare oltre i 3600 mhz mentre i phenom X6 con i 45 andavano a 3300 e con due core in meno quasi battevano l'octa core (octa...) ...ma come, con i core reali ti vanti di battere quelli misti mentre non riesci a farlo nemmeno con due in più rispetto alla vecchia architettura prodotta peraltro su un silicio a miniaturizzazione più vecchia?

Come spieghiamo il tdp così tanto elevato dei processori FX 9xxx? Stiam parlando di 220 w di tdp per una frequenza operativa fino a 4.700 mhz ...ma non dovevano partire con questa frequenza da subito? Ma soprattutto, non dovevano garantire frequenze alte per rimediare al basso ipc delle lunghe pipeline rientrando alla fine in un normale consumo?

Però visto che il tuo post è riferito anche alla lunghezza delle pipeline rispetto alla concorrenza allora dico a maggior ragione se questa lunghezza è "normale" come spieghiamo i consumi elevatissimi e l'ipc scarsissimo?
Intel ha un ipc molto elevato in single thread e in single thread l'HT non si attiva quindi la loro architettura è molto ben progettata e quella BD molto mal progettata.

Ma l'ingegnere che l'ha realizzata a cosa pensava? A tirar fuori dai casini l'azienda per cui lavorava o solo realizzare un suo sogno nel cassetto con i soldi di amd?
Perché posso capire che mi falli una cosa, ma alla fine ci sono tante cose che non tornano niente in quel progetto. Parlo da non ingegnere e forse non dovrei dire niente per la mia ignoranza, però non si possono negare tante evidenze che han fatto solo danni.


E ok che una architettura va a braccetto con il silicio ma proprio per questo fai in modo che l'architettura abbia consumi che rientrano nella norma, velocità di elaborazione il più alte possibile, e maggior numero di cores con minor perdita di ipc nel MT ecc ecc ecc il tutto dentro un silicio adottato in quel tempo in cui l'architettura vedrà la luce, non in silici del futuro perché così anche io mi improvviso ingegnere studiando una triennale e aspettando il silicio del 2035 tanto avrò progettato alla carlona.

Immagino Keller che ha un peso non indifferente sulle spalle (magari anche no, forse lui progetta divertendosi) visto che con Zen stanno puntando tutto ma proprio tutto in amd. La situazione non è proprio delle più rosee a questo punto.

Però quello che non torna è questo:
Kaveri è un BD ed a livello di parte X86 come efficienza e consumo/potenza non è che si distanza granché dagli Intel a parità di TDP, e Carrizo sempre a 28nm migliora pure, visto che arriverebbe a 3,5GHz in turbo nei 35W.
Il problema quindi non sarebbe la frequenza in sé, perché Excavator con un IP di un 20% superiore, uguaglierebbe un FX X8 con solamente 35W (teorizzando che in un die da 35W la metà sono per l'IP, e visto che nei 17,5W e quindi 35W teorizzando un 4 moduli e quindi X8, ci sarebbero 2 MC e 2 PCI e quant'altro, ci sarebbe una enorme differenza tra 125W X8 Piledriver e spariamo 40W Excavator con la medesima frequenza.
La differenza per me non è nel modulo, ma nel leackage del 32nm SOI. Per questo basta fare un confronto semplice. Intel da un i7 X6 al 5960X c'è chiaramente un aumento di TDP, ma passando a modelli superiori, Intel riesce a contenere l'aumento del TDP unicamente abbassando la frequenza, ma IMPORTANTE, ottenendo addirittura un consumo inferiore rispetto alla potenza raggiunta.
Facendo un esempio ad cactus, se un core fosse 10W a 5GHz e lo stesso core a 3GHz fosse 5W, è chiaro che 2 core a 3GHz risolverebbe più istruzioni rispetto allo stesso ma a 5GHz, ma allo stesso consumo.
Se si guarda AMD, i die super selezionati Opera X16, hanno 140W rendendo meno di un 5960X, non certamente per la frequenza, visto che fanno 3GHz al max (ed un 8370E starebbe sotto i 95W con tutti e 8 i core a @4,5GHz test di Tom's).
Addirittura, come postato mesi fa, un Intel X12 nei 115W, a frequenze si da Opteron, ma impossibili assolutamente per AMD, perché si parlerebbe di 500W per la stessa potenza.
Ricapitolando, a parità di rendimento silicio, cioè con lo stesso leackage, AMD dovrebbe riuscire a fornire la stessa potenza con il medesimo scarto, sia che si parli di 2 moduli Kaveri/Carrizo, (1 modulo Vs 1 core e HT) sia che si parli di X12 nativi.
AMD aveva un vantaggio del 50% su Intel per numero di core a parità di miniaturizzazione, Thuban X6 a 45nm Vs i7 X6 ma sul 32nm, ora siamo a X8 Vs X12. Se non fosse per il silicio, ma sul banco l'architettura, allora avremmo 1 modulo AMD (e non 2) Vs gli i3... Tra l'altro, con un tot di transistor in più sia per l'IP più prestante, per la memoria unificata e pure per il supporto HSA 1.0.

tuttodigitale
25-07-2015, 19:10
Come ho scritto a Paolo l'architettura così progettata aveva bisogno di ben altro silicio per sopperire a consumi e altre mancanze.
Ma poi scusa se in amd stessa avevano pure previsto (Paolo si ricorderà di) nuovi processori a 10 e più cores in realtà mai usciti è segno che qualcosa con i consumi è andato storto... solo silicio? Certo se mi fai un architettura che non può reggere quelli attuali qualche calcolo sballato c'è.

L'aumento delle pipeline (che secondo uno studio di ibm l'ideale teorico era appunto quel numero scelto da amd) porta ad un abbassamento di ipc (difatti le precedenti architetture rullavano rispetto alla concorrenza proprio per avere sempre pipeline molto corte fino a che intel ha tolto fuori l'HT) ma se diminuisce l'ipc devo riuscire a riportare la potenza e velocità di elaborazione ad un livello tale da compensare questa perdita e uno dei modi per farlo è l'aumento di frequenza operativa, ma abbiamo visto che così facendo i consumi erano davvero elevati.

AMD aveva previsto prestazioni nel MT superiori del 50% rispetto al 1100T,sufficiente per competere con un i7 990x. E pur di risultar antipatico, ripeto che la misura dell'ipc è molto molto precisa.
Teoricamente quindi il compito di chiudere il gap con il i7 3960x e batterlo spettava al Piledriver deca-core.
Qualcosa è andato storto. Non è un segreto che AMD, inutilmente ha rinviato la commercializzazione perchè il clock raggiunto (3,6GHz) era di gran lunga più basso delle attese. E l'immancabile Paolo, disse che non sono certo 300-400MHz a fare una cpu (sono solo il 10%), cosa diversa se i MHz mancanti sono 1000 o giù di li..

I 3,6GHz sono da considerarsi a tutti gli effetti frequenze medie. Le apu excavator a 3,4-3,5 GHz ci arrivano con il 28nm bulk e librerie HDL, adatte proprio a frequenze ritenute inadatte per cpu ad alte prestazioni (leggasi inadatte ad una cpu FX). Questo sta a significare che sebbene 3 GHz sia in assoluto una frequenza elevata, è per bulldozer l'equivalente di 2,2GHz per SB...


Fatto che fa ancora più impressione che con il 28nm bulk, kaveri (niente HDL), fa segnare 3,6GHz in turbo boost in 35W di TDP contro i 4,2GHz di un fx, che ha un TDP di 125W, con cache l1 più piccola e un numero di decoder dimezzato.



E infatti alla sua uscita BD non poteva andare oltre i 3600 mhz mentre i phenom X6 con i 45 andavano a 3300 e con due core in meno quasi battevano l'octa core (octa...) ...ma come, con i core reali ti vanti di battere quelli misti mentre non riesci a farlo nemmeno con due in più rispetto alla vecchia architettura prodotta peraltro su un silicio a miniaturizzazione più vecchia?
sui 45nm ulk e 32nm SOI, ho sempre manifestato più di una perplessità sul reale beneficio lato prestazioni del "nuovo" processo produttivo (AMD con i 45nm vendeva thuban 6 core a 2,8GHz con un tdp di 95 watt)...
La storiella che l'architettura k10 (rinominata stars su 32nm) sia superiore a Piledriver è stata smentita dai fatti.
In ordine:
1) A8-3870k a malapena raggiungeva i 3,6 GHz in OC (contro i 4,5GHz+ di Richland)
2) a 3GHz non consumava di certo meno di richland a 4GHz,

La realtà dei fatti che se il passaggio dai 45nm ai 32nm avesse portato lo stesso beneficio che ha ricevuto Intel, sarebbe bastato una leggera revisione di k10 (d'altronde sandy bridge nei confronti di nehalem, migliora "solo" del 15% a livello di architettura)

Come spieghiamo il tdp così tanto elevato dei processori FX 9xxx? Stiam parlando di 220 w di tdp per una frequenza operativa fino a 4.700 mhz ...ma non dovevano partire con questa frequenza da subito? Ma soprattutto, non dovevano garantire frequenze alte per rimediare al basso ipc delle lunghe pipeline rientrando alla fine in un normale consumo?

Il confronto steamroller 28nm e sandy bridge 32nm, vede il primo superare il secondo, almeno per quello che riguarda le prestazioni complessive. Direi quindi che l'architettura era/è ottima, addirittura più di quella Intel, nel MT.


Ma l'ingegnere che l'ha realizzata a cosa pensava? A tirar fuori dai casini l'azienda per cui lavorava o solo realizzare un suo sogno nel cassetto con i soldi di amd?
Hanno fatto l'architettura per sfruttare le caratteristiche del SOI, ovvero a frequenze alte (sopra i 4GHz) l'aumento di consumo è assai modesto rispetto ad altri processi produttivi, peccato che le prestazioni offerte alle basse frequenze siano assai scarse (per giunta i 4GHz è stata raggiunta grazie al Resonant Clock Mesh). Fatto sta che i 3,6GHz, che poi sono la frequenza massima naturale (vedi RCM) di un fx8000 su 32nm, sono praticamente irraggiungibili sullo stesso processo produttivo da k10, ma non octa, ne esa, ma anche da un semplice quad-core (tdp di circa 180W...).

Se Intel ha migliorato "solo" del 15% con il passaggio a Sandybridge, il buco delle prestazioni del 50% è dovuto certamente ad un'altra causa, che per motivi detti in precedenza non può essere imputabile alla non riuscita di Piledriver (AMD aveva praticamente già pronte le maschere per k10 su 32nm, ma nonostante ciò si è fossilizzata su bulldozer e le sue evoluzioni).

Per il silicio futuro, vorrei ricordare che una architettura ha anni e anni di sviluppo alle spalle prima di essere gettata nella mischia, quindi è un compromesso tra il silicio del debutto (che comunque sarà pronto tra 4 anni) e quello finale (uno o addirittura due step). Semmai qui c'è a chiedersi se AMD avesse avuto a disposizione il 28nm Fd-soi, invece del bulk, rinomato per essere un processo produttivo eccellente a livello teorico anche nei confronti dei 22nm Bulk di Intel , cosa sarebbe successo. Ma più che altro quanto bene fanno alle tasche di AMD i cambi di progetti improvvisati da parte di GF?

paolo.oliva2
25-07-2015, 20:54
Quello che critico ad AMD, è il non utilizzo di TDP reale ma fossilizzarsi sul predittivo. Come si fa a spendere milioni per un più 10% di IPC e poi perdere il tutto per frequenze/Vuole ad cactus? Intel può sfruttare l'ultimo militato del TDP, oppure sforare per un tempo stabilito. AMD ha impostato negli FX un turbo su 4 core che praticamente ha la stessa frequenza sia sui provi 95W che 125.
Con questo non voglio dire che cambierebbe la situazione, però, cacchio, ha senso sviluppare Kaveri spendendo soldi quando un Piledriver avrebbe ottenuto lo stesso miglioramento SE semplicemente si adottare il giusto Vuole alla frequenza X permessa dalla rilevazione del TDP istantaneo?
Proviamo ad immaginare che un FX X8 su core Steamroller potrebbe girare alle stesse frequenze di un Piledriver solamente sfruttando il TDP non sfruttato, e qui già saremmo ad un più 10%, a questo sommiamoci un altro ALMENO 5% nella forza bruta a core portando le frequenze turbo sui 4,4GHz (e se 8 core possono girare a 4,5GHz senza sforare i 125W, alla faccia del margine per solo 4). Insomma, sono cose che AMD poteva fare anche sul 32nm SOS, era meglio fare questo o commercializzare i 9370 a 220W TDP?

tuttodigitale
26-07-2015, 21:39
puntualizzo che lo scarso ipc di bulldozer è dovuto solo in parte alla lunghezza delle pipeline. Si è parlato già nei post precedenti che in realtà un modulo bulldozer è da considerarsi un supercore. Anche il confronto con k10, vede quest'ultimo in grado di garantire picchi superiori del 50% a parità di clock.


@paolo
un miglior sfruttamento del margine termico, migliora si la prestazioni ma è deleteria per l'efficienza. La coperta è corta. Anche se prima o poi bisogna comunque adeguarsi ai competitors che da anni usano soluzioni decisamente più sofisticate (e in un certo senso più furbe, proprio per una certa sfumatura sulle prestazioni che può esserci tra diverse cpu/gpu con la stessa sigla ).
Tuttavia la soluzione AMD l'ha sotto al naso: excavator, considerando che secondo slide, in cinebench, vanno molto di più:
9-13% in più rispetto a steamroller nel MT e ST rispettivamente,
steamroller a sua volta è più veloce di piledriver del 12,3% nel MT nello stesso test (eseguito a 4,3GHz).

In conclusione il guadagno in cinebench è pari al 22,5% a livello di ipc (3,6 ghz excavator equivalgono a 4,4ghz di piledriver). Se poi decidi di aumentare anche il numero di core (per giunta un modulo excavator ha solo 1MB di cache L2), meglio ancora. Solo motivi economici possono spingere AMD a non produrre nuove soluzioni FX, anche sul non esaltante 32nm SOI.

PS ricordo che le APU carrizo grazie a excavator migliorano l'efficienza del 30% rispetto ai core Puma.

george_p
27-07-2015, 09:37
puntualizzo che lo scarso ipc di bulldozer è dovuto solo in parte alla lunghezza delle pipeline. Si è parlato già nei post precedenti che in realtà un modulo bulldozer è da considerarsi un supercore. Anche il confronto con k10, vede quest'ultimo in grado di garantire picchi superiori del 50% a parità di clock.



Per mancanza di tempo rispondo solo a questo post per ora.

Penso che tutto il mio "ragionamento" stia proprio nella tua frase che evidenzio.
A me sta benissimo considerare un modulo un super core come Corsini stesso aveva scritto nella recensione di BD e per ciò ribadisco che l'architettura era anacronistica, non al passo con i tempi del silicio.
Ergo tutto il discorso sull'aver mal progettato tutto l'insieme.
La bravura sta proprio nel pianificare un prodotto che puoi realizzare subito e non dopo quasi 5 anni con Kaveri e Excavator.
Il grosso Fail sta soprattutto li.

davo30
27-07-2015, 10:14
Record negativo assoluto per AMD:
http://www.google.com/finance?q=NYSE:AMD

Speriamo gli metta un po di pepe per far uscire Zen

paolo.oliva2
27-07-2015, 10:15
puntualizzo che lo scarso ipc di bulldozer è dovuto solo in parte alla lunghezza delle pipeline. Si è parlato già nei post precedenti che in realtà un modulo bulldozer è da considerarsi un supercore. Anche il confronto con k10, vede quest'ultimo in grado di garantire picchi superiori del 50% a parità di clock.


@paolo
un miglior sfruttamento del margine termico, migliora si la prestazioni ma è deleteria per l'efficienza. La coperta è corta. Anche se prima o poi bisogna comunque adeguarsi ai competitors che da anni usano soluzioni decisamente più sofisticate (e in un certo senso più furbe, proprio per una certa sfumatura sulle prestazioni che può esserci tra diverse cpu/gpu con la stessa sigla ).
Tuttavia la soluzione AMD l'ha sotto al naso: excavator, considerando che secondo slide, in cinebench, vanno molto di più:
9-13% in più rispetto a steamroller nel MT e ST rispettivamente,
steamroller a sua volta è più veloce di piledriver del 12,3% nel MT nello stesso test (eseguito a 4,3GHz).

In conclusione il guadagno in cinebench è pari al 22,5% a livello di ipc (3,6 ghz excavator equivalgono a 4,4ghz di piledriver). Se poi decidi di aumentare anche il numero di core (per giunta un modulo excavator ha solo 1MB di cache L2), meglio ancora. Solo motivi economici possono spingere AMD a non produrre nuove soluzioni FX, anche sul non esaltante 32nm SOI.

PS ricordo che le APU carrizo grazie a excavator migliorano l'efficienza del 30% rispetto ai core Puma.

Infatti il giudizio su BD è comunque inficiato dal fattore architettura Piledriver + 32nm SOI e su questo prodotto (che è l'unico commercializzato) il confronto in efficienza e prestazioni/consumi.
Teorizzando lo stesso FX, anche sul 32nm SOI, ma su base Excavator, è indubbio che avrebbe tutt'altro risultati in termini di efficienza. Se poi a questo aggiungessimo che l'efficienza è un metro valido solo a parità di bontà silicio e per esempio il Phenom II che dal 45nm liscio al 45nm con look ha aumentato l'efficienza a dismisura, visto che con circa lo stesso TDP ha aumentato le prestazioni MT di un 25% con zero variazioni architetturali, figuriamoci un passaggio da un 32nm a un 22nm o16nm cosa potrebbe quantificare.
Per me la pecca di BD è una non esaltante potenza bruta, ma diversa da insufficiente, e magari rivedere la lunghezza pipeline a seconda delle caratteristiche silicio e/o dell'IPC ottenuto... Visto l'aumento dell'efficienza CMT tra Pile ed Excavator, mi sembra ovvio che il giudizio si CMT no CMT come minimo andrebbe ricalcolato

Personalmente mi sono divertito con gli FX, sono tutt'altro che insoddisfatto. Però pretendo da AMD è che il nuovo procione desktop sia sempre Black, con un numero di core non inferiore a 8, che aumenti la potenza MT e.... Che costi poco sia come procio che me mobo.

george_p
27-07-2015, 10:22
Record negativo assoluto per AMD:
http://www.google.com/finance?q=NYSE:AMD

Speriamo gli metta un po di pepe per far uscire Zen

Penso che il pepe lo abbiano già da svariati anni, ancor prima che tornasse keller nel 2012. Ma proprio perché loro stanno puntando tutto su Zen non possono saltare gradini importanti.
Ormai si può solo aspettare.

davo30
27-07-2015, 12:13
Penso che il pepe lo abbiano già da svariati anni, ancor prima che tornasse keller nel 2012. Ma proprio perché loro stanno puntando tutto su Zen non possono saltare gradini importanti.
Ormai si può solo aspettare.
Beh non mi pare abbiano tutto sto pepe. 10 mesi di ritardo per far uscire un rebrand delle gpu... speriamo solo non ritardino con zen e lo facciano uscire entro la prima meta del 2016, quantomeno per farlo scontrare con skylake e approfittare del ritardo che sta avendo anche intel con cannonlake


Inviato dal mio GT-I9505 utilizzando Tapatalk

george_p
27-07-2015, 12:20
Beh non mi pare abbiano tutto sto pepe. 10 mesi di ritardo per far uscire un rebrand delle gpu... speriamo solo non ritardino con zen e lo facciano uscire entro la prima meta del 2016, quantomeno per farlo scontrare con skylake e approfittare del ritardo che sta avendo anche intel con cannonlake


Inviato dal mio GT-I9505 utilizzando Tapatalk

Il rebrand è dovuto sia al fatto che non è pronto da nessuna parte il processo produttivo più avanzato per una nuova architettura (anche io all'inizio dell'anno avevo capito il contrario) e sia perché le architetture GCN hanno tutto quello che occorre per la programmazione ANCHE con le nuove DX12.

Vedremo nuova architettura con la serie 400 direttamente e su nuovo processo produttivo.

Il pepe puoi averlo a prescindere dalle risorse a tua disposizione ma se ti mancano e non dipende strettamente da te ma da terzi e/o dalla disponibilità finanziaria hai voglia a farti prendere dalla fretta (cattiva consigliera da sempre) :)

davo30
27-07-2015, 12:28
Il rebrand è dovuto sia al fatto che non è pronto da nessuna parte il processo produttivo più avanzato per una nuova architettura (anche io all'inizio dell'anno avevo capito il contrario) e sia perché le architetture GCN hanno tutto quello che occorre per la programmazione ANCHE con le nuove DX12.

Vedremo nuova architettura con la serie 400 direttamente e su nuovo processo produttivo.

Il pepe puoi averlo a prescindere dalle risorse a tua disposizione ma se ti mancano e non dipende strettamente da te ma da terzi e/o dalla disponibilità finanziaria hai voglia a farti prendere dalla fretta (cattiva consigliera da sempre) :)
Sisi, infatti non discutevo della bonta di gcn che è evidente a tutti (tranne forse le 390/x che consumano veramente troppo in confronto alle offerte della controparte 970). Nenache il pp di cui sappiamo essere tutte le colpe (l'unica colpa di amd è di continuare a fornirsi da dei menefteghisti). È proprio il fatto che essendo un rebrand, trovo assurdo aver regalato 10 mesi di monopolio a nvidia, con tutte le ripercussioni che ne sono conseguite (perdita di market share e diminuzione del 50% del fatturato yoy del settore cpu e gpu)

Inviato dal mio GT-I9505 utilizzando Tapatalk

Totix92
27-07-2015, 12:53
secondo me se amd sin dall'inizio avesse fatto un die shrink dei Phenom II a 32nm aggiungendo le varie istruzioni SSE4.2, AES e quant'altro e rinominandoli in Phenom III avrebbe avuto molto più senso.

jok3r87
27-07-2015, 13:53
Ma in overclock avete constatato una reale differenza tra 8320 r 8350? Salgono in media allo stesso modo?

Inviato dal mio SM-G920F utilizzando Tapatalk

isomen
27-07-2015, 16:54
Ma in overclock avete constatato una reale differenza tra 8320 r 8350? Salgono in media allo stesso modo?

Inviato dal mio SM-G920F utilizzando Tapatalk

In overcloch ad aria per daily use la differenza é minima, io per uso quotidiano stò a 4,6 con tutti e due gli 8350... anche se uno nn va oltre e con l'altro (in inverno :asd: ) ho benchato anche a 5ghz, nel forum ci sono diversi utenti con 8320 che stanno a 4,5/4,6... quindi direi che come oc massimo "forse" un minimo di differenza c'é, ma per le condizioni dette sopra secondo me uno vale l'altro.

;) ciauz

Chris70
27-07-2015, 18:40
Ok, grazie...
Oggi intanto ho abbassato a 4.2 con vcore a 1.35 vcore a 1.30 per poi magari scendere un po'...
Un consiglio un po' O.T., mi è arrivata la pasta termica artic mx-4, come mi consigliate di metterla?
In un forum avevo visto che le cpu fx hanno la parte che scalda di più sviluppata "orizzontalmente" e consigliavano di mettere una strisciolina di pasta in quel modo...

Come vi sembra 4.3 con vcore 1.33750 e cpu-nb a 1.23750, in caso quale potrei ancora far scendere?

isomen
27-07-2015, 19:30
Come vi sembra 4.3 con vcore 1.33750 e cpu-nb a 1.23750, in caso quale potrei ancora far scendere?

Ma... per un 9370 nn mi sembra un risultato eccezionale, diciamo nella media:

http://thumbnails105.imagebam.com/42464/8f7359424635008.jpg (http://www.imagebam.com/image/8f7359424635008)

;) ciauz

Chris70
27-07-2015, 19:50
Ok, grazie...
Oggi intanto ho abbassato a 4.2 con vcore a 1.35 vcore a 1.30 per poi magari scendere un po'...
Un consiglio un po' O.T., mi è arrivata la pasta termica artic mx-4, come mi consigliate di metterla?
In un forum avevo visto che le cpu fx hanno la parte che scalda di più sviluppata "orizzontalmente" e consigliavano di mettere una strisciolina di pasta in quel modo...

Ma... per un 9370 nn mi sembra un risultato eccezionale, diciamo nella media:

http://thumbnails105.imagebam.com/42464/8f7359424635008.jpg (http://www.imagebam.com/image/8f7359424635008)

;) ciauz

Infatti, il mio non è un "vanto", chiedo consiglio su quanto ancora scendere e se prediligere vcore o cpu/nb core o farli scendere entrambi...

isomen
27-07-2015, 20:51
Infatti, il mio non è un "vanto", chiedo consiglio su quanto ancora scendere e se prediligere vcore o cpu/nb core o farli scendere entrambi...

...e la mia nn éra una critica, dipende sempre dalla bontà della cpu... devi regolarti con le temp, posso dirti che l'8370E dello screen con 1,16 tiene 4ghz ma con vcore a 1,4 già scalda parecchio, mentre questo 8350 (molto più sfigato) con 1,44 sta tranquillo a 4,6... probabile che il tuo avendo un vcore più alto sopporti meglio questo voltaggio.

;) ciauz

Chris70
27-07-2015, 21:17
Non ho capito molto...
Una curiosità sulle temperature, ho visto che con OCCT verso la fine del secondo minuto raggiunge un picco anche quasi a 78, poi inizia a scendere anche di parecchio...

x Jason x l7l
28-07-2015, 01:29
Ma ragazzi, domandona riguardo alle temperature:
vorrei una spiegazione un po' "tecnica" riguardo alle temperature rilevate dai vari software sulle cpu AMD.

Con 30° in casa avevo una temperatura in idle (con dissipatore ad aria) di 21° rilevata con HWmonitor.
Ciò è fisicamente impossibile quindi mi chiedo: quali sono le reali temperature raggiunte dalla cpu?
Per quale motivo il valore è così basso rispetto a quello che dovrebbe essere reale?
Sulle nuove cpu sarà previsto lo stesso sistema?
E' possibile rilevare la temperatura effettiva?

paolo.oliva2
28-07-2015, 09:17
La rilevazione delle temperature adotta un sistema differente dai gradi reali, ma non c'è da preoccuparsi, perchè il sistema di protezione automatico funziona più che bene.
In pratica, se si fa il test con OCCT in condizione di temperatura ambiente elevata e il procione non abbassa le frequenze operative, difficilmente si potrà ricreare la stessa situazione nell'uso normale.
Altro punto... A seconda dei BIOS si potrebbe verificare un abbassamento delle frequenze se non si disattiva una opzione (non mi ricordo quale, sono arrugginito) ma non dipende dalle temperature, supporre più un controllo autonomo della moto sulla corrente erogata, visto che la funzione di controllo tempo del procio è assolutamente autonoma e automatica e non disattivabile).
In ogni caso la situazione estiva del 30 gradi e più è veramente una situazione da incubo per il sistema, non tanto per i 10 gradi almeno di temperatura generale più alta, quanto per l'effettiva capacità dell'insieme, cioè che la dissipazione si basa sulla differenza tra temperatura ambiente e temperatura procio, più questa diminuisce e più immancabilmente si alzerà la temperatura procio, quasi del doppio, cioè +1 grado ambiente = +2 gradi procio (naturalmente dipende dal tipo di raffreddamento)

tuttodigitale
28-07-2015, 23:34
Beh non mi pare abbiano tutto sto pepe. 10 mesi di ritardo per far uscire un rebrand delle gpu... speriamo solo non ritardino con zen e lo facciano uscire entro la prima meta del 2016, quantomeno per farlo scontrare con skylake e approfittare del ritardo che sta avendo anche intel con cannonlake

davo30, un produttore deve confrontarsi con il rapporto costo/benefici. NVidia ha aggiornato le sue gpu, perchè evidentemente il numero di prodotti venduti era tale che il risparmio sulla singola gpu (misero) ma venduto per n-mila prodotti, avrebbe permesso di coprire i costi (enormi) per la messa in produzione di nuove gpu.
Vorrei infatti sottolineare che anche nel periodo d'oro del vliw4 e 5 (HD5000 e HD6000) anche se apparentemente non c'era motivo alcuno (tranne per il gpgpu) di acquistare schede basate sull'architettura Fermi (più costose e meno efficienti), il mercato non ha dato ragione ad AMD.
Ma di certo non sono stati fermi: le apu Carrizo in 15W di TDP hanno l'igp con i 512sp completamente abilitati e con un clock decisamente maggiore rispetto alle apu kaveri in 19W (che non aveva il southbridge integrato), senza cedere di un passo per quanto riguarda la frequenza della cpu, pari a 2,1GHz.

secondo me se amd sin dall'inizio avesse fatto un die shrink dei Phenom II a 32nm aggiungendo le varie istruzioni SSE4.2, AES e quant'altro e rinominandoli in Phenom III avrebbe avuto molto più senso.
il primo prodotto a 32nm era proprio basato sull'architettura k10. E proprio grazie a llano che abbiamo potuto constatare che sono i 32nm SOI la spina nel fianco di AMD. Per raggiungere i 4GHz hanno dovuto usare il Resonant Clock Mesh.

Un quad-core k10 (a8-3850 e 3870k) a 3,6GHz di un fx8150, ci arriva su 32nm consumando non 65/70watt (il massimo per poter ipotizzare un octa-core) ma 170-180 watt.

Come ho detto più in dettaglio uno o due mesi fa, in questo stesso thread, mediamente le apu richland, in un range di TDP che va dai 25 ai 100W, hanno frequenze superiori del 35% rispetto alle apu llano, pur essendo entrambe basate nominalmente sullo stesso processo produttivo. Differenze seppur gonfiate dall'utilizzo del RCM, restano comunque notevoli.

Visto l'aumento dell'efficienza CMT tra Pile ed Excavator, mi sembra ovvio che il giudizio si CMT no CMT come minimo andrebbe ricalcolato
in realtà dall'unico test disponibile, risulta che lo scaling di excavator sia peggiore di quello visto in steamroller. Ho come l'impressione che la cache di un solo MB per modulo abbia un peso negativo nello scaling (ma potrebbe in un certo senso risvolti positivi per le prestazioni nel st, qualora fosse diventata più veloce).

Non sono neppure d'accordo che il CMT di steamroller/excavator sia migliore di quello di piledriver/bulldozer. Sono solo diversi. Mi spiego meglio.
Tanto per cominciare, il cambiamento più significativo è il raddoppio delle unità di decodifica. Questo permette a steamroller di avere si un CMT migliore ma a scapito del consumo, proprio in virtù degli elementi aggiuntivi.
Quindi qualcuno potrebbe ora fare la seguente osservazione: "il CMT delle ultime due architetture è migliore, in caso contrario non avrebbe avuto senso farlo".
NI. steamroller non era certo previsto per i 32nm. Probabilmente AMD aveva previsto che i futuri processi produttivi era produttivo aumentare l'ipc. Infatti se già a 32nm le frequenze dovevano essere intorno ai 5GHz (improbabile pensare di aumentare il limite di un altro GHz con un die shrink), il miglioramento del CMT avrebbe permesso un boost equivalente a 400MHz.
Quello che sto cercando di dire, è che probabilmente un FX steamroller/excavator si dovrebbe accontentare di frequenze più basse di un FX piledriver anche sui 32nm SOI.

paolo.oliva2
29-07-2015, 20:52
davo30, un produttore deve confrontarsi con il rapporto costo/benefici. NVidia ha aggiornato le sue gpu, perchè evidentemente il numero di prodotti venduti era tale che il risparmio sulla singola gpu (misero) ma venduto per n-mila prodotti, avrebbe permesso di coprire i costi (enormi) per la messa in produzione di nuove gpu.
Vorrei infatti sottolineare che anche nel periodo d'oro del vliw4 e 5 (HD5000 e HD6000) anche se apparentemente non c'era motivo alcuno (tranne per il gpgpu) di acquistare schede basate sull'architettura Fermi (più costose e meno efficienti), il mercato non ha dato ragione ad AMD.
Ma di certo non sono stati fermi: le apu Carrizo in 15W di TDP hanno l'igp con i 512sp completamente abilitati e con un clock decisamente maggiore rispetto alle apu kaveri in 19W (che non aveva il southbridge integrato), senza cedere di un passo per quanto riguarda la frequenza della cpu, pari a 2,1GHz.


il primo prodotto a 32nm era proprio basato sull'architettura k10. E proprio grazie a llano che abbiamo potuto constatare che sono i 32nm SOI la spina nel fianco di AMD. Per raggiungere i 4GHz hanno dovuto usare il Resonant Clock Mesh.

Un quad-core k10 (a8-3850 e 3870k) a 3,6GHz di un fx8150, ci arriva su 32nm consumando non 65/70watt (il massimo per poter ipotizzare un octa-core) ma 170-180 watt.

Come ho detto più in dettaglio uno o due mesi fa, in questo stesso thread, mediamente le apu richland, in un range di TDP che va dai 25 ai 100W, hanno frequenze superiori del 35% rispetto alle apu llano, pur essendo entrambe basate nominalmente sullo stesso processo produttivo. Differenze seppur gonfiate dall'utilizzo del RCM, restano comunque notevoli.


in realtà dall'unico test disponibile, risulta che lo scaling di excavator sia peggiore di quello visto in steamroller. Ho come l'impressione che la cache di un solo MB per modulo abbia un peso negativo nello scaling (ma potrebbe in un certo senso risvolti positivi per le prestazioni nel st, qualora fosse diventata più veloce).

Non sono neppure d'accordo che il CMT di steamroller/excavator sia migliore di quello di piledriver/bulldozer. Sono solo diversi. Mi spiego meglio.
Tanto per cominciare, il cambiamento più significativo è il raddoppio delle unità di decodifica. Questo permette a steamroller di avere si un CMT migliore ma a scapito del consumo, proprio in virtù degli elementi aggiuntivi.
Quindi qualcuno potrebbe ora fare la seguente osservazione: "il CMT delle ultime due architetture è migliore, in caso contrario non avrebbe avuto senso farlo".
NI. steamroller non era certo previsto per i 32nm. Probabilmente AMD aveva previsto che i futuri processi produttivi era produttivo aumentare l'ipc. Infatti se già a 32nm le frequenze dovevano essere intorno ai 5GHz (improbabile pensare di aumentare il limite di un altro GHz con un die shrink), il miglioramento del CMT avrebbe permesso un boost equivalente a 400MHz.
Quello che sto cercando di dire, è che probabilmente un FX steamroller/excavator si dovrebbe accontentare di frequenze più basse di un FX piledriver anche sui 32nm SOI.
È interessante (molto interessante) quello che scrivi, e secondo me è giusto.
Comunque secondo me è molto più complesso.
Scrivo dei dati a memoria, diciamo indicativi.
Nel confronto CMT e no CMT, si è sempre considerato l'IPC come metro, ed il numero di transistor necessari.
Da qui veniva fuori che AMD dava 100 Vs Intel che dava 150.
Nell'utilizzo completo del modulo, AMD ottiene un +80% mentre Intel un +30% (valori di massima) che nel complessivo davano 180 per AMD Vs 195 per Intel.
Fino a qui ci siamo, ma la differenza è che un aumento IPC della stessa percentuale ha pesi molto differenti tra le 2 architetture perché:
Intel: 100 + 10% = 110. HT = +30% di 110. Incremento finale = 143.
AMD: 100 + 10% = 110. Modulo = +80% = 198.
L'invrento del 10% porta un guadagno di 13 su Intel contro i 18 di AMD, semplicemente perché tra le due l'HT di Intel sfrutta il 30% contro l'80% del CMT.

Per una parità immaginaria, basterebbe che AMD non stia sotto in IPC ad Intel tanto quanto la differenza di un +50% che c'è tra HT e modulo con la circuiteria rispettivamente DELL'HT e del CMT.

In ogni caso è ben più difficile per Intel aumentare l'IPC sopra al +5% di quanto non lo sia per AMD a 2 cifre, questo a livello di architettura, poi è chiaro che AMD molto lo deve avere dal silicio, perché in ambito mobile, tanto tanto, ma in ambito Opteron/FX paga almeno almeno sopra un -50% di efficienza.

isomen
30-07-2015, 00:11
È interessante (molto interessante) quello che scrivi, e secondo me è giusto.
Comunque secondo me è molto più complesso.
Scrivo dei dati a memoria, diciamo indicativi.
Nel confronto CMT e no CMT, si è sempre considerato l'IPC come metro, ed il numero di transistor necessari.
Da qui veniva fuori che AMD dava 100 Vs Intel che dava 150.
Nell'utilizzo completo del modulo, AMD ottiene un +80% mentre Intel un +30% (valori di massima) che nel complessivo davano 180 per AMD Vs 195 per Intel.
Fino a qui ci siamo, ma la differenza è che un aumento IPC della stessa percentuale ha pesi molto differenti tra le 2 architetture perché:
Intel: 100 + 10% = 110. HT = +30% di 110. Incremento finale = 143.
AMD: 100 + 10% = 110. Modulo = +80% = 198.
L'invrento del 10% porta un guadagno di 13 su Intel contro i 18 di AMD, semplicemente perché tra le due l'HT di Intel sfrutta il 30% contro l'80% del CMT.

Per una parità immaginaria, basterebbe che AMD non stia sotto in IPC ad Intel tanto quanto la differenza di un +50% che c'è tra HT e modulo con la circuiteria rispettivamente DELL'HT e del CMT.

In ogni caso è ben più difficile per Intel aumentare l'IPC sopra al +5% di quanto non lo sia per AMD a 2 cifre, questo a livello di architettura, poi è chiaro che AMD molto lo deve avere dal silicio, perché in ambito mobile, tanto tanto, ma in ambito Opteron/FX paga almeno almeno sopra un -50% di efficienza.

Paolo, sai quanto sono pro amd, ma secondo me hai sbagliato ad impostare il calcolo... seguendo il tuo ragionamento iniziale:

intel 150+10%=165+HT= +30%=214,5

amd 100+10%=110+modulo= +80%=198

il tuo ragionamento sarebbe valido se partissero alla pari.

;) ciauz

tuttodigitale
30-07-2015, 07:12
Fino a qui ci siamo, ma la differenza è che un aumento IPC della stessa percentuale ha pesi molto differenti tra le 2 architetture perché:
Intel: 100 + 10% = 110. HT = +30% di 110. Incremento finale = 143.
AMD: 100 + 10% = 110. Modulo = +80% = 198.
L'invrento del 10% porta un guadagno di 13 su Intel contro i 18 di AMD, semplicemente perché tra le due l'HT di Intel sfrutta il 30% contro l'80% del CMT.

Per una parità immaginaria, basterebbe che AMD non stia sotto in IPC ad Intel tanto quanto la differenza di un +50% che c'è tra HT e modulo con la circuiteria rispettivamente DELL'HT e del CMT.
Il ragionamento è sbagliato. Un incremento di ipc del 10% fa si che l'aumento di prestazioni complessivo sia di pari entità. 1-2 o n-mila core, SMT o quant’altro non cambia niente.
Quei numeri sono sbagliati, perchè parte dal presupposto tutt'altro che giusto, che un modulo BD sia in grado di sviluppare una potenza superiore del 38% a parità di clock rispetto ad un core haswell. Ed è ovvio che a parità di aumento di prestazioni relative (198/180 e 143/130), la cpu più potente abbia un incremento in valore assoluto superiore (18 vs 13).

La situazione reale è presso a poco questa (ovvero un modulo può confrontarsi con un core+ht):
intel ST 100 + ht 30 = 130
AMD ST 72 + cmt 80 = 130
ipc +10% = 143 sia per intel che per amd.


In ogni caso è ben più difficile per Intel aumentare l'IPC sopra al +5% di quanto non lo sia per AMD a 2 cifre, questo a livello di architettura, poi è chiaro che AMD molto lo deve avere dal silicio, perché in ambito mobile, tanto tanto, ma in ambito Opteron/FX paga almeno almeno sopra un -50% di efficienza.
questo è tutt'altro paio di maniche e in effetti l'aumento di ipc è stato ben più solido, ma il motivo di fondo è proprio da ricercarsi in alcune scelte progettuali.

con i 22nm Intel ha migliorato, ma relativamente poco, solo 25% di efficienza in più,(praticamente quanto il passaggio dai 45nm al 45nm low k), quando mediamente (a spanne) siamo nel range 40-50% per un die shrink.
Tra il 45nm e il 45 low k, il miglioramento è stato all’incirca del 20-25%, mentre addirittura dai 65 ai 45 lisci, si è passato ad una riduzione dei consumi clock to clock del 100% (praticamente era possibile fare un octa-core da 2,6GHz). Nel caso di llano a 3 GHz, addirittura il 45 nm low-k fa meglio del 32nm del 40-45%. A 3,6Ghz quel gap è con il 45nm liscio (circa il 70% con il low-k)… Paradossalmente il 45nm era (è?) stato prestazionalmente il die shrink dei 32nm.

I numeri sono abbastanza eloquenti, dalle slide al prodotto finito si è perso il 35% delle prestazioni per strada.

Chris70
30-07-2015, 09:37
...e la mia nn éra una critica, dipende sempre dalla bontà della cpu... devi regolarti con le temp, posso dirti che l'8370E dello screen con 1,16 tiene 4ghz ma con vcore a 1,4 già scalda parecchio, mentre questo 8350 (molto più sfigato) con 1,44 sta tranquillo a 4,6... probabile che il tuo avendo un vcore più alto sopporti meglio questo voltaggio.

;) ciauz

Ieri con Ai suite asus ho impostato i vari "cpu load line, power phase control, ecc..." su alti valori.
Fatto questo ho abbassato di nuovo vcore e cpu/nb e il sistema ha retto, mentre con valori normali dopo neanche 60 secondi si bloccava o riavviava.
A questo punto la domanda è, meglio alzare quei valori e abbassare voltaggio o no?

paolo.oliva2
30-07-2015, 09:49
Rispondendo ad entrambi:
Faccio un preambolo. La discussione la metterei più sull'architettura che sul prodotto finito. Secondo, il silicio a livello architetturale ha inciso poco, perché le aspettative erano circa quelle di un 9590 nei 125W, quindi 4,7GHz def e 5GHz turbo, meglio ma sempre insufficiente a livello di forza bruta. In MT invece molto, perché se al posto di un 4 moduli/8 core nei 125W si potrebbe realizzare un 6~8 moduli, cioè 16 TH quanto un 5960X, AMD avrebbe sempre pagato la differenza di IPC, ma avrebbe raggiunto una potenza MT a die ben superiore.

Ho fatto i calcoli e avete ragione voi.
Porta vasca, a parità di incremento la differenza è costante, ho scritto una boiata

La mia posizione è da rivedere... L'IPC è più importante di quanto pensavo.
in ogni caso rimango MOLTO scettico riguardo l'incremento di Zen pubblicizzato.

lauda
30-07-2015, 12:10
in ogni caso rimango MOLTO scettico riguardo l'incremento di Zen pubblicizzato.

Io spero che si riveli un architettura migliore di skylake, perché mi piacerebbe tornare in AMD dopo i gloriosi Athlon 64 :cry:

paolo.oliva2
30-07-2015, 14:05
Io spero che si riveli un architettura migliore di skylake, perché mi piacerebbe tornare in AMD dopo i gloriosi Athlon 64 :cry:

Ho letto che sui core Excavator troviamo l'AVFS che prevede l’implementazione di sensori in silicio brevettati in grado di rilevare velocità e voltaggio, permettendo così l'adattamento in tempo reale portando ad un risparmio fino al 30%.
Poi mi sembrava che c'era un'altra cosa che portava fino ad un altro +20%, ma non la trovo più... Sono col cellulare... È un macello.

Potrebbe darsi, però che AMD parli in senso lato? Cioè, più potenza del 40% non vuole dire IPC maggiore del 40%, ma prestazioni superiori del 40% a parità di consumo.
Cioè, se un modulo Steamroller fosse 15W con IPC 100 a 3GHz, la logica vorrebbe che aumentando l'IPC aumenterebbe il TDP, questo in parte sarebbe cancellato dall'ottimizzazione architetturale, ma è chiaro che se l'AVFS arrivasse al -30% del TDP, magari 20% come media, un modulo Excavator potrebbe aumentare l'IPC rispetto a Steamroller addirittura con un TDP inferiore, utilizzabile magari per uno scricchiolii di frequenza in più.

Riversando la cosa su Zen, il discorso cambierebbe, per un semplice motivo:
Si parla di 95W per Zen X8, e io ho espresso dubbi circa le prestazioni finali appunto perché va bene i 14/16nm, ma un 5960% è pur sempre 140W anche se 22nm.
Però se i 95W fossero ottenuti con l'AVFS senza forse sarebbero 110W,il che avvicinerebbe al TDP di un teorico 5960X realizzato sul 14nm.

Per quanto si possa avere fantasia, non penso che Zen possa avere stravolgimenti degli INT e FP rispetto al core Excavator (1 anno o più non sarebbero sufficienti), si potrebbero teorizzare pipeline più corte, cache più veloci magari aggiungendo altre pipeline, insomma quanto si vuole ma un IPC del 50% superiore equivarrebbe a dire che Excavator avrebbe un'efficienza catastrofica, ma se già Trinity stava una spanna sopra a Llano puoi capire Llano Vs Kavery/Carrizo.

tuttodigitale
30-07-2015, 14:09
Secondo, il silicio a livello architetturale ha inciso poco, perché le aspettative erano circa quelle di un 9590 nei 125W, quindi 4,7GHz def e 5GHz turbo, meglio ma sempre insufficiente a livello di forza bruta. In MT invece molto, perché se al posto di un 4 moduli/8 core nei 125W si potrebbe realizzare un 6~8 moduli, cioè 16 TH quanto un 5960X, AMD avrebbe sempre pagato la differenza di IPC, ma avrebbe raggiunto una potenza MT a die ben superiore.
già solo 5 moduli e 4,7GHz cambierebbero e di molto lo scenario: siamo a + 44% con livelli prestazioni del tutto simili ad un i7 4960x (in cinebench leggermente più lento, nella conversione video più veloce). Tra haswell-e e IB-e ci corre solo il 15% (con alcune punte del 20%), certamente il livello prestazionale sarebbe stato decisamente molto alto e dannatamente competitivo.


La mia posizione è da rivedere... L'IPC è più importante di quanto pensavo.
in ogni caso rimango MOLTO scettico riguardo l'incremento di Zen pubblicizzato.
più che altro il dubbio è su come si tradurrà questo aumento di ipc lato performance (non è comunque da escludere un ulteriore aumento di clock).
Sulla slide comunque si parla ESPLICITAMENTE di core, non di moduli. E anche l'aumento, praticamente inesistente sulla slide (nella realtà siamo intorno al 25%) tra le diverse versioni di bulldozer, toglie qualsiasi forma di dubbio (le reali differenze tra la prima versione di bulldozer e steamroller è nel MT).
Il confronto probabilmente è tra le prestazioni di excavator nel ST con un core Zen con HT abilitato..questo vorrebbe dire un aumento netto nelle prestazioni del ST "solo" del 8% assumendo un contributo del SMT pari al 30%. 8% non è comunque poco considerando che tra excavator e piledriver, più o meno la differenza è nell'ordine del 10% (in linea di massima).

quindi se abbiamo da una parte:
PD 100ST+78 % CMT=178
EX 110ST+87% CMT= 205
ZEN 118ST+30% SMT = 153
in definitiva credo che siano questi i rapporti di forza tra zen e le architetture con bulldozer.

PS mi sono tenuto un pò basso con gli incrementi di excavator, non sapendo dove e quanto migliore sia rispetto a steamroller.

Secondo il mio ragionamento (che mi sembra corretto :) ) hai ragione quando dici che i core ZEN non sono supercore alla INTEL, visto che secondo i numeri di cui sopra, il secondo dovrebbe avere ancora un abbondante 20-25% di ipc in più, ma non è assolutamente detto che sia più lento del i7 5960x che deve accontentarsi di una frequenza di soli 3GHz per rientrare nel tdp di 140W.


Potrebbe darsi, però che AMD parli in senso lato? Cioè, più potenza del 40% non vuole dire IPC maggiore del 40%, ma prestazioni superiori del 40% a parità di consumo.
sulla slide c'è scritto ipc bulldozer-excavator- zen core (notare il singolare e nessun riferimento al modulo)


Secondo me AMD non parla espressamente di prestazioni per due soli motivi:
1) non conoscono la frequenza di funzionamento.
2) questa è inferiore ad un fx8370, ed è sempre bello pubblicare numeri più elevati (magari lasciando intendere che in questi anni i miglioramenti sono stati marginali, anche se non è così).
Per quanto si possa avere fantasia, non penso che Zen possa avere stravolgimenti degli INT e FP rispetto al core Excavator (1 anno o più non sarebbero sufficienti), si potrebbero teorizzare pipeline più corte, cache più veloci magari aggiungendo altre pipeline, insomma quanto si vuole ma un IPC del 50% superiore equivarrebbe a dire che Excavator avrebbe un'efficienza catastrofica, ma se già Trinity stava una spanna sopra a Llano puoi capire Llano Vs Kavery/Carrizo.
è bulldozer che ha portato a stravolgimenti lato fp. A livello teorico il salto di due nodi di integrazione permette un risparmio netto a livello di consumo prossimo al 50%, questo permetterebbe di raddoppiare la potenza nel MT con il semplice die shrink. Il confronto da fare è ZEN octa-core a X GHz vs excavator x16 3,6-4GHz.
Zen, come qualsiasi architettura nuova, ha anni di sviluppo alle spalle. E nel momento in cui vari il numero stage stravolgi l'int (a livello di architettura si intende).

Attenzione non confondiamo troppo ipc e lunghezza delle pipeline. Anche le architetture da smartphone ad alte prestazioni hanno pipeline lunghissime se confrontato con k10 (15+vs 12) mentre quelli a basso consumo, come a53 solo 8. Il SMT è adatto esclusivamente alle cpu con pipeline con numerosi stadi, o almeno nella storia non mi pare esistano eccezioni.


PS Anche gli fx, mi pare di ricordare dovevano essere tutti dei 95W ad eccezione di un unico modello di punta.

isomen
30-07-2015, 17:32
Ieri con Ai suite asus ho impostato i vari "cpu load line, power phase control, ecc..." su alti valori.
Fatto questo ho abbassato di nuovo vcore e cpu/nb e il sistema ha retto, mentre con valori normali dopo neanche 60 secondi si bloccava o riavviava.
A questo punto la domanda è, meglio alzare quei valori e abbassare voltaggio o no?

Io gli LLC preferisco tenerli con l'impostazioni che mi danno i voltaggi più stabili, ma queste cambiano da mobo a mobo, posso dirti che con M5A99X e M5A97 (entrambe EVO R2) tengo ultra high per la cpu e high per il cpu/nb mentre con la sabertooth tengo high e medium.

;) ciauz

Chris70
30-07-2015, 19:36
Io gli LLC preferisco tenerli con l'impostazioni che mi danno i voltaggi più stabili, ma queste cambiano da mobo a mobo, posso dirti che con M5A99X e M5A97 (entrambe EVO R2) tengo ultra high per la cpu e high per il cpu/nb mentre con la sabertooth tengo high e medium.

;) ciauz

Grazie, ora li ho modificati da bios, non rischio di creare danni "elettrici"?
Un'altra domanda, sempre con la suite ho creato due profili bios, uno a 4.3 e l'altro a 4.7. Prima della modifica di quei parametri il passaggio da uno all'altro schermata "azzurra", ora invece il passaggio sembra indolore.
La mia idea sarebbe quella di avere due profili,uno per l'utilizzo normale /magari scenderei a 4.0), e l'altro per quelle poche volte che gioco,
potrei creare danni alla lunga?
Grazie di nuovo per i consigli...

isomen
30-07-2015, 20:20
Grazie, ora li ho modificati da bios, non rischio di creare danni "elettrici"?
Un'altra domanda, sempre con la suite ho creato due profili bios, uno a 4.3 e l'altro a 4.7. Prima della modifica di quei parametri il passaggio da uno all'altro schermata "azzurra", ora invece il passaggio sembra indolore.
La mia idea sarebbe quella di avere due profili,uno per l'utilizzo normale /magari scenderei a 4.0), e l'altro per quelle poche volte che gioco,
potrei creare danni alla lunga?
Grazie di nuovo per i consigli...

Di niente, ma considera che AI suite io l'ho usato per un po' per monitorare le temperature (con la sabertooth)... poi l'ho disistallato del tutto, preferisco utilizzare il bios e per e per switchare la potenza uso l'opzioni risparmio energia del pannello di controllo (da risparmio energia, che tengo di solito, a prestazioni elevate).

;) ciauz

tuttodigitale
31-07-2015, 20:07
Ho letto che sui core Excavator troviamo l'AVFS che prevede l’implementazione di sensori in silicio brevettati in grado di rilevare velocità e voltaggio, permettendo così l'adattamento in tempo reale portando ad un risparmio fino al 30%.
il grosso del merito vanno alle librerie HDL.

L'AVFS contribuisce davvero poco:
A 10W per modulo, permette frequenze superiori del 6% o di risparmiare un watt (9 invece di 10) a parità di frequenza (+11% in efficienza).

Il grande vantaggio c'è a 5W per modulo: 14% di frequenza in più o 1,2W in meno (+32% in efficienza).
A 2,5W per modulo AVFS permette frequenze più alte del 45% (parliamo di 1,7 vs 1,2 GHz). Un die shrink a 20nm ed excavator è già pronto per entrare in un smartphone. Pazzesco.

A 22 Watt per modulo (interessante per gli octa-core da 95W) non esiste nessunissima differenza tra l'avere o no l'AVFS.

A 25W per modulo assistiamo al sorpasso del HDL liscio. L'AVFS è un freno per le cpu ad alte prestazioni visto e considerato che seppur di pochissimo le librerie high performance fanno meglio delle HDL (2-3% di frequenza in più, ampiamente compensata dal maggior ipc di excavator).

PS il confronto è con i 28nm HDL senza AVFS, tutte le misure le ho ricavate dalla slide.


Poi mi sembrava che c'era un'altra cosa che portava fino ad un altro +20%, ma non la trovo più... Sono col cellulare... È un macello.
ho ricontrollato le slide. Mi sembra che si parli solo di AVFS e HDL.


approfondisco la mia risposta riguarda un rimaneggio del numero di stadi che compongono la pipeline (o meglio le pipeline, visto che parliamo di un architettura superscalare).

Il tasso di esecuzione di una CPU a pipeline è fortemente influenzato dallo stadio più lento, il cosiddetto collo di bottiglia.
Il caso ideale si ha quando tutti i segmenti richiedono un uguale tempo t.

Il tempo di elaborazione del singolo stadio è la base sulla quale si costruisce la cpu: il famigerato FO4, ritardo normalizzato di uno stadio della pipeline, è un parametro essenziale nella progettazione di una nuova architettura (addirittura si fanno studi solo per determinarne il più adatto).

Il FO4 è un obiettivo di progettazione. Se qualche blocco di codice non soddisfa questo obiettivo, deve essere ottimizzato ulteriormente o viene aggiunto un ulteriore stadio lungo la pipeline. Nel caso in cui uno stage presenta un fo4 basso, il tempo "vinto" potrebbe essere utilizzato per implementare una logica più efficiente o più grande (ad esempio aumento delle dimensioni del buffer) per migliorare le prestazioni.

A proposito di FO4, quello di bulldozer è di 17 contro i 22 di k10/k8 e i 21 di k7. In linea teorica a parità di processo produttivo bulldozer può andare fino al 30% in più (quindi su 45nm il limite superiore è di 5GHz). Fino perchè va considerato il tempo di ritardo che ogni stadio introduce. Tuttavia con l'ausilio della maglia di condensatori, si è andati persino oltre: 35%..Sui 45nm steamroller, almeno nella versione esacore, avrebbe potuto girare a 4,4GHz/5,2GHz in turbo mode...

C'è da fare un ulteriore differenziazione tra il FO4 dell'architettura e il ritardo del FO4 (delay) dovuto al processo produttivo.

Per motivi apparentemente immotivati (per noi si intende) , un processo produttivo migliore può presentare un fo4 delay sfavorevole su uno o più stadi. Anche nel caso in cui il ritardo del fo4 risultasse più basso su tutti gli altri stadi, il fo4 complessivo del processore viene inevitabilmente compromesso. Può bastare una modifica leggera al design, altre volte le modifiche devono essere più profonde, magari con scelte che vanno a scapito del ipc.

Per tutta una serie di motivi, resto dell’idea che qualsiasi maneggio della lunghezza delle pipeline in una moderna cpu, richieda modifiche profonde dell’architettura.

paolo.oliva2
02-08-2015, 01:39
K.

Però quella tecnologia penso dipenda anche dalla linearità del silicio, cioè dove servirebbe il Vuole max da come scrivi influirebbe poco, ma nei p-state intermedi di più, sempre se non c'è una correlazione ad un certo valore di Watt, perché se parlassimo sino a 100 a core, Zen comunque sarebbe dentro i 10W, perché se 95Win 8 core, escludendo PCI, MC e tutto l'I/O, non è che si starebbe tanto distante dai 10W se non addirittura sotto.
In ogni caso è probabile o almeno possibile che su Excavator mobile l'abbiano finalizzata per il campo mobile, cioè dando la priorità al minor consumo a scapito della prestazione massima, mentre se implementata su Zen con chiaro obiettivo alle massime prestazioni, la tipologia sarebbe differente.
In ogni caso il 28nm ha un rendimento anche ben superiore al 32nm SOI sui15W, superiore sui 35W, per poi mano a mano decadere a 65W ed infine essere inferiore sopra i 65W.
Di Zen si riporta una potenza superiore ma ancora non si è capito se questa viene tutta da un IPC superiore o in parte anche da frequenze superiori

Però a me non è chiaro una cosa... e semplifico in modo grossolano.
Io mi immagino le unità logiche INT e FP del Phenom II con potenza 8, ed in BD l'INT è stato potenziato (un mix di cose, tra set di istruzioni nuove e cicli più rapidi e/o meno cicli a istruzione e/o più istruzioni a parità di cicli) e l'FP è stata si condivisa, ma è passata da 128 bit a 256 (il Phenom II non supporta le AVX).

In linea teorica, quindi, ci dovremmo trovare che il modulo BD dovrebbe avere un IPC superiore al Phenom II, perché avrebbe la parte INT più potente di quella Phenom II e un FP condivisa che comunque risulterebbe doppia di quello del Phenom II, quindi, considerando che a 128 bit sarebbero 2, ogni core del modulo avrebbe una FP tale e quale a quella del core Phenom II.

Io ho sempre avuto l'idea che la mancanza di IPC non sia stata a causa della condivisione in sé, ma al fatto che le unità logiche fossero "alimentate" male, come ad esempio nel passaggio da Zambesi a Piledriver, non è stato fatto nulla nelle unità logiche ma semplicemente aggiunta una pipeline alla parte MMX della FP.
Di Steamroller non so molto, ma credo che la strada sia sempre stata quella di rendere più efficiente l'alimentazione alle unità logiche più che potenziarle.

Sempre a fantasia, faccio un esempio:
Intel non ha una FP doppia per il secondo TH nell'HT ma semplicemente è velocissimo a svuotare la L1 ed utilizzare nel tempo "morto" tutto il potenziale del procio che non è sfruttato. Quindi essenzialmente non è una potenza in sé delle unità logiche, ma semplicemente che queste lavorano al max (considerando che, se si riesce a sfruttare il tempo "morto" la circuiteria indubbiamente deve essere veloce e di conseguenza alimenterebbe più che bene i cicli del core già nella condizione senza HT e di qui più IPC

Quello che per me è incomprensibile, è che AMD perda un totale di IPC nel core, ma molto meno nel modulo con 2 TH. Cioè... Quando in effetti il modulo BD si comporterebbe similmente ad un core +HT Intel (cioè 2 TH sulle stesse unità logiche FP) il modulo recupera tantissimo, mentre con 1 TH e quindi forza bruta, si siede.
Cioè... non riesco ad inquadrare il punto di delimitazione cioè dove Intel è brava o dove AMD invece operi malissimo.

Spiegando meglio, sarebbe come se il modulo BD operasse 2 TH fisici fisici sugli INT ed un TH fisico ed uno logico sull'FP e qui ci sta la differenza tra fisico e logico ed AMD guadagnerebbe. Ma quando si passa al core, Ok che Intel guadagnerebbe per la gestione HT, ma in fin dei conti AMD avrebbe una FP fisica mentre Intel comunque la deve condividere nell'HT. Cioè, se il modulo arriva li li con 2 TH, la differenza con 1 TH dovrebbe essere del 30% circa, ma non del 50% o del 45% senza HT.

P. S.
Il confronto ipotetico lo farei a parità di set di istruzioni, nel senso che è chiaro che se si confrontasse una FP Intel che risolvere le AVX2 nativamente Vs un Piledriver che max si ferma alle AVX, la differenza di IPC sarebbe ovvia, come è ovvio che un FX Piledriver non ha tutte le implementazioni di Steamroller/Excavator, quindi andrebbe confronto questi ultimi con una proiezione immaginaria di un FX X8, tanto Zen è distante e comunque migliore.

tuttodigitale
02-08-2015, 11:30
K.
Però quella tecnologia penso dipenda anche dalla linearità del silicio, cioè dove servirebbe il Vuole max da come scrivi influirebbe poco,
i vantaggi del AVFS e del HDL sono via via sempre minori rispetto al 28nm bulk, mano a mano che si va su con la frequenza.

sempre se non c'è una correlazione ad un certo valore di Watt, perché se parlassimo sino a 100 a core, Zen comunque sarebbe dentro i 10W, perché se 95Win 8 core, escludendo PCI, MC e tutto l'I/O, non è che si starebbe tanto distante dai 10W se non addirittura sotto.
è da notare comunque si parla di consumo per modulo e non per core. Purtroppo non abbiamo nessun dato su ZEN, e non sappiamo neppure cosa aspettarci dai 14/16nm finfet. Zen potrebbe essere anche essere semplicemente core excavator modificati per il SMT. Secondo i calcoli fatti nei post precedenti l'ipc di zen nel ST si innalzerebbe al massimo del 8% se HT è efficace quanto quello Intel.


In ogni caso è probabile o almeno possibile che su Excavator mobile l'abbiano finalizzata per il campo mobile, cioè dando la priorità al minor consumo a scapito della prestazione massima, mentre se implementata su Zen con chiaro obiettivo alle massime prestazioni, la tipologia sarebbe differente.
In ogni caso il 28nm ha un rendimento anche ben superiore al 32nm SOI sui15W, superiore sui 35W, per poi mano a mano decadere a 65W ed infine essere inferiore sopra i 65W.
in realtà i 32nm non sono poi così superiori a 100W di TDP. E' vero che kaveri non è più veloce di richland, però consuma anche 16W meno, a dispetto dell'identico tdp nominale. A conti fatti il consumo di un a10-7850 è del tutto paragonabile al a10-6700, nonostante il secondo abbia un tdp stimato in 65W. Entrambi girano a 3,7GHz, ma il 28nm lo fa con un architettura che ha un CMT meno spinto.
E ancora il a10-7800 da 65W (3,5GHz), consuma 15W in meno. A 45W non c'è proprio confronto, visto che kaveri ha velocità di clock superiore del 25-30%.


Di Zen si riporta una potenza superiore ma ancora non si è capito se questa viene tutta da un IPC superiore o in parte anche da frequenze superiori
in realtà, da slide, si sa solo che l'ipc per core sarà superiore del 40% rispetto a excavator. Non si sa niente della potenza o delle frequenze.


Però a me non è chiaro una cosa... e semplifico in modo grossolano.
Io mi immagino le unità logiche INT e FP del Phenom II con potenza 8, ed in BD l'INT è stato potenziato (un mix di cose, tra set di istruzioni nuove e cicli più rapidi e/o meno cicli a istruzione e/o più istruzioni a parità di cicli) e l'FP è stata si condivisa, ma è passata da 128 bit a 256 (il Phenom II non supporta le AVX).

La parte int non è detto che sia più potente, ci sono pur sempre più alu in k10 e una penalità da miss prediction molto ridotta grazie alle pipeline molto corte.


In linea teorica, quindi, ci dovremmo trovare che il modulo BD dovrebbe avere un IPC superiore al Phenom II, perché avrebbe la parte INT più potente di quella Phenom II e un FP condivisa che comunque risulterebbe doppia di quello del Phenom II, quindi, considerando che a 128 bit sarebbero 2, ogni core del modulo avrebbe una FP tale e quale a quella del core Phenom II.
questo è un punto che andrebbe chiarito, e secondo me ti basta fare una semplice prova: disattiva il CMT e fai il test della FPU con sandra e lo paragoni con il risultato ottenuto con il CMT attivo.
Un test sintetico di questo tipo serve proprio per testare la potenza grezza degli int e della fpu (infatti tra bulldozer e piledriver non ci sono differenze)


Io ho sempre avuto l'idea che la mancanza di IPC non sia stata a causa della condivisione in sé, ma al fatto che le unità logiche fossero "alimentate" male, come ad esempio nel passaggio da Zambesi a Piledriver, non è stato fatto nulla nelle unità logiche ma semplicemente aggiunta una pipeline alla parte MMX della FP.
Di Steamroller non so molto, ma credo che la strada sia sempre stata quella di rendere più efficiente l'alimentazione alle unità logiche più che potenziarle.

in piledriver hanno modificato un pò tutto. Sandra smentisce in parte quello che dici: il troughput non è variato.
http://www.businessmagazine.it/articoli/3424/slide_1.png

Modifiche effettuate in steamroller:
1) decoder dedicati per ogni cluster
2) aumentata la dimensione della cache istruzione
3) migliorata l’efficienza del dispatch
4) introduzione delle micro ops fusion nella fase di decodifica
5) ulteriori miglioramenti del predittore rami

e per quel dato sapere al momento di excavator hanno modificato, per l'ennesima volta la cache l1 (3 su 3) e ridotto la cache l2 (aumentandone la velocità?)


Sempre a fantasia, faccio un esempio:
Intel non ha una FP doppia per il secondo TH nell'HT ma semplicemente è velocissimo a svuotare la L1 ed utilizzare nel tempo "morto" tutto il potenziale del procio che non è sfruttato. Quindi essenzialmente non è una potenza in sé delle unità logiche, ma semplicemente che queste lavorano al max (considerando che, se si riesce a sfruttare il tempo "morto" la circuiteria indubbiamente deve essere veloce e di conseguenza alimenterebbe più che bene i cicli del core già nella condizione senza HT e di qui più IPC
HT aumenta la potenza nei calcoli in virgola mobile del 50-70%. In BD non solo la fpunit si sdoppia in realtà può dividersi in 4 pezzi. Mi è oscuro come faccia, anche se probabilmente è una FPu con 4 tubi da 64 bit, che a seconda del tipo di dati si aggregano. Ora anche a me è parso strano che la fpunit di bulldozer vada solo il 50% in più di quella di deneb. Mi hai messo una pulce nell'orecchio (maledetto! :mad: ). Ho il sospetto che la fpu di Nehalem sia "scomponibile" come quella di bulldozer.

PS il fatto che la fp unit abbia diverse pipeline, il fatto di poter gestire più thread può significare che la fpu è tanto ampia che la cpu non riesca comunque estrarre abbastanza ILP da saturarla. Quindi in realtà la fpu di nehalem aldilà della flessibilità potrebbe essere molto più ampia e potente di quelle viste nell'architettura di AMD.

forse ho trovato la risposta
le pipeline della fpu di SB sono composte da due "canali" da 128bit. C'è un ritardo di un ciclo di clock per trasferire i 128bit lsb e i 128 bit più significativi. I due registri non sono trattati come indipendenti fatta eccezione per il "saved state" . Apparentemente le due metà sono trasmesse completamente nel "modified state". Quindi la FP unit di INtel non ha la flessibilità della fpu di AMD.
Le pipe sono 3

Ho scoperto una cosa interessante su BD, le pipe sono 4, ma sono passati a 3 con steamroller. Non che la cosa non fosse stata resa pubblica:
http://cdn.eteknix.com/wp-content/uploads/2013/04/steamroller_slide_3.jpg

Nonostante ciò lo scaling in cinebench, noto per essere un test fp-intensive, è ottimo. La FPu probabilmente era sovradimensionata alle capacità dell'architettura. Addirittura in Piledriver abbiamo un troughput molto peggiore d bulldozer con i dati a 256 bit. Mentre steamroller fa molto meglio di entrambi:
sono richiesti 3 cicli di clock nel caso allineato per bd e 10 se non allineati (17 per piledriver). Steamroller fa scendere questi valori rispettivamente a 2 e a 4.

Quindi in BD/PD si hanno 4 pipe da 128 bit contro 3 ma a 256bit di Intel e le 3 a 128bit di k10 e SR...
Effettivamente un +50% su k10, significa che in media ogni pipeline permette mediamente un aumento delle prestazioni del 13% a parità di clock. La super fp unit di bulldozer non sembra più tale da questa prima analisi superficiale


Spiegando meglio, sarebbe come se il modulo BD operasse 2 TH fisici fisici sugli INT ed un TH fisico ed uno logico sull'FP e qui ci sta la differenza tra fisico e logico ed AMD guadagnerebbe. Ma quando si passa al core, Ok che Intel guadagnerebbe per la gestione HT, ma in fin dei conti AMD avrebbe una FP fisica mentre Intel comunque la deve condividere nell'HT. Cioè, se il modulo arriva li li con 2 TH, la differenza con 1 TH dovrebbe essere del 30% circa, ma non del 50% o del 45% senza HT.
nella slide le due frecce che entrano nello scheduler della FPu di steamroller dovrebbero rappresentare uno thread a testa. Fai un test per vedere se effettivamente la FPunit è all'oscuro del thread aggiuntivo.

paolo.oliva2
03-08-2015, 09:40
Al momento sono in Italia ed i provi li ho lasciati in Africa.
Io non ho la tua competenza, ma credo che si possa creare questa situazione:
Metto valori indicativi...
CMT - 20%.
Modulo con 1 core disattivato +10%

(valori a spannella che ricordo)

Può darsi che nei bench ci sia una media (INT e FP) e che il guadagno sia riferito solo all'FP in quanto sulla parte INT il CMT non influirebbe (a parte forse l'attesa di un dato dall'FP), ma è possibile che i canali all'FP siano studiati per 2 core e nel caso di disattivazione di un core, questi non siano sufficienti a sfruttarla al 100%.

-----

Comunque è giusto il mio pensiero? Cioè, penso che alla radice una ALU AMD o Intel (scartando set di istruzioni proprietarie o se simili) abbiano circa la stessa potenza. La superiorità Intel sta nell'alimentarle il più velocemente possibile (come predizione, come rapidità cache e quant'altro). Il CMT può essere anche visto come alternativa, cioè, se AMD non riesce a fare quello che Intel fa (ma può anche dipendere dal silicio) mettere 2 canali di alimentazione dati sull'FP poteva anche avere un effetto simile all'HT ma probabilmente si è ancor più incasinato l'insieme e (forse) a causa di un silicio che genera più TDP del previsto, hanno dovuto snellire la parte alimentazione e/o comunque senza apportare aumenti consistenti di transistor. Non mi sembra un caso che comunque gli incrementi di potenza coincidono con la disponibilità di silicio migliore
Steamroller dà più di Piledriver ma nei 15/35W del 28nm bulk
Excavator va più di Steamroller perché si è fatto in modo che il core generi più potenza a parità di TDP con opportune modifiche nel rapporto transistor/consumo
Zen andrebbe di più, ma cacchio, da un 32nm/28nm si passerebbe a 16nm/14nm, questo lascerebbe un gran margine di TDP e numero di transistor/core... Per dare una idea, si potrebbe passare da 4 moduli/8 core per 125W a 8 core con gli stessi transistor del modulo BD e addirittura abbassare a 95W il TDP.

In fin dei conti l'evoluzione modulo da Piledriver a Steamroller non sabbie stata possibile allo stesso TP/frequenze/numero di core su FX, ma possibile unicamente sul 28nm bulk nei 15/35W (il confronto Trinity-kaveri è impietoso). Il passaggio Steamroller-Excavator con il controllo Vcore/frequenze ha portato un vantaggio dal 10 al 30% sul TDP finale, e siccome i gradini del TDP commerciale sono gli stessi, lo spazio TDP si è incrementato.

AMD di certo le colpe le ha, ma è innegabile che sviluppo d incremento prestazionale siano strettamente dipendenti dal silicio disponibile.

FroZen
03-08-2015, 15:05
R15 a def del mio nuovo sistemino :D

Win 7 64bit vanilla

642 punti

Essendo ad aria con un noctua doppia ventola che punta alla silenziosità più che alla prestazione, non ho particolari aspettative........ vediamo dove arrivo a vdef con turbo spento...... e poi decidiamo quale oc daily impostare.....il batch sembra buono, su oc.net ho visto un 4,7 a 1,404v con la mia stessa mobo (asus crosshair formula v z) a liquido.

Poi quando liquiderò pure io se ne riparlerà :D

Chris70
03-08-2015, 19:55
Di niente, ma considera che AI suite io l'ho usato per un po' per monitorare le temperature (con la sabertooth)... poi l'ho disistallato del tutto, preferisco utilizzare il bios e per e per switchare la potenza uso l'opzioni risparmio energia del pannello di controllo (da risparmio energia, che tengo di solito, a prestazioni elevate).

;) ciauz

Ora ho cambiato case (cm 690 III) e AIO (h100i) le cose sono notevolmente cambiate in positivo, anche con ventole a basso profilo ho raggiunto sui 64-65 con OCCTP.
Ho raggiunto stabilmente (prima del cambio case e AIO) a 4.3 cpu volt 1.30 e cpu/nb a 1.225 mentre a 4.7 cpu volt 1.30625 e cpu/nb a 1.225.
La mia domanda è la seguente, visto che questa "para" delle temperature e dei voltaggi mi è venuta solo dopo che ho preso 9370, con 8350 di prima che valori avevo di default?
Solo per sapere, non ho mai fatto test e robe simili, per un pò lo avevo tenuto a 4.4 con 21x205, gli unici test erano i giochi.
Saluti...

isomen
03-08-2015, 20:54
Ora ho cambiato case (cm 690 III) e AIO (h100i) le cose sono notevolmente cambiate in positivo, anche con ventole a basso profilo ho raggiunto sui 64-65 con OCCTP.
Ho raggiunto stabilmente (prima del cambio case e AIO) a 4.3 cpu volt 1.30 e cpu/nb a 1.225 mentre a 4.7 cpu volt 1.30625 e cpu/nb a 1.225.
La mia domanda è la seguente, visto che questa "para" delle temperature e dei voltaggi mi è venuta solo dopo che ho preso 9370, con 8350 di prima che valori avevo di default?
Solo per sapere, non ho mai fatto test e robe simili, per un pò lo avevo tenuto a 4.4 con 21x205, gli unici test erano i giochi.
Saluti...

Chris sono contento dei tuoi risultati, ma riguardo alla tua domanda (se l'ho capita bene) mi é un po' difficile rispondere e ti spiego perché, io ho tre 8350... 2 con vcore default a 1,375 (anche se uno tiene i 4,6ghz con 1,45 ma nn va oltre neanche con 1,6 mentre con l'altro ho benchato anche a 5/5,1ghz) e uno con vcore a 1,275 che con 1,44 tiene i 4,8ghz (la mobo e la stabilità del reparto d'alimentazione possono fare la differenza.. ma io ho testato le cpu sulle stesse mobo e la sabertooth nn lascia dubbi sull'affidabilità).

correzione
l'8350 con vcore a 1,275 tiene i 4,6 con 1,38v (rileggendo mi sono accorto dell'errore :doh: )

;) ciauz

isomen
03-08-2015, 20:58
R15 a def del mio nuovo sistemino :D

Win 7 64bit vanilla

642 punti

Essendo ad aria con un noctua doppia ventola che punta alla silenziosità più che alla prestazione, non ho particolari aspettative........ vediamo dove arrivo a vdef con turbo spento...... e poi decidiamo quale oc daily impostare.....il batch sembra buono, su oc.net ho visto un 4,7 a 1,404v con la mia stessa mobo (asus crosshair formula v z) a liquido.

Poi quando liquiderò pure io se ne riparlerà :D

Ma... quello che hai in firma :confused:

;) ciauz

Chris70
04-08-2015, 08:50
Chris sono contento dei tuoi risultati, ma riguardo alla tua domanda (se l'ho capita bene) mi é un po' difficile rispondere e ti spiego perché, io ho tre 8350... 2 con vcore default a 1,375 (anche se uno tiene i 4,6ghz con 1,45 ma nn va oltre neanche con 1,6 mentre con l'altro ho benchato anche a 5/5,1ghz) e uno con vcore a 1,275 che con 1,44 tiene i 4,8ghz (la mobo e la stabilità del reparto d'alimentazione possono fare la differenza.. ma io ho testato le cpu sulle stesse mobo e la sabertooth nn lascia dubbi sull'affidabilità).

;) ciauz

Ciao, la mia domanda l'hai capita benissimo e penso di aver capito anch'io...
Quindi ogni cpu è diversa dall'altra, anche se della stessa serie, sapevo già che i pezzi migliori venivano "promossi" a cpu superiori.
Io pensavo che tutti gli 8350, per esempio, avessero caratteristiche uguali, oltre che alla frequenza.
La mia cpu se fosse capitata in mani ad uno ancora più inesperto di me si sarebbe trovato una "stufetta" sotto la scrivania...

isomen
04-08-2015, 09:29
Ciao, la mia domanda l'hai capita benissimo e penso di aver capito anch'io...
Quindi ogni cpu è diversa dall'altra, anche se della stessa serie, sapevo già che i pezzi migliori venivano "promossi" a cpu superiori.
Io pensavo che tutti gli 8350, per esempio, avessero caratteristiche uguali, oltre che alla frequenza.
La mia cpu se fosse capitata in mani ad uno ancora più inesperto di me si sarebbe trovato una "stufetta" sotto la scrivania...

Tutte le CPU di un modello devono rientrare in un certo standard, ma per quello che riguarda l'overclock/downvolt è una questione di fortuna... ogni CPU è diversa dall'altra.

;) ciauz

FroZen
05-08-2015, 16:46
Ma... quello che hai in firma :confused:

;) ciauz

E' quattro piani più sopra....

L'FX è sul pc in garage :stordita: metti che la vespa vuole vedere qualcosa su iutubbe.....

Sto weekend spero di montare tutto nel raven e iniziare a alzare il multi del FX :stordita:

sgrinfia
05-08-2015, 18:21
E' quattro piani più sopra....

L'FX è sul pc in garage :stordita: metti che la vespa vuole vedere qualcosa su iutubbe.....

Sto weekend spero di montare tutto nel raven e iniziare a alzare il multi del FX :stordita:

E lì che deve stare un fx 8core ,essendo un otto cilindri deve stare in garage

paolo.oliva2
05-08-2015, 22:45
Fare anticipazioni sui silicio è un terno al lotto.

Ho letto l'articolo sulle nuove cpu a 14nm Intel.
Io mi aspettavo un TDP molto inferiore al 22nm, un rapporto consumo/prestazioni un 20% inferiore almeno ed un OC inferiore.
Non ci ho beccato una mazza... Consumi e TDP quasi simili, ed addirittura a naso, visto i @4,7GHz raggiunti mi pare facilmente, mi da' l'idea addirittura che si occhi meglio il 14nm del 22nm.
Ribaltando il tutto ad AMD, io fino ad ora mi ero ipotizzato che gli OC del 32nm SOI >5GHz sarebbero stati un bel ricordo e che già sarebbe stato bello avere le stesse frequenze Def di 4GHz.
Cacchio... Intel, considerando che alla prima sfornata del 22nm era a 3,5GHz, massimi, ha guadagnato la bellezza di 500MHz, e se non ricordo male, già ora con la stessa facilità (o difficoltà, a picere) circa 300MHz in OC.
Ma non si parlava che Intel aveva qualche problema sul 14nm?

el-mejo
05-08-2015, 23:07
Fare anticipazioni sui silicio è un terno al lotto.

Ho letto l'articolo sulle nuove cpu a 14nm Intel.
Io mi aspettavo un TDP molto inferiore al 22nm, un rapporto consumo/prestazioni un 20% inferiore almeno ed un OC inferiore.
Non ci ho beccato una mazza... Consumi e TDP quasi simili, ed addirittura a naso, visto i @4,7GHz raggiunti mi pare facilmente, mi da' l'idea addirittura che si occhi meglio il 14nm del 22nm.
Ribaltando il tutto ad AMD, io fino ad ora mi ero ipotizzato che gli OC del 32nm SOI >5GHz sarebbero stati un bel ricordo e che già sarebbe stato bello avere le stesse frequenze Def di 4GHz.
Cacchio... Intel, considerando che alla prima sfornata del 22nm era a 3,5GHz, massimi, ha guadagnato la bellezza di 500MHz, e se non ricordo male, già ora con la stessa facilità (o difficoltà, a picere) circa 300MHz in OC.
Ma non si parlava che Intel aveva qualche problema sul 14nm?

Probabilmente faranno Skylake refresh quando il silicio è più maturo. Tralatro da alcuni commenti che ho letto pare che abbiano usato ancora la Pasta del Capitano sotto all'His :asd:

tuttodigitale
05-08-2015, 23:35
Può darsi che nei bench ci sia una media (INT e FP) e che il guadagno sia riferito solo all'FP in quanto sulla parte INT il CMT non influirebbe (a parte forse l'attesa di un dato dall'FP), ma è possibile che i canali all'FP siano studiati per 2 core e nel caso di disattivazione di un core, questi non siano sufficienti a sfruttarla al 100%.

sull'int assistiamo ad una piccola regressione in piledriver con il CMT sul singolo core, per un piccolo collo di bottiglia dovuta al decoder condiviso.
Sul maggior utilizzo della FP unit con il secondo thread non ho dubbi al riguardo. Semmai sul quantitativo del suo contributo.

Comunque è giusto il mio pensiero? Cioè, penso che alla radice una ALU AMD o Intel (scartando set di istruzioni proprietarie o se simili) abbiano circa la stessa potenza. La superiorità Intel sta nell'alimentarle il più velocemente possibile (come predizione, come rapidità cache e quant'altro).
Le ALU di AMD dovrebbero essere persino più potenti come set di operazioni possibili (farò un elenco appena possibile, sono un ignorante assoluto sulle architetture della concorrenza).
Alimentarle il più possibile significa avere tutta una serie di accorgimenti circuitali di una complessità probabilmente tale da non rientrare nei limiti del FO4 stabilito in fase di progetto. L'ipc ha un costo lato frequenza, c'è poco da fare. La scelta di averne solo 2 può giovarne lato consumi (meno, molto meno per il risparmio di spazio sul die).

. Il CMT può essere anche visto come alternativa, cioè, se AMD non riesce a fare quello che Intel fa (ma può anche dipendere dal silicio) mettere 2 canali di alimentazione dati sull'FP poteva anche avere un effetto simile all'HT ma probabilmente si è ancor più incasinato l'insieme e (forse) a causa di un silicio che genera più TDP del previsto, hanno dovuto snellire la parte alimentazione e/o comunque senza apportare aumenti consistenti di transistor. Non mi sembra un caso che comunque gli incrementi di potenza coincidono con la disponibilità di silicio migliore
AMD non ha VOLUTO fare quello che fa Intel, date le caratteristiche assai differenti sulla carta del 32nm SOI. L'intero progetto si è basato sulla possibilità del silicio di raggiungere e superare i 5 GHz, architettura permettendo. Con bulldozer hanno perso ipc non perchè all'improvviso non sanno fare cpu: i core jaguar hanno un ipc a metà strada tra piledriver e steamroller, quindi abbondantemente più elevato di bulldozer nonostante l'uso di un'architettura OoO 2-issue invece di una OoO 4-issue.

Il CMT lo vedo come il fratello povero del SMT, ovvero un SMT parziale efficace solo nell'utilizzo della fp unit.

Zen andrebbe di più, ma cacchio, da un 32nm/28nm si passerebbe a 16nm/14nm, questo lascerebbe un gran margine di TDP e numero di transistor/core... Per dare una idea, si potrebbe passare da 4 moduli/8 core per 125W a 8 core con gli stessi transistor del modulo BD e addirittura abbassare a 95W il TDP.
Premetto che quello che sto scrivendo è frutto della mia immaginazione.
Secondo me, un +8% sul ST e +40% nel dual-thread, è possibile con "semplici" modifiche. Si prende il core excavator, si aumenta il numero dell'unità esecutive del 50% (da 2 a 3 ALU, da 3 a 5 pipe della fpu), si aggiunge con alcune modifiche HW il SMT senza aumentare la potenza del front-end di piledriver, sufficiente per alimentare un core e mezzo.
Ovviamente quello che scrivo è pura fantasia, tutto per sottolineare che in fondo il +40% a parità di core e frequenza, non è così esagerato..Speriamo piuttosto che il SMT dia un contributo minimo (diciamo 10-15%), e che le risorse int vengano utilizzate meglio nel ST.


teoricamente un doppio die shrink dovrebbe permette un dimezzamento dei consumi insieme ad un aumento, minimo, di frequenza. Quindi, se il 40% fosse confermato anche lato prestazioni (ovvero zen girasse a 4GHz), non mi sembra un risultato poi così fuori portata. Un doppio die shrink per andare "solo" il 40% (65%?) più di excavator (piledriver), consumando il 30% in meno è nelle corde di AMD, soprattutto se consideriamo il debaclé dei 32nm SOI. (dal 65 ai 45nm low k addirittura l'efficienza è aumentata ben oltre al 100%, senza considerare l'aumento dell'ipc della seconda revisione di k10..)

tuttodigitale
06-08-2015, 22:18
Fare anticipazioni sui silicio è un terno al lotto.

Ho letto l'articolo sulle nuove cpu a 14nm Intel.
Io mi aspettavo un TDP molto inferiore al 22nm, un rapporto consumo/prestazioni un 20% inferiore almeno ed un OC inferiore.
Non ci ho beccato una mazza... Consumi e TDP quasi simili, ed addirittura a naso, visto i @4,7GHz raggiunti mi pare facilmente, mi da' l'idea addirittura che si occhi meglio il 14nm del 22nm.
Ribaltando il tutto ad AMD, io fino ad ora mi ero ipotizzato che gli OC del 32nm SOI >5GHz sarebbero stati un bel ricordo e che già sarebbe stato bello avere le stesse frequenze Def di 4GHz.
Cacchio... Intel, considerando che alla prima sfornata del 22nm era a 3,5GHz, massimi, ha guadagnato la bellezza di 500MHz, e se non ricordo male, già ora con la stessa facilità (o difficoltà, a picere) circa 300MHz in OC.
Ma non si parlava che Intel aveva qualche problema sul 14nm?
ho visto oggi le review, e insomma tutto si può dire tranne che siano prestazioni che si aspettano da un die shrink. Passi i 22nm, largamente criticato dagli addetti ai lavori (sulla carta vaporizzato dal fd-soi), ma i 14nm Intel sono ritenuti i migliori in assoluto anche rispetto ai futuri 16nm finfet di TMSC. Quindi ora la paralisi prestazionale che ha caratterizzato il passaggio dai 45 ai 32 nm SOI, si è manifestato anche con il bulk e visto le premesse inizio a dubitare fortemente che da steamroller/excavator a Zen l'efficienza raddoppi.
non è detto che le capacità del silicio 22nm al debutto siano state sfruttate al massimo, e comunque invito sempre a non guardare il TDP dichiarato, ma il consumo effettivo, quei 500MHz aggiuntivi richiedono 15W extra, un inerzia certo, considerando il boost.

Su tomshw ad esempio, il 4770k al debutto è stato occato a 4,7 GHz contro i 4,6 del i7 4790k...entrambi erano esemplari destinati alla stampa. Bisogna anche tener presente che le capacità del primo haswell in OC sono state fortemente limitate dalla pasta del capitano 1.0, come dimostrano gli 8°C in più nonostante un consumo inferiore rispetto al i7 4790k.

Anandtech riporta in una tabella un regressione delle capacità di raggiungere certe frequenze che si è avuta da SB fino a broadwell, sembra che sklake abbia invertito un poco la tendenza, ma parliamo di cifre percentualmente insignificanti.
http://www.anandtech.com/show/9483/intel-skylake-review-6700k-6600k-ddr4-ddr3-ipc-6th-generation/6

Dalle recensioni che ho visto, le capacità di OC di Broadwell non mi sembrano poi così buone, chi si è fermato ad un modesto 4,3GHz chi a 4,6GHz . Ormai con il solo die shrink sembra che non si possa aumentare le prestazioni del singolo core (con i 32 nm il turbo core è passato da 3,4 a 3,73GHz con nehalem), ma non è detto che le cose non sia destinate a cambiare il prossimo anno per Intel in concomitanza con la messa in produzione dei primi chip a 10nm. Chissà magari GF farà un processo produttivo straordinario, tanto da capovolgere la situazione che si è venuta a creare con i 32nm (imho i 28nm bulk per quanto non pensati per la sezione x86 di kaveri è un ottimo pp).

Sembra che più si va giù con la miniaturizzazione più le differenze si fanno sottili, Forse è per tale motivo che AMD è fiduciosa con Zen? 10, 14, 16 o 20nm, potrebbero influenzare le prestazioni e i consumi molto meno di quello che si è soliti pensare.

PS il monopolio del silicio negli integrati è destinato a finire tra meno di 5 anni.

edit
il i7 6700k consuma tanto per colpa della mobo o la causa è da imputare ai 500 MHz in più rispetto al i5 6600k? il delta è di 47W..

paolo.oliva2
07-08-2015, 09:03
Però lo sviluppo dell'architettura è comunque legato parecchio a quello che può concedere il silicio.
Ad esempio, da Zambesi a Piledriver, l'incremento si è avuto ma come è stato ottenuto? Con la gestione dei clock si è guadagnato un +11,11% di frequenza def, a fronte di un incremento di IPC del 5/7% poi da valutare se parzializzato per rimanere in un determinato IPC
Kaveri con Steamroller ha pagato il silicio, visto che il 28nm Bulk anche se migliore del 32nm SOI sotto i 45W, ha di fatto segato la commercializzazione FX/Opteron e comunque castrato anche modelli mobili/desktop sulle potenze massime. Obbligando la scelta alle librerie ad alta densità, con ovvie limitazioni al raggiungimento di frequenze massime.
Carrizo con Excavator da quello che ho letto introduce tutta una serie di features tutte indirizzate a cercare di limitare il più possibile i consumi per poi sfruttare il TDP di margine per aumentare le prestazioni, il tutto aggravato dalla compatibilità HSA 1.0 che comunque richiede transistor.
Per me è evidente che AMD abbia come minimo frazionato la potenza di sviluppo architettura destinando parte delle risorse per cercare soluzioni in grado di sopperire al deficit del silicio.
Nessuno nega che Intel sia molto più efficiente in forza bruta e nel prestazioni/consumo, ma guardare un Kaveri ed il prox Carrizo entrambi sul 28nm con equivalenti Intel anche con miniaturizzazione ben più spinta, da uno scenario ben differente rispetto a quello del confronto tra un 8350 ed un 5960X, ben differente dal 10/20% di IPC tra Piledriver/Steamroller/Excavator con impietoso -50% di prestazioni a parità di consumi tra 8350 e 5960X.
SE AMD avrà a disposizione un 14/16nm per ZEN, e sembra comunque che lo avrà, poco importerà se mediocre/buono o ottimo, perché in ogni caso il margine di guadagnò in TDP dovrebbe essere notevole. A me basterebbe anche un pareggio prestazioni/consumo simile a quello del 22nm Intel, perché ciò vorrebbe dire (almeno) un posizionamento con i 95W Zen prossimo agli i7 => X6, fermo restando la valutazione tra forza bruta/potenza complessiva a die.

Mister D
07-08-2015, 17:58
ho visto oggi le review, e insomma tutto si può dire tranne che siano prestazioni che si aspettano da un die shrink. Passi i 22nm, largamente criticato dagli addetti ai lavori (sulla carta vaporizzato dal fd-soi), ma i 14nm Intel sono ritenuti i migliori in assoluto anche rispetto ai futuri 16nm finfet di TMSC. Quindi ora la paralisi prestazionale che ha caratterizzato il passaggio dai 45 ai 32 nm SOI, si è manifestato anche con il bulk e visto le premesse inizio a dubitare fortemente che da steamroller/excavator a Zen l'efficienza raddoppi.
non è detto che le capacità del silicio 22nm al debutto siano state sfruttate al massimo, e comunque invito sempre a non guardare il TDP dichiarato, ma il consumo effettivo, quei 500MHz aggiuntivi richiedono 15W extra, un inerzia certo, considerando il boost.

Su tomshw ad esempio, il 4770k al debutto è stato occato a 4,7 GHz contro i 4,6 del i7 4790k...entrambi erano esemplari destinati alla stampa. Bisogna anche tener presente che le capacità del primo haswell in OC sono state fortemente limitate dalla pasta del capitano 1.0, come dimostrano gli 8°C in più nonostante un consumo inferiore rispetto al i7 4790k.

Anandtech riporta in una tabella un regressione delle capacità di raggiungere certe frequenze che si è avuta da SB fino a broadwell, sembra che sklake abbia invertito un poco la tendenza, ma parliamo di cifre percentualmente insignificanti.
http://www.anandtech.com/show/9483/intel-skylake-review-6700k-6600k-ddr4-ddr3-ipc-6th-generation/6

Dalle recensioni che ho visto, le capacità di OC di Broadwell non mi sembrano poi così buone, chi si è fermato ad un modesto 4,3GHz chi a 4,6GHz . Ormai con il solo die shrink sembra che non si possa aumentare le prestazioni del singolo core (con i 32 nm il turbo core è passato da 3,4 a 3,73GHz con nehalem), ma non è detto che le cose non sia destinate a cambiare il prossimo anno per Intel in concomitanza con la messa in produzione dei primi chip a 10nm. Chissà magari GF farà un processo produttivo straordinario, tanto da capovolgere la situazione che si è venuta a creare con i 32nm (imho i 28nm bulk per quanto non pensati per la sezione x86 di kaveri è un ottimo pp).

Sembra che più si va giù con la miniaturizzazione più le differenze si fanno sottili, Forse è per tale motivo che AMD è fiduciosa con Zen? 10, 14, 16 o 20nm, potrebbero influenzare le prestazioni e i consumi molto meno di quello che si è soliti pensare.

PS il monopolio del silicio negli integrati è destinato a finire tra meno di 5 anni.

edit
il i7 6700k consuma tanto per colpa della mobo o la causa è da imputare ai 500 MHz in più rispetto al i5 6600k? il delta è di 47W..

Da chi sono ritenuti i migliori? Da intel? ce credo. Su bitsandchips in questi ultimi 2 anni le notizie su continui ritardi dei 14 nm intel, delle base rese produttive e delle basse prestazioni in merito alla frequenza raggiungibile si sono sprecate e sono state voci poi confermate, prima con il ritardo di broadwell mobile, poi la cancellazione di broadwell desktop (se non in versione 65 watt) e poi un ulteriore ritardo con skylake e non è che skylake avrà da subito grosse rese. Insomma sti 14 nm hanno messo i bastoni tra le ruote persino al tick-tock di intel tanto da costringerli prima a ritardi, poi a cancellazioni e a un secondo tock con haswell refresh (ma con medesima architettura). Ma vi siete chiesti perché skylake non ha i regolatori di tensioni integrati come haswell e broadwell? E perché broadwell hanno dovuto limitarlo in frequenza/TDP per il desktop? Perché i 14 sono il peggior proccesso produttivo di questi ultimi anni di intel insieme ai 22.
Scusate l'OT ma si vede benissimo che intel non è riuscita come gli altri anni con la fase di tock a migliorare così tanto proprio per il pp. E l'oc è circa identico ad haswell refresh a 22 nm per cui....
E con i 10 ci saranno altri problemi visto che hanno già cancellato cannolake (die shrink di skylake a 10) per kaby lake ancora a 14nm (stavolta non hanno usato l'aggettivo refresh ma non è altro che uno skylake refresh).
Purtroppo mi sa che è il proccesso bulk ad avere più problemi con il passaggio a nanometrie inferiori visto che il leakage è sempre più alto di un processo SOI. Peccato che gf abbia cannato i 32 nm SOI e non abbia voluto continuare lo sviluppo come invece sta facendo ST con gli FD-SOI o IBM con PD-SOI e ET-SOI (che dovrebbe essere la stessa versione finfet del PD-SOI se non sbaglio).
In generale tutti faticano ma quelli messi peggio per me sono i processi bulk caraterizzati da maggiore leakage;)

tuttodigitale
07-08-2015, 20:55
Da chi sono ritenuti i migliori? Da intel? ce credo. Su bitsandchips in questi ultimi 2 anni le notizie su continui ritardi dei 14 nm intel, delle base rese produttive e delle basse prestazioni in merito alla frequenza raggiungibile si sono sprecate e sono state voci poi confermate,
io parlavo di prestazioni non di rese produttive e/o costi.

http://www.bitsandchips.it/enterprise-business/50-enterprise-business/5054-selantek-vantaggi-e-svantaggi-dei-14nm-fd-soi-e-bulk-finfet

Alla luce di tutto ciò, possiamo ben affermare che Intel possiede i 14nm FinFET più avanzati al mondo, ma l'elevato costo potrebbe limitarne grandemente l'utilizzo

Perché i 14 sono il peggior proccesso produttivo di questi ultimi anni di intel insieme ai 22.
Scusate l'OT ma si vede benissimo che intel non è riuscita come gli altri anni con la fase di tock a migliorare così tanto proprio per il pp. E l'oc è circa identico ad haswell refresh a 22 nm per cui....
il 14nm di Intel permetterebbe ad AMD di ddoppiare (o quasi) le prestazioni per watt dei suoi FX8150.
L'OC circa identico ai 22-32nm, non è poi così male, considerando che in giro processi produttivi che fanno meglio non ce ne sono (tranne il fd-soi 20nm, ammesso che venga prodotto qualcosa)

.
E con i 10 ci saranno altri problemi visto che hanno già cancellato cannolake (die shrink di skylake a 10) per kaby lake ancora a 14nm (stavolta non hanno usato l'aggettivo refresh ma non è altro che uno skylake refresh).
devono necessariamente rientrare nei costi di sviluppo, visto il ritardo di broadwell


Purtroppo mi sa che è il proccesso bulk ad avere più problemi con il passaggio a nanometrie inferiori visto che il leakage è sempre più alto di un processo SOI. Peccato che gf abbia cannato i 32 nm SOI e non abbia voluto continuare lo sviluppo come invece sta facendo ST con gli FD-SOI o IBM con PD-SOI e ET-SOI (che dovrebbe essere la stessa versione finfet del PD-SOI se non sbaglio).
In generale tutti faticano ma quelli messi peggio per me sono i processi bulk caraterizzati da maggiore leakage;)
secondo diversi studi sono le alternative, vedi fd-soi, ad essere ancora più difficile da implementare e costose, mano a mano che si riducono le dimensioni.

PS Intel non ha rispettato la tabella di marcia, è vero, ma la concorrenza quando avrà un processo produttivo minimamente paragonabile? Tra 12 mesi? E saranno buoni come i 14nm attuali? E nel frattempo Intel resterà a guardare?

Mister D
07-08-2015, 21:12
io parlavo di prestazioni non di rese produttive e/o costi.

http://www.bitsandchips.it/enterprise-business/50-enterprise-business/5054-selantek-vantaggi-e-svantaggi-dei-14nm-fd-soi-e-bulk-finfet




il 14nm di Intel permetterebbe ad AMD di ddoppiare (o quasi) le prestazioni per watt dei suoi FX8150.
L'OC circa identico ai 22-32nm, non è poi così male, considerando che in giro processi produttivi che fanno meglio non ce ne sono (tranne il fd-soi 20nm, ammesso che venga prodotto qualcosa)


devono necessariamente rientrare nei costi di sviluppo, visto il ritardo di broadwell


secondo diversi studi sono le alternative, vedi fd-soi, ad essere ancora più difficile da implementare e costose, mano a mano che si riducono le dimensioni.

PS Intel non ha rispettato la tabella di marcia, è vero, ma la concorrenza quando avrà un processo produttivo minimamente paragonabile? Tra 12 mesi? E saranno buoni come i 14nm attuali? E nel frattempo Intel resterà a guardare?

Ciao,
il mio discorso non voleva dire o far intendere che gf o altri hanno al momento un processo produttivo migliore di quello intel. Ho solo detto e motivato che questo è il pp più problematico che intel abbia mai avuto nella storia recente e lo dimostra quello che tu stesso dici: per rientrare nei costi gli allungheranno la vita necessariamente oltre a quello previsto. Che poi di quanto lo sanno solo loro e dipenderà principalmente dalle problematiche del futuro 10 nm.
Intel il prossimo anno resterà a guardare evolvendo ancora i 14 nm migliorandolo dove si può e così produrrà kabylake. GF ancora non si sa cosa produrra oltre i 14 nm bulk finfet di derivazione samsung e i 22 FD-SOI di derivazione ST. Potrebbe preparare anche un 22 PD-SOI visto che già lo deve produrre per IBM e il suo power8. O forse aspetterà i 14 ET-SOI o i 10 sempre by IBM. AMD infatti non ha specificato se saranno 14 di GF o i 16 di TMSC ma solo che sarà un pp FINFET. Chi gli darà le migliori garanzie verrà scelto ed è la prima volta che almeno amd avrà una scelta.

Per quanto riguarda il costo soi vs bulk forse ti sei perso questo:
http://www.bitsandchips.it/enterprise-business/50-enterprise-business/5812-glofo-ci-presenta-le-prime-declinazioni-del-nodo-22fdx-22nm-fd-soi
Il pp prodotto da gf di derivazione ST si propone innanzitutto per essere economico al punto di costare quanto un pp 28 bulk ma offrendo prestazioni pari ai 14/16 finfet bulk.

tuttodigitale
07-08-2015, 21:17
Però lo sviluppo dell'architettura è comunque legato parecchio a quello che può concedere il silicio.
Ad esempio, da Zambesi a Piledriver, l'incremento si è avuto ma come è stato ottenuto? Con la gestione dei clock si è guadagnato un +11,11% di frequenza def, a fronte di un incremento di IPC del 5/7% poi da valutare se parzializzato per rimanere in un determinato IPC
non credo che l'ipc sia stato limitato per rientrare nel TDP, visto che AMD ha dovuto già rinunciare a 2 core (piledriver doveva avere un die da 10 core, secondo le slide)


Kaveri con Steamroller ha pagato il silicio, visto che il 28nm Bulk anche se migliore del 32nm SOI sotto i 45W, ha di fatto segato la commercializzazione FX/Opteron e comunque castrato anche modelli mobili/desktop sulle potenze massime. Obbligando la scelta alle librerie ad alta densità, con ovvie limitazioni al raggiungimento di frequenze massime.
il bulk era una strada obbligata per kaveri.
Le HDL hanno debuttato lato cpu solo con Carrizo, ed è grazie a loro che le prestazioni per watt a frequenze ritenute non troppo alte (1,7-3GHz) sono cresciute notevolmente


Carrizo con Excavator da quello che ho letto introduce tutta una serie di features tutte indirizzate a cercare di limitare il più possibile i consumi per poi sfruttare il TDP di margine per aumentare le prestazioni, il tutto aggravato dalla compatibilità HSA 1.0 che comunque richiede transistor.
la compatibilità con hsa 1.0 richiede modifiche principalmente lato gpu. Le AVFS non penso che siano un fattore limitante per le alte frequenze


Nessuno nega che Intel sia molto più efficiente in forza bruta e nel prestazioni/consumo, ma guardare un Kaveri ed il prox Carrizo entrambi sul 28nm con equivalenti Intel anche con miniaturizzazione ben più spinta, da uno scenario ben differente rispetto a quello del confronto tra un 8350 ed un 5960X, ben differente dal 10/20% di IPC tra Piledriver/Steamroller/Excavator con impietoso -50% di prestazioni a parità di consumi tra 8350 e 5960X.
AMD dovrebbe seriamente pensare di fare cpu con 12-14-16 core excavator con i 28nm.
Faccio un esempio:
il 6370p è un opteron con 16 core piledriver da 2GHz e 99 W di TDP
Carrizo ha 4 core excavator (più gpu e chipset) da 2,1 GHz e 15W di tdp
moltiplicando tutto per 4 abbiamo un SoC da 16core XV da 2,1GHZ e 60W di tdp
in 100 W di tdp ci rientrano 26 core excavator da 2,1 GHz, per un aumento delle prestazioni pari a :
26/16 core * 2,1/2 frequenza *1,2ipc = +105%

tuttodigitale
07-08-2015, 21:58
Ciao,
il mio discorso non voleva dire o far intendere che gf o altri hanno al momento un processo produttivo migliore di quello intel. Ho solo detto e motivato che questo è il pp più problematico che intel abbia mai avuto nella storia recente e lo dimostra quello che tu stesso dici: per rientrare nei costi gli allungheranno la vita necessariamente oltre a quello previsto. Che poi di quanto lo sanno solo loro e dipenderà principalmente dalle problematiche del futuro 10 nm.
credo che a questi livelli di miniaturizzazione le fonderie che si troveranno maggiormente in difficoltà sono quelle che pretenderanno maggiori prestazioni dal silicio. Intel non è stata che l'ultima a scontrarsi con problematiche di questo tipo. GF ben 3 anni prima. Questo ritardo di "pochi" mesi (qualche anno fa aveva tutt'altro peso) è ben poca cosa rispetto a quello dei competitors. Intel almeno ha qualcosa su cui è possibile mettere le mani, e per quanto non rispecchi le aspettative ("non sono prestazioni che ci si aspetta da un die shrink") è di quanto di meglio c'è in circolazione.

Ciao,
Intel il prossimo anno resterà a guardare evolvendo ancora i 14 nm migliorandolo dove si può e così produrrà kabylake. GF ancora non si sa cosa produrra oltre i 14 nm bulk finfet di derivazione samsung e i 22 FD-SOI di derivazione ST. Potrebbe preparare anche un 22 PD-SOI visto che già lo deve produrre per IBM e il suo power8. O forse aspetterà i 14 ET-SOI o i 10 sempre by IBM. AMD infatti non ha specificato se saranno 14 di GF o i 16 di TMSC ma solo che sarà un pp FINFET. Chi gli darà le migliori garanzie verrà scelto ed è la prima volta che almeno amd avrà una scelta.
questa è un ottima cosa


Per quanto riguarda il costo soi vs bulk forse ti sei perso questo:
http://www.bitsandchips.it/enterprise-business/50-enterprise-business/5812-glofo-ci-presenta-le-prime-declinazioni-del-nodo-22fdx-22nm-fd-soi
Il pp prodotto da gf di derivazione ST si propone innanzitutto per essere economico al punto di costare quanto un pp 28 bulk ma offrendo prestazioni pari ai 14/16 finfet bulk.
me lo sono perso e ti ringrazio per il link.
Tuttavia hai frainteso il senso delle mie parole. Parlavo del costo del fd-soi a 14nm, che al momento sembra molto alto, d'altra io stesso avevo dichiarato che il 20nm SOI (forse era meglio scrivere 22) è migliore del 14nm finfet, peccato che al momento sembra che non se lo fili nessuno. Il link che hai postato smentirebbe questa mia ultima affermazione.

paolo.oliva2
07-08-2015, 22:57
Non edito perché sono con il telefonino.
Quello che intendevo dire lato IPC, è che per aumentarlo in primis si genera più TDP a core. Se ad esempio un FX è come base 8 core per max 125W, ipotizzando una cifra per comodità di 25W per quanto riguarda I/O, MC, L3 e quant'altro, nei 100W rimanenti praticamente si hanno max 25W a modulo e quindi 12,5W a core
In teoria potrebbe essere che AMD potrebbe avere tranquillamente la carta per aumentare l'IPC con qualche cosa tipo aggiunta pipeline o similari, ma se poi implementasse ciò, non potrebbe più rientrare nei 125W.
Steamroller non è stato portato sul 32nm SOI appunto per questo motivo, visto che Zen al 99,9% comunque si baserà su core Excavator, quindi comunque andrebbe portato dal Bulk al SOI, ed AMD non ha nessunissima intenzionec di abbandonare high desktop e server.
Quindi di fatto è stato il silicio che non ha permesso aumenti di IPC

La compatibilità HSA 1.0 rientra se lato GPU comunque si integrano determinate features, vedi Huma, che richiede la sua circuiteria e chiaramente transistor in più che per quanto poco comunque alzano il TDP.

Per quanto riguarda il numero di core, il discorso per me è ben più complesso perché si basa su molti fattori che interagiscono tra loro.
Il primo è il costo, ma come hanno riportato altri, il 14/16nm che AMD adotterebbe costerebbe meno del 22nm Bulk, quindi a parità di die prodotti a wafer il 14/16nm permetterebbe un aumento di core comunque ad un costo inferiore. In pratica su 300 e rotti mm2 di un 8350 ci scapperebbe il mondo.
Lato frequenza raggiungibile per essere compatibile come desktop in un limite di TDP accettabile (125W/140W) mi sembra esserci, perché si parla di 95W come X8.

La riflessione è che il die di Zen dovrebbe essere bilanciato come TDP max e numero di core perché poi nella versione Opteron è ipotizzabile che AMD faccia come sempre ha fatto, cioè utilizzare lo stesso die nativo per accoppiarlo in schema a 2 per il max dei core nei 140W.

Mi sembra non avere senso affermare di voler arrivare al massimo prestazionale sia high desktop e server per poi doversi confrontare con Intel con 95W massimi vs 140W nel desktop e idem facendo la proporzione, con meno TDP nei server.
Facendo un conto di massima, gli FX X8 sono 125W, ed il modello di punta Opteron ha 2 die FX il tutto per 140W. In pratica dai 125W FX si passa a 70W con un -44% di TDP.
Facendo la stessa logica, un 95W Zen X8 porterebbe un Opteron X16 a 106,4W (95W -44% = 53,2W che x 2 = 106,4).
Cacchio, per 140W ci rientrerebbe quasi un altro die X8... Cioè, che senso avrebbe dire di puntare alle massime prestazioni quando nel desktop non si sfrutterebbero 125W/140W perdendo per strada almeno 4 core e nei server la bellezza di 8 core? Ha senso aumentare la potenza di un 40% per poi perderne un 30% per non sfruttare l'intero TDP?
Per assurdo, ipotizzando che un FX 8350 trasportato sul 14/16nm possa dimezzare il TDP, si riuscirebbe a realizzare un X16 nei 125/140W. Ipotizzando un +50% di Zen su Piledriver, un X8 Zen esprimerebbe una potenza del 50% superiore ad un 8350 X8, ma inferiore del 25% rispetto ad un X16.
Faccio notare che per HP desktop/server non di intende il max IPC del singolo core, ma quante istruzioni il die può fare, cioè una sorta di IPC x frequenza x numero core.

Quanto costerebbe ad AMD la realizzazione di un FX mettendo i moduli Excavator al posto dei Piledriver e modificare l'MC per le DDR4 e integrare il PCI? È già stato fatto con Carrizo.
AMD realizzerebbe Zen e poi lo castrerebbe con un TDP basso perdendo tutto l'incremento di IPC ed addirittura con una potenza inferiore di un teorico Excavator FX 125W?

davo30
08-08-2015, 16:01
AMD realizzerebbe Zen e poi lo castrerebbe con un TDP basso perdendo tutto l'incremento di IPC ed addirittura con una potenza inferiore di un teorico Excavator FX 125W?

Io penso che sara proprio cosi invece. Grazie ai nostri amici di GF che presenteranno ad Amd un pp a caso, sviluppato da cani e assolutamente inutile.


Inviato dal mio GT-I9505 utilizzando Tapatalk

isomen
08-08-2015, 16:56
Io penso che sara proprio cosi invece. Grazie ai nostri amici di GF che presenteranno ad Amd un pp a caso, sviluppato da cani e assolutamente inutile.


Inviato dal mio GT-I9505 utilizzando Tapatalk

Il punto é sempre il solito... puoi avere un'architettura buona quanto vuoi sulla carta, ma se nn hai un silicio almeno passabile su cui metterla... nn puoi fare buone cpu

;) ciauz

davo30
08-08-2015, 18:28
Il punto é sempre il solito... puoi avere un'architettura buona quanto vuoi sulla carta, ma se nn hai un silicio almeno passabile su cui metterla... nn puoi fare buone cpu

;) ciauz
Esatto. O amd sara cosi brava da riuscire a tirare fuori una architettura dipendente il meno possobile dal silicio, oppure si salvi chi puo. La stessa intel ha avuto dei grossi problemi con i 14nm, figuriamoci GlobalCioccolateria cosa tirera fuori

Inviato dal mio GT-I9505 utilizzando Tapatalk

paolo.oliva2
09-08-2015, 00:18
Esatto. O amd sara cosi brava da riuscire a tirare fuori una architettura dipendente il meno possobile dal silicio, oppure si salvi chi puo. La stessa intel ha avuto dei grossi problemi con i 14nm, figuriamoci GlobalCioccolateria cosa tirera fuori

Inviato dal mio GT-I9505 utilizzando Tapatalk

Io non voglio difendere GF, ma comunque GF fa parte del consorzio, cioè IBM, Samsung & C., quindi quello che tira fuori (o non tira fuori) GF, non lo hanno neanche gli altri.
Quello che non capisco, è perché il silicio di IBM con cui fa i powrr8 non potrebbe andare bene per AMD.

The technical details presented at the Hot Chip 2013 conference by IBM showcased the Power8 Processor featuring 12 cores with the new 8-Way simultaneous multithreading (SMT) compared to the 4-Way SMT in Power7 processors. Being the most high-performance chip that IBM has to offer, the components are scattered across a 22nm die featuring silicon-on-insulator technology spread across an area of 650mm2 which is quite huge.
The Power8 Processor also features a 16 Execution Pipeline followed with 64K data cache per-core and 32K instruction cache. On the cache front, the new processor has 512 KB SRAM L2 cache per core, 96 MB eDRAM shared L3 cache and also 128 MB of eDRAM L4 cache that’s situated off-die unlike the on-board eDRAM on Haswell processors featuring GT3e iGPUs.
P.S.
Il tutto ad una frequenza di 4GHz

Non trovò il TDP, ma ha un die size doppio rispetto ad un 8350.

davo30
09-08-2015, 01:31
Io non voglio difendere GF, ma comunque GF fa parte del consorzio, cioè IBM, Samsung & C., quindi quello che tira fuori (o non tira fuori) GF, non lo hanno neanche gli altri.
Quello che non capisco, è perché il silicio di IBM con cui fa i powrr8 non potrebbe andare bene per AMD.

The technical details presented at the Hot Chip 2013 conference by IBM showcased the Power8 Processor featuring 12 cores with the new 8-Way simultaneous multithreading (SMT) compared to the 4-Way SMT in Power7 processors. Being the most high-performance chip that IBM has to offer, the components are scattered across a 22nm die featuring silicon-on-insulator technology spread across an area of 650mm2 which is quite huge.
The Power8 Processor also features a 16 Execution Pipeline followed with 64K data cache per-core and 32K instruction cache. On the cache front, the new processor has 512 KB SRAM L2 cache per core, 96 MB eDRAM shared L3 cache and also 128 MB of eDRAM L4 cache that’s situated off-die unlike the on-board eDRAM on Haswell processors featuring GT3e iGPUs.
P.S.
Il tutto ad una frequenza di 4GHz

Non trovò il TDP, ma ha un die size doppio rispetto ad un 8350.

Il problema è che l'acquisizione delle fonderie IBM da parte di GF è avvenuta dopo il 2013. All'attuale GF di papabili, per Zen, ha i 14nm http://globalfoundries.com/technology-solutions/leading-edge-technology/14-lpe-lpp
però a quanto è scritto qui, nascono per LP, e dei fantomatici 22nm FDX, che tra l'altro sono sviluppati a Dresda. http://globalfoundries.com/technology-solutions/leading-edge-technology/22fdx
Quale sarà dei due? Possibile che non si abbiano notizie da parte di AMD a meno di 6/8 mesi dall'uscita di ZEN? Il secondo probabilmente no, siccome AMD ha dichiarato che zen sara su FinFet. Pero quei due nodi non sono adatti (a meno che abbia letto male) a cpu high performance

paolo.oliva2
09-08-2015, 09:48
C'è di più e comunque tutto è poco chiaro.
Cioè... all'epoca del 32nm SOI si diceva (almeno ricordo) che il SOI in quanto tale era morto perché con l'avanzare della miniaturizzazione non era più possibile fare SOI. Ma il Power8 è su SOI ed è 22nm. Poi si diceva che sotto i 10nm ci sarebbe passato un decennio perché a 9nm il silicio è insufficiente per il passaggio degli elettroni (o simile, non sono un fisico) ma IBM ha risolto inserendo il germanio ed ha già presentato il primo transistor funzionante a 9nm e si prevede la produzione prima del 2020.

Mettendoci un po' di fantasia, io credo che il SOI con lo strato di isolamento e sempre sul silicio avrebbe delle difficoltà ad eccitare il transistor (il Vcore è enorme, riportato al Bulk di Intel) e di qui probabilmente consumi superiori.
Ora... Se lo studio per il 9nm e similari avesse portato una soluzione per lo strato di isolamento del SOI e quindi riportato il vantaggio del minore leakage?
Insomma, il 22nm SOI è una realtà quando la stessa IBM mi sembra avesse detto fine al SOI, e se AMD comunque riporta ZEN per il 2016, anche fosse il 31 dicembre, per forza DEVE già avere almeno già dei prototipi per quanto arcaici, e non ha senso riportare i nm e non il tipo di silicio, a meno che sia ancora da tenere nascosto.
Non è magari che scappi tipo un SOI 14/16nm con gate in germanio?

isomen
09-08-2015, 11:02
C'è di più e comunque tutto è poco chiaro.
Cioè... all'epoca del 32nm SOI si diceva (almeno ricordo) che il SOI in quanto tale era morto perché con l'avanzare della miniaturizzazione non era più possibile fare SOI. Ma il Power8 è su SOI ed è 22nm. Poi si diceva che sotto i 10nm ci sarebbe passato un decennio perché a 9nm il silicio è insufficiente per il passaggio degli elettroni (o simile, non sono un fisico) ma IBM ha risolto inserendo il germanio ed ha già presentato il primo transistor funzionante a 9nm e si prevede la produzione prima del 2020.

Mettendoci un po' di fantasia, io credo che il SOI con lo strato di isolamento e sempre sul silicio avrebbe delle difficoltà ad eccitare il transistor (il Vcore è enorme, riportato al Bulk di Intel) e di qui probabilmente consumi superiori.
Ora... Se lo studio per il 9nm e similari avesse portato una soluzione per lo strato di isolamento del SOI e quindi riportato il vantaggio del minore leakage?
Insomma, il 22nm SOI è una realtà quando la stessa IBM mi sembra avesse detto fine al SOI, e se AMD comunque riporta ZEN per il 2016, anche fosse il 31 dicembre, per forza DEVE già avere almeno già dei prototipi per quanto arcaici, e non ha senso riportare i nm e non il tipo di silicio, a meno che sia ancora da tenere nascosto.
Non è magari che scappi tipo un SOI 14/16nm con gate in germanio?

Sarebbe come tirare fuori un coniglio dal cilindro :)

ma il passato insegna che quando c'é molta segretezza é più probabile che sia perchè neanche amd ha certezze, magari stà ancora valutando quale silicio sia più adatto alla sua architettura e probabilmente il suo sviluppo nn é ancora completo... spero che nn sia così, ma in questo caso credo che ci siano più probabilità che si ritrovi con un PP inadatto e/o sotto le aspettative che si ritrovi per le mani un silicio almeno buono per la sua architettura... naturalmente spero di sbagliarmi e che amd esca a maggio/giugno prossimi con delle cpu che consumano poco, hanno un ipc alto e in MT vanno meglio degli FX :sofico:

;) ciauz

dav1deser
09-08-2015, 12:43
C'è di più e comunque tutto è poco chiaro.
Cioè... all'epoca del 32nm SOI si diceva (almeno ricordo) che il SOI in quanto tale era morto perché con l'avanzare della miniaturizzazione non era più possibile fare SOI. Ma il Power8 è su SOI ed è 22nm. Poi si diceva che sotto i 10nm ci sarebbe passato un decennio perché a 9nm il silicio è insufficiente per il passaggio degli elettroni (o simile, non sono un fisico) ma IBM ha risolto inserendo il germanio ed ha già presentato il primo transistor funzionante a 9nm e si prevede la produzione prima del 2020.

Mettendoci un po' di fantasia, io credo che il SOI con lo strato di isolamento e sempre sul silicio avrebbe delle difficoltà ad eccitare il transistor (il Vcore è enorme, riportato al Bulk di Intel) e di qui probabilmente consumi superiori.
Ora... Se lo studio per il 9nm e similari avesse portato una soluzione per lo strato di isolamento del SOI e quindi riportato il vantaggio del minore leakage?
Insomma, il 22nm SOI è una realtà quando la stessa IBM mi sembra avesse detto fine al SOI, e se AMD comunque riporta ZEN per il 2016, anche fosse il 31 dicembre, per forza DEVE già avere almeno già dei prototipi per quanto arcaici, e non ha senso riportare i nm e non il tipo di silicio, a meno che sia ancora da tenere nascosto.
Non è magari che scappi tipo un SOI 14/16nm con gate in germanio?

Ti sbagli, non si è mai detto che il SOI era morto, tutt'altro, si diceva che sotto i 20nm il SOI sarebbe stato addirittura più economico da produrre rispetto al bulk (oltre alle altre migliorie prestazionali/consumi classiche del SOI rispetto al bulk). Forse era il PD-SOI (partially depleted SOI) ad essere al capolinea, difatti i 22nm di IBM globalfoundries li chiama FDX e FD sta quasi sicuramente per "Fully depleted" che è la normale evoluzione dei PD-SOI.

tuttodigitale
09-08-2015, 13:34
C'è di più e comunque tutto è poco chiaro.
Cioè... all'epoca del 32nm SOI si diceva (almeno ricordo) che il SOI in quanto tale era morto perché con l'avanzare della miniaturizzazione non era più possibile fare SOI.
sono sicuro che nel 2012 si parlava bene del fd-soi a 28nm, con tanto di tabelle comparative. Comunque ad oggi, se non mi sono perso qualcosa, si parla di costi esorbitanti per un possibile 14nm.
Il v-core influisce pesantemente sul consumo energetico ed è innegabile, tuttavia le proprietà fisiche di un transistor SOI, sono molto più favorevoli.

Insomma, il 22nm SOI è una realtà quando la stessa IBM mi sembra avesse detto fine al SOI, e se AMD comunque riporta ZEN per il 2016, anche fosse il 31 dicembre, per forza DEVE già avere almeno già dei prototipi per quanto arcaici, e non ha senso riportare i nm e non il tipo di silicio, a meno che sia ancora da tenere nascosto.

non ho particolare dubbi che a livello di architettura, Zen è pronto a netto di qualche bug. A livello di silicio il fatto che AMD non si sia pronunciata, probabilmente (corro di fantasia) stanno studiando il da farsi a livello ingegneristico, o al più c'è la volontà di strappare un prezzo migliore.

Per quanto riguarda il numero di core, il discorso per me è ben più complesso perché si basa su molti fattori che interagiscono tra loro.
Il primo è il costo, ma come hanno riportato altri, il 14/16nm che AMD adotterebbe costerebbe meno del 22nm Bulk, quindi a parità di die prodotti a wafer il 14/16nm permetterebbe un aumento di core comunque ad un costo inferiore.
che i 14/16nm che utilizzerà AMD costeranno meno dei 22nm di Intel, credo che sia una vera e propria bufala. Il bulk Intel è stato criticato per il suo basso livello di integrazione non certo per i costi esorbitanti. Il risparmio si avrebbe con il fd-soi 22 che pur offrendo prestazioni comparabili (se non superiori) ai 14/16 nm finfet, non ha le complicazioni e i costi che nanometraggi inferiori portano con sé. Poi che i 14nm di Intel siano molto più costosi (e in teoria migliori) dei concorrenti non ci dovrebbero essere dubbi al riguardo. Semmai se questo è il rendimento prestazionale dello stato dell'arte dei processi produttivi a 14/16nm, si può solo essere pessimisti. Tanto vale andare sul sicuro con il fd-soi a 22nm (ma questo significherebbe sacrificare l'igp delle apu ed intel sta facendo passi da gigante)
In pratica su 300 e rotti mm2 di un 8350 ci scapperebbe il mondo.
Lato frequenza raggiungibile per essere compatibile come desktop in un limite di TDP accettabile (125W/140W) mi sembra esserci, perché si parla di 95W come X8.
ecco perchè i 14nm sono meglio, nel lungo periodo, dei 22nm fd-soi. Le rese migliorano, ma il numero di die sul singolo wafer sono molto maggiori.


La riflessione è che il die di Zen dovrebbe essere bilanciato come TDP max e numero di core perché poi nella versione Opteron è ipotizzabile che AMD faccia come sempre ha fatto, cioè utilizzare lo stesso die nativo per accoppiarlo in schema a 2 per il max dei core nei 140W.

Mi sembra non avere senso affermare di voler arrivare al massimo prestazionale sia high desktop e server per poi doversi confrontare con Intel con 95W massimi vs 140W nel desktop e idem facendo la proporzione, con meno TDP nei server.
AMD potrebbe, uso il condizionale, differenziare il mercato consumer da quello high-end. Da una parte avremmo il socket FM3 dall'altra un socket erede del g34. La differenza tra un Zen FX e un Zen Opteron, risiederebbe nel numero di core attivi (ad esempio 12 invece di 16) e nell'impossibilità di usarlo in configurazioni multi-processore, esattamente quello che fa Intel con le versioni XX-E.


Mi sembra non avere senso affermare di voler arrivare al massimo prestazionale sia high desktop e server per poi doversi confrontare con Intel con 95W massimi vs 140W nel desktop e idem facendo la proporzione, con meno TDP nei server.

gli opteron non sono poi un gran bel esempio, visto che l'aumento delle prestazioni dal passaggio k10 a Piledriver è stato molto ridotto, e non è un caso se i dati che ho postato dicono che con un processo produttivo migliore (28nm bulk) avrebbero consumato almeno il 30% in meno


Facendo un conto di massima, gli FX X8 sono 125W, ed il modello di punta Opteron ha 2 die FX il tutto per 140W. In pratica dai 125W FX si passa a 70W con un -44% di TDP.
bella forza considerando che perdono il 30% di frequenza: da 4 a 2,8GHz...vanno un 40% in più (ma è più realistico un 30%) ma consumano anche il 12% in più, per un aumento massimo teorico dell'efficienza del 25% (più vicino a 15%) nella realtà.


Per assurdo, ipotizzando che un FX 8350 trasportato sul 14/16nm possa dimezzare il TDP, si riuscirebbe a realizzare un X16 nei 125/140W.
in teoria anche a 95W, ma visto cosa è successo a Intel credo che la tua previsione sia più realistica


Per assurdo, ipotizzando che un FX 8350 trasportato sul 14/16nm possa dimezzare il TDP, si riuscirebbe a realizzare un X16 nei 125/140W. Ipotizzando un +50% di Zen su Piledriver, un X8 Zen esprimerebbe una potenza del 50% superiore ad un 8350 X8, ma inferiore del 25% rispetto ad un X16.
imho l'ipc di Zen è superiore del 65% rispetto a Piledriver, quindi "solo" il 50% starebbe a significare 3,6GHz, che mi sembrano, una frequenza giusta, se non addirittura ottimistica per un octa-core vero (anche se imho avrà ancora fortissimi legami con bulldozer, se non altro per l'aumento di ipc nel ST che non si preannuncia certo straordinario), visti i progressi di Intel non certo eccezionali.

Qualche settimana fa avrei detto che con i 14nm ci girerebbe 12-core sb a 3,6...
un doppio die shrink di solito permette di raddoppiare l'efficienza

tuttodigitale
09-08-2015, 14:18
Sarebbe come tirare fuori un coniglio dal cilindro :)

ma il passato insegna che quando c'é molta segretezza é più probabile che sia perchè neanche amd ha certezze, magari stà ancora valutando quale silicio sia più adatto alla sua architettura e probabilmente il suo sviluppo nn é ancora completo... spero che nn sia così, ma in questo caso credo che ci siano più probabilità che si ritrovi con un PP inadatto e/o sotto le aspettative che si ritrovi per le mani un silicio almeno buono per la sua architettura... naturalmente spero di sbagliarmi e che amd esca a maggio/giugno prossimi con delle cpu che consumano poco, hanno un ipc alto e in MT vanno meglio degli FX :sofico:

;) ciauz
in effetti logica imporrebbe che l'ufficio marketing parlasse di prestazioni e non di ipc che è un dato non molto significativo per l'acquirente. Tuttavia non so se questo è dovuto a simulazioni o ad un certa cautela rispetto a quanto reso pubblico in passato.
Nella migliore delle ipotesi potremmo avere addirittura frequenze superiori a piledriver.

il confronto a parità di thread vede la vecchia architettura vincente. Per questa ragione si è preferito un confronto dallo scarso interesse pratico, quello delle prestazioni a parità di core, ovvero con Zen avvantaggiato dal secondo thread, come se fossero disponibili in commercio cpu con 1core a modulo..

PS certo se una cpu da 16thread (zen) andrà meno di una a 8thread (FX), qualcosa sarà andato a dir poco storto. Comunque secondo me, non dobbiamo aspettarci un ipc altissimo: un +20%(10%) rispetto a steamroller (excavator) nel singolo thread è molto più realistico.

BodyKnight
09-08-2015, 22:54
OT

A quando [Thread Ufficiale]Aspettando Zen ?

paolo.oliva2
10-08-2015, 05:54
Comunque io non trovo una similitudine tra aumento di IPC del 50% di Zen su Pile a core e nel contempo che 8 core rientrino nei 95W.
BD da Zambesi a Excavator ha migliorato l'efficienza di un 20/25% (considerando l'aumento prestazionale a parità di consumo) e siccome lato silicio il guadagno è risicato, è palese che dipenda quasi interamente dal miglioramento dell'efficienza dell'architettura.
Nel passaggio a Zen, ad un +50% di IPC sarebbe già difficile limitare l'aumento di TDP del 50%, semplicemente perché Zen non è rodato e incognita silicio.
Soluzioni?

1) le prestazioni del core potrebbero essere a modulo con 1 TH ma decadere con 2 TH e quindi diminuire il TDP, quindi considerare il modulo come un super-core nelle prestazioni a core e poi considerarlo 2 core nel conteggio dei core/TH.

2) non è che 95W siano per i core e i 30W mancanti siano per l'IGP per avere un 125W APU con cui i core potrebbero avere risorse condivise nell'FP? Questo risolverebbe il perché ricercare prestazioni massime ma limitare il TDP disponibile, è comunque avrebbe un senso a tutti gli sforzi HSA/Huma per una architettura (Zen) che durerebbe almeno 4 anni e quindi non può ignorare. Ma lato server, il discorso HSA è acerbo?

Mister D
10-08-2015, 07:32
Ti sbagli, non si è mai detto che il SOI era morto, tutt'altro, si diceva che sotto i 20nm il SOI sarebbe stato addirittura più economico da produrre rispetto al bulk (oltre alle altre migliorie prestazionali/consumi classiche del SOI rispetto al bulk). Forse era il PD-SOI (partially depleted SOI) ad essere al capolinea, difatti i 22nm di IBM globalfoundries li chiama FDX e FD sta quasi sicuramente per "Fully depleted" che è la normale evoluzione dei PD-SOI.

Ciao,
guarda che si sta facendo un po' di confusione: i 22 FDX presentati da GF sono un pp ibrido basato sui 14 FD-SOI di STmicro. Ibridi perché usano il backend del 28 shp bulk e integrano parti del 14 fd-SOI. Così ho letto su bitandchips e se vi ricordate l'utente blindwrite già all'epoca mi rispose che non era più come una volta che l'indicazione nanomentrica indicasse le reali lunghezze del gate e delle altre parti componenti il pp. Lo si fa per abbattere i costi e raggiungere le prestazioni di un nodo completo, in questo caso degli stessi 14 FD-SOI di STmicro.
IBM invece per il power 8 ha continuato a sviluppare il processo PD-SOI nella variante conosciuta come ET-SOI (Extremely thin SOI) dove il substrato è più stretto che nel normale PD-SOI. Basta cercare su google e ti vengono presentazioni in pdf di IBM stessa che spiega le differenze tra PD-SOI e ET-SOI.
GF, data l'acquisizione delle fab di IBM, produce per lei i power8 con questo pp e può accedere al suo know-how per sviluppare in proprio varianti di questo pp (chi dice per x86 visto che il power8 è una cpu RISC molto evoluta?). Che lo faccia e che poi AMD decida per questo è tutto da vedere visto che GF negli ultimi anni si è spesa poco per sviluppare lei internamente. I 14 bulk finfet che ha attualmente sono di samsung, e i nuovissimi 22 FD.SOI sono di derivazione ST. In futuro probabilmente continuerà con i 14 FD-SOI di ST o di IBM, anche perché IBM sta studiando attualmente e utilizza sia ET-SOI (ex PD-SOI) che FD-SOI. Questi due rami del SOI sono stati sviluppati per necessità diverse, gli ET-SOI (che dal prossimo nodo di IBM, 10 nm, diventeranno pure FINFET) sono sviluppati per alte potenze mentre gli FD-SOI sono sviluppati per basse potenze. Questa è la differenza.
Per quanto riguarda l'utilizzo di germanio e altri materiali IBM, come altri, hanno già allo studio diverse diverse ricerche e implementazioni sui futuri nodi SOI. Tutto, come al solito, girerà attorno al costo/beneficio. Vedremo.

EDIT:
Il pp 22 FDX usa come frontend il 14 FD-SOI di ST e come backend il 28 FD-SOI sempre di ST (quindi non il 28 shp bulk come avevo scritto erroneamente, tradito dalla mia infida memoria).

Chris70
10-08-2015, 09:06
Tutte le CPU di un modello devono rientrare in un certo standard, ma per quello che riguarda l'overclock/downvolt è una questione di fortuna... ogni CPU è diversa dall'altra.

;) ciauz

Ciao, ho raggiunto dei buoni valori in downvolt, ma vorrei sapere gentilmente se ha senso "combatterre" per gli ultimi 0.00... volt da spremere o non serve molto.
Ora ho buoni voltaggi e buone temperature rispetto all'inizio, giusto per sapere se vale la pena lottare per ogni singolo step?
Un grazie in anticipo...

isomen
10-08-2015, 11:28
Ciao, ho raggiunto dei buoni valori in downvolt, ma vorrei sapere gentilmente se ha senso "combatterre" per gli ultimi 0.00... volt da spremere o non serve molto.
Ora ho buoni voltaggi e buone temperature rispetto all'inizio, giusto per sapere se vale la pena lottare per ogni singolo step?
Un grazie in anticipo...

Finchè rimani stabile é sempre meglio un vcore più basso, chiaramente uno 0,006 incide poco che sia in meno che in più... quindi é inutile sbattersi per così poco.

;) ciauz

paolo.oliva2
10-08-2015, 13:00
Ciao,
guarda che si sta facendo un po' di confusione: i 22 FDX presentati da GF sono un pp ibrido basato sui 14 FD-SOI di STmicro. Ibridi perché usano il backend del 28 shp bulk e integrano parti del 14 fd-SOI. Così ho letto su bitandchips e se vi ricordate l'utente blindwrite già all'epoca mi rispose che non era più come una volta che l'indicazione nanomentrica indicasse le reali lunghezze del gate e delle altre parti componenti il pp. Lo si fa per abbattere i costi e raggiungere le prestazioni di un nodo completo, in questo caso degli stessi 14 FD-SOI di STmicro.
IBM invece per il power 8 ha continuato a sviluppare il processo PD-SOI nella variante conosciuta come ET-SOI (Extremely thin SOI) dove il substrato è più stretto che nel normale PD-SOI. Basta cercare su google e ti vengono presentazioni in pdf di IBM stessa che spiega le differenze tra PD-SOI e ET-SOI.
GF, data l'acquisizione delle fab di IBM, produce per lei i power8 con questo pp e può accedere al suo know-how per sviluppare in proprio varianti di questo pp (chi dice per x86 visto che il power8 è una cpu RISC molto evoluta?). Che lo faccia e che poi AMD decida per questo è tutto da vedere visto che GF negli ultimi anni si è spesa poco per sviluppare lei internamente. I 14 bulk finfet che ha attualmente sono di samsung, e i nuovissimi 22 FD.SOI sono di derivazione ST. In futuro probabilmente continuerà con i 14 FD-SOI di ST o di IBM, anche perché IBM sta studiando attualmente e utilizza sia ET-SOI (ex PD-SOI) che FD-SOI. Questi due rami del SOI sono stati sviluppati per necessità diverse, gli ET-SOI (che dal prossimo nodo di IBM, 10 nm, diventeranno pure FINFET) sono sviluppati per alte potenze mentre gli FD-SOI sono sviluppati per basse potenze. Questa è la differenza.
Per quanto riguarda l'utilizzo di germanio e altri materiali IBM, come altri, hanno già allo studio diverse diverse ricerche e implementazioni sui futuri nodi SOI. Tutto, come al solito, girerà attorno al costo/beneficio. Vedremo.

Volevo chiederti una cosa:
È esatto ipotizzare che GF possa anche utilizzare la catena 22nm SOI del Power8 per AMD? Non voglio dire che produrrebbe domani, ma che se ciò fosse fattibile ma è stato escluso, vorrebbe dire che realmente AMD avrebbe alternative e nel contempo valide.

Il power8 arriva a 5GHz come click massimo, integra IVRs per il controllo del Vcore per selezionare il TDP finale (simile a Intel e AMD).

Quello che non capisco, è:(se proprio non mi becco un tapiro)

POWER8 comes in 4-, 6-, 8-, 10- and 12-core variants;[14][15] each version is fabricated in a 22 nm silicon on insulator (SOI) process using 15 metal layers. The 12-core version consists of 4.2 billion transistors[16] and is 650 mm2 large while the 6-core version is only 362 mm2 large.

Quel "coso" integra 4200 miliardi di transistor in 650mm2, un 8350 ne ha 1,2 miliardi in 315mm2. Se per layer sono le facce, in teoria praticamente averne 15 ridurrebbe della stessa misura la superficie del die ma anche così un 8350 avrebbe 1,2 miliardi di transistor x 15 facce = 18 miliardi, sempre anni luce da 4200 miliardi.
Per fare un esempio, da un wafer 300mm ci scappano al max 224 proci (r*r*pi=70685mm2 /315mm2 (die 8350) = 224) per un totale di 270miliardi di transistor scarsi... Anche se moltiplicarssimo per 15 facce, arriveremo a 4039 miliardi di transistor.. Cioè, manco l'intero wafer a 32nm SOI basterebbe a contenere tutti i transistor di un power8 da 650mm2 sul 22nm? Dove sto sbagliando?
E poi... Ma che cacchio di dissipazione ha per smaltire tutta quella concentrazione di TDP?

Ren
10-08-2015, 13:50
Ciao,
guarda che si sta facendo un po' di confusione: i 22 FDX presentati da GF sono un pp ibrido basato sui 14 FD-SOI di STmicro. Ibridi perché usano il backend del 28 shp bulk e integrano parti del 14 fd-SOI. Così ho letto su bitandchips e se vi ricordate l'utente blindwrite già all'epoca mi rispose che non era più come una volta che l'indicazione nanomentrica indicasse le reali lunghezze del gate e delle altre parti componenti il pp. Lo si fa per abbattere i costi e raggiungere le prestazioni di un nodo completo, in questo caso degli stessi 14 FD-SOI di STmicro.

Non è un ibrido con backend riciclato, ma semplicemente il processo 22nm di IBM con l'aggiunta del FD-SOI.

Hanno riesumato il processo di IBM, perchè non necessita del double patterning ed offre già di per se prestazioni superiori al 28nm TSMC.

L'aggiunta del FD-SOI non incede nei costi come il double patterning, inoltre è un processo HP con una buona densità, quindi adatto anche per i SOC.

davo30
10-08-2015, 14:11
In ogni caso AMD ha dichiarato che per Zen utilizzerà un pp finfet, non dicendo però quale.
Bisogna poi vedere quanto è attendibile questa dichiarazione, per cui non è detto che questi 22nm saranno proprio quelli su cui svilupperanno Zen. Anche perche all'attuale i 14FF di GF non parrebbero adatti a chip ad alte prestazioni e TDP.
Oltretutto GF li descrive cosi: "22nm Fully-Depleted Silicon-On-Insulator (FD-SOI) technology that delivers FinFET-like performance and energy-efficiency at a cost comparable to 28nm planar technologies."

Chris70
10-08-2015, 14:26
Finchè rimani stabile é sempre meglio un vcore più basso, chiaramente uno 0,006 incide poco che sia in meno che in più... quindi é inutile sbattersi per così poco.

;) ciauz

Ok, grazie...
Chiedo un'altra cosa forse un pò O.T.
Il mio sistema monta 16gb di ram (4x4 1866 2 marche diverse). La scheda madre le vede a 1333, con 8350 le mettevo tranquillame a 1866 e anche a 2133 senza cambiare voltaggio memorie. Ora ho cambiato solo cpu, ma se imposto le memorie sopra 1600 e riavvio mi esce "overclock failed". Ieri ho provato a mettere volt a 1.65 (auto in default) ma stesso problema...
Questo ora che ho fatto i vari downvolt, non se con il mega voltaggio della cpu di defaut, le cosa andrebbero meglio...
P.s.: con 8350 da bios non ho mai cambiato voltaggio cpu e toccato le voci sotto DIGI...

isomen
10-08-2015, 15:11
Ok, grazie...
Chiedo un'altra cosa forse un pò O.T.
Il mio sistema monta 16gb di ram (4x4 1866 2 marche diverse). La scheda madre le vede a 1333, con 8350 le mettevo tranquillame a 1866 e anche a 2133 senza cambiare voltaggio memorie. Ora ho cambiato solo cpu, ma se imposto le memorie sopra 1600 e riavvio mi esce "overclock failed". Ieri ho provato a mettere volt a 1.65 (auto in default) ma stesso problema...
Questo ora che ho fatto i vari downvolt, non se con il mega voltaggio della cpu di defaut, le cosa andrebbero meglio...
P.s.: con 8350 da bios non ho mai cambiato voltaggio cpu e toccato le voci sotto DIGI...

OT nn direi, riguarda il memory controller dell'FX,
secondo me sopra 1866 nn ti merita andare... ma per riportare la frequenza ram a questo valore quasi sicuramente dovrai "ritoccare" il voltaggio del cpu/nb e probabilmente anche vdimm e vcore... ma escludo che tu debba tornare ai valori di prima del vcore (il cpu/nb generalmente intorno 1,25 va bene, mentre il vdimm per ram a 1,5 può essere necessario anche di 0,1 superiore al valore di targa, per quelle a 1,65 al massimo 0,02/3).

;) ciauz

Mister D
10-08-2015, 15:14
Non è un ibrido con backend riciclato, ma semplicemente il processo 22nm di IBM con l'aggiunta del FD-SOI.

Hanno riesumato il processo di IBM, perchè non necessita del double patterning ed offre già di per se prestazioni superiori al 28nm TSMC.

L'aggiunta del FD-SOI non incede nei costi come il double patterning, inoltre è un processo HP con una buona densità, quindi adatto anche per i SOC.

Veramente lo dice la stessa GF:
"A parlare è stato Gerd Teepe, Director and Design Engineering presso GlobalFoundries.
....
“We are developing 22nm FD-SOI process technology right now. We are using STMicroelectronics’ 14nm FD-SOI in our frontend, while using 28nm FD-SOI in the backend”.
"
http://www.bitsandchips.it/enterprise-business/50-enterprise-business/5738-glofo-descrive-i-propri-nodi-fd-soi-c-e-anche-quello-a-22nm

Stamattina non ho linkato la fonte però avevo scritto dove avevo letto la news;)

Chris70
10-08-2015, 15:21
OT nn direi, riguarda il memory controller dell'FX,
secondo me sopra 1866 nn ti merita andare... ma per riportare la frequenza ram a questo valore quasi sicuramente dovrai "ritoccare" il voltaggio del cpu/nb e probabilmente anche vdimm e vcore... ma escludo che tu debba tornare ai valori di prima del vcore (il cpu/nb generalmente intorno 1,25 va bene, mentre il vdimm per ram a 1,5 può essere necessario anche di 0,1 superiore al valore di targa, per quelle a 1,65 al massimo 0,02/3).

;) ciauz

Se ho capito bene mi stai dicendo che per le ram forse sono sceso un pò troppo con i voltaggi?
Ora da bios mi parte a 4300 cpu/nb a 1.225 vcore a 1.29375.
Il dram voltage è su auto, vdimm devo vedere, grazie...

Mister D
10-08-2015, 15:31
Volevo chiederti una cosa:
È esatto ipotizzare che GF possa anche utilizzare la catena 22nm SOI del Power8 per AMD? Non voglio dire che produrrebbe domani, ma che se ciò fosse fattibile ma è stato escluso, vorrebbe dire che realmente AMD avrebbe alternative e nel contempo valide.

Il power8 arriva a 5GHz come click massimo, integra IVRs per il controllo del Vcore per selezionare il TDP finale (simile a Intel e AMD).

Quello che non capisco, è:(se proprio non mi becco un tapiro)

POWER8 comes in 4-, 6-, 8-, 10- and 12-core variants;[14][15] each version is fabricated in a 22 nm silicon on insulator (SOI) process using 15 metal layers. The 12-core version consists of 4.2 billion transistors[16] and is 650 mm2 large while the 6-core version is only 362 mm2 large.

Quel "coso" integra 4200 miliardi di transistor in 650mm2, un 8350 ne ha 1,2 miliardi in 315mm2. Se per layer sono le facce, in teoria praticamente averne 15 ridurrebbe della stessa misura la superficie del die ma anche così un 8350 avrebbe 1,2 miliardi di transistor x 15 facce = 18 miliardi, sempre anni luce da 4200 miliardi.
Per fare un esempio, da un wafer 300mm ci scappano al max 224 proci (r*r*pi=70685mm2 /315mm2 (die 8350) = 224) per un totale di 270miliardi di transistor scarsi... Anche se moltiplicarssimo per 15 facce, arriveremo a 4039 miliardi di transistor.. Cioè, manco l'intero wafer a 32nm SOI basterebbe a contenere tutti i transistor di un power8 da 650mm2 sul 22nm? Dove sto sbagliando?
E poi... Ma che cacchio di dissipazione ha per smaltire tutta quella concentrazione di TDP?

Ti rispondo come posso non essendo un super esperto ma semplicemente un appassionato che legge molto;)
Alla prima domanda bisognerebbe chiedere direttamente a GF se conviene, cioè è fattibile, sviluppare e produrre una variante del 22 ET-SOI utilizzato per cpu RISC, per cpu X86. Tutto dipende da quanto gli costa e quanto vuole guadagnarci e se per amd stessa è remunerativo utilizzare questo processo SOI che è ancora planare. Purtroppo non ho altre informazioni. Lo sviluppo congiunto con IBM lo continuerà sicuramente ma che sviluppi una variante per le cpu di amd è tutta un'altra storia.
Per i layer non sono altro che gli strati di metalizzazione utilizzati per costruire il tuo chip. Più ne metti, più puoi impilare transistor e quindi renderlo più denso. A ragionamento la vedo così. Però non capisco come fai a dire che con un wafer da 300 mm di diametro non puoi produrre die con 650 mm quadrati. Basta che fai 70685/650 e ottieni il numero di die di power8 in massima configurazione core. Sbagli perché il numero di transistor di una cpu è dato dalla grandezza degli stessi (e quindi i transistor di un 22 saranno più piccoli di un 32 e quindi a a parità di superficie ce ne saranno di più) e dal numero di metalizzazioni utilizzate. L'unica cosa che puoi dire è che il processo produttivo utilizzata da IBM è dannatamente più denso del 32 SOI. Ma penso che le pipe di una cpu risc (che poi una cpu risc attuale converge a quella cisc aka x86) sia più semplice come desing e forse per questo ce ne riescono a far stare di più. Blindwrite può essere sicuramente più preciso di me e correggermi se ho detto delle castronerie visto che lui lavora proprio sui pp.;)

Ren
10-08-2015, 16:51
Veramente lo dice la stessa GF:
"A parlare è stato Gerd Teepe, Director and Design Engineering presso GlobalFoundries.
....
“We are developing 22nm FD-SOI process technology right now. We are using STMicroelectronics’ 14nm FD-SOI in our frontend, while using 28nm FD-SOI in the backend”.
"
http://www.bitsandchips.it/enterprise-business/50-enterprise-business/5738-glofo-descrive-i-propri-nodi-fd-soi-c-e-anche-quello-a-22nm

Stamattina non ho linkato la fonte però avevo scritto dove avevo letto la news;)

Tieni si smentiscono da soli ;) (guarda la data)

http://www.bitsandchips.it/enterprise-business/50-enterprise-business/5812-glofo-ci-presenta-le-prime-declinazioni-del-nodo-22fdx-22nm-fd-soi

Non avrebbe senso sviluppare un processo a 14nm sul frontend, quando hai già in casa un 14nm completo di tutto, inoltre risparmieresti poco in termini di costo.

La furbata sta proprio nell'evitare finfet e double patterning in favore del FDSOI...

el-mejo
10-08-2015, 17:19
Volevo chiederti una cosa:
È esatto ipotizzare che GF possa anche utilizzare la catena 22nm SOI del Power8 per AMD? Non voglio dire che produrrebbe domani, ma che se ciò fosse fattibile ma è stato escluso, vorrebbe dire che realmente AMD avrebbe alternative e nel contempo valide.

Il power8 arriva a 5GHz come click massimo, integra IVRs per il controllo del Vcore per selezionare il TDP finale (simile a Intel e AMD).

Quello che non capisco, è:(se proprio non mi becco un tapiro)

POWER8 comes in 4-, 6-, 8-, 10- and 12-core variants;[14][15] each version is fabricated in a 22 nm silicon on insulator (SOI) process using 15 metal layers. The 12-core version consists of 4.2 billion transistors[16] and is 650 mm2 large while the 6-core version is only 362 mm2 large.

Quel "coso" integra 4200 miliardi di transistor in 650mm2, un 8350 ne ha 1,2 miliardi in 315mm2. Se per layer sono le facce, in teoria praticamente averne 15 ridurrebbe della stessa misura la superficie del die ma anche così un 8350 avrebbe 1,2 miliardi di transistor x 15 facce = 18 miliardi, sempre anni luce da 4200 miliardi.
Per fare un esempio, da un wafer 300mm ci scappano al max 224 proci (r*r*pi=70685mm2 /315mm2 (die 8350) = 224) per un totale di 270miliardi di transistor scarsi... Anche se moltiplicarssimo per 15 facce, arriveremo a 4039 miliardi di transistor.. Cioè, manco l'intero wafer a 32nm SOI basterebbe a contenere tutti i transistor di un power8 da 650mm2 sul 22nm? Dove sto sbagliando?
E poi... Ma che cacchio di dissipazione ha per smaltire tutta quella concentrazione di TDP?

https://en.wikipedia.org/wiki/Billion

Ovviamente si parla di 4.2 miliardi di transistor, sennò Intel, Amd e Arm possono tutti chiudere baracca e GG :asd:

dav1deser
10-08-2015, 17:27
Ti rispondo come posso non essendo un super esperto ma semplicemente un appassionato che legge molto;)
Alla prima domanda bisognerebbe chiedere direttamente a GF se conviene, cioè è fattibile, sviluppare e produrre una variante del 22 ET-SOI utilizzato per cpu RISC, per cpu X86. Tutto dipende da quanto gli costa e quanto vuole guadagnarci e se per amd stessa è remunerativo utilizzare questo processo SOI che è ancora planare. Purtroppo non ho altre informazioni. Lo sviluppo congiunto con IBM lo continuerà sicuramente ma che sviluppi una variante per le cpu di amd è tutta un'altra storia.
Per i layer non sono altro che gli strati di metalizzazione utilizzati per costruire il tuo chip. Più ne metti, più puoi impilare transistor e quindi renderlo più denso. A ragionamento la vedo così. Però non capisco come fai a dire che con un wafer da 300 mm di diametro non puoi produrre die con 650 mm quadrati. Basta che fai 70685/650 e ottieni il numero di die di power8 in massima configurazione core. Sbagli perché il numero di transistor di una cpu è dato dalla grandezza degli stessi (e quindi i transistor di un 22 saranno più piccoli di un 32 e quindi a a parità di superficie ce ne saranno di più) e dal numero di metalizzazioni utilizzate. L'unica cosa che puoi dire è che il processo produttivo utilizzata da IBM è dannatamente più denso del 32 SOI. Ma penso che le pipe di una cpu risc (che poi una cpu risc attuale converge a quella cisc aka x86) sia più semplice come desing e forse per questo ce ne riescono a far stare di più. Blindwrite può essere sicuramente più preciso di me e correggermi se ho detto delle castronerie visto che lui lavora proprio sui pp.;)

Attenzione i layer metallici non servono a impilare transistor, nei processi produttivi per CPU attualmente i transistor sono disposti su di un solo piano, è per chip più semplici come le memorie NAND che è possibile impilare più chip uno sull'altro per aumentare la densità di transistor:

http://electronicsbus.com/wp-content/uploads/2011/10/3d-ic-Through-Silicon-Via-TSV-Technology.jpg

Ma qui stai impilando veri e propri chip di silicio uno sull'altro.

Gli strati di metallizzazione non sono nient'altro che i collegamenti elettrici fra i vari transistor. Averne di più o di meno è solo questione di cercare l'ottimo fra minore leakage (più layer), minore costo di produzione (meno maschere, meno passaggi => meno layer).

Comunque

Power8: 4500M transistor / 650mm2 = 6,9M transistor/mm2
FX: 1200M transistor / 315mm2 = 3,8M transistor/mm2
Power8 vs FX = 6,9/3,8 = 1,82 = +82% di densità
32nm vs 22nm = 32^2/22^2 = 2,11 = +111% di densità

Quindi non è che siamo così lontani dalla densità teorica di un 22nm vs 32nm.

isomen
10-08-2015, 18:11
Se ho capito bene mi stai dicendo che per le ram forse sono sceso un pò troppo con i voltaggi?
Ora da bios mi parte a 4300 cpu/nb a 1.225 vcore a 1.29375.
Il dram voltage è su auto, vdimm devo vedere, grazie...

Di sicuro nn c'é niente, ma secondo me, prima di ritoccare il vcore (ma nn é detto che soprattutto se devi alzare il cpu/nb tu nn debba rialzarlo leggermente) proverei ad alzare un po' il vdimm (soprattutto se le tue ram l'hanno a 1,5v) e visto che hai provato anche con vdimm a 1,65 senza risultati, proverei ad alzare contemporaneamente anche il cpu/nb a 1,25/1,275 (ma questa operazione potrebbe costringerti a rialzare leggermente il vcore)

PS
un'altra strada sarebbe ripartire dai voltaggi default con ram a 1866 e vedere se trovi la stabilità, per poi ricominciare ad abbassarli... ma dovresti rifare tutto il lavoro

;) ciauz

Mister D
10-08-2015, 18:50
Tieni si smentiscono da soli ;) (guarda la data)

http://www.bitsandchips.it/enterprise-business/50-enterprise-business/5812-glofo-ci-presenta-le-prime-declinazioni-del-nodo-22fdx-22nm-fd-soi

Non avrebbe senso sviluppare un processo a 14nm sul frontend, quando hai già in casa un 14nm completo di tutto, inoltre risparmieresti poco in termini di costo.

La furbata sta proprio nell'evitare finfet e double patterning in favore del FDSOI...

Ciao,
l'avevo già letto quell'articolo ma non contraddice da nessuna parte quello detto dal direttore ingegneristico e di desing di GF. Quelle sono parole testuali. Perché avrebbe dovuto sparare una cavolata del genere?
Guarda questo video che si trova linkato sulla pagina di GF:
http://www.chipestimate.com/videos.php?watch=544&GLOBALFOUNDRIES+Webinar:+Extending+Moore%27s+Law+with+FD-SOI+Technology
Al minuto 13:20 fanno vedere una slide in cui dichiarano che nelle loro 4 versioni non c'è una versione per l'HP (e lo scrivono pure nella pagina del loro sito).
Poi sempre nel video e qui:
http://globalfoundries.com/docs/default-source/PDF/22fdx-product-brief.pdf?sfvrsn=10
fanno vedere l'uso della tecnologia FBB per un maggiore controllo della potenza, delle prestazioni e del leakage e guarda caso è pari pari il disegno e la tecnologia di ST:
http://www.st.com/web/en/about_st/learn_fd-soi.html
Non ti pare più semplice essere partiti dalla tecnologia di ST che era già sviluppata per le basse potenze e aver fatto come dice? E poi sinceramente se quelle parole le ha dette un responsabile di GF perché non dovrebbero essere vere??? Non capisco il senso e non è per dirti che non hai ragione, anzi può essere pure come dici te.;)

EDIT:
A parte che leggendo qui:
http://www.bitsandchips.it/hardware/50-enterprise-business/5584-globalfoundries-continua-lo-sviluppo-dei-22nm-soi-high-performance-di-ibm#
il nodo utilizzato a 22 nm di IBM è sempre un FD-SOI solo che loro lo chiamano ET-SOI. Dicitura ET che sta per estremamente sottile che poi è la definizione del fulldepleted:
https://www.semiwiki.com/forum/showwiki.php?title=Semi%20Wiki:FD-SOI%20Wiki
FD-SOI stands for fully-depleted silicon-on-insulator. The term FD-SOI typically refers to a planar transistor architecture. Planar architectures are pretty much what the industry's been doing for decades, but with FD-SOI, it's done on an SOI wafer with very thin top silicon over a very thin layer of insulating Buried Oxide (aka BOX). This confers significant advantages in terms of power, performance and area at an extremely competitive final cost.
e
Some of the companies and institutions that have historically been most active in the latest developments in the FD-SOI arena (although they sometimes call it by a different acroynm) include STMicroelectronics (ultra-thin body & box / UTB2) Hitachi (hybrid silicon on thin box - SOTB), IBM (extremely thin / ET-SOI), ARM, GlobalFoundries, Soitec (FD-2D), Leti and UCBerkeley. Most belong to the SOI Industry Consortium.

Quindi quello che mi chiedo io perché prendere un nodo FD-SOI ad alte prestazioni come quello di IBM e poi farne una versione "povera" per basse potenze quando hai già la tecnologia di ST e hai già firmato accordi per utilizzarla? Mi suona sinceramente strano. Mi sembrano più sensate le parole di quel responsabile e del fatto di aver utilizzato caratteristiche del 14 FD-SOI su base 28 per ottenere una via di mezzo e risparmiare sull'uso dei pattern come dici te.

Mister D
10-08-2015, 18:53
Attenzione i layer metallici non servono a impilare transistor, nei processi produttivi per CPU attualmente i transistor sono disposti su di un solo piano, è per chip più semplici come le memorie NAND che è possibile impilare più chip uno sull'altro per aumentare la densità di transistor:

http://electronicsbus.com/wp-content/uploads/2011/10/3d-ic-Through-Silicon-Via-TSV-Technology.jpg

Ma qui stai impilando veri e propri chip di silicio uno sull'altro.

Gli strati di metallizzazione non sono nient'altro che i collegamenti elettrici fra i vari transistor. Averne di più o di meno è solo questione di cercare l'ottimo fra minore leakage (più layer), minore costo di produzione (meno maschere, meno passaggi => meno layer).

Comunque

Power8: 4500M transistor / 650mm2 = 6,9M transistor/mm2
FX: 1200M transistor / 315mm2 = 3,8M transistor/mm2
Power8 vs FX = 6,9/3,8 = 1,82 = +82% di densità
32nm vs 22nm = 32^2/22^2 = 2,11 = +111% di densità

Quindi non è che siamo così lontani dalla densità teorica di un 22nm vs 32nm.

Grazie della delucidazione ho confuso le due cose (chip 3d per aumentare la densità e le metalizzazioni) e poi ho dota per buone le cifre di Paolo senza neanche prestare attenzione a Bilion :D Ecco dov'era l'errore e così alla fine la densità è circa la medesima rapporta al passaggio dai 32 ai 22;)

Chris70
10-08-2015, 19:11
Di sicuro nn c'é niente, ma secondo me, prima di ritoccare il vcore (ma nn é detto che soprattutto se devi alzare il cpu/nb tu nn debba rialzarlo leggermente) proverei ad alzare un po' il vdimm (soprattutto se le tue ram l'hanno a 1,5v) e visto che hai provato anche con vdimm a 1,65 senza risultati, proverei ad alzare contemporaneamente anche il cpu/nb a 1,25/1,275 (ma questa operazione potrebbe costringerti a rialzare leggermente il vcore)

PS
un'altra strada sarebbe ripartire dai voltaggi default con ram a 1866 e vedere se trovi la stabilità, per poi ricominciare ad abbassarli... ma dovresti rifare tutto il lavoro

;) ciauz

Grazie di nuovo...
Vdimm sarebbe dram voltage?
In ogni caso i parametri per cpu con memoria stabile a 1600 li ho già, se mi gira posso provare a 1866....

paolo.oliva2
10-08-2015, 20:32
https://en.wikipedia.org/wiki/Billion

Ovviamente si parla di 4.2 miliardi di transistor, sennò Intel, Amd e Arm possono tutti chiudere baracca e GG :asd:

:sofico: avevo toppato da qualche parte... biliard in inglese è miliardo in italiano, non 1000 miliardi. Comunque è sempre il doppio circa rispetto al 32nm.

paolo.oliva2
10-08-2015, 20:41
Grazie della delucidazione ho confuso le due cose (chip 3d per aumentare la densità e le metalizzazioni) e poi ho dota per buone le cifre di Paolo senza neanche prestare attenzione a Bilion :D Ecco dov'era l'errore e così alla fine la densità è circa la medesima rapporta al passaggio dai 32 ai 22;)

Come sopra... avevo rifatto 10 volte i calcoli per non fare una pessima figura... ma proprio non avevo fatto caso a biliard e sono andato giù con 1000 miliardi.

digieffe
10-08-2015, 21:26
Io non voglio difendere GF, ma comunque GF fa parte del consorzio, cioè IBM, Samsung & C., quindi quello che tira fuori (o non tira fuori) GF, non lo hanno neanche gli altri.
Quello che non capisco, è perché il silicio di IBM con cui fa i powrr8 non potrebbe andare bene per AMD.

The technical details presented at the Hot Chip 2013 conference by IBM showcased the Power8 Processor featuring 12 cores with the new 8-Way simultaneous multithreading (SMT) compared to the 4-Way SMT in Power7 processors. Being the most high-performance chip that IBM has to offer, the components are scattered across a 22nm die featuring silicon-on-insulator technology spread across an area of 650mm2 which is quite huge.
The Power8 Processor also features a 16 Execution Pipeline followed with 64K data cache per-core and 32K instruction cache. On the cache front, the new processor has 512 KB SRAM L2 cache per core, 96 MB eDRAM shared L3 cache and also 128 MB of eDRAM L4 cache that’s situated off-die unlike the on-board eDRAM on Haswell processors featuring GT3e iGPUs.
P.S.
Il tutto ad una frequenza di 4GHz

Non trovò il TDP, ma ha un die size doppio rispetto ad un 8350.


il power7 è 300w a cpu raffreddato ad solo acqua, non penso che il power8 sia da meno


un saluto a tutti :)

Ren
10-08-2015, 22:19
Ciao,
l'avevo già letto quell'articolo ma non contraddice da nessuna parte quello detto dal direttore ingegneristico e di desing di GF. Quelle sono parole testuali. Perché avrebbe dovuto sparare una cavolata del genere?


Si contraddice quando afferma che utilizzano il 22nm per evitare il double patterning. Dai 20nm in giù il double patterning è inevitabile.

Qualcosa non quadra...:fagiano:

ps. La versione Hp del 22fdx si chiama UHP nelle slide;).

isomen
10-08-2015, 23:29
Grazie di nuovo...
Vdimm sarebbe dram voltage?
In ogni caso i parametri per cpu con memoria stabile a 1600 li ho già, se mi gira posso provare a 1866....

Si, vdimm é il voltaggio della ram

puoi provare con ram a 1866 e i parametri stabili con ram a 1600... se hai problemi provi ad alzare leggermente il cpu/nb e/o il vdimm.

;) ciauz

tuttodigitale
11-08-2015, 01:56
BD da Zambesi a Excavator ha migliorato l'efficienza di un 20/25% (considerando l'aumento prestazionale a parità di consumo) e siccome lato silicio il guadagno è risicato, è palese che dipenda quasi interamente dal miglioramento dell'efficienza dell'architettura.
ma i miei calcoli li leggi? Rischio di offendermi
da piledriver a excavator, AMD grazie all'architettura ha migliorato l'ipc del 20-25% ma sulla carta l'efficienza è più che raddoppiata a 2,1GHz.

Da slide a 7.5W per modulo, i miglioramento di efficienza sono del:
39% per mezzo delle librerie HDL (da solo quasi come se fossimo in presenza di un die shrink)
19% AVFS (complessivamente +65%)
a questo va aggiunto il fatto che il 28nm bulk già ha dimostrato di essere meglio del 32nm soi a basse frequenze.

quindi probabilmente con la gpu in idle le apu carrizo a 15W potranno viaggiare a frequenze molto più elevate (ho calcolato 2,6GHz rispetto a 2,1ghz base)

praticamente siamo a +130% di efficienza rispetto a piledriver. ci vorrebbe un test per verificare questi numeri.


Nel passaggio a Zen, ad un +50% di IPC sarebbe già difficile limitare l'aumento di TDP del 50%, semplicemente perché Zen non è rodato e incognita silicio.
dai disastrosi 32nm a 14nm, secondo me si sono tenuti anche un bel pò di margine. Un +65% su piledriver significa comunque restare abbondantemente dietro alla concorrenza a livello di ipc. Chissà magari hanno in programma di lanciare un die da 12 core con la seconda revisione di Zen (che Intel abbia attualmente un processo produttivo non eccelso non implica necessariamente che lo siano anche quelle dei concorrenti, anche il SOI di GF doveva essere il no-plus-ultra...).


1) le prestazioni del core potrebbero essere a modulo con 1 TH ma decadere con 2 TH e quindi diminuire il TDP, quindi considerare il modulo come un super-core nelle prestazioni a core e poi considerarlo 2 core nel conteggio dei core/TH.
non sei stato chiarissimo.
un modulo zen è formato da 4 core. Un singolo core è in grado di gestire due thread. Da slide si evince che le prestazioni di un core zen (capace di gestire 2 thread) sono circa il 90% di un modulo piledriver e 75% di un excavator. E se non cado in errore tra un modulo piledriver e ivy bridge ci corre circa il 10-15% di ipc. Saranno core dall'ipc elevato, paragonabile a Nehalem, non certo alle ultime uscite. Nulla si sa sul clock, anche se secondo me sarà molto elevato, per un octa-core si intende. L'eredità di bulldozer si farà sentire nel bene e nel male.



2) non è che 95W siano per i core e i 30W mancanti siano per l'IGP per avere un 125W APU con cui i core potrebbero avere risorse condivise nell'FP? Questo risolverebbe il perché ricercare prestazioni massime ma limitare il TDP disponibile, è comunque avrebbe un senso a tutti gli sforzi HSA/Huma per una architettura (Zen) che durerebbe almeno 4 anni e quindi non può ignorare. Ma lato server, il discorso HSA è acerbo?
la piattaforma sarà la stessa, e secondo me sarebbe una mossa suicida non integrare l'igp soprattutto se AMD riuscisse a vendere con un buon margine i propri prodotti. Il primo problema di HSA è la diffusione.
95W sinceramente non mi sembrano pochi per un octa-core su 14/16nm. Questi dubbi sono frutti delle prestazioni non esaltanti dei 14nm Intel. Possibile che AMD avrà un processo produttivo migliore della rivale? Se non sbaglio non è mai successo in passato.

Chris70
11-08-2015, 10:20
Si, vdimm é il voltaggio della ram

puoi provare con ram a 1866 e i parametri stabili con ram a 1600... se hai problemi provi ad alzare leggermente il cpu/nb e/o il vdimm.

;) ciauz

Sempre grazie...
Non ho capito il discorso relativo alle ram a 2133 "secondo me sopra 1866 nn ti merita andare".
In ogni caso a 1866 sono riuscito, penso di avere capito il problema dei vari insuccessi, quando modifico una voce del bios e poi il sistema riparte senza più visualizzare schermata accesso bios (solo ventole) io spegnevo il tutto e ripartivo, entravo nel bios e ricambiavo la stessa voce in originale.
Fatto questo, anche se tutto salvato, mi dava sempre "overclock failed" a prescindere da quello che avevo modificato.
Ora quando funziona, salvo il profilo del bios, così in caso di problemi successivi ricarico l'ultimo funzionante.
Ieri sera ho caricato il bios "default" e poi un pò alla volta modificato le varie voci con memorie a 1866.

isomen
11-08-2015, 11:25
Sempre grazie...
Non ho capito il discorso relativo alle ram a 2133 "secondo me sopra 1866 nn ti merita andare".
In ogni caso a 1866 sono riuscito, penso di avere capito il problema dei vari insuccessi, quando modifico una voce del bios e poi il sistema riparte senza più visualizzare schermata accesso bios (solo ventole) io spegnevo il tutto e ripartivo, entravo nel bios e ricambiavo la stessa voce in originale.
Fatto questo, anche se tutto salvato, mi dava sempre "overclock failed" a prescindere da quello che avevo modificato.
Ora quando funziona, salvo il profilo del bios, così in caso di problemi successivi ricarico l'ultimo funzionante.
Ieri sera ho caricato il bios "default" e poi un pò alla volta modificato le varie voci con memorie a 1866.

Bene

con gli FX frequenze ram superiori a 1866 nn portano grossi benefici e con le 1600 perdi poco, quindi nn vale la pena di sbattersi per portarle a 2133

;) ciauz

Free Gordon
11-08-2015, 11:58
Grazie ragazzi, discussione molto interessante.. è un piacere leggervi! ;)

Chris70
11-08-2015, 12:18
Bene

con gli FX frequenze ram superiori a 1866 nn portano grossi benefici e con le 1600 perdi poco, quindi nn vale la pena di sbattersi per portarle a 2133

;) ciauz

Grazie di nuovo...
Infatti la mia prossima domanda sarebbe stata inerente ai miglioramenti "certi o presunti" tra 1600-1866-2133.
Ora faccio un pò di prove, saluti.

paolo.oliva2
11-08-2015, 14:59
ma i miei calcoli li leggi? Rischio di offendermi
da piledriver a excavator, AMD grazie all'architettura ha migliorato l'ipc del 20-25% ma sulla carta l'efficienza è più che raddoppiata a 2,1GHz.

Da slide a 7.5W per modulo, i miglioramento di efficienza sono del:
39% per mezzo delle librerie HDL (da solo quasi come se fossimo in presenza di un die shrink)
19% AVFS (complessivamente +65%)
a questo va aggiunto il fatto che il 28nm bulk già ha dimostrato di essere meglio del 32nm soi a basse frequenze.

quindi probabilmente con la gpu in idle le apu carrizo a 15W potranno viaggiare a frequenze molto più elevate (ho calcolato 2,6GHz rispetto a 2,1ghz base)

praticamente siamo a +130% di efficienza rispetto a piledriver. ci vorrebbe un test per verificare questi numeri.


dai disastrosi 32nm a 14nm, secondo me si sono tenuti anche un bel pò di margine. Un +65% su piledriver significa comunque restare abbondantemente dietro alla concorrenza a livello di ipc. Chissà magari hanno in programma di lanciare un die da 12 core con la seconda revisione di Zen (che Intel abbia attualmente un processo produttivo non eccelso non implica necessariamente che lo siano anche quelle dei concorrenti, anche il SOI di GF doveva essere il no-plus-ultra...).


non sei stato chiarissimo.
un modulo zen è formato da 4 core. Un singolo core è in grado di gestire due thread. Da slide si evince che le prestazioni di un core zen (capace di gestire 2 thread) sono circa il 90% di un modulo piledriver e 75% di un excavator. E se non cado in errore tra un modulo piledriver e ivy bridge ci corre circa il 10-15% di ipc. Saranno core dall'ipc elevato, paragonabile a Nehalem, non certo alle ultime uscite. Nulla si sa sul clock, anche se secondo me sarà molto elevato, per un octa-core si intende. L'eredità di bulldozer si farà sentire nel bene e nel male.


la piattaforma sarà la stessa, e secondo me sarebbe una mossa suicida non integrare l'igp soprattutto se AMD riuscisse a vendere con un buon margine i propri prodotti. Il primo problema di HSA è la diffusione.
95W sinceramente non mi sembrano pochi per un octa-core su 14/16nm. Questi dubbi sono frutti delle prestazioni non esaltanti dei 14nm Intel. Possibile che AMD avrà un processo produttivo migliore della rivale? Se non sbaglio non è mai successo in passato.

Quello che avevo in testa di dire è che il 28nm Bulk di GF è si migliorato di sé e tramite altre features, ma la gente non guarda Carrizo X4 a 3GHz ma guarda un 5960X.
Nella stessa riga, nel confronto 8350 Vs 5960X, vedrebbe un ipotetico FX Excavator recuperare del 20/25% il divario nell'IPC
Se l'aumento del 65% delle prestazioni rispetto ai consumi si unisse a quello dell'IPC ed il tutto reggerebbe un FX ad almeno 4GHz, equivarrebbe a raddoppiare le prestazioni MT di un 8350, cioè li li con un 5960X.
L'idea mia sull'IPC probabilmente viene perché parto dalla posizione di un FX di AMD e non da un X4 Intel. È chiaro che un possessore X4 Intel voglia conservare lo stesso rapporto IPC/frequenza ma aumentare i core, mentre io, e non per bandiera, preferirei più fermarmi a +25% di IPC ma avere 16 core che +50% di IPC ma 8 core.
Se il 28nm Bulk GF non può offrire altro, è logico che io guardo al 20/25% di incremento IPC che sarebbero certi, e poi il resto si spera nel silicio.
Tra l'altro, il 20/25% di IPC bisogna vedere su quali frequenze, perché se ad esempio si parlasse di 5GHz (non ci spero, ma non sono da escludere) Intel avrebbe una frequenza Def di 4GHz, quindi i sarebbe come se l'IP di AMD fosse maggiore di un 25%.

Se Zen rimane a modulo ed i core passerebbero a 4 (lo so adesso) la L2 di 2MB non sarebbe insufficiente?
Cioè... Pile da 2TH nominali ne sopportava 6TH senza battere ciglio, Zen già ne avrebbe 8 nominali, probabilmente potrà arrivare a 12TH, con un IPC del 50% superiore, aumenterebbero quasi di 3 volte la banda dati.
Cioè, se il modulo Zen lavorasse con 2TH il +50% di IPC del core potrebbe essere possibile semplicemente perché gli altri core del modulo o sono in idee o hanno un carico esiguo.
Dichiarare +50% di prestazioni a core sarebbe una cosa, dichiarare il modulo Zen 3 volte più potente di quello Pile, un'altra.
Sono quei 95W che mi lasciano perplesso... A meno che AMD non faccia il bis. All'epoca aveva dichiarato tutti gli FX 95W tranne uno a 125W e a posteriori sarebbe dovuto essere l'X10... E poi tutti a 125W e max X8.

shellx
11-08-2015, 15:25
cut...
È chiaro che un possessore X4 Intel voglia conservare lo stesso rapporto IPC/frequenza ma aumentare i core, mentre io, e non per bandiera, preferirei più fermarmi a +25% di IPC ma avere 16 core che +50% di IPC ma 8 core.
cut...

Sempre con il solito massimo rispetto:
bene... quindi tu (e no per bandiera) preferisci cpu meno performanti, l'importante che abbiano più core's. Mi sembra più una mania tua personale di avere tanti core's a discapito delle prestazioni della cpu NEL TUO UTILIZZO.
ipotetici +50% di ipc su excavator sono tanta roba diamine e sono pure 8 core's (quindi ottimo MT per desktop). Tu invece preferisci meno performance GLOBALI, pur di sapere che hai 16 timidi core's ?
Torniamo al discorso che abbiamo fatto qualche mese fa: ma gestisci una farm o una struttura bigdata ? Mi hai già spiegato molto bene cosa fai con il pc, ed io molto bene ho capito, ma ho capito anche che il tuo utilizzo non giustifica e non soddisfa questa tua preferenza (meglio 16 core's e +25%ipc al posto di 8 core's +50% di ipc). E' come dire preferisco una jeep 4x4 con due motori per andare in montagna ma a 20km l'ora massimi, al posto di una lamborgini con un solo motore che viaggia a 250km l'ora per la strada normale.
Il fatto è che in base ai tuoi utilizzi con il pc paolo, non mi pare proprio che frequenti molto la montagna, sei piu un viaggiatore su strada sterrata.
Aruba, Ovh, Hetzner, Facebook, i vari social, tutto ciò che gira a ritimi psichedelici su DB, o chi distribuisce soluzioni dedicate server, o ancora tutto ciò che gestisce strutture BIGDATA, questi si che frequentano la montagna... quindi meglio una jeep con tanti motori, che va lenta, ma che arranca il carico della salita (tanti core's poco performanti ma in densità superiore per accessi utente repentini e registrazione repentina di record su db). Te l'ho detto, a te piacciono le cpu da server, ma tu non fai un utilizzo da server, a meno che non gestisci una server-farm o ti sei aperto un social network (il paolobook) e ancora non ce l'hai detto. Se è cosi ti chiedo scusa, edito il mio post e vengo nel tuo social ad iscrivermi pure o nella tua farm ad affittarmi un server dedicato o un vps e 10tb di spazio hosting ;)

davo30
11-08-2015, 16:42
Quello che avevo in testa di dire è che il 28nm Bulk di GF è si migliorato di sé e tramite altre features, ma la gente non guarda Carrizo X4 a 3GHz ma guarda un 5960X.
Nella stessa riga, nel confronto 8350 Vs 5960X, vedrebbe un ipotetico FX Excavator recuperare del 20/25% il divario nell'IPC
Se l'aumento del 65% delle prestazioni rispetto ai consumi si unisse a quello dell'IPC ed il tutto reggerebbe un FX ad almeno 4GHz, equivarrebbe a raddoppiare le prestazioni MT di un 8350, cioè li li con un 5960X.
L'idea mia sull'IPC probabilmente viene perché parto dalla posizione di un FX di AMD e non da un X4 Intel. È chiaro che un possessore X4 Intel voglia conservare lo stesso rapporto IPC/frequenza ma aumentare i core, mentre io, e non per bandiera, preferirei più fermarmi a +25% di IPC ma avere 16 core che +50% di IPC ma 8 core.
Se il 28nm Bulk GF non può offrire altro, è logico che io guardo al 20/25% di incremento IPC che sarebbero certi, e poi il resto si spera nel silicio.
Tra l'altro, il 20/25% di IPC bisogna vedere su quali frequenze, perché se ad esempio si parlasse di 5GHz (non ci spero, ma non sono da escludere) Intel avrebbe una frequenza Def di 4GHz, quindi i sarebbe come se l'IP di AMD fosse maggiore di un 25%.

Se Zen rimane a modulo ed i core passerebbero a 4 (lo so adesso) la L2 di 2MB non sarebbe insufficiente?
Cioè... Pile da 2TH nominali ne sopportava 6TH senza battere ciglio, Zen già ne avrebbe 8 nominali, probabilmente potrà arrivare a 12TH, con un IPC del 50% superiore, aumenterebbero quasi di 3 volte la banda dati.
Cioè, se il modulo Zen lavorasse con 2TH il +50% di IPC del core potrebbe essere possibile semplicemente perché gli altri core del modulo o sono in idee o hanno un carico esiguo.
Dichiarare +50% di prestazioni a core sarebbe una cosa, dichiarare il modulo Zen 3 volte più potente di quello Pile, un'altra.
Sono quei 95W che mi lasciano perplesso... A meno che AMD non faccia il bis. All'epoca aveva dichiarato tutti gli FX 95W tranne uno a 125W e a posteriori sarebbe dovuto essere l'X10... E poi tutti a 125W e max X8.

Il prblema è che facendo cosi si ripresenterebbe la stessa situazione dell'architettura BD, tanti core, votata al MT ma un legno in ST. Tanto valeva mantenere l'architettura BD a sto punto, ed evitare di spendere soldi su ZEN e perderne altrettanti per la mancata uscita degli FX SR e EX.
Il problema è che Intel stessa offre sia potenza MT che ST allo stesso tempo. Hai necessitè di prestazioni MT ridotte: i3/i5
Hai necessitè di prestazioni MT superiori: i7/i7-e, ma comunque con un ottimo ST

Se AMD ripresentasse una nuova architettura votata solo all'MT saremmo punto a capo. Avresti millemila core che al 90% non servirebbero perche non sfruttati, mentre per, tanto per fare esempio, la fascia gaming, avresti cpu a 4/6 core pesantemente limitate nel ST (come lo sono adesso gli FX).

digieffe
11-08-2015, 18:13
Saranno core dall'ipc elevato, paragonabile a Nehalem, non certo alle ultime uscite. Nulla si sa sul clock, anche se secondo me sarà molto elevato, per un octa-core si intende. L'eredità di bulldozer si farà sentire nel bene e nel male.

spannometricamente avevo ipotizzato in una fascia tra Nehalem e Sandy-Bridge.

mi ricordate un attimo quando si pensa uscià Zen? (quale trimestre del 2016 o 2017?)

shellx
11-08-2015, 19:13
spannometricamente avevo ipotizzato in una fascia tra Nehalem e Sandy-Bridge.

mi ricordate un attimo quando si pensa uscià Zen? (quale trimestre del 2016 o 2017?)

AMD dice 2016, non dice altro. Ma io ti dico (secondo me) se ne parla nel quarto trimestre. Come avvenne al debutto del primo bulldozer zambesi (Settembre 2011). A sto giro per non fare di nuovo le cose di fretta e fail, io dico pure Ottobre-Novembre 2016. Ma preferisco vederlo tardi 2016 è valido, che vedere na ciofeca a inizi 2016. Intel non dorme è vero, ma neppure scherza. A sto punto meglio dormire un altro pò (in termini di uscite commerciali e no di lavoro di produzione) e al primo risveglio fare la svolta.

paolo.oliva2
11-08-2015, 19:34
Sempre con il solito massimo rispetto:
bene... quindi tu (e no per bandiera) preferisci cpu meno performanti, l'importante che abbiano più core's. Mi sembra più una mania tua personale di avere tanti core's a discapito delle prestazioni della cpu NEL TUO UTILIZZO.
ipotetici +50% di ipc su excavator sono tanta roba diamine e sono pure 8 core's (quindi ottimo MT per desktop). Tu invece preferisci meno performance GLOBALI, pur di sapere che hai 16 timidi core's ?
Torniamo al discorso che abbiamo fatto qualche mese fa: ma gestisci una farm o una struttura bigdata ? Mi hai già spiegato molto bene cosa fai con il pc, ed io molto bene ho capito, ma ho capito anche che il tuo utilizzo non giustifica e non soddisfa questa tua preferenza (meglio 16 core's e +25%ipc al posto di 8 core's +50% di ipc). E' come dire preferisco una jeep 4x4 con due motori per andare in montagna ma a 20km l'ora massimi, al posto di una lamborgini con un solo motore che viaggia a 250km l'ora per la strada normale.
Il fatto è che in base ai tuoi utilizzi con il pc paolo, non mi pare proprio che frequenti molto la montagna, sei piu un viaggiatore su strada sterrata.
Aruba, Ovh, Hetzner, Facebook, i vari social, tutto ciò che gira a ritimi psichedelici su DB, o chi distribuisce soluzioni dedicate server, o ancora tutto ciò che gestisce strutture BIGDATA, questi si che frequentano la montagna... quindi meglio una jeep con tanti motori, che va lenta, ma che arranca il carico della salita (tanti core's poco performanti ma in densità superiore per accessi utente repentini e registrazione repentina di record su db). Te l'ho detto, a te piacciono le cpu da server, ma tu non fai un utilizzo da server, a meno che non gestisci una server-farm o ti sei aperto un social network (il paolobook) e ancora non ce l'hai detto. Se è cosi ti chiedo scusa, edito il mio post e vengo nel tuo social ad iscrivermi pure o nella tua farm ad affittarmi un server dedicato o un vps e 10tb di spazio hosting ;)

Los che sono l'unico forse che la pensa in questo modo... Ma faccio solo un calcolo matematico. 8 core con una potenza superiore del 50% di IPC (ma a quale frequenza? Se fosse 3,5GHz, già sarebbe meno del 40% in prestazioni) equivarrebbe a 12 core di pile. 16 core con 20% in più di IPC su base Excavator equivarrebbero a 19 core Pile.
Come potenza complessiva Zen sarebbe inferiore del 50%, come forza bruta superiore del 50%.
Io comprendo benissimo quello che tu pensi... Ma sarò stupido e fissato, ma anche senza avere una farm, io guardo un 5960X e non un 4790k, anche se quest'ultimo avrebbe una forza bruta a core superiore... Ma a me non serve la forza bruta... Non gioco e nell'uso normale la situazione dei banchi è diversa.
Ma come ho detto altre volte, io mi adeguo al tipo di processore con lo sghiribizzo di ottenere il massimo. Non è questione di caricare millemila programmi, ma proprio un modo di fare differente. Nessuno credo sia tornato indietro da un Thuban X6 ad un Phenom II X4, come nessuno tornerebbe indietro da un FX X8 ad un X6. C'è chi ha cambiato da un FX X8 ad un Intel X4 +HT, perché cercava quello che un FX non poteva dare, e buon per lui, ma per me è per come la penso, guardo gli Intel dall'X6 in su

digieffe
11-08-2015, 20:00
AMD dice 2016, non dice altro. Ma io ti dico (secondo me) se ne parla nel quarto trimestre. Come avvenne al debutto del primo bulldozer zambesi (Settembre 2011). A sto giro per non fare di nuovo le cose di fretta e fail, io dico pure Ottobre-Novembre 2016. Ma preferisco vederlo tardi 2016 è valido, che vedere na ciofeca a inizi 2016. Intel non dorme è vero, ma neppure scherza. A sto punto meglio dormire un altro pò (in termini di uscite commerciali e no di lavoro di produzione) e al primo risveglio fare la svolta.

ciao shellx (S.) :)

vi ricordate quanto tempo prima dell'uscita delle precedenti architetture si videro in giro gli eng. sample ?

digieffe
11-08-2015, 20:10
Los che sono l'unico forse che la pensa in questo modo... Ma faccio solo un calcolo matematico. 8 core con una potenza superiore del 50% di IPC (ma a quale frequenza?
...cut

imo, è probabile che a Q4 2016 avremo un intel X8 @~3.6ghz ed un X6 @ ~4ghz su base broadwell-e o skywell-e (+10%) tutti @140w

sempre imo, si riproporra il confronto amd X8 vs intel X6, e se amd vuol competere col X8 intel dovra tirar fuori un X12.

riuscirà a rientrare nel tdp per poter competere con x8 intel ?

se tutti gli amd avranno la igp (cosa che mi auguro) quanto inciderà visto che intel nelle fasce citate non ce l'ha ?

isomen
11-08-2015, 20:14
Los che sono l'unico forse che la pensa in questo modo... Ma faccio solo un calcolo matematico. 8 core con una potenza superiore del 50% di IPC (ma a quale frequenza? Se fosse 3,5GHz, già sarebbe meno del 40% in prestazioni) equivarrebbe a 12 core di pile. 16 core con 20% in più di IPC su base Excavator equivarrebbero a 19 core Pile.
Come potenza complessiva Zen sarebbe inferiore del 50%, come forza bruta superiore del 50%.
Io comprendo benissimo quello che tu pensi... Ma sarò stupido e fissato, ma anche senza avere una farm, io guardo un 5960X e non un 4790k, anche se quest'ultimo avrebbe una forza bruta a core superiore... Ma a me non serve la forza bruta... Non gioco e nell'uso normale la situazione dei banchi è diversa.
Ma come ho detto altre volte, io mi adeguo al tipo di processore con lo sghiribizzo di ottenere il massimo. Non è questione di caricare millemila programmi, ma proprio un modo di fare differente. Nessuno credo sia tornato indietro da un Thuban X6 ad un Phenom II X4, come nessuno tornerebbe indietro da un FX X8 ad un X6. C'è chi ha cambiato da un FX X8 ad un Intel X4 +HT, perché cercava quello che un FX non poteva dare, e buon per lui, ma per me è per come la penso, guardo gli Intel dall'X6 in su

Molto dipende sall'uso, ma personalmente fra 16 core cob ipc più alto del 25% e 8 core con ipc più alto del 50'%... sceglierei 6 core con ipc più alto del 75% :asd:
sotto 6 core reali nn scendetei, ma vista la difficoltà ad usarne già 8 (almeno in alcuni ambiti)... altrimenti con 4 die kabini vivremmo tutti felici e contenti.

@ Paolo
ho quotato te perchè siamo stati concordi tante volte nel difendere la sopportazione degli FX ai carichi pesanti, ma nn per criticare quello che dici... anche se questa volta nn sono completamente d'accordo, la maggiore potenza dei core si moltiplica per il numero degli stessi, ma visto il poco parallelismo di molti software meglio più potenza e meno core (secondo me 6/8 puoi sfruttarli, averne 16/24 servirebbe a pochi), parlando dei giochi (cosa xhe interessa a molti), sono passato da 6300 a 4,6 a 8350 a 4,6 e tranne 1 o 2 casi le prestazioni sono le stesse (naturalmente la cosa cambia un po' se giochi mentre il pc svolge altri lavori, ma nn credo che riuscirei a sfruttare 16 core... mentre 6/8 con le stesse caratteristiche e ipc più alto darebbero sicuramente di più)

edit
ho corretto gli errori... chiedo scusa

;) ciauz

paolo.oliva2
11-08-2015, 21:02
Molto dipende sall'uso, ma personalmente fra 16 core cob ipc più alto del 25% e 8 core con ipc più alto del 5'%... scrglierei 6 core con ipc più alto del 75% :asd:
sotto 6 core reali nn scendetei, ma vista la difficoltà ad usarne già 8 (almeno in alcuni ambiti)... altrimenti con 4 die kabini vivremmo tutti felici e contenti.

@ Paolo
ho quotato te perchè siamo stati concordi tante volte nel difendere la sopportazione degli FX ai carichi pesanti, ma nn per criticare quello che dici... anche se questa volta nn sono completamente d'accordo, la maggiore potenza dei core si moltiplica per il numero degli stessi, ma visto il poco parallelismo di molti software meglio più potenza e meno core (secondo me 6/8 puoi sfruttarli, averne 16/24 servirebbe a pochi), parlando dei giochi (cosa xhe interessa a molti), sono passato da 6300 a 4,6 a 8350 a 4,6 e tranne 1 o 2 casi le prestazioni sono le stesse (naturalmente la cosa cambia un po' se giochi mentre il pc svolge altri lavori, ma nn credo che riuscirei a sfruttare 16 core... mentre 6/8 con le stesse caratteristiche e ipc più alto darebbero sicuramente di più)

;) ciauz

Però per la quantità di core bisogna vedere... Perché Intel ha 2 TH a core e anche Zen lo dovrebbe avere... Ma io non ci vedo chiaro un modulo Zen con 4 core e 8 TH con 2MB di L2 a meno che con 16MB di L3.

digieffe
11-08-2015, 21:14
Però per la quantità di core bisogna vedere... Perché Intel ha 2 TH a core e anche Zen lo dovrebbe avere... Ma io non ci vedo chiaro un modulo Zen con 4 core e 8 TH con 2MB di L2 a meno che con 16MB di L3.

anche 8-10 mb L3 son sufficienti se le caches sono veloci

paolo.oliva2
11-08-2015, 21:31
Comunque tornando al discorso silicio... Secondo me il 14nm di Intel non è scarso, ma paga di essere il successore di un 22nm eccelso.

Mi viene da pensare che Intel abbia investito sul 22nm perché il 45nm SOI solamente implementando il low-k aveva reso possibile 6 core al posto di 4 nel mercato desktop, mentre idem il 45nm bulk pure implementando L'HKMG si è dovuto attendere il 32nm.
Insomma, il 32nm SOI con ULK e pure HKMG avrebbe anche potuto sorprendere (in negativo a posteriori). In ogni caso il 22nm Intel secondo me è uno dei processi meglio riusciti di Intel, anche perché strabiliante per leakage/numero di transistor per un processo bulk.

Probabilmente il 14nm Intel ha un pp normale, ma paga di essere il successore di un 22nm eccelso. Io non penso che il 14/16nm che utilizzerà AMD avrà vita facile.

paolo.oliva2
11-08-2015, 22:01
anche 8-10 mb L3 son sufficienti se le caches sono veloci

Si ma io non ci vedo chiaro.
Un Zen con 40% su Excavator il quale avrebbe 20/25% su Piledriver, risulterebbe circa il 70% più potente di un 8350 łse a frequenze simili). AMD lo riporta 95W.
Boh... 70% in più di prestazioni con un -24% di TDP.

digieffe
11-08-2015, 22:20
Si ma io non ci vedo chiaro.
Un Zen con 40% su Excavator il quale avrebbe 20/25% su Piledriver, risulterebbe circa il 70% più potente di un 8350 łse a frequenze simili). AMD lo riporta 95W.
Boh... 70% in più di prestazioni con un -24% di TDP.

70% -> core vs core o core+ht vs modulo?

cmq prendendo 70% più potente di un 8350 vuol dire ~170% di 125w tdp @32mn soi = 212W tdp.

tendendo conto che 32 -> 22 -> 16 sono già 2 nodi il che significa 50% di tdp di 212w --> 106w
metti le librerie ad alta densità (~20% ?) 85w tdp forse anche meno


edit: se fosse a 14mn ci sarebbe a0ncora un risparmio del ~15%

shellx
11-08-2015, 23:06
ciao shellx (S.) :)

vi ricordate quanto tempo prima dell'uscita delle precedenti architetture si videro in giro gli eng. sample ?

Ciao ;)
Appunto, il fatto che ancora non si senta neppure la minima puzza, mi fa pensare che la cosa sia più lunga del solito.
Ma del resto meglio cosi: il marketing eccitato ad amd ha sempre portato sfiga ;)
Il fatto che non ci siano sample, può trattarsi di una scelta da parte di amd (si tiene in basso profilo). Ti ricordo che il CEO attuale non è più il CEO di prima. E quando si cambia il capitano anche le scelte piu banali subiscono cambiamenti a bordo del vascello. E siccome alcune scelte del vecchio capitano hanno fatto male alla scialuppa, meglio che il nuovo capitano non imiti il vecchio. ;)
Poi buu..? Può darsi che fra una settimana fudzilla ha gia una f.k.-cpu Zen fra le mani :rotfl:

tuttodigitale
12-08-2015, 01:47
un excavator x16 a 4 GHz avrebbe prestazioni nel MT di gran lunga superiore ad haswell-E. E le prestazioni nel singolo thread sarebbero comunque di tutto rispetto, tra turbo-core e ipc significativamente più elevato di PD.

Il punto semmai, se è possibile fare un excavator x16, perchè non sarebbe possibile fare uno zen x12. E almeno dalle poche informazioni che abbiamo (8core e 95W di tdp) questo sembra possibile.

La questione (sollevata da Paolo) è se vogliamo rinchiusa in queste poche righe: perchè AMD sembrerebbe decisa a limitare il tdp delle sue cpu a 95W, quando la concorrenza ha un margine termico del 50% superiore (140W)? Se fai un octa core da 95W come modello di punta puoi permetterti di fare un 12-core che consumi come un top di gamma.
Per regalare un 30-50% di prestazioni alla concorrenza, non devi essere solo competitivo ma molto di più. Gli ingegneri di AMD forse sono convinti che un octa core da 95W, sia sufficiente per battere un haswell-e da 140W?

Non credo che il (presunto) basso ipc di ZEN sia un freno. Siamo a circa 25-30% da haswell (spannometricamente). Ma se pensiamo che haswell-e gira con una frequenza di soli 3GHz per rimanere nel tdp, basterebbero 4GHz per stargli davanti. E se il tdp è di 95W, la storia fx vs i7, è destinata a ripetersi ma a parti invertite.

Paolo in termini assoluti non ho dubbio alcuno che i 22nm e i 14nm siano ottimi eccellenti processi produttivi, ma va altresì notato che i miglioramenti che ha ottenuto con i 22nm non sono proprio quelli che ti aspetti da un salto di nodo, alla fine hanno aumentato il numero di core del 33%, ma hanno perso 500MHz -15%.
Ora è chiaro che qualcosa è dipeso anche dall'architettura che richiede sempre più corrente a parità di parametri. Ma insomma.

PS skylake ha una cache l2 di soli 256kB per singolo core.

digieffe
12-08-2015, 02:17
@tutto digitale

tieni conto che con intel 14nm-e (broadwell-skylake) il clock di base del X8 potrebbe salire a 3.6 ghz

davo30
12-08-2015, 02:22
un excavator x16 a 4 GHz avrebbe prestazioni nel MT di gran lunga superiore ad haswell-E. E le prestazioni nel singolo thread sarebbero comunque di tutto rispetto, tra turbo-core e ipc significativamente più elevato di PD.

Il punto semmai, se è possibile fare un excavator x16, perchè non sarebbe possibile fare uno zen x12. E almeno dalle poche informazioni che abbiamo (8core e 95W di tdp) questo sembra possibile.

La questione (sollevata da Paolo) è se vogliamo rinchiusa in queste poche righe: perchè AMD sembrerebbe decisa a limitare il tdp delle sue cpu a 95W, quando la concorrenza ha un margine termico del 50% superiore (140W)? Se fai un octa core da 95W come modello di punta puoi permetterti di fare un 12-core che consumi come un top di gamma.
Per regalare un 30-50% di prestazioni alla concorrenza, non devi essere solo competitivo ma molto di più. Gli ingegneri di AMD forse sono convinti che un octa core da 95W, sia sufficiente per battere un haswell-e da 140W?

Non credo che il (presunto) basso ipc di ZEN sia un freno. Siamo a circa 25-30% da haswell (spannometricamente). Ma se pensiamo che haswell-e gira con una frequenza di soli 3GHz per rimanere nel tdp, basterebbero 4GHz per stargli davanti. E se il tdp è di 95W, la storia fx vs i7, è destinata a ripetersi ma a parti invertite.

Paolo in termini assoluti non ho dubbio alcuno che i 22nm e i 14nm siano ottimi eccellenti processi produttivi, ma va altresì notato che i miglioramenti che ha ottenuto con i 22nm non sono proprio quelli che ti aspetti da un salto di nodo, alla fine hanno aumentato il numero di core del 33%, ma hanno perso 500MHz -15%.
Ora è chiaro che qualcosa è dipeso anche dall'architettura che richiede sempre più corrente a parità di parametri. Ma insomma.

PS skylake ha una cache l2 di soli 256kB per singolo core.

Io penso semplicemente che non abbiano interesse a confrontarsi con la fascia extreme. E in fondo se ci pensiamo la scelta non è neanche cosi insensata. Dai Phenom in poi AMD ha avuto difficolta a fronteggiare la fascia i5. Se gia Zen fosse competitivo con la fascia i7, sarebbe un gran successo.
Secondariamente penso che la scelta di "limitarsi" a 95W sia dettata da due motivi: il primo sostanzialmente per dare un immagine di architettura poco esosa (quanti utonti scambiano il TDP con il consumo?), il secondo (e quello che mi fa piu paura) è che il processo produttivo a 14nm, nato per LP, non permetta TDP maggiori (un po come è successo con i 28nm bulk)

davo30
12-08-2015, 02:25
Ciao ;)
Appunto, il fatto che ancora non si senta neppure la minima puzza, mi fa pensare che la cosa sia più lunga del solito.
Ma del resto meglio cosi: il marketing eccitato ad amd ha sempre portato sfiga ;)
Il fatto che non ci siano sample, può trattarsi di una scelta da parte di amd (si tiene in basso profilo). Ti ricordo che il CEO attuale non è più il CEO di prima. E quando si cambia il capitano anche le scelte piu banali subiscono cambiamenti a bordo del vascello. E siccome alcune scelte del vecchio capitano hanno fatto male alla scialuppa, meglio che il nuovo capitano non imiti il vecchio. ;)
Poi buu..? Può darsi che fra una settimana fudzilla ha gia una f.k.-cpu Zen fra le mani :rotfl:

Beh, diciamo che con la sparata +40% IPC, non sono andati proprio leggeri. Contaci anche l'hype "involontario" causato dalle aspettative che molti hanno su Zen, solo per il fatto che è da 3 anni che si aspettano delle CPU di fascia alta da AMD, e la frittata è gia in realtà fatta

isomen
12-08-2015, 03:40
Però per la quantità di core bisogna vedere... Perché Intel ha 2 TH a core e anche Zen lo dovrebbe avere... Ma io non ci vedo chiaro un modulo Zen con 4 core e 8 TH con 2MB di L2 a meno che con 16MB di L3.

Credo che abbiamo pensato lo stesso paragone... ma siamo giunti a conclusioni diverse, pensa ad un FX con un ipc simile a quello intel (anche un po' inferiore andrebbe bene) e poi mettigli sopra anche l'ht (portasse anche soltanto un 10% in più), cosa ottieni? una cpu forte in st e mostruosa in mt, anche se fosse 6/8 core (che significherebbe sempre 12/16 thread)... nn sarebbe meglio di una cpu 12/16 core che per quanto possa essere forte in mt, in st le prende di brutto :confused:

adesso:

core amd 100 + secondo core modulo 80% = 180x4 moduli = 720

core intel 150 + HT 30% = 195x4 core fisici + ht = 780

ma se:

core amd 140 + secondo core 80% = 252 + HT 10% = 277x4 = 1108 (277x3=831)

;) ciauz

paolo.oliva2
12-08-2015, 11:26
Credo che abbiamo pensato lo stesso paragone... ma siamo giunti a conclusioni diverse, pensa ad un FX con un ipc simile a quello intel (anche un po' inferiore andrebbe bene) e poi mettigli sopra anche l'ht (portasse anche soltanto un 10% in più), cosa ottieni? una cpu forte in st e mostruosa in mt, anche se fosse 6/8 core (che significherebbe sempre 12/16 thread)... nn sarebbe meglio di una cpu 12/16 core che per quanto possa essere forte in mt, in st le prende di brutto :confused:

adesso:

core amd 100 + secondo core modulo 80% = 180x4 moduli = 720

core intel 150 + HT 30% = 195x4 core fisici + ht = 780

ma se:

core amd 140 + secondo core 80% = 252 + HT 10% = 277x4 = 1108 (277x3=831)

;) ciauz

È chiaro che se si avesse un X8 Zen che andrebbe tanto quanto un Pile X16, avresti un MT medesimo ma con forza bruta doppia.
Il punto è che per realizzare ciò AMD dovrebbe realizzare cache, predizione, front/end, e caxxi vari non quanto Intel, meglio ancora, ed in più non so se le alu attuali avrebbero una simile potenza senza contare che Intel per fare ciò ci ha speso una barca nel silicio...
Poi l'HT, Intel è arrivato al +30% massimi in 15 anni, AMD alla prima botta quanto potrebbe fare?

È per questo che penso che se Zen è ancora modulare, l'esperienza acquisita potrebbe far sì che l'HT sia condiviso tra tutti i core del modulo.
Una cosa del genere potrebbe si aumentare l'IPC di un core, ma non da incrementare più di tanto il TDP del modulo.

Cioè, fantascienza, l'HT sfrutta i tempi morti del core aumentandone l'efficienza al 100%.
Proviamo ad immaginare il modulo Zen con 4 core e ricordare il saltella dei TH in BD.
Se la L2 è inclusiva come sembra che si è cambiato, in Intel (crefo) ci sia una L2 che alimenta la L1 che, velocissima, si svuota e si riempie per alimentare le pipeline che a sua volta alimentano le alu... Che poi le pipeline siano doppie per 2 TH o che la cosa sia più a monte, non ne ho idea.
Però, la stessa cosa sarebbe possibile nel modulo Zen semplicemente perché il modulo potrebbe essere visto come 1 core con l'HT su un altro core che in quel momento è libero.
La L2 è condivisa, il gap delle cache, predizioni e quant'altro sarebbe limitato semplicemente perché il secondo TH sarebbe fisico e non logico gravano il meno possibile sul core nativo.

Insomma, se facciamo un super-core all'Inter avremmo anche un TDP core all'Intel, con richiesta di un silicio che non limiti l'architettura.
Se non dico boiate e per un attimo pensassimo alla logica di un HT modulare se possibile, avremmo molti vantaggi:
In primis il click massimo concesso dal silicio sarebbe relativo, perché credo che rispetto ad una logica svuota-riempi e svuota-riempi su un core, tramite 2 core si dovrebbero risparmiare dei cicli svuota-riempi e di qui si potrebbe forse dire che il clock relativo potrebbe essere più alto del 30% del reale.
Il modulo comunque non avrebbe un TDP alto perché non sopporterebbe 8TH complessivi nativi, ed è normale che il TDP sia basso (e di qui 95W per X8).
L'unica problematica potrebbe essere l'alto numero di transistor, ma visto le librerie ad alta densità e le features, il leakage non dovrebbe essere un problema è neppure la grandezza del di vista la miniaturizzazione.

isomen
12-08-2015, 14:33
È chiaro che se si avesse un X8 Zen che andrebbe tanto quanto un Pile X16, avresti un MT medesimo ma con forza bruta doppia.
Il punto è che per realizzare ciò AMD dovrebbe realizzare cache, predizione, front/end, e caxxi vari non quanto Intel, meglio ancora, ed in più non so se le alu attuali avrebbero una simile potenza senza contare che Intel per fare ciò ci ha speso una barca nel silicio...
Poi l'HT, Intel è arrivato al +30% massimi in 15 anni, AMD alla prima botta quanto potrebbe fare?

È per questo che penso che se Zen è ancora modulare, l'esperienza acquisita potrebbe far sì che l'HT sia condiviso tra tutti i core del modulo.
Una cosa del genere potrebbe si aumentare l'IPC di un core, ma non da incrementare più di tanto il TDP del modulo.

Cioè, fantascienza, l'HT sfrutta i tempi morti del core aumentandone l'efficienza al 100%.
Proviamo ad immaginare il modulo Zen con 4 core e ricordare il saltella dei TH in BD.
Se la L2 è inclusiva come sembra che si è cambiato, in Intel (crefo) ci sia una L2 che alimenta la L1 che, velocissima, si svuota e si riempie per alimentare le pipeline che a sua volta alimentano le alu... Che poi le pipeline siano doppie per 2 TH o che la cosa sia più a monte, non ne ho idea.
Però, la stessa cosa sarebbe possibile nel modulo Zen semplicemente perché il modulo potrebbe essere visto come 1 core con l'HT su un altro core che in quel momento è libero.
La L2 è condivisa, il gap delle cache, predizioni e quant'altro sarebbe limitato semplicemente perché il secondo TH sarebbe fisico e non logico gravano il meno possibile sul core nativo.

Insomma, se facciamo un super-core all'Inter avremmo anche un TDP core all'Intel, con richiesta di un silicio che non limiti l'architettura.
Se non dico boiate e per un attimo pensassimo alla logica di un HT modulare se possibile, avremmo molti vantaggi:
In primis il click massimo concesso dal silicio sarebbe relativo, perché credo che rispetto ad una logica svuota-riempi e svuota-riempi su un core, tramite 2 core si dovrebbero risparmiare dei cicli svuota-riempi e di qui si potrebbe forse dire che il clock relativo potrebbe essere più alto del 30% del reale.
Il modulo comunque non avrebbe un TDP alto perché non sopporterebbe 8TH complessivi nativi, ed è normale che il TDP sia basso (e di qui 95W per X8).
L'unica problematica potrebbe essere l'alto numero di transistor, ma visto le librerie ad alta densità e le features, il leakage non dovrebbe essere un problema è neppure la grandezza del di vista la miniaturizzazione.

Se aumenta l'ipc e nn aumenta la perdita sul secondo core (con zen bisognerà vedere anche il comportamento del terzo e del quarto) aumenta anche la potenza MT, poi viene aggiunto anche l'ht, é tutto un punto interrogativo... a me piace il comportamento in MT degli FX, ma indipendentemente da come lo fa, amd deve aumentare l'ipc... altrimenti per quanto possano essere forti in mt saranno sempre, sotto alcuni aspetti, cpu deboli... anche eseguissero 24 thread contemporaneamente.

;) ciauz

Blitz90
12-08-2015, 14:44
Bel Lavoro!:D

Ren
12-08-2015, 15:03
Ma è già stata postata questa slide ?

http://www.kitguru.net/wp-content/uploads/2015/06/amd_quad_core_zen.jpg

digieffe
12-08-2015, 16:50
Poi l'HT, Intel è arrivato al +30% massimi in 15 anni, AMD alla prima botta quanto potrebbe fare?

forse ache di più se non ha un buon branch prediction ;)

digieffe
12-08-2015, 16:53
Se aumenta l'ipc e nn aumenta la perdita sul secondo core (con zen bisognerà vedere anche il comportamento del terzo e del quarto) aumenta anche la potenza MT, poi viene aggiunto anche l'ht, é tutto un punto interrogativo... a me piace il comportamento in MT degli FX, ma indipendentemente da come lo fa, amd deve aumentare l'ipc... altrimenti per quanto possano essere forti in mt saranno sempre, sotto alcuni aspetti, cpu deboli... anche eseguissero 24 thread contemporaneamente.

;) ciauz

da quanto si può vedere al momento il modulo con 4 core sembra solo un raggruppamento con la sola L3 condivisa.
se non è condiviso null'altro sarà difficile che ci siano delle perdite sugli altri core

isomen
12-08-2015, 17:20
da quanto si può vedere al momento il modulo con 4 core sembra solo un raggruppamento con la sola L3 condivisa.
se non è condiviso null'altro sarà difficile che ci siano delle perdite sugli altri core

Meglio, se nn ci sono perdite... quindi se un +40% di ipc nn sarebbe abbastanza in ST per stare a pari degli intel, in MT già così avrebbe una bella potenza:

100+40% ipc=140x8=1120

mentre adesso:

100+80% secondo core=180x4=720

più c'é l'ht, sul quale nn ho molta fiducia, ma se l'implementano qualcosa deve pur portare :confused:

;) ciauz

shellx
12-08-2015, 17:50
Meglio, se nn ci sono perdite... quindi se un +40% di ipc nn sarebbe abbastanza in ST per stare a pari degli intel, in MT già così avrebbe una bella potenza:

100+40% ipc=140x8=1120

mentre adesso:

100+80% secondo core=180x4=720

più c'é l'ht, sul quale nn ho molta fiducia, ma se l'implementano qualcosa deve pur portare :confused:

;) ciauz

Io spero solo che sto +40% ipc sia genuinamente vero. In caso contrario siamo punto e a capo con una sorta di bd-refresh e vorrà dire che AMD negli ultimi 6 anni adora buttarsi la zappa sui propri piedi prendendo per il culo i clienti con le slide. A quel punto è meglio che si dedicano ad altro (ma no per scarsi prodotti, ma per scarsa serietà aziendale).
Ma secondo me non sarà cosi: l'architettura zen non sarà la svolta che surclasserà il sistema solare, ma secondo me stavolta le next soluzioni e piattaforme di amd saranno competitive uguale o quasi con un rapporto 1:1 con il mercato high-mainstream (no enthusiast) della controparte. Che del resto è quello che tutti noi abbiam voluto con BD. Ovviamente sperare di affiancare il socket lga2011-3 è un suicidio mentale. Poi buu ? nell'elettronica e nell'informatica tuttò è possibile, non ci ho mai scommesso, perchè ne ho visti di scenari che mi hanno spiazzato. Ma sono quasi convinto che Zen affronterà il socket 1151 e successivo ad armi pari, del resto è la fascia di mercato piu remunerativa di Intel rispetto la fascia sua più alta basata sulle soluzioni x-E. Quindi anche ad amd interessa fronteggiare in quella posizione di fascia di mercato, in quanto paradossalmente è li che dovrebbe sottrarre nel mercato dei pc più clienti possibili ad Intel

shellx
12-08-2015, 18:25
Si ma con un +40% ipc no prende manco i sandy bridge come ipc, quindi ci beccheremo altri forni a 5ghz per pareggiare Intel.

+40% di ipc su Excavator i Sandy li brucia, ma non supera i broadwell...
Infatti io mi auguro che il +40% sia l'ipc di partenza di zen, e che con i refresh successivi dell'architettura, il 40% incrementi. Comunque bisogna attendere e capire cosa c'è in servo. Non credo proprio che amd riproponga una soluzione hardware basata nuovamente su un concetto di computing errato per un approccio desktop consuming, ma più idoneo a quello server. Non credo proprio che questo si ripete. Sarebbe sadico.

Ma poi, bisognerebbe invidiare il fatto che un azienda come amd sia riuscita a rialzarsi ed a elaborare diversificazione di profitto che hanno mantenuto tutto a galla, per poi riavere il coraggio di riproporsi con un altra sfida nel mercato enthusiast x86. Un azienda che non produce più silicio a casa sua, non è mica facile. Oltre il 70% della motivazione per il quale Intel ha aumentato il gap di clienti e profitto rispetto amd è proprio influenzato dal fatto che il silicio se lo fa a casa sua. Altrimenti non ti dico che amd dominava il mercato x86, ma sicuramente Intel non aveva vita facile.

°Phenom°
12-08-2015, 19:31
Non so se giá stato postato: http://wccftech.com/amd-opteron-mcm-zeppelin-cpu-greenland-hbm-data-fabric/

digieffe
12-08-2015, 20:03
Si ma con un +40% ipc no prende manco i sandy bridge come ipc, quindi ci beccheremo altri forni a 5ghz per pareggiare Intel.

oppure frequenze non alte e qualche core in più (per la felicità di paolo)

digieffe
12-08-2015, 20:07
Non so se giá stato postato: http://wccftech.com/amd-opteron-mcm-zeppelin-cpu-greenland-hbm-data-fabric/

dal grafico si deduce che zen sarà dual channel,in quanto ddr4@3200 dual channel = 100GB/s

°Phenom°
12-08-2015, 20:15
Esatto, inoltre la notizia ri-conferma abbia una specie di ht

digieffe
12-08-2015, 20:47
però poi in fondo riporta:The processor is thought to have 4 DDR4 channels with a capacity of 256GB per channel.
"The processor is thought to have 4 DDR4 channels with a capacity of 256GB per channel."

forse ho calcolato male la banda delle ddr4@3200 ?

e cmq spero non sia riservato solo ad opteron

shellx
12-08-2015, 23:32
Non so se giá stato postato: http://wccftech.com/amd-opteron-mcm-zeppelin-cpu-greenland-hbm-data-fabric/

ottimo..................................................sktop

tuttodigitale
12-08-2015, 23:36
@tutto digitale

tieni conto che con intel 14nm-e (broadwell-skylake) il clock di base del X8 potrebbe salire a 3.6 ghz
600MHz in più per quello che si è visto con skylake, sembrano risultati fuori dalla portata di Intel al momento.
Beh, diciamo che con la sparata +40% IPC, non sono andati proprio leggeri. Contaci anche l'hype "involontario" causato dalle aspettative che molti hanno su Zen, solo per il fatto che è da 3 anni che si aspettano delle CPU di fascia alta da AMD, e la frittata è gia in realtà fatta
+40% non è sto gran numero. Si parla di prestazioni per core nella slide. Quindi in quel +40%, dobbiamo tener conto del contributo offerto dal SMT.. Le prestazioni nel ST aumenteranno per meno del 20% rispetto a excavator (che comunque già di suo viaggia abbondantemente oltre il 10% rispetto a Piledriver, sempre nel ST).
A conti fatti a livelli di ipc siamo negli intorni di Nehalem e Sandy bridge, poca cosa se contiamo che skylake va rispetto a SB mediamente il 20-25% in più.

Io penso semplicemente che non abbiano interesse a confrontarsi con la fascia extreme. E in fondo se ci pensiamo la scelta non è neanche cosi insensata. Dai Phenom in poi AMD ha avuto difficolta a fronteggiare la fascia i5. Se gia Zen fosse competitivo con la fascia i7, sarebbe un gran successo.
Ha avuto difficoltà usando tutto il margine termico a disposizione. Pensa se si fosse limitata con i phenom a 95W..

Secondariamente penso che la scelta di "limitarsi" a 95W sia dettata da due motivi: il primo sostanzialmente per dare un immagine di architettura poco esosa (quanti utonti scambiano il TDP con il consumo?), il secondo (e quello che mi fa piu paura) è che il processo produttivo a 14nm, nato per LP, non permetta TDP maggiori (un po come è successo con i 28nm bulk)
la storia dei TDP maggiori non permesso da un processo produttivo mi sembra che non stia in piedi. I 28 nm hanno limitato un poco la frequenza di clock massima (il 7870K viaggia a 3,9GHz di base), ma nessuno vieta di raggiungere tdp maggiori aumentando il numero di unità di elaborazione che compongono la cpu. Le gpu, per fare un esempio terra-terra, arrivano a 300W.

nn sarebbe meglio di una cpu 12/16 core che per quanto possa essere forte in mt, in st le prende di brutto
Ma non parliamo di una cpu competitiva, ma di una soluzione in grado di sbriciolare le prestazioni di un haswell-e. Non va forte nel MT, ma va fortissimo: 2.5x un fx8350, praticamente il 40-50% di un 5960x.


adesso:

core amd 100 + secondo core modulo 80% = 180x4 moduli = 720

core intel 150 + HT 30% = 195x4 core fisici + ht = 780

ma se:

core amd 140 + secondo core 80% = 252 + HT 10% = 277x4 = 1108 (277x3=831)

;) ciauz
ragazzi non capisco perchè vi ostinate a pensare che quel +40% della slide si riferisca alle prestazioni nel singolo thread, quando a chiari lettere c'è scritto CORE. E fino a prova contraria un core ZEN è in grado di gestire 2 thread.

cioè se un MODULO excavator va 100+87% per il CMT=187
un MODULO PileDriver fa circa 88+78%=156...
un CORE Zen fa "solo" 140
ora se facciamo 50-50, miglioramento nel ST e quello dovuto al SMT abbiamo 118 ST + 18% SMT.
Che è comunque tanta, tanta roba:
+35% nel ST e +60% a livello di core rispetto a piledriver, non sono briciole


Sempre da slide si attende un ulteriore +20-25%, praticamente se partiamo da Nehalem, AMD potrebbe raggiungere haswell con Zen+. Fosse il motivo di un TDP così basso è dovuto ai margini di miglioramento lato architettura che si preannunciano enormi. Partire con un 12core a livello commerciale potrebbe non essere una strategiacommerciale azzeccata, se il modello di punta successivo sarà solo un octa (SUPER) core.


Ancora se le prestazioni a livello di ipc fossero a livello di Nehalem, e meno di 3GHz è davvero difficile immaginarlo per una cpu di quella fascia. Vi rendete conto che quel "misero" +40% su excavator significa che grazie alla presenza del 33% di core in più, la soluzione di AMD è in grado di tallonare da molto vicino le attuali soluzioni esacore della concorrenza a una frazione del TDP. Se la frequenza fosse di 4GHz e/o l'ipc più vicino a quello di SB, annienterebbe il 5960x.

Secondo me, limitarsi a 3GHz per rientrare nei 95W di tdp non ha molto senso. Più verosimile che la frequenza di questa cpu si aggiri intorno ai 3,5-4GHz, ben più vicino alla soglia oltre la quale aumentare la frequenza per aumentare le prestazioni non è molto conveniente. Se tutto venisse confermato (lo scarso ipc ma unito ad una frequenza generosa per un octa-core) siamo di fronte ad un ottima/eccellente cpu

digieffe
13-08-2015, 00:14
600MHz in più per quello che si è visto con skylake, sembrano risultati fuori dalla portata di Intel al momento.

...cut...

cioè se un MODULO excavator va 100+87% per il CMT=187
un MODULO PileDriver fa circa 88+78%=156...
un CORE Zen fa "solo" 140
ora se facciamo 50-50, miglioramento nel ST e quello dovuto al SMT abbiamo 118 ST + 18% SMT.
Che è comunque tanta, tanta roba:
+35% nel ST e +60% a livello di core rispetto a piledriver, non sono briciole


Sempre da slide si attende un ulteriore +20-25%, praticamente se partiamo da Nehalem, AMD potrebbe raggiungere haswell con Zen+. Fosse il motivo di un TDP così basso è dovuto ai margini di miglioramento lato architettura che si preannunciano enormi. Partire con un 12core a livello commerciale potrebbe non essere una strategiacommerciale azzeccata, se il modello di punta successivo sarà solo un octa (SUPER) core.

visto che non so quasi nulla del pp 14 mnm di itel secondo te a che frequenza potrebbe arrivare il prox X8 (tendendo conto che ora è a 3.0 di freq base) ?


mi sono perso le slide dell'ulteriore +20-25% Zen+ dove le posso recuperare?

isomen
13-08-2015, 00:21
+40% di ipc su Excavator i Sandy li brucia, ma non supera i broadwell...
Infatti io mi auguro che il +40% sia l'ipc di partenza di zen, e che con i refresh successivi dell'architettura, il 40% incrementi. Comunque bisogna attendere e capire cosa c'è in servo. Non credo proprio che amd riproponga una soluzione hardware basata nuovamente su un concetto di computing errato per un approccio desktop consuming, ma più idoneo a quello server. Non credo proprio che questo si ripete. Sarebbe sadico.

Ma poi, bisognerebbe invidiare il fatto che un azienda come amd sia riuscita a rialzarsi ed a elaborare diversificazione di profitto che hanno mantenuto tutto a galla, per poi riavere il coraggio di riproporsi con un altra sfida nel mercato enthusiast x86. Un azienda che non produce più silicio a casa sua, non è mica facile. Oltre il 70% della motivazione per il quale Intel ha aumentato il gap di clienti e profitto rispetto amd è proprio influenzato dal fatto che il silicio se lo fa a casa sua. Altrimenti non ti dico che amd dominava il mercato x86, ma sicuramente Intel non aveva vita facile.

Certo, a questo punto, se si presentasse con un +10% "reale" di ipc... sarebbe la fine delle cpu amd :cry:

ma quando dici che con un +40% starebbe sotto a broadwell credo tu intenda in ST... perchè in MT mentre gli intel moltiplicano per 4 a cui si somma un 30% per le cpu con HT... zen moltiplicherebbe il suo "misero" 140 per 8 e da quello che ho letto anche skylake nn fatto un gran salto in avanti :confused:

;) ciauz

Free Gordon
13-08-2015, 00:35
dal grafico si deduce che zen sarà dual channel,in quanto ddr4@3200 dual channel = 100GB/s

1600X2 *8byte/canale = 25600MB/s

Se sono 100GB/s vuol dire che sono 4 canali a 64Bit, in teoria..

isomen
13-08-2015, 00:43
600MHz in più per quello che si è visto con skylake, sembrano risultati fuori dalla portata di Intel al momento.

+40% non è sto gran numero. Si parla di prestazioni per core nella slide. Quindi in quel +40%, dobbiamo tener conto del contributo offerto dal SMT.. Le prestazioni nel ST aumenteranno per meno del 20% rispetto a excavator (che comunque già di suo viaggia abbondantemente oltre il 10% rispetto a Piledriver, sempre nel ST).
A conti fatti a livelli di ipc siamo negli intorni di Nehalem e Sandy bridge, poca cosa se contiamo che skylake va rispetto a SB mediamente il 20-25% in più.


Ha avuto difficoltà usando tutto il margine termico a disposizione. Pensa se si fosse limitata con i phenom a 95W..

la storia dei TDP maggiori non permesso da un processo produttivo mi sembra che non stia in piedi. I 28 nm hanno limitato un poco la frequenza di clock massima (il 7870K viaggia a 3,9GHz di base), ma nessuno vieta di raggiungere tdp maggiori aumentando il numero di unità di elaborazione che compongono la cpu. Le gpu, per fare un esempio terra-terra, arrivano a 300W.


Ma non parliamo di una cpu competitiva, ma di una soluzione in grado di sbriciolare le prestazioni di un haswell-e. Non va forte nel MT, ma va fortissimo: 2.5x un fx8350, praticamente il 40-50% di un 5960x.


ragazzi non capisco perchè vi ostinate a pensare che quel +40% della slide si riferisca alle prestazioni nel singolo thread, quando a chiari lettere c'è scritto CORE. E fino a prova contraria un core ZEN è in grado di gestire 2 thread.

cioè se un MODULO excavator va 100+87% per il CMT=187
un MODULO PileDriver fa circa 88+78%=156...
un CORE Zen fa "solo" 140
ora se facciamo 50-50, miglioramento nel ST e quello dovuto al SMT abbiamo 118 ST + 18% SMT.
Che è comunque tanta, tanta roba:
+35% nel ST e +60% a livello di core rispetto a piledriver, non sono briciole


Sempre da slide si attende un ulteriore +20-25%, praticamente se partiamo da Nehalem, AMD potrebbe raggiungere haswell con Zen+. Fosse il motivo di un TDP così basso è dovuto ai margini di miglioramento lato architettura che si preannunciano enormi. Partire con un 12core a livello commerciale potrebbe non essere una strategiacommerciale azzeccata, se il modello di punta successivo sarà solo un octa (SUPER) core.


Ancora se le prestazioni a livello di ipc fossero a livello di Nehalem, e meno di 3GHz è davvero difficile immaginarlo per una cpu di quella fascia. Vi rendete conto che quel "misero" +40% su excavator significa che grazie alla presenza del 33% di core in più, la soluzione di AMD è in grado di tallonare da molto vicino le attuali soluzioni esacore della concorrenza a una frazione del TDP. Se la frequenza fosse di 4GHz e/o l'ipc più vicino a quello di SB, annienterebbe il 5960x.

Secondo me, limitarsi a 3GHz per rientrare nei 95W di tdp non ha molto senso. Più verosimile che la frequenza di questa cpu si aggiri intorno ai 3,5-4GHz, ben più vicino alla soglia oltre la quale aumentare la frequenza per aumentare le prestazioni non è molto conveniente. Se tutto venisse confermato (lo scarso ipc ma unito ad una frequenza generosa per un octa-core) siamo di fronte ad un ottima/eccellente cpu

Se amd facesse una cpu del genere... dubito che potrei permettermela :(
ma zen competerebbe con il socket 2011 :)

;) ciauz

digieffe
13-08-2015, 01:08
1600X2 *8byte/canale = 25600MB/s

Se sono 100GB/s vuol dire che sono 4 canali a 64Bit, in teoria..


mi ero chiesto se avevo sbagliato


forse ho calcolato male la banda delle ddr4@3200 ?

non so perché ho pensato che ddr4 raddoppiava la banda a parità d mhz :D

davo30
13-08-2015, 01:19
600MHz in più per quello che si è visto con skylake, sembrano risultati fuori dalla portata di Intel al momento.

+40% non è sto gran numero. Si parla di prestazioni per core nella slide. Quindi in quel +40%, dobbiamo tener conto del contributo offerto dal SMT.. Le prestazioni nel ST aumenteranno per meno del 20% rispetto a excavator (che comunque già di suo viaggia abbondantemente oltre il 10% rispetto a Piledriver, sempre nel ST).
A conti fatti a livelli di ipc siamo negli intorni di Nehalem e Sandy bridge, poca cosa se contiamo che skylake va rispetto a SB mediamente il 20-25% in più.


Ha avuto difficoltà usando tutto il margine termico a disposizione. Pensa se si fosse limitata con i phenom a 95W..

la storia dei TDP maggiori non permesso da un processo produttivo mi sembra che non stia in piedi. I 28 nm hanno limitato un poco la frequenza di clock massima (il 7870K viaggia a 3,9GHz di base), ma nessuno vieta di raggiungere tdp maggiori aumentando il numero di unità di elaborazione che compongono la cpu. Le gpu, per fare un esempio terra-terra, arrivano a 300W.



Pero non tieni conto che le gpu le fabbrica (se non ricordo male) TSMC con i suoi 28nm, sia per Nvidia sia per AMD.
Probabilmente se AMD avesse avuto per le cpu un processo simile da parte di GF, avrebbe tirato fuori una APU Kaveri x6 in 125W

tuttodigitale
13-08-2015, 04:31
Pero non tieni conto che le gpu le fabbrica (se non ricordo male) TSMC con i suoi 28nm, sia per Nvidia sia per AMD.
Probabilmente se AMD avesse avuto per le cpu un processo simile da parte di GF, avrebbe tirato fuori una APU Kaveri x6 in 125W
i 28nm di GF si sono rivelati ben più prestanti di quelli di TSMC: il clock è aumentato fino al 60%
http://www.anandtech.com/show/7974/amd-beema-mullins-architecture-a10-micro-6700t-performance-preview/2
a onor del vero. non tutto è merito del silicio. Tuttavia dubito fortemente che i 28nm di GF siano peggiori di TSMC

Se pensiamo che un a10-7800 ha un tdp di 65w, e impostandolo a 45W va (a memoria) come un i3-2100 consumando 10W in meno, si evince che i 28nm già un anno e mezzo fa erano buoni per un steamroller x10 o addirittura x12

visto che non so quasi nulla del pp 14 mnm di itel secondo te a che frequenza potrebbe arrivare il prox X8 (tendendo conto che ora è a 3.0 di freq base) ?
premetto che non ho letto molte recensioni su skylake: i consumi e le frequenze sono rimasti praticamente invariati da haswell, l'unico vantaggio dei 14nm è l'architettura skylake.
certo la situazione potrebbe migliorare, ma 3,6GHz mi sembra davvero troppo al momento.

mi sono perso le slide dell'ulteriore +20-25% Zen+ dove le posso recuperare?

la slide è sempre quella dove viene indicato un aumento di ipc del 40% per ZEN, in effetti avrei dovuto scrivere mi aspetto un +20%,

mi sono basato sulle frecce: il coefficiente angolare della freccia di zen+ è 2,5 maggiore di quello di bd-xv . Moltiplichiamo questo fattore per la percentuale media di miglioramento da un architettura bulldozer all'altra e otteniamo il mio numerino. Anche se mi rendo conto che quelle frecce non hanno poi tutto questo significato, dovrebbero essere comunque indicative sul fatto che l'aumento di ipc sarà costantemente a doppia cifra. E miglioramenti di tale entità si possono avere solo con un'architettura che non ha un ipc molto elevato, imho


Poi l'HT, Intel è arrivato al +30% massimi in 15 anni, AMD alla prima botta quanto potrebbe fare?
il problema del HT è stato principalmente di natura software. Comunque se ht migliora poco le prestazioni vuol dire che le prestazioni ST saranno più elevate.


È per questo che penso che se Zen è ancora modulare, l'esperienza acquisita potrebbe far sì che l'HT sia condiviso tra tutti i core del modulo.
Una cosa del genere potrebbe si aumentare l'IPC di un core, ma non da incrementare più di tanto il TDP del modulo.
di condiviso sembra che sia rimasta solo la cache l3
Per quanto possa sembrare strano credo che ZEN per quanto sia nuovo fondi le sue radici in excavator.
Ad ogni step abbiamo assistito alla riduzione delle risorse condivise L'unico elemento rimasto in auge è stata la FPu. Siamo passati da un front-end in grado di gestire 2 thread in due cicli di clock, ad uno in grado di gestirne due in un solo ciclo. Il front-end di excavator/steamroller è assolutamente sovradimensionato a quello che possono fare le sole due alu.
Secondo me sono proprio le risorse di elaborazione ad essere diventate il collo di bottiglia. Infatti da slide da 4 pipeline siamo passati a 6 (avevo detto +50%, sono un profeta :O ), le pipeline della fpu sono tre esattamente come in steamroller/excavator, ma con la differenza sostanziale che sono a 256 bit e soprattutto sono una per singolo core.
Di per sè quindi la FPU non dovrebbe fare meglio della vecchia con il vecchio codice salvo il fatto non di poco conto che saranno 8 invece di 4 (praticamente il throughput sarà doppio con le avx 128 e quadruplo con le avx 256).

Per quanto possa essere suggestiva l'idea che AMD abbia progettato ZEN da zero, è praticamente impossibile che sia così, e pertanto non mi aspetto stravolgimenti nel ST , anche se i miglioramenti non saranno certo marginali rispetto a PD.


http://cdn.wccftech.com/wp-content/uploads/2015/08/7e42c9447e754167c85105ffe1a1d866_L.jpg
questa notizia mi fa pensare che HSA a livello HW avrà raggiunto la piena maturità entro due anni. La gpu è a dir poco mostruosa per essere una integrata: 4Tflops+, praticamente una r9 280x, altro che ps4 che si ferma a 1,84...(ps ci ho azzeccato anche in questo caso :eek:
E poi l’utilizzo delle HBM risolve la questione di un ulteriore e probabilmente inevitabile cache condivisa da più moduli ZEN.

Se amd facesse una cpu del genere... dubito che potrei permettermela :(
ma zen competerebbe con il socket 2011 :)

;) ciauz
quella cpu (excavator x16 4 GHz) non esiste, ma è solo frutto di fantasia purtroppo, e nonostante ciò molti, a quanto pare, sarebbero pronti a criticarla.

digieffe
13-08-2015, 05:18
...cut...

ho rifatto un po' di conti in modo più "preciso"

fatto 100 l'ipc di sandy bridge skylake ha 122 (c'è tutto su anand articolo su skylake, io ho preso una serie di applicazioni "medie" altrimenti si va dal 105 a 150)

fatto 100 l'ipc di skylake, l' 8350 (piledriver) ha da 50 a 54 di ipc (anand sezione benchmark), prederò in considerazione 52 (media)

fatto 100 excavator abbiamo 88 piledriver (fonte tuttodigitale, spero che hai fatto bene i conti :D, scherzo) ed 82 buldozer (a memoria 7%)


normalizzando il tutto su skylake a 100, abbiamo sandy bridge a 82, excavator a 59, piledriver a 52 e bulldozer a 48.5.

faccio 2 ipotesi che possono essere la pessimistica e la ottimistica, nell'ordine:
- excavator 59 + 20% = 71% di skylake
- excavator 59 + 40% = 83% di skylake

mi auguro che la tua ipotesi del +20% sul tread non si verifichi, perché non sarebbe molto lontana dal 60% di buldozer al debutto vs sandy bridge

spero che sia qualcosa di più tendente al 40%


EDIT:

mi auguro

- excavator 59 + 31% = 77% di skylake con un HT scarso da +7%


EDIT2:il fatto che hanno aumentato del 50% le unità di esecuzione mi fa sperar in un aumento oltre il 20%

anche perché l'HT non permette di sftuttare quelle unità quanto è già in esecuzione un thread ma solo quando questo va in stallo allora le impegna tutte


EDIT3: ricordiamoci che l'ipc di intel compreso di ht è 130 :-/

digieffe
13-08-2015, 05:51
altre due parole sui modelli con i quali si andrebbe a scontrare Zen:

broadwell-e 8/16@~3.4ghz 140w -> 5775c@3.3 65w x 2
broadwell-e 6/12@~4.0ghz 140w -> 6770k@4.0 91w x 1.5

digieffe
13-08-2015, 06:03
quindi facendo il paragone con skylake avremmo

skylake 6/12 ipc(ht) 1.30 x 6 = 7.80
zen ..... 8/16 ipc(ht) 0.83 x 8 = 6.64
excavator 12/12 ipc 0.55 x 12 = 6.60 (solo a tilolo di confronto, 55 perché attivi 2 core del modulo)
skylake 5/10 ipc(ht) 1.30 x 5 = 6.50 (ipotetico a titolo di confronto)
skylake 4/8 ..ipc(ht) 1.30 x 4 = 5.20


a parità di frequenza si posizionerebbe a metà tra un 4/8 ed un 6/12 intel skylake, ma anche se fosse un broadwell non raggiungerebbe il 6/12.


qualcuno l'ha già detto andrebbe come un 5 core skylake ma con ben 16 thead :-/




dove ho sbagliato il ragionamento?

george_p
13-08-2015, 09:46
Ma è già stata postata questa slide ?



Queste slide non sono di amd, se ne è parlato mesi fa quando uscirono e sul sito tedesco amd smentì queste roadmap.

Free Gordon
13-08-2015, 10:01
ho rifatto un po' di conti in modo più "preciso"
fatto 100 l'ipc di sandy bridge skylake ha 122 (c'è tutto su anand articolo su skylake, io ho preso una serie di applicazioni "medie" altrimenti si va dal 105 a 150)
fatto 100 l'ipc di skylake, l' 8350 (piledriver) ha da 50 a 54 di ipc (anand sezione benchmark), prederò in considerazione 52 (media)
fatto 100 excavator abbiamo 88 piledriver (fonte tuttodigitale, spero che hai fatto bene i conti :D, scherzo) ed 82 buldozer (a memoria 7%)
normalizzando il tutto su skylake a 100, abbiamo sandy bridge a 82, excavator a 59, piledriver a 52 e bulldozer a 48.5.
faccio 2 ipotesi che possono essere la pessimistica e la ottimistica, nell'ordine:
- excavator 59 + 20% = 71% di skylake
- excavator 59 + 40% = 83% di skylake
mi auguro che la tua ipotesi del +20% sul tread non si verifichi, perché non sarebbe molto lontana dal 60% di buldozer al debutto vs sandy bridge
spero che sia qualcosa di più tendente al 40%
EDIT:
mi auguro
- excavator 59 + 31% = 77% di skylake con un HT scarso da +7%
EDIT2:il fatto che hanno aumentato del 50% le unità di esecuzione mi fa sperar in un aumento oltre il 20%
anche perché l'HT non permette di sftuttare quelle unità quanto è già in esecuzione un thread ma solo quando questo va in stallo allora le impegna tutte
EDIT3: ricordiamoci che l'ipc di intel compreso di ht è 130 :-/


Quindi uno Zen con un IPC in ST di poco superiore a Sandy Bridge? :)
Non sarebbe male se consumasse meno di skylake, a parità di frequenza.
Con un incremento del 10% nella frequenza, rispetto ai concorrenti Intel, e un prezzo adeguato... AMD avrebbe finalmente una cpu abbastanza competitiva su desktop (ma anche mobile). E nel futuro prossimo con i nuovi link inter-cpu, anche su server...

george_p
13-08-2015, 10:25
+40% non è sto gran numero. Si parla di prestazioni per core nella slide. Quindi in quel +40%, dobbiamo tener conto del contributo offerto dal SMT.. Le prestazioni nel ST aumenteranno per meno del 20% rispetto a excavator (che comunque già di suo viaggia abbondantemente oltre il 10% rispetto a Piledriver, sempre nel ST).
A conti fatti a livelli di ipc siamo negli intorni di Nehalem e Sandy bridge, poca cosa se contiamo che skylake va rispetto a SB mediamente il 20-25% in più.


Da poco pensavo proprio a questo fatto.
Ma non avendo dati ufficiali non possiamo certo inventarci affermazioni di questo tipo.
Come facciamo a sapere che nel 40% è incluso l'SMT?

Ossia, nei processori intel l'HT funziona in questo modo? Cioè, l'ipc elevato per core è dato anche dall'aumento dell'HT?

Quindi senza HT anche in single thread un core intel perde ipc?

Personalmente penso che se con Zen nel 40% di ipc in più rispetto a Excavator ci sia un 20% dato dall'SMT allora questo SMT è davvero penoso.
Ma poi mi viene in mente che la percentuale del lavoro svolto dal core virtuale vari da applicazione a applicazione visto anche nei processori intel dove con cinebench ad es si arriva ad un buon 50% di prestazione in più in aggiunta al/ai core fisico/i.

Altra considerazione che forse va tenuta molto in conto.
Prendiamo un processore quadcore della serie Phenom II, prendiamo il suo risultato con cinebench ad es. (cito sempre cinebench perché sfrutta al massimo tutti i cores), prendiamo il 975 a 3,6 GHz che con cinebench 11,5 restituisce circa 1,10 in ST e 4,25 in MT.

Ora, prendendo il 7850K che ha 100 mhz in più e restituisce sempre in cinebench rispettivamente circa 1 e 3,6 ci manca sapere quanto lo supera un Excavator di pari frequenza. Ovviamente intendo un Excavator desktop che ancora non è uscito ;)

Ma ipotizziamo che l'aumento sia come molti affermano di un 10%, avremo circa i risultati del phenom 975 al quale aggiungiamo quella potenza del 40% e un quadcore Zen non arriva a quella stessa frequenza di 3,6 GHz nemmeno a eguagliare l'esacore amd Thuban.

Fatevi un pò i conti voi se Zen è davvero competitivo con un 40% inclusivo del valore aggiuntivo dato dall'SMT.

Attenzione, non sto dicendo che non sia come dite voi ma solo che se così fosse di competitivo non ha proprio nulla ad oggi :)

digieffe
13-08-2015, 10:25
Quindi uno Zen con un IPC in ST di poco superiore a Sandy Bridge? :)
Non sarebbe male se consumasse meno di skylake, a parità di frequenza.
Con un incremento del 10% nella frequenza, rispetto ai concorrenti Intel, e un prezzo adeguato... AMD avrebbe finalmente una cpu abbastanza competitiva su desktop (ma anche mobile). E nel futuro prossimo con i nuovi link inter-cpu, anche su server...

dipende dall'interpretazione se ipc a core o a thread.
io propendo per quella a core (che è stata proposta da tuttodigitale) cioè thread normale + thread ht > sandy bridge senza ht.

però sinceramente spero che non sia così, oppure che il contributo dell'ht in questa prima versione amd sia acerbo es +7% e quindi il resto dell'ipc sia per all'esecuzione del singolo thread..
spero di non essermi spiegato male

Piedone1113
13-08-2015, 17:02
Da poco pensavo proprio a questo fatto.
Ma non avendo dati ufficiali non possiamo certo inventarci affermazioni di questo tipo.
Come facciamo a sapere che nel 40% è incluso l'SMT?

Ossia, nei processori intel l'HT funziona in questo modo? Cioè, l'ipc elevato per core è dato anche dall'aumento dell'HT?

Quindi senza HT anche in single thread un core intel perde ipc?

Personalmente penso che se con Zen nel 40% di ipc in più rispetto a Excavator ci sia un 20% dato dall'SMT allora questo SMT è davvero penoso.
Ma poi mi viene in mente che la percentuale del lavoro svolto dal core virtuale vari da applicazione a applicazione visto anche nei processori intel dove con cinebench ad es si arriva ad un buon 50% di prestazione in più in aggiunta al/ai core fisico/i.

Altra considerazione che forse va tenuta molto in conto.
Prendiamo un processore quadcore della serie Phenom II, prendiamo il suo risultato con cinebench ad es. (cito sempre cinebench perché sfrutta al massimo tutti i cores), prendiamo il 975 a 3,6 GHz che con cinebench 11,5 restituisce circa 1,10 in ST e 4,25 in MT.

Ora, prendendo il 7850K che ha 100 mhz in più e restituisce sempre in cinebench rispettivamente circa 1 e 3,6 ci manca sapere quanto lo supera un Excavator di pari frequenza. Ovviamente intendo un Excavator desktop che ancora non è uscito ;)

Ma ipotizziamo che l'aumento sia come molti affermano di un 10%, avremo circa i risultati del phenom 975 al quale aggiungiamo quella potenza del 40% e un quadcore Zen non arriva a quella stessa frequenza di 3,6 GHz nemmeno a eguagliare l'esacore amd Thuban.

Fatevi un pò i conti voi se Zen è davvero competitivo con un 40% inclusivo del valore aggiuntivo dato dall'SMT.

Attenzione, non sto dicendo che non sia come dite voi ma solo che se così fosse di competitivo non ha proprio nulla ad oggi :)
Non sfrutta affatto al massimo tutti i core.
Cinebench, come gli altri software di rendering possono dividere la scena in più parti ed affidarne l'elaborazione a più core, ma l'ht porta vantaggi perché il core è sfruttato al 60% del suo potenziale massimo teorico.
Ci sono troppe dipendenze sequenziali nel codice (aspetti prima l'orientamento della superfice, poi il colore, la riflessione, l'ombra ecc) ed ad aspettare questi risultati l'ht usa la parti inutilizzate per migliorare l'efficienza.
Ma ci sono software multith che con ht attivo hanno un + 10% di prestazioni, mentre qualcuno un -2% (meno 2 ) addirittura.
questi software usano continuamente sempre le stesse parti di cpu lasciando all'ht poco o nulla da poter usare.
Se hanno fatto una media dei software usati normalmente nei benchmark al +40% di ipc dato dal th+th1 (core fisico + virtuale) andrebbe tolto un 12% per avere una approssimazione realistica sull'ipc del singolo core fisico.
Se invece il +40% è riferito ai GFlop massimi teorici, è un discorso completamente differente con ipc che può variare a seconda dell'applicazione da 0% a + 100% sul singolo core, ma senza un riferimento certo si parla solo di congetture e tutti i calcoli sono potenzialmente errati o giusti.

digieffe
13-08-2015, 17:14
un'altra piccola riflessione:

a livello di cpu (per quanto se ne sa ora) uno Zen a parità di frequenza andrebbe come uno skylake 5 core.
nella peggiore delle ipotesi uno Zen@3.2 (3.2 ottenibili anche con un pessimo silicio) andrebbe come un 6770k il tutto a 95w di tpd ed immagino comprensiva di igp.

tutto sommato non sarebbe male anche se si ripeterebbe la storia "doppio dei core"

il che significherebbe che avrebbe ragginto la stessa efficienza energetica di intel (lo aveva detto già tuttodigitale)

shellx
13-08-2015, 19:04
un'altra piccola riflessione:

a livello di cpu (per quanto se ne sa ora) uno Zen a parità di frequenza andrebbe come uno skylake 5 core.
nella peggiore delle ipotesi uno Zen@3.2 (3.2 ottenibili anche con un pessimo silicio) andrebbe come un 6770k il tutto a 95w di tpd ed immagino comprensiva di igp.

tutto sommato non sarebbe male anche se si ripeterebbe la storia "doppio dei core"

il che significherebbe che avrebbe ragginto la stessa efficienza energetica di intel (lo aveva detto già tuttodigitale)

Ma cosa intendi per Skylake 5 core ? L' i7-6700K ha 4 core fisici + 4 logici (8threads) con un clock di 4ghz (in turbo 4,2). Io come altri non lo so che cosa sarà Zen, per questo motivo è difficile fare calcoli, ma davvero non mi illudo che esso possa arrivare ad affiancarsi alle top-cpu skylake del socket 1151. Io mi accontento se (sempre in ST parlando) si avvicini ad Haswell/Broadwell socket 1150. Il socket 2011-3, quello basato sul chipset X99 neppure lo tengo in considerazione. Anche perchè come ha gia detto qualcun'altro se davvero per ipotesi più assurda dovesse veramente tallonare quella fascia di mercato di Intel...scordatevi le cpu amd ad un max di 250$ a scendere. Si parlerà poi di chip che partiranno da 400$ a salire. E non saranno più accessibili a tutti. Accadrà che alcuni di chi oggi ha gli FX passerà alla fascia APU più bassa. E solo quelli che potranno si prenderanno lo Zen sul socket AM4 (proprio come accade con i clienti Intel '1150/1151 vs 2011-3/2011-3').
Tuttavia però sarà una cinquina al superenalotto per Paolo. Lui sarà sicuramente il primo nel forum ad avere il chippone di Zen al day-one sul mostro sacro top di gamma di Asus come mobo :D

(ironicamente ma con rispetto parlando) ;)

isomen
13-08-2015, 19:40
Ma cosa intendi per Skylake 5 core ? L' i7-6700K ha 4 core fisici + 4 logici (8threads) con un clock di 4ghz (in turbo 4,2). Io come altri non lo so che cosa sarà Zen, per questo motivo è difficile fare calcoli, ma davvero non mi illudo che esso possa arrivare ad affiancarsi alle top-cpu skylake del socket 1151. Io mi accontento se (sempre in ST parlando) si avvicini ad Haswell/Broadwell socket 1150. Il socket 2011-3, quello basato sul chipset X99 neppure lo tengo in considerazione. Anche perchè come ha gia detto qualcun'altro se davvero per ipotesi più assurda dovesse veramente tallonare quella fascia di mercato di Intel...scordatevi le cpu amd ad un max di 250$ a scendere. Si parlerà poi di chip che partiranno da 400$ a salire. E non saranno più accessibili a tutti. Accadrà che alcuni di chi oggi ha gli FX passerà alla fascia APU più bassa. E solo quelli che potranno si prenderanno lo Zen sul socket AM4 (proprio come accade con i clienti Intel '1150/1151 vs 2011-3/2011-3').
Tuttavia però sarà una cinquina al superenalotto per Paolo. Lui sarà sicuramente il primo nel forum ad avere il chippone di Zen al day-one sul mostro sacro top di gamma di Asus come mobo :D

(ironicamente ma con rispetto parlando) ;)

E' quello che spero anche io, ma...
in MT saranno 8 core fisici + SMT contro 4 core fisici + HT
quindi nn é utopistico sperare che stia dabanti anche a skylake (almeno in questa sua prima incarnazione) nel multitrhead

sperando che quel +40% sia reale, come dicevi te, mi sembra che la speranza di tutti sia che l'SMT incrementi poco le prestazioni... perchè più incrementa lui e meno é l'aumento d'IPC, quindi nn sono il solo a pensare che per recuperare serve un IPC alto :)

;) ciauz

Piedone1113
13-08-2015, 19:41
Ma cosa intendi per Skylake 5 core ? L' i7-6700K ha 4 core fisici + 4 logici (8threads) con un clock di 4ghz (in turbo 4,2). Io come altri non lo so che cosa sarà Zen, per questo motivo è difficile fare calcoli, ma davvero non mi illudo che esso possa arrivare ad affiancarsi alle top-cpu skylake del socket 1151. Io mi accontento se (sempre in ST parlando) si avvicini ad Haswell/Broadwell socket 1150. Il socket 2011-3, quello basato sul chipset X99 neppure lo tengo in considerazione. Anche perchè come ha gia detto qualcun'altro se davvero per ipotesi più assurda dovesse veramente tallonare quella fascia di mercato di Intel...scordatevi le cpu amd ad un max di 250$ a scendere. Si parlerà poi di chip che partiranno da 400$ a salire. E non saranno più accessibili a tutti. Accadrà che alcuni di chi oggi ha gli FX passerà alla fascia APU più bassa. E solo quelli che potranno si prenderanno lo Zen sul socket AM4 (proprio come accade con i clienti Intel '1150/1151 vs 2011-3/2011-3').
Tuttavia però sarà una cinquina al superenalotto per Paolo. Lui sarà sicuramente il primo nel forum ad avere il chippone di Zen al day-one sul mostro sacro top di gamma di Asus come mobo :D

(ironicamente ma con rispetto parlando) ;)

Ma questo è lapalissiano:
Se la struttura zen va bene le apu (con core zen ) prenderanno il posto di BD fx.
Poco importa se un ipotetico A10 va come un i5 1151 con prezzo leggermente inferiore e socket FM3 (o FM4).
Se poi crediamo che sia meglio avere la piattaforma top di AMD con prestazioni prezzo da I3 Intel...
Vorrei vedere una cpu AMD che vada il doppio del top 2011 e che costi una volta e mezzo.
Va da se che una ipotetica cpu amd che si inserisca come prestazioni tra 1151 e 2011 avrà un prezzo che sarà simile al top cpu 1151 di intel, e così per un i5 o i3 o Pentium.
Ed onestamente non mi interessa che socket sia.

Amorph
13-08-2015, 19:45
Ma cosa intendi per Skylake 5 core ? L' i7-6700K ha 4 core fisici + 4 logici (8threads) con un clock di 4ghz (in turbo 4,2). Io come altri non lo so che cosa sarà Zen, per questo motivo è difficile fare calcoli, ma davvero non mi illudo che esso possa arrivare ad affiancarsi alle top-cpu skylake del socket 1151. Io mi accontento se (sempre in ST parlando) si avvicini ad Haswell/Broadwell socket 1150. Il socket 2011-3, quello basato sul chipset X99 neppure lo tengo in considerazione. Anche perchè come ha gia detto qualcun'altro se davvero per ipotesi più assurda dovesse veramente tallonare quella fascia di mercato di Intel...scordatevi le cpu amd ad un max di 250$ a scendere. Si parlerà poi di chip che partiranno da 400$ a salire. E non saranno più accessibili a tutti. Accadrà che alcuni di chi oggi ha gli FX passerà alla fascia APU più bassa. E solo quelli che potranno si prenderanno lo Zen sul socket AM4 (proprio come accade con i clienti Intel '1150/1151 vs 2011-3/2011-3').
Tuttavia però sarà una cinquina al superenalotto per Paolo. Lui sarà sicuramente il primo nel forum ad avere il chippone di Zen al day-one sul mostro sacro top di gamma di Asus come mobo :D

(ironicamente ma con rispetto parlando) ;)

ma Zen non dovrebbe uscire il prossimo anno inoltrato? se è così non mi sembra tanto sperare che vada per lo meno come uno skylake appena uscito e più o meno 1 anno dopo o giù di li, almeno io spererei che va ben di più di così, sennò sarebbe già troppo indietro rispetto alle prossime cpu della concorrenza o sbaglio?

Piedone1113
13-08-2015, 19:46
E' quello che spero anche io, ma...
in MT saranno 8 core fisici + SMT contro 4 core fisici + HT
quindi nn é utopistico sperare che stia dabanti anche a skylake (almeno in questa sua prima incarnazione) nel multitrhead

sperando che quel +40% sia reale, come dicevi te, mi sembra che la speranza di tutti sia che l'SMT incrementi poco le prestazioni... perchè più incrementa lui e meno é l'aumento d'IPC, quindi nn sono il solo a pensare che per recuperare serve un IPC alto :)

;) ciauz
L'SMT deve per forza di cose dare un boost medio di +18% almeno sull'mt.
Altrimenti spendere tra 8 e 10% di transistor in più a core sarebbe antieconomico.
Ps più è alto l'ipc per core più guadagna l'smt.
Un smt che da poco ha di base un ipc per core basso (se ogni ciclo non utile, e ci devono essere per forza come dimostrano i test su cinebench, offre un recupero di ipc basso significa che è basso l'ipc di partenza)

digieffe
13-08-2015, 19:53
Ma cosa intendi per Skylake 5 core ? L' i7-6700K ha 4 core fisici + 4 logici (8threads) con un clock di 4ghz (in turbo 4,2). Io come altri non lo so che cosa sarà Zen, per questo motivo è difficile fare calcoli, ma davvero non mi illudo che esso possa arrivare ad affiancarsi alle top-cpu skylake del socket 1151. Io mi accontento se (sempre in ST parlando) si avvicini ad Haswell/Broadwell socket 1150. Il socket 2011-3, quello basato sul chipset X99 neppure lo tengo in considerazione. Anche perchè come ha gia detto qualcun'altro se davvero per ipotesi più assurda dovesse veramente tallonare quella fascia di mercato di Intel...scordatevi le cpu amd ad un max di 250$ a scendere. Si parlerà poi di chip che partiranno da 400$ a salire. E non saranno più accessibili a tutti. Accadrà che alcuni di chi oggi ha gli FX passerà alla fascia APU più bassa. E solo quelli che potranno si prenderanno lo Zen sul socket AM4 (proprio come accade con i clienti Intel '1150/1151 vs 2011-3/2011-3').
Tuttavia però sarà una cinquina al superenalotto per Paolo. Lui sarà sicuramente il primo nel forum ad avere il chippone di Zen al day-one sul mostro sacro top di gamma di Asus come mobo :D

(ironicamente ma con rispetto parlando) ;)

si quei calcoletti li ho fatti più per me e se ha voglia di verificare che non ho fatto errori tuttodigitale.

semplificando al massimo:

in base alle sole informazioni attualmente disponibili ,uno Zen in MT, a parità di clock, dovrebbe andare come un ipotetico 6700k a 5 core/10 thread in altre parole il 25% più veloce.

se Zen dovesse avere una frequenza più bassa di 4.0ghz, quel core di vantaggio si andrebbe ad erodere fino al punto che Zen @3.2 = 6700k@4.0.


tutto ciò per dire che zen si andrà a porre in concorrenza col socket "piccolo" di intel.



EDIT: speravo potesse andare a fare concorrenza alla fascia 6 core di intel :(

dav1deser
13-08-2015, 19:53
ma Zen non dovrebbe uscire il prossimo anno inoltrato? se è così non mi sembra tanto sperare che vada per lo meno come uno skylake appena uscito e più o meno 1 anno dopo o giù di li, almeno io spererei che va ben di più di così, sennò sarebbe già troppo indietro rispetto alle prossime cpu della concorrenza o sbaglio?

Guarda le recenti evoluzioni Intel e ti rendi conto che non sarebbe troppo indietro: da Sandy Bridge in poi ogni nuova CPU Intel ha portato si e no un 5% in più di prestazioni (a livello desktop), quindi essere indietro di un anno vuol dire essere indietro di un 5%. Facilmente giustificabile con prezzi leggermente più bassi.

Amorph
13-08-2015, 20:03
Guarda le recenti evoluzioni Intel e ti rendi conto che non sarebbe troppo indietro: da Sandy Bridge in poi ogni nuova CPU Intel ha portato si e no un 5% in più di prestazioni (a livello desktop), quindi essere indietro di un anno vuol dire essere indietro di un 5%. Facilmente giustificabile con prezzi leggermente più bassi.

si ma non la vedo una cosa molto positiva uscire nel 2016 inoltrato e andare anche il 5% in meno di una cpu uscita ad agosto 2015, ma è un mio modo di vedere personale, poi come hai detto tutto è facilmente gestibile con i prezzi

poi quanti core dovrebbe avere Zen, 4, 8 o di più?:)

se ne avrebbe 8 o di più penso che dovrebbe competere con la 2011 e gli esacore almeno, distaccando gli skylake

paolo.oliva2
13-08-2015, 23:52
Comunque va bene parlare di confronto di IPC, ma la situazione reale è differente perché il valore reale è IPC * frequenza.
Esempio, se parliamo che un 5960X ha un IPC doppio rispetto a Piledriver (non lo so di preciso, ma butto li un valore) bisogna anche tenere in considerazione che un 8350 ha una frequenza def del 33% superiore e che il reale divario non è quello dell'IPC ma inferiore del 33%.

Io non so quale frequenza permetterà il nuovo 14/16nm. Mi pare ovvio che non andrà a 5GHz semplicemente perché con un core Excavator che dovrebbe avere il 20/25% in più di IPC rispetto a Piledriver (Steamroller era già al +10,5%}, con una frequenza di 5GHz avrebbe il 50% di performance rispetto a Piledriver, quindi spendere su Zen si sarebbe evitato.

Però mi sembra che tutti siano unanimi nel dire che il 14nm difficilmente porterà un 5960X a 3,5GHz def (e già comunque sarebbe un +17% rispetto ad ora). Se però continuiamo a confrontare unicamente l'IPC, onestamente il conto è sfasato e non di poco, perché nella parte AMD io reputerei un fallimento frequenze sotto i 4GHz def per 8 core. È chiaro che 500MHz in più di frequenza è come avere un IPC del 17% più alto e per fare un esempio, sarebbe come segare l'intero guadagno di Steamroller ed Excavator e di parlare ancora di Piledriver.... Mica una virgola.

isomen
14-08-2015, 00:06
si ma non la vedo una cosa molto positiva uscire nel 2016 inoltrato e andare anche il 5% in meno di una cpu uscita ad agosto 2015, ma è un mio modo di vedere personale, poi come hai detto tutto è facilmente gestibile con i prezzi

poi quanti core dovrebbe avere Zen, 4, 8 o di più?:)

se ne avrebbe 8 o di più penso che dovrebbe competere con la 2011 e gli esacore almeno, distaccando gli skylake

Dovrebbe avere 8 core e gestire 16 thread, ma un -5% in ST potrebbe significare che in MT stà sopra... e nn sarebbe male, adesso in ST le cpu amd quanto sono sotto a quelle intel, 20/30/40% :confused:

sperare che rivaleggino con le cpu sckt 2011 mi sembra utopistico :boh:

;) ciauz

paolo.oliva2
14-08-2015, 00:19
Ma cosa intendi per Skylake 5 core ? L' i7-6700K ha 4 core fisici + 4 logici (8threads) con un clock di 4ghz (in turbo 4,2). Io come altri non lo so che cosa sarà Zen, per questo motivo è difficile fare calcoli, ma davvero non mi illudo che esso possa arrivare ad affiancarsi alle top-cpu skylake del socket 1151. Io mi accontento se (sempre in ST parlando) si avvicini ad Haswell/Broadwell socket 1150. Il socket 2011-3, quello basato sul chipset X99 neppure lo tengo in considerazione. Anche perchè come ha gia detto qualcun'altro se davvero per ipotesi più assurda dovesse veramente tallonare quella fascia di mercato di Intel...scordatevi le cpu amd ad un max di 250$ a scendere. Si parlerà poi di chip che partiranno da 400$ a salire. E non saranno più accessibili a tutti. Accadrà che alcuni di chi oggi ha gli FX passerà alla fascia APU più bassa. E solo quelli che potranno si prenderanno lo Zen sul socket AM4 (proprio come accade con i clienti Intel '1150/1151 vs 2011-3/2011-3').
Tuttavia però sarà una cinquina al superenalotto per Paolo. Lui sarà sicuramente il primo nel forum ad avere il chippone di Zen al day-one sul mostro sacro top di gamma di Asus come mobo :D

(ironicamente ma con rispetto parlando) ;)

Bah... Se devo essere sincero, se dovessi pagare uno Zen X8 top di gamma 600€ o più e stare sotto ad un 5960X, non avrebbe senso. Una moto 2011-3 è fuori di testa con tutti i gadget, la CF-5 z costa un pacco a confronto per quello che offre.
L'unica cosa è che devo provare se con la mia soluzione posso tenere almeno i 140W TDP in Africa... Poi posso anche passare ad Intel prima di Zen.

P. S.
Lo so che hai competenza ed esperienza, ma non mi giudicare uno svasato figlio di papà se acquisto Asus top di gamma. Di modo nel tempo le ho provate tutte, ed a parte una marca di cui non ricordo il nome (ma non esiste più), Asus è quella che alla fine è fatta meglio, anche se a prezzi da ladri. Ma tutto rientra (e a mio avviso giustifica) il mio "dibertimento". Non puoi fare bench >5,2GHz se l'alimentazione è insufficiente, e a che mi servirebbe impianto a liquido/Watch per acquari polari e quant'altro per benchare a4,5GHz? Per me è un divertimento... Alla fine 50€ in più nel procione X8 top anziché entry-level e 50€ in più nella mobo sono 100€ in più,
Cacchio, ma pensa quanto money ho risparmiato tra divertirmi con AMD ed invece Intel. Se penso alle vagonate di mobo e provi cambiati ogni 6 mesi, a quest'ora starei pagando ancora i mutui (non è una beccata di sarcasmo, ma acquistare THUBAN/8150/81350 e prox 8370, il tutto con relative mobo, altro che 2600k, 3770k 4790 e probabile 2011 X6/X8)

digieffe
14-08-2015, 00:26
Dovrebbe avere 8 core e gestire 16 thread, ma un -5% in ST potrebbe significare che in MT stà sopra... e nn sarebbe male, adesso in ST le cpu amd quanto sono sotto a quelle intel, 20/30/40% :confused:

sperare che rivaleggino con le cpu sckt 2011 mi sembra utopistico :boh:

;) ciauz

ok che i miei post sono pesanti :D e ma ho fatto la tabellina:

normalizzando il tutto su skylake a 100, abbiamo sandy bridge a 82, excavator a 59, piledriver a 52 e bulldozer a 48.5

sempre che i miei conti e quelli di tuttodigitale (dal quale ho preso la parte relativa ai rapporti tra le architetture amd) siano esatti

digieffe
14-08-2015, 00:31
Però mi sembra che tutti siano unanimi nel dire che il 14nm difficilmente porterà un 5960X a 3,5GHz def

come già scritto:
broadwell-e 8/16@~3.4ghz 140w -> 5775c@3.3 65w x 2
broadwell-e 6/12@~4.0ghz 140w -> 6770k@4.0 91w x 1.5

secondo me il prossimo 8 core di intel sarà @3.4 ( e cmq non meno di 3.3) ed il prossimo 6 core sarà @4.0

già esistono quelle cpu (che tra l'altro hanno pure la gpu) basta moltiplicare il numero dei core

digieffe
14-08-2015, 00:34
Comunque va bene parlare di confronto di IPC, ma la situazione reale è differente perché il valore reale è IPC * frequenza.
Esempio, se parliamo che un 5960X ha un IPC doppio rispetto a Piledriver (non lo so di preciso, ma butto li un valore) bisogna anche tenere in considerazione che un 8350 ha una frequenza def del 33% superiore e che il reale divario non è quello dell'IPC ma inferiore del 33%.

Io non so quale frequenza permetterà il nuovo 14/16nm. Mi pare ovvio che non andrà a 5GHz semplicemente perché con un core Excavator che dovrebbe avere il 20/25% in più di IPC rispetto a Piledriver (Steamroller era già al +10,5%}, con una frequenza di 5GHz avrebbe il 50% di performance rispetto a Piledriver, quindi spendere su Zen si sarebbe evitato.

Però mi sembra che tutti siano unanimi nel dire che il 14nm difficilmente porterà un 5960X a 3,5GHz def (e già comunque sarebbe un +17% rispetto ad ora). Se però continuiamo a confrontare unicamente l'IPC, onestamente il conto è sfasato e non di poco, perché nella parte AMD io reputerei un fallimento frequenze sotto i 4GHz def per 8 core. È chiaro che 500MHz in più di frequenza è come avere un IPC del 17% più alto e per fare un esempio, sarebbe come segare l'intero guadagno di Steamroller ed Excavator e di parlare ancora di Piledriver.... Mica una virgola.

ho già scritto:

a livello di cpu (per quanto se ne sa ora) uno Zen a parità di frequenza andrebbe come uno skylake 5 core.
nella peggiore delle ipotesi uno Zen@3.2 (3.2 ottenibili anche con un pessimo silicio) andrebbe come un 6770k il tutto a 95w di tpd ed immagino comprensiva di igp.


ma mi avete tutti nella ignore list :D :D :D

digieffe
14-08-2015, 00:38
Bah... Se devo essere sincero, se dovessi pagare uno Zen X8 top di gamma 600€ o più e stare sotto ad un 5960X, non avrebbe senso.
IMHO in un caso medio Zen top di gamma 95w andrà un pelino più di un 6770k e costerà 3/4 di quest'ultimo :)

isomen
14-08-2015, 00:48
ok che i miei post sono pesanti :D e ma ho fatto la tabellina:



sempre che i miei conti e quelli di tuttodigitale (dal quale ho preso la parte relativa ai rapporti tra le architetture amd) siano esatti

Io leggo con piacere sia i tuoi post che quelli di tuttodigitale, anche se nn sempre capisco i vostri calcoli (per colpa mia, nn certo vostra)... ma quello che volevo dire é che adesso le cpu amd in ST sono sotto di ben più del 5% e se fra un anno quello fosse il risultato... lo vedrei molto positivo.

;) ciauz

paolo.oliva2
14-08-2015, 00:52
Dovrebbe avere 8 core e gestire 16 thread, ma un -5% in ST potrebbe significare che in MT stà sopra... e nn sarebbe male, adesso in ST le cpu amd quanto sono sotto a quelle intel, 20/30/40% :confused:

sperare che rivaleggino con le cpu sckt 2011 mi sembra utopistico :boh:

;) ciauz

Beh, se AMD butta fuori Zen per combattere con gli i7 X4 mi sembra un suicidio di gran lunga più eclatante dell'8150.

Tuttavia la vedo molto improbabile... e ti dico il perché in spicciolo.
Prendi un Piledriver, ci stecchi i moduli Excavator, se il silicio regge sia il clock che 125W, si potrebbe realizzare un procione stile 9590, ma non 220W ma 125W.
Un Excavator con 20/25% in più di IPC alle frequenze di un 9590 sarebbe come un FX a 5,7/5.8GHz def (per l'MT) con un turbo di 6/6,2GHz di ST e quindi di forza bruta.

Per me sono 2 cose distinte la frequenza che voleva BD e la frequenza ad un determinato TDP concessa dal 32nm SOI. Il 28nm Bulk riesce a portare 3,1miliardi di transistor a 3,5GHz in 45W, BD ne ha 1,2 miliardi e praticamente la metà sono nella L3.
Se il 14/16nm avrà un PP "normale", non avrà nulla da invidiare al 14nm Intel, e se il 14nm Intel permette i 4GHz def negli X4, meglio o uguale al 22nm che comunque guadagnava sul 32nm, ci sarebbero tutte le possibilità che il nuovo silicio di AMD non solo possa permettere le stesse frequenze del 32nm SOI, ma ancor più che le possa superare.

digieffe
14-08-2015, 00:54
Io leggo con piacere sia i tuoi post che quelli di tuttodigitale, anche se nn sempre capisco i vostri calcoli (per colpa mia, nn certo vostra)... ma quello che volevo dire é che adesso le cpu amd in ST sono sotto di ben più del 5% e se fra un anno quello fosse il risultato... lo vedrei molto positivo.

;) ciauz

oin verità sono io che non faccio post divulgativi ma solo 4 conti buttati li,
in ogni caso se ti interessa quando non si capisce chiedi pure, la cosa peggiore ceh potra accadere e che potro non rispondere immediatamente :)

semplicemente
ipc 6700k = 100 excavator = 59

oppure
ipc 6700k = 170 excavator = 100

sono dei rapporti.

quindi ipc di excavator -41%

AceGranger
14-08-2015, 01:13
come già scritto:


secondo me il prossimo 8 core di intel sarà @3.4 ( e cmq non meno di 3.3) ed il prossimo 6 core sarà @4.0

già esistono quelle cpu (che tra l'altro hanno pure la gpu) basta moltiplicare il numero dei core

ma anche senza moltiplicare, praticamente esiste gia da un anno e mezzo

E5-2687W v2 (20M cache, 8 Cores, 16 Threads, 3.40 GHz (150W)

paolo.oliva2
14-08-2015, 01:28
IMHO in un caso medio Zen top di gamma 95w andrà un pelino più di un 6770k e costerà 3/4 di quest'ultimo :)

Io non mi faccio menate sulla forza bruta, nel senso che proprio lo escludo che Zen possa raggiungere Intel.
Per l'MT invece non ho alcun dubbio che qualsiasi X4 Intel starà sotto.
Ai tempi del 2600K Vs 8150 AMD perdeva, poi uscì l'8350 e il 3770k e AMD era sempre sotto, ma di meno, in quanto il guadagno da 8150 a 8350 era ben superiore a quello del 2600K 3770k. Poi sono seguiti il 4770k, con Steamroller realizzato ma assente negli FX, poi il nuovo Intel e Excavator sempre assente negli FX. A questo aggiungici pure che da una parte Intel ha guadagnato sia architetturalmente ma pure con incrementi di frequenza def per il salto miniaturizzazione silicio mentre in AMD si è visto un Steamroller gambizzato da un - 10% di frequenza e comunque da soluzioni mobili il cui obiettivo non è certo la potenza massima ma il consumo minimo.
Il vizio è che si confronta un Piledriver 32nm SOI e non un possibile Excavator, 22nm con il salto a Zen 14/16nm.
Un Excavator 22nm non è la differenza tra Piledriver 32nm Vs Excavator 32nm quantificato unicamente l'IPC perché a 125W un 22nm Vs un 125W 32nm ci scapperebbe l'incremento di IPC con (almeno) 2/4 core in più.
Da qui, che verrebbe meglio il calcolo di Zen + 14nm...

Guarda Intel, 32nm X6 3,2GHz, 22nm 3GHz X8 e mettiamo 3,5GHz X8 sul 14nm.. È meno o più rispetto al guadagno architetturale? Un FX a 125W sul 14nm sarebbe un X16, molto di più di un 6770k. Nella peggiore delle ipotesi si parlerà di 8 TH fisici Vs 8 TH logici, ma mentre il recupero in Pile del TH fisico sul logico era si enorme (un 50%?) ma insufficiente per azzerare il divario, in Zen sarà praticamente impossibile che non sia positivo.

shellx
14-08-2015, 02:08
Ma questo è lapalissiano:
Se la struttura zen va bene le apu (con core zen ) prenderanno il posto di BD fx.
Poco importa se un ipotetico A10 va come un i5 1151 con prezzo leggermente inferiore e socket FM3 (o FM4).
Se poi crediamo che sia meglio avere la piattaforma top di AMD con prestazioni prezzo da I3 Intel...
Vorrei vedere una cpu AMD che vada il doppio del top 2011 e che costi una volta e mezzo.
Va da se che una ipotetica cpu amd che si inserisca come prestazioni tra 1151 e 2011 avrà un prezzo che sarà simile al top cpu 1151 di intel, e così per un i5 o i3 o Pentium.
Ed onestamente non mi interessa che socket sia.


:mbe: eh.. certo è ovvio.. semmai Zen nel socket top affianchi il socket 2011-3 di Intel, di conseguenza è chiaro che il socket inferiore di amd aumenti le performance, andando cosi a creare una situazione in quella fascia di prestazioni quasi simile al socket inferiore di Intel, sia dal punto di vista di performance che di prezzi ovviamente (a patto che l'architettura zen venga adottata anche nel socket inferiore). E' quello che amd cerca di imitare da alcuni anni sullo stile Intel (doppio socket per doppie fasce). Ma c'è una cosa che ti sfugge:
innanzittutto in scala il ragionamento globale delle due fasce è differente fra quello Intel e quello di AMD, anche se le soluzioni finali dovessero quasi pareggiare le performance; secondo: ma ti guardi intorno dentro questo forum ? Semmai fosse uno scenario simile, sono più le persone che prenderebbero il top dei top Zen (al costo di spendere 500 e passa euro per una cpu) che quelle che vanno al socket inferiore apu (anche se quest'ultime vanno come le cpu 1151 di intel o giù di li). Con questo voglio dire, che per chi simpatizza amd, se quest'ultima dovesse fare cpu del calibro 5930K (senza tocccare il 5960x, altrimenti tocchiamo la fantascienza davvero), tu credi che non le acquisterebbero ? (Io il primo correndo a talloni sulla schiena). Sarebbe in numero inferiori quelli che si prenderebbero il socket inferiore.

Bah... Se devo essere sincero, se dovessi pagare uno Zen X8 top di gamma 600€ o più e stare sotto ad un 5960X, non avrebbe senso.

Si ma bada che il 5960X costa oltre 1000 paperelle... ergo se dovessi andare meno per 600 euro mi sembra anche giusto. Per quella cifra c'è il 5930K.

Una moto 2011-3 è fuori di testa con tutti i gadget, la CF-5 z costa un pacco a confronto per quello che offre.
L'unica cosa è che devo provare se con la mia soluzione posso tenere almeno i 140W TDP in Africa... Poi posso anche passare ad Intel prima di Zen.

In linea di massima le mobo Intel sono generalmente più ricche di features. Anche quelle meno costose (che poi le meno costose costano quanto le top del socket am3+). Le mobo 2011/2011-3 sono dei mostri.

P. S.
Lo so che hai competenza ed esperienza, ma non mi giudicare uno svasato figlio di papà se acquisto Asus top di gamma.

Macchè... io scherzo ;) Ma poi figurati, una top di gamma socket am3+ non supera le 200 euro. Ho visto mobo Intel del socket superiore toccare anche le 500 euro e passa, e molta gente acquistarle (per giocare e no per professione). Quelli sono figli di papà...

Di modo nel tempo le ho provate tutte, ed a parte una marca di cui non ricordo il nome (ma non esiste più),

DFI. Le numero 1 come mobo. Insieme ad Abit deceduta nel mercato mobo qualche anno prima di DFI. Altro che Asus, Msi e compagnia cantante...sono giocattoli quelle di oggi in confronto con una DFI LANPARTY nF4 SLI-DR Expert socket 939 ... e ancora prima sul socket A con gli athlon xp ;)
Bei tempi diamine ... :(

Se penso alle vagonate di mobo e provi cambiati ogni 6 mesi, a quest'ora starei pagando ancora i mutui (non è una beccata di sarcasmo, ma acquistare THUBAN/8150/81350 e prox 8370, il tutto con relative mobo, altro che 2600k, 3770k 4790 e probabile 2011 X6/X8)

Ci credo..ai voglia: ti prendevi due piattaforme 2001-3 + una server opteron 4P basata sul g32 con una tyan super cazzuta ;)

tuttodigitale
14-08-2015, 03:39
fatto 100 excavator abbiamo 88 piledriver (fonte tuttodigitale, spero che hai fatto bene i conti :D, scherzo) ed 82 buldozer (a memoria 7%)

quella differenza è solo nel ST, ed è stata ottenuta dal +7-8 medio di steamroller su piledriver moltiplicato per il 5% dichiarato da amd per excavator. Con un +20% siamo comunque a 36% più di PD nel ST che non sono poi così pochi. Di certo da ivy bridge a skylake, Intel non ha migliorato così tanto. Anche se il divario è comunque notevole sarà di gran lunga ridotto nel MT, vuoi perchè il CMT di PD fa perdere circa il 22%(quindi un +27% solo perchè per ogni core c'è una fpu), vuoi perchè il SMT minimo minimo un +15% dovrebbe garantirlo..

i risultati in cinebench sono questi:
ST:

PD 100
SR 104
XV 118
ib 160 ib=ivy bridge

MT:
PD 100
SR 114
XV 124
ib 191 (senza HT )

scaling ratio
XV 3.21 CMT 84% (ipotetico quad-core +19%)

da BD a PD, mi pare di ricordare che il grosso del merito andava al miglioramento delle prestazioni offerte dal CMT. Sempre in cinebench lo scaling di PD è migliore di circa il 5%.

Va altresì notato che lo scaling di excavator è peggiore di steamroller. In prima battuta avevo dato la colpa alla riduzione della dimensione della cache l2. Tuttavia cinebench non è un test particolarmente intensivo sulla memoria. Le mie conclusioni, al momento sono queste: in excavator la fp unit viene utilizzata maggiormente nel ST, quindi il secondo thread si trova con un quantitativo di risorse inferiori peggiorandone lo scaling.



Ora venendo al sodo della questione, un ipotetico quad core excavator con 4 fpu potrebbe offrire nel MT:
PD.......... 100
XV...........124
XV 4fpu....148 (xv * 19%CMT)

ib ..........191(senza HT)

XV 4fpu + HT 30% (una specie di ZEN-minus)...192
(questo numero fa un poco a cazzotti con la slide visto che saremmo a +55% e non a 40%, probabilmente non dovremmo aspettarci un HT particolarmente brillante).


Nella peggiore delle ipotesi, mi aspetto che un core+HT Zen vada come un core intel ivy bridge senza hyperthreading. D'altra parte se davvero è un octa-core dai consumi umani non si deve pretendere l'impossibile. Potrebbe comunque diventare la soluzione più efficiente sul mercato chi lo sa.

Nhirlathothep
14-08-2015, 05:06
ciao!
scusa il consiglio poco esperto in materia, ma non ti conviene per le alte temperature e umidita' prendere una vecchia piastra madre economica server socket 1366 con due X5650 (sono esacore con basso clock e costano 60 euro l'uno)

http://www.ebay.com/itm/Dell-Precision-T7500-dual-2x-Hex-Xeon-CPU-Six-Core-X5650-2-67GHz-16GB-500Gb-/151773375836?hash=item235665ed5c

se lo prendi hp spendi anche meno, l' anno scorso avevo trovato a 600 euro un 12 core dual X5650 e a 800 euro lo stesso con 96gb di ram ecc (o era anche piu')

Piedone1113
14-08-2015, 08:56
:mbe: eh.. certo è ovvio.. semmai Zen nel socket top affianchi il socket 2011-3 di Intel, di conseguenza è chiaro che il socket inferiore di amd aumenti le performance, andando cosi a creare una situazione in quella fascia di prestazioni quasi simile al socket inferiore di Intel, sia dal punto di vista di performance che di prezzi ovviamente (a patto che l'architettura zen venga adottata anche nel socket inferiore). E' quello che amd cerca di imitare da alcuni anni sullo stile Intel (doppio socket per doppie fasce). Ma c'è una cosa che ti sfugge:
innanzittutto in scala il ragionamento globale delle due fasce è differente fra quello Intel e quello di AMD, anche se le soluzioni finali dovessero quasi pareggiare le performance; secondo: ma ti guardi intorno dentro questo forum ? Semmai fosse uno scenario simile, sono più le persone che prenderebbero il top dei top Zen (al costo di spendere 500 e passa euro per una cpu) che quelle che vanno al socket inferiore apu (anche se quest'ultime vanno come le cpu 1151 di intel o giù di li). Con questo voglio dire, che per chi simpatizza amd, se quest'ultima dovesse fare cpu del calibro 5930K (senza tocccare il 5960x, altrimenti tocchiamo la fantascienza davvero), tu credi che non le acquisterebbero ? (Io il primo correndo a talloni sulla schiena). Sarebbe in numero inferiori quelli che si prenderebbero il socket inferiore.



Si ma bada che il 5960X costa oltre 1000 paperelle... ergo se dovessi andare meno per 600 euro mi sembra anche giusto. Per quella cifra c'è il 5930K.



In linea di massima le mobo Intel sono generalmente più ricche di features. Anche quelle meno costose (che poi le meno costose costano quanto le top del socket am3+). Le mobo 2011/2011-3 sono dei mostri.



Macchè... io scherzo ;) Ma poi figurati, una top di gamma socket am3+ non supera le 200 euro. Ho visto mobo Intel del socket superiore toccare anche le 500 euro e passa, e molta gente acquistarle (per giocare e no per professione). Quelli sono figli di papà...



DFI. Le numero 1 come mobo. Insieme ad Abit deceduta nel mercato mobo qualche anno prima di DFI. Altro che Asus, Msi e compagnia cantante...sono giocattoli quelle di oggi in confronto con una DFI LANPARTY nF4 SLI-DR Expert socket 939 ... e ancora prima sul socket A con gli athlon xp ;)
Bei tempi diamine ... :(


Ci credo..ai voglia: ti prendevi due piattaforme 2001-3 + una server opteron 4P basata sul g32 con una tyan super cazzuta ;)

Onestamente se una futura apu AMD avesse prestazioni cpu in linea con un attuale i5 e gpu in linea con una fury nano (quella da 175w che dovrebbe essere circa tra una 380x ed una 390) 400€ per mobo e apu li spenderei tranquillamente per avere una piattaforma davvero funzionale a 360°.
Per me sono finiti i tempi delle pure prestazioni, gli attuali software desktop hanno potenza più che necessaria dalle attuale cpu ed onestamente credo che non noterei differenze tra un i5 ed un i7 nell'uso che ne faccio.
Un bd 8 core con prestazioni sempre a cavallo tra i5 ed i7 (serie 4) in 95w sarebbe la mia cpu perfetta, anche per la sua alta tolleranza al carico (e mi ritrovo spesso ad avere 7-8 applicativi aperti contemporaneamente.

Ps di mb hai dimenticato Epox, che su socket A erano in linea con dfi e abit (nf ultra d e nf7 s rev2 rispettivamente).
Su 939 e nf3 ultra la migliore era però la msi, mentre su 939 quella con più alte prestazioni era lan party nf4 ultra che andava leggermente più della sli dr-expert, ma l'nf4 ultra e sli avevano diversi bug sia hardware che software difatti il chipset per 939 più prestante era l'uli utilizzato sulla asrock dual sata.
Una mobo che su 939 mi ha dato soddisfazioni è stata la A8R-mvp (non la A8r32-mvp) che mi teneva un opteron 146 a 2950 mhz con +0,15 v, mentre la dual sata la stessa cpu la teneva a 2700 con -0,1v (1.25v contro 1,35v def) con C&Q attivo a moltiplicatore minimo 4x (l'nf di nvidia crashava in oc con moltiplicatore 4 e dovevo usare rmclock con molti minimo 5x).
Su 775 e 1366 dfi e abit hanno avuto un netto declino soprattutto a causa dell'appiattimento generale dell'oc con mobo di produttori diversi.

Dimonios
14-08-2015, 09:01
A proposito di sopportazione al carico ... vi lascio con questa comparativa :eek:
http://www.technologyx.com/featured/amd-vs-intel-our-8-core-cpu-gaming-performance-showdown/4/

Seconda vita per gli FX? :eek:

sniperspa
14-08-2015, 09:48
A proposito di sopportazione al carico ... vi lascio con questa comparativa :eek:
http://www.technologyx.com/featured/amd-vs-intel-our-8-core-cpu-gaming-performance-showdown/4/

Seconda vita per gli FX? :eek:

Questo grazie al Dx12 quindi?

el-mejo
14-08-2015, 10:07
A proposito di sopportazione al carico ... vi lascio con questa comparativa :eek:
http://www.technologyx.com/featured/amd-vs-intel-our-8-core-cpu-gaming-performance-showdown/4/

Seconda vita per gli FX? :eek:

IMHO sono benchmark fasulli, quell' I7 legna gli Fx sia in ST che in MT, ma soprattutto fornisce due linee piene pci-e 16x 3.0

Più interessante invece un altro test 4k, con sli di Titan x, su piattaforma 990fx e z97, con le cpu ammiraglie(I7 4970k vs 8370). In quel caso le 16 linee pci-e 3.0 della piattaforma Intel fornivano meno banda delle 32 linee pci-e 2.0 del 990fx, facendo da collo di bottiglia in scenari gpu-limited.

sburnolo
14-08-2015, 12:24
Interessante.... http://wccftech.com/amd-one-fpu-per-core-design-zen-processors/

°Phenom°
14-08-2015, 12:29
IMHO sono benchmark fasulli, quell' I7 legna gli Fx sia in ST che in MT, ma soprattutto fornisce due linee piene pci-e 16x 3.0

Più interessante invece un altro test 4k, con sli di Titan x, su piattaforma 990fx e z97, con le cpu ammiraglie(I7 4970k vs 8370). In quel caso le 16 linee pci-e 3.0 della piattaforma Intel fornivano meno banda delle 32 linee pci-e 2.0 del 990fx, facendo da collo di bottiglia in scenari gpu-limited.
Appunto ;)

shellx
14-08-2015, 17:02
Onestamente se una futura apu AMD avesse prestazioni cpu in linea con un attuale i5 e gpu in linea con una fury nano (quella da 175w che dovrebbe essere circa tra una 380x ed una 390) 400€ per mobo e apu li spenderei tranquillamente per avere una piattaforma davvero funzionale a 360°.
Per me sono finiti i tempi delle pure prestazioni, gli attuali software desktop hanno potenza più che necessaria dalle attuale cpu ed onestamente credo che non noterei differenze tra un i5 ed un i7 nell'uso che ne faccio.
Un bd 8 core con prestazioni sempre a cavallo tra i5 ed i7 (serie 4) in 95w sarebbe la mia cpu perfetta, anche per la sua alta tolleranza al carico (e mi ritrovo spesso ad avere 7-8 applicativi aperti contemporaneamente.

Anche questo è vero.

Ps di mb hai dimenticato Epox, che su socket A erano in linea con dfi e abit (nf ultra d e nf7 s rev2 rispettivamente).

Si si, grande Epox anch'essa...

Su 939 e nf3 ultra la migliore era però la msi,

Ehehhe io ho avuto anche la MSI K8N Neo2 Platinum con chipset nf3 ultra.
Ricordo che la presi perchè l'nf3 ultra aveva prestazioni a volte pure superiori alla versione nf4 (liscia).Tanto è vero che quella mobo costava quanto le dfi con nf4 (no le serie expert o dr) le ultra-d sli. Ma ricordo anche (correggimi se sbaglio) che per questo motivo mi sembra dovetti rinunciare all'appena nato PCI-E (che adottavano per la prima volta le mobo con nf4) e accontentarmi dell'AGP, questa mobo fu una delle ultime mobo (insieme a qualcun'altra) ad avere ancora agp, ma non mi interessava, all'epoca avevo una geforce 6800 ultra sli (agp), sti caxxi al pci-e ;).

mentre su 939 quella con più alte prestazioni era lan party nf4 ultra che andava leggermente più della sli dr-expert, ma l'nf4 ultra e sli avevano diversi bug sia hardware che software difatti il chipset per 939 più prestante era l'uli utilizzato sulla asrock dual sata.

Le ho avute quasi tutte, la dr-expert edizione limitata, la prima mobo in assoluto ad adottare quasi tutti i condensatori solidi al posto degli elettrolitici. Secondo me per l'oc era questa la migliore, anche se il chipset non era poi più veloce del modello ultra-d o sli-dr.

Una mobo che su 939 mi ha dato soddisfazioni è stata la A8R-mvp (non la A8r32-mvp) che mi teneva un opteron 146 a 2950 mhz con +0,15 v, mentre la dual sata la stessa cpu la teneva a 2700 con -0,1v (1.25v contro 1,35v def) con C&Q attivo a moltiplicatore minimo 4x (l'nf di nvidia crashava in oc con moltiplicatore 4 e dovevo usare rmclock con molti minimo 5x).

L'nf4 crashava non solo in oc ;) Al tempo c'erano pure gli ottimi VIA KT800 e 600. Con i driver hyperion 4 in 1 :D Anche se le performance erano inferiori rispetto i chispet di nvidia. Prima di essi sul socket A anche i chispet SIS (ma erano orribili in tutto e per tutto sia nelle piattaforme intel che amd). Nsomma tutto sommato, tempi d'oro....

Su 775 e 1366 dfi e abit hanno avuto un netto declino soprattutto a causa dell'appiattimento generale dell'oc con mobo di produttori diversi.

Si, è questo il motivo. Praticamente quando l'oc è diventato una pratica hobbystica più espansa e sono sopratutto cambiate le tecnologie di regolazione di questo, altri produttori hanno creato ecosistemi di oc facilitato, eliminando l'esclusività del vero OC (puro) a produttori come dfi e abit. E tutt'oggi è cosi, anzi va sempre peggio. Il vero oc era quello quando una mobo rispetto un'altra te lo permetteva per via delle sue capacità elettroniche/elettriche, e no perchè questa aveva pulsanti per l'oc EASY come avviene oggi ;)

Credo che ora possiamo chiudere con l'ot, prima che ci linciano ;)

paolo.oliva2
14-08-2015, 17:11
Questo grazie al Dx12 quindi?

La mia non è una contestazione, però come si evidenzia come in certe situazioni Intel va a palla rispetto ad AMD, se poi in altre AMD va bene, non è che quando va male è colpa dell'architettura e quando invece va bene è merito di altri.

capitan_crasy
14-08-2015, 17:24
Ehehhe io ho avuto anche la MSI K8N Neo2 Platinum con chipset nf3 ultra.
Ricordo che la presi perchè l'nf3 ultra aveva prestazioni a volte pure superiori alla versione nf4 (liscia).Tanto è vero che quella mobo costava quanto le dfi con nf4 (no le serie expert o dr) le ultra-d sli. Ma ricordo anche (correggimi se sbaglio) che per questo motivo mi sembra dovetti rinunciare all'appena nato PCI-E (che adottavano per la prima volta le mobo con nf4) e accontentarmi dell'AGP, questa mobo fu una delle ultime mobo (insieme a qualcun'altra) ad avere ancora agp, ma non mi interessava, all'epoca avevo una geforce 6800 ultra sli (agp), sti caxxi al pci-e ;).


Quanti ricordi...

http://i.imgur.com/kn10i0Z.jpg (http://imgur.com/kn10i0Z.jpg)

Nforce4 faceva cagare soprattutto nei driver quindi l'alternativa (almeno personalmente) era la mitica 939SLI32-ESATA2 con ULI M1697 che era superiore...

george_p
14-08-2015, 17:27
Non sfrutta affatto al massimo tutti i core.
Cinebench, come gli altri software di rendering possono dividere la scena in più parti ed affidarne l'elaborazione a più core, ma l'ht porta vantaggi perché il core è sfruttato al 60% del suo potenziale massimo teorico.
Ci sono troppe dipendenze sequenziali nel codice (aspetti prima l'orientamento della superfice, poi il colore, la riflessione, l'ombra ecc) ed ad aspettare questi risultati l'ht usa la parti inutilizzate per migliorare l'efficienza.
Ma ci sono software multith che con ht attivo hanno un + 10% di prestazioni, mentre qualcuno un -2% (meno 2 ) addirittura.
questi software usano continuamente sempre le stesse parti di cpu lasciando all'ht poco o nulla da poter usare.
Se hanno fatto una media dei software usati normalmente nei benchmark al +40% di ipc dato dal th+th1 (core fisico + virtuale) andrebbe tolto un 12% per avere una approssimazione realistica sull'ipc del singolo core fisico.
Se invece il +40% è riferito ai GFlop massimi teorici, è un discorso completamente differente con ipc che può variare a seconda dell'applicazione da 0% a + 100% sul singolo core, ma senza un riferimento certo si parla solo di congetture e tutti i calcoli sono potenzialmente errati o giusti.

Non so se il massimo con l'uso di cinebench (o cinema4D visto che utilizza lo stesso motore) arrivi al 100% o al 60% però quando apro il task manager di windows tutti i core sono sempre al massimo nella scala grafica e soprattutto in caso di render pesanti non posso fare quasi niente al computer, a meno di dare diversa priorità tramite le preferenze di gestione threads (ma solo in cinema4D).

Comunque l'SMT deve venire supportato da tutti i software? Cioè, mi spiego, occorre una ottimizzazione software? Se non erro è avvenuto lo stesso per intel ma poi queste stesse ottimizzazioni valgono anche per amd? O avviene in maniera automatica?

Per il resto, riguardo i calcoli, concordissimo con te, possiamo solo speculare.

Grazie

Grizlod®
14-08-2015, 18:19
Quanti ricordi...

C'era pure Soltek ... una delle poche con il KT880 :p :

http://s26.postimg.org/tswepq3lx/Soltek_SL_KT880_E_RL.jpg (http://postimg.org/image/tswepq3lx/)

Funzionante, ma al momento non attiva :O

shellx
14-08-2015, 18:43
Quanti ricordi...

CUT...
Nforce4 faceva cagare soprattutto nei driver quindi l'alternativa (almeno personalmente) era la mitica 939SLI32-ESATA2 con ULI M1697 che era superiore...

Si è vero. Comunque la msi la conservo ancora anchio, assieme all'athlon64 winchester 3500+ , e al mitico athlon 64 4400+ X2.
Mi viene da piangere :( .. che darei per tornare a quei tempi dell'informatica, ma pure prima del 939. Le più belle nottate con gli amici a trovare l'ultimo mhz le ho passate con il socket A e gli athlon xp 2500+ barton, o il palomino 1800+ che occava da pazzi, o ancora il 2600+ 333 lo portavo a 2500mhz, finoa quando non scoppiava l'alimentatore o si corrompeva ogni 2 e 3 il bios della mitica Abit nf7-s, anzi io avevo quella senza sata. Poi presi la -s, dopo che ne ho arrostite due precedentemente di quelle senza sata. Al tempo recoverybios si è fatto i milioni ad eprom con bios che mi spediva, fino a quando non mi comprai io il programmatore di chip eprom, e ci caricavo il bios (altrimenti se ne andavano 12 euro di eproom ogni 2/3 mesi, avevo solo 23 anni e la cosa mi pesava assieme a tutto l'altro hardware che compravo, al tempo non facevo il lavoro che faccio oggi).
:D

isomen
14-08-2015, 19:59
Quanti ricordi...

http://i.imgur.com/kn10i0Z.jpg (http://imgur.com/kn10i0Z.jpg)

Nforce4 faceva cagare soprattutto nei driver quindi l'alternativa (almeno personalmente) era la mitica 939SLI32-ESATA2 con ULI M1697 che era superiore...

C'era pure Soltek ... una delle poche con il KT880 :p :

http://s26.postimg.org/tswepq3lx/Soltek_SL_KT880_E_RL.jpg (http://postimg.org/image/tswepq3lx/)

Funzionante, ma al momento non attiva :O

Si è vero. Comunque la msi la conservo ancora anchio, assieme all'athlon64 winchester 3500+ , e al mitico athlon 64 4400+ X2.
Mi viene da piangere :( .. che darei per tornare a quei tempi dell'informatica, ma pure prima del 939. Le più belle nottate con gli amici a trovare l'ultimo mhz le ho passate con il socket A e gli athlon xp 2500+ barton, o il palomino 1800+ che occava da pazzi, o ancora il 2600+ 333 lo portavo a 2500mhz, finoa quando non scoppiava l'alimentatore o si corrompeva ogni 2 e 3 il bios della mitica Abit nf7-s, anzi io avevo quella senza sata. Poi presi la -s, dopo che ne ho arrostite due precedentemente di quelle senza sata. Al tempo recoverybios si è fatto i milioni ad eprom con bios che mi spediva, fino a quando non mi comprai io il programmatore di chip eprom, e ci caricavo il bios (altrimenti se ne andavano 12 euro di eproom ogni 2/3 mesi, avevo solo 23 anni e la cosa mi pesava assieme a tutto l'altro hardware che compravo, al tempo non facevo il lavoro che faccio oggi).
:D

Io sto già :cry:

avevo l'asus con KT880... ed é morta :cry: :muro: :cry:

allora si che l'oc éra divertente... sudavi mhz so mhz :mc:

;) ciauz

mtk
14-08-2015, 20:13
ricordo con amore il mio 3800x2 a 2850Mhz su asrock con chip via,non ricordo la mobo ma in coppia con la 1950xt era invidiato dai miei amici,anche quelli con gli intel conroe.....era anche il mio primo pc a liquido.....kit a liquido che ora suda per raffreddare l 8350 n.1 :asd:
comunque mantengo vivi e vegeti anche due 4200x2,li usano in sala giochi mio fratello e un amico e non si sono mai lamentati delle prestazioni...vabbe' si gioca solo a battlefield 2 e gtr2-gtl :D

el-mejo
14-08-2015, 22:07
Bha io invece non rimpiango minimamente i tempi andati dell'informatica, con componenti costosi e a rapida obsolescenza.

Ricordo che il pc precedente era un Athlon 64 3200+ Venice pagato 200€ (84mm^2 di die), con 2x512mb ddr e mobo Sapphire bolsa, seppur pagata sui 100€. E 200€ di x800gto2, con i suoi mitici sm 2.0b :muro:

Tre anni e mezzo fa ho preso con 130€ ho preso il Phenom in firma (258mm^2), con 80€ gli 8 giga di ram che non ho avuto ancora modo di usare fino in fondo (diciamo anche fino a tre quarti:asd: ), e un mese fa con 80€ ho preso la mobo in firma che seppur di fascia media si mangia quella del Venice.
Ma il pezzo migliore resta la hd5770, pagata usata 2 anni fa 55€ che mi permette di giocare ancora a tutto, con i dovuti accorgimenti. Una gpu del 2009!

Questa è l'informatica che mi piace!

digieffe
15-08-2015, 00:44
Non sfrutta affatto al massimo tutti i core.
Cinebench, come gli altri software di rendering possono dividere la scena in più parti ed affidarne l'elaborazione a più core, ma l'ht porta vantaggi perché il core è sfruttato al 60% del suo potenziale massimo teorico.
Ci sono troppe dipendenze sequenziali nel codice (aspetti prima l'orientamento della superfice, poi il colore, la riflessione, l'ombra ecc) ed ad aspettare questi risultati l'ht usa la parti inutilizzate per migliorare l'efficienza.
Ma ci sono software multith che con ht attivo hanno un + 10% di prestazioni, mentre qualcuno un -2% (meno 2 ) addirittura.
questi software usano continuamente sempre le stesse parti di cpu lasciando all'ht poco o nulla da poter usare.
Se hanno fatto una media dei software usati normalmente nei benchmark al +40% di ipc dato dal th+th1 (core fisico + virtuale) andrebbe tolto un 12% per avere una approssimazione realistica sull'ipc del singolo core fisico.
Se invece il +40% è riferito ai GFlop massimi teorici, è un discorso completamente differente con ipc che può variare a seconda dell'applicazione da 0% a + 100% sul singolo core, ma senza un riferimento certo si parla solo di congetture e tutti i calcoli sono potenzialmente errati o giusti.

non sto mettendo in dubbio quanto affermi, ma vorrendo approfondire di più mi spieghi (o mi dai il link) come "il core è sfruttato al 60% del suo potenziale massimo teorico" ? (tu qualcosa spieghi a proposito di "troppe dipendenze sequenziali nel codice" ma come esce il 60% ?)

non capisco questa affermazione "questi software usano continuamente sempre le stesse parti di cpu lasciando all'ht poco o nulla da poter usare.", che differenza farebb e usare parti differenti di cpu ?

non capisco a cosa sia riferito "andrebbe tolto un 12%", a Zen ?

scusa se ti ho fatto tente domande ma vorrei capire bene la situazione, grazie.

paolo.oliva2
15-08-2015, 01:57
Invece io proporrei che qualcuno (o anche più di uno) faccia una tabella riassuntiva, per quello che si sa, tra Pile-->Steamroller-->Excavator in incremento IPC a core, potenza ST e MT a modulo, giusto per capire la direzione di AMD, perché supporrei che il core Excavator sia comunque l'osso di Zen.
Io sinceramente non è che ci abbia capito tanto di Zen, ma Excavator, implementa già le AVX2?

FazzoMetal
15-08-2015, 09:03
http://i61.tinypic.com/17puzp.png

Ho creato questa tabellina usando come riferimento i dati disponibili su Anandtech Bench e su Notebookcheck per quanto riguarda Carrizo. I criteri che ho utilizzato sono i seguenti:

-Le performance Single Thread sono relative a Cinebench R15 e normalizzate a 1GHz.

-Le performance Multi Thread sono relative a Cinebench R15 e CPU con 4 core/2 moduli, normalizzate a 1GHz.

-L'IPC normalizzato di Steamroller e Excavator (eventuale versione non APU con L3) è stimato (e quindi riportato in rosso) aggiungendo il 2% all'IPC di Kaveri e Carrizo (Piledriver va il 2% più di Trinity)

-Le performance di Carrizo sono calcolate usando la review dell'A10 8700P disponibile su Notebook check e correggendo i dati considerando il turbo (3100MHz con 1 core attivo, 2300MHz con 4 core attivi) dal momento che si è rivelato molto aggressivo su Carrizo

Ovviamente tutti i dati sono puramente indicativi

batou83
15-08-2015, 10:16
Quindi usando i dati di quella tabella e prendendo per buono il +40%, zen dovrebbe avere un ipc del 65% superiore a piledrive, cioè una cosa simile a ivybridge.
Sarebbe una bella cosa.
Poi magari gli tirano un po' il collo con la frequenza e otteniamo un qualcosa competitivo come prestazioni che magari consumerà un po' di più della controparte Intel.

Sono d'accordo. AMD non deve necessariamente fare la rincorsa ad Intel, deve trovare il giusto compromesso tra ipc, multithreading e consumi. L'importante è che le cpu zen siano facilmente overclockabili e non abbiano la pasta del capitano. Io auspico una piattaforma che supporti dai 6 ai 16 core, mentre i quad core li lascerei alle apu su un altro socket.

george_p
15-08-2015, 10:27
http://i61.tinypic.com/17puzp.png

Ho creato questa tabellina usando come riferimento i dati disponibili su Anandtech Bench e su Notebookcheck per quanto riguarda Carrizo. I criteri che ho utilizzato sono i seguenti:

-Le performance Single Thread sono relative a Cinebench R15 e normalizzate a 1GHz.

-Le performance Multi Thread sono relative a Cinebench R15 e CPU con 4 core/2 moduli, normalizzate a 1GHz.

-L'IPC normalizzato di Steamroller e Excavator (eventuale versione non APU con L3) è stimato (e quindi riportato in rosso) aggiungendo il 2% all'IPC di Kaveri e Carrizo (Piledriver va il 2% più di Trinity)

-Le performance di Carrizo sono calcolate usando la review dell'A10 8700P disponibile su Notebook check e correggendo i dati considerando il turbo (3100MHz con 1 core attivo, 2300MHz con 4 core attivi) dal momento che si è rivelato molto aggressivo su Carrizo

Ovviamente tutti i dati sono puramente indicativi

Non riesco a leggerla e a inquadrarla con dati reali.

L'ipc normalizzato a singolo core di BD sta a 100 mentre quello di PD sta a 98? Kaveri che guadagna un 10% rispetto a PD qui ne guadagna solo 2 rispetto a BD?
:confused:

FazzoMetal
15-08-2015, 10:43
Non riesco a leggerla e a inquadrarla con dati reali.

L'ipc normalizzato a singolo core di BD sta a 100 mentre quello di PD sta a 98? Kaveri che guadagna un 10% rispetto a PD qui ne guadagna solo 2 rispetto a BD?
:confused:
I dati si riferiscono solo a Cinebench R15 che, ovviamente, non mostra gli stessi andamenti che si otterrebbero mediando i risultati di più test sintetici.
Piledriver mostra un IPC che è solo il 98% di Bulldozer in ST ma guarda il MT dove la storia è diversa.
Direi che come IPC BD e PD si equivalgano nel benchmark in oggetto, fermo restando che PD offre frequenze maggiori. Poi il 2% di differenza vuol dire poco e nulla, c'è comunque il margine di errore dovuto alla non ripetibilità dei test.

george_p
15-08-2015, 11:37
Non bisogna fare distinzione tra apu e fx, secondo me zen avrà solo apu a meno che non ci sarà una serie solo CPU simile ai socket 2011 di Intel.
AMD ha rinunciato a fare di hsa una tecnologia di punta ma non ci ha rinunciato completamente, la cosa va avanti soprattutto nel mobile e non avrebbe senso presentare cpu non compatibili.
Non per niente ha annunciato una apu 32 core zen con igpu Greenland per il settore server, credette che la igpu serve per la grafica? :D

Ma per niente, amd ha ufficialmente dichiarato che con Zen vuole tornare nel settore high end e nella prima incarnazione Zen sarà invece esclusivamente solo cpu senza gpu mentre la prossima generazione apu sarà realizzata molto probabilmente con excavator.
Anno di uscita di entrambi 2016.

Amorph
15-08-2015, 11:44
Ma per niente, amd ha ufficialmente dichiarato che con Zen vuole tornare nel settore high end

chissà se ritornerà come al tempo degli athlon xp e 64

tuttodigitale
15-08-2015, 13:18
[IMG]cut

Attenzione che da slide in cinebench r15, l'ipc di excavator (quindi di carrizo) è superiore del 13 % nel ST e "solo" del 9% nel MT
http://images.anandtech.com/doci/9319/Slide%2012%20-%2015W%20Optimized_575px.png

Mi fa piacere che i dati, che ho ricavato da un altro sito che confronta l'ipc di PD e SR (pari frequenza e turbo core disattivato) siano molto simili a tuoi.

tuttodigitale
15-08-2015, 14:20
Ma per niente, amd ha ufficialmente dichiarato che con Zen vuole tornare nel settore high end e nella prima incarnazione Zen sarà invece esclusivamente solo cpu senza gpu mentre la prossima generazione apu sarà realizzata molto probabilmente con excavator.
Anno di uscita di entrambi 2016.
Aspetta non corriamo di fantasia. (detto da me :asd: )
Ufficialmente l'octa-core Zen sarà su FM3, il socket delle future APU. il fatto che possa debuttare prima con una cpu di alto livello senza igp, non significa assolutamente che una futura revisione non possa averla integrata.
Il socket glielo consentirebbe. D'altra parte AMD ha assoluta necessità di diffondere hw HSA compatibile, sopratutto di alto livello.

tuttodigitale
15-08-2015, 15:45
Hyperthreading, serve per utilizzare di più le pipeline (notare il plurale) nelle cpu superscalari.
Non voglio essere polemico, ma va detto che c'è software dove la cpu è in grado di estrarre un maggior ILP (tradotto lo stesso thread è distribuito tra più pipeline).

La frase: questi software usano continuamente sempre le stesse parti di cpu lasciando all'ht poco o nulla da poter usare.
Non ha molto senso. Se per esempio abbiamo
due variabili int (a e b) e un float c
a=5+2;
b=2+3;
c=2.5+b;
l'esecuzione di c deve necessariamente attendere che la variabile b sia stata completata, nonostante l'unità floating point sia libera. Ovviamente i progettisti di cpu non si fermano per così poco: ecco che spuntano fuori OoO (l'esecuzione fuori ordine), la ridenominazione dei registri, l'esecuzione speculativa, tutto nel tentativo di tener costantemente alimentata le unità esecutive.

Se hanno fatto una media dei software usati normalmente nei benchmark al +40% di ipc dato dal th+th1 (core fisico + virtuale) andrebbe tolto un 12% per avere una approssimazione realistica sull'ipc del singolo core fisico.
Se invece il +40% è riferito ai GFlop massimi teorici, è un discorso completamente differente con ipc che può variare a seconda dell'applicazione da 0% a + 100% sul singolo core, ma senza un riferimento certo si parla solo di congetture e tutti i calcoli sono potenzialmente errati o giusti.
Piedone già le informazioni su Zen latitano, quelle poche che ci sono diamole per buone :D
la slide parla di IPC per core, nessun riferimento al throughput che si preannucia molto ma molto più alto, visto che le fpu sono raddoppiate di numero (e dovrebbero essere pipeline con registri a 256, per prestazioni doppie con le e istruzioni avx 256 bit, quindi fino a 4 volte più potente)

isomen
15-08-2015, 16:46
Aspetta non corriamo di fantasia. (detto da me :asd: )
Ufficialmente l'octa-core Zen sarà su FM3, il socket delle future APU. il fatto che possa debuttare prima con una cpu di alto livello senza igp, non significa assolutamente che una futura revisione non possa averla integrata.
Il socket glielo consentirebbe. D'altra parte AMD ha assoluta necessità di diffondere hw HSA compatibile, sopratutto di alto livello.

Cambia solo il nome e nn il significato... ma il nuovo socket nn dovrebbe chiamarsi am4 (mi sembra che sia riportato anche in qualche slide) :confused:

;) ciauz

MICENE89
15-08-2015, 17:15
Cambia solo il nome e nn il significato... ma il nuovo socket nn dovrebbe chiamarsi am4 (mi sembra che sia riportato anche in qualche slide) :confused:

Sì. Ecco la slide in questione:

http://www.tomshw.it/data/thumbs/9/5/8/2/amd-financial-analyst-day-2015-05-3243669ad32ee6fa15258a40a15fa9e0d.jpg

APU e CPU desktop verranno unificate sullo stesso socket, l'AM4.

MICENE89
15-08-2015, 17:27
Aspetta non corriamo di fantasia. (detto da me :asd: )
Ufficialmente l'octa-core Zen sarà su FM3, il socket delle future APU.

AMD non ha mai parlato di "octa-core Zen". L'unico riferimento a una probabile CPU octa-core erano le slide che mostravano le "unità Zen" formate da quattro core ciascuna, ma AMD ha negato la veridicità di quelle slide, quindi le future CPU potrebbero benissimo essere quad core + HT. Inoltre il Socket delle future APU/CPU Zen sarà l'AM4, non l'FM3.

Le uniche informazioni ufficiali disponibili al momento sono queste (http://www.tomshw.it/news/amd-vuole-mettere-paura-a-intel-e-nvidia-i-piani-per-il-futuro-66025); tutte le altre sono da considerarsi false.

george_p
15-08-2015, 18:16
Aspetta non corriamo di fantasia. (detto da me :asd: )
Ufficialmente l'octa-core Zen sarà su FM3, il socket delle future APU. il fatto che possa debuttare prima con una cpu di alto livello senza igp, non significa assolutamente che una futura revisione non possa averla integrata.
Il socket glielo consentirebbe. D'altra parte AMD ha assoluta necessità di diffondere hw HSA compatibile, sopratutto di alto livello.

E quale mia frase ti fa capire diversamente?
Scrivendo nella prima incarnazione intendo dire che al suo debutto Zen sarà solo CPU senza GPU mentre molto probabilmente dopo la versione apu EX vedremo quella Zen.

Qui corriamo tutti di fantasia fino a che AMD concretizza le sue slide.

george_p
15-08-2015, 18:20
Sì. Ecco la slide in questione:

http://www.tomshw.it/data/thumbs/9/5/8/2/amd-financial-analyst-day-2015-05-3243669ad32ee6fa15258a40a15fa9e0d.jpg

APU e CPU desktop verranno unificate sullo stesso socket, l'AM4.


Esatto e come si vede inizialmente Zen sarà in versione FX senza Igpu. In seguito post Ex sarà quasi certamente Zen a costituire i cores nelle APU del futuro.

paolo.oliva2
15-08-2015, 20:31
Esatto e come si vede inizialmente Zen sarà in versione FX senza Igpu. In seguito post Ex sarà quasi certamente Zen a costituire i cores nelle APU del futuro.

Se posso dire una cosa, anche se al 99% penso che sia una calzata, guardando quelle slide:
Nella fascia mobile la divisione in altezza è la medesima, cioè APU di 6a generazione e 7a sono simili. Supponendo che la 7a dovrebbe essere più prestante della 6a, allora la differenza non risalta la potenza, ma allora cosa? Ho pensato al numero dei core, ed in effetti, gli FX erano offerti nelle varianti X4, X6 e X8. Se guardiamo il divisorio, le APU desktop si piazzano a metà dell'offerta FX, che si potrebbe interpretare quindi come X6 APU. La fascia di Zen, come altezza, è più grande di quella FX, e per la differenza a me pare X12.

Se questo fosse vero, il discorso 95W potrebbe avere senso se AMD lo interpretasse come 32nm SOI X8 125W Piledriver, prox silicio, X8 95W ma più potente del 40% su Excavator (e quindi ancor più potente su Piledriver) e considerando 95W come X8, nei 125W un X12 ci starebbe.
Resta il punto che Zen non può avere un IPC prossima a Intel, semplicemente perché 140W in X8 per un 5960X non possono diventare X12 e calare 10W con AMD.

FroZen
15-08-2015, 22:17
Sto iniziando a giochicchiare con l'8350 e la crossahir z.

Ho benchato a cinebench r15 a 4,4ghz a vdef (turbo off obviously), 701 punti.

Il problema è che non riesco a monitorare le temp....hwinfo64 mi crasha all'apertura quando carica la 380....asus probe 2 dal sito asus non mi si installa... occt e altri non rilevano le temp.....mmmm......capitato a qualcuno? :mbe:

paolo.oliva2
15-08-2015, 23:37
In realtà non c'è scritto così, c'è scritto fx cpu ma anche 8800p è un fx :rolleyes:

Edit: che poi probabilmente sarà anche così, ma non è quella slide che lo dice.
Ma poi siamo qua a discutere delle slide? :D
Dai Paolo è così in hype che vede indizi anche dall'altezza dei quadratini :asd:

P.s: però avete notato che sono spariti i derivati dei core Jaguar dalle slide?

Ma sono 2 cose diverse.
FX non vuol dire APU o non APU, ma proci ad alte prestazioni (nella scala AMD).
Invece AMD è piuttosto chiara perché quando parla di APU li definisce APUs e quando no, li definisce Core.

Il tuo discorso precedente lo condivido ampiamente, quello di implementare IP per supporto HSA. Però, è anche logica la scelta AMD, nel senso che nel mobile continua il discorso HSA anche perché a parte 3,1 miliardi di transistor, il TDP non è elevato e la potenza c'è. La fascia "alta" desktop sono in pratica degli Opteron, ed AMD non può permettersi il lusso di fare più catene, quindi finché in ambito server il discorso HSA non è a maturazione, meglio risparmiare transistor e riservare TDP tutta alla parte X86, per essere più competitiva.
Da notare che il socket viene riportato lo stesso sia per APU che non, quindi permane il discorso con PCI integrata e quant'altro, ed in pratica un FX core sarebbe visto come un APU con l'IGP come disabilitata.
Quello che invece non mi è chiaro, è che un FX 8350 ha tutta una parte I/O da Opteron che un procio desktop non necessita... Un socket FM2 quanti più ha in meno pur avendo la VGA rispetto ad un AM3+?

Per il discorso delle altezze, beh, è AMD che riporta di voler aumentare la potenza dei proci per la fascia alta desktop. Non mi sembra che la strada sia quella di 95W Unito a max X8. Se per fascia alta si intende un 5960X, credo che avere 12 core Vs 8 a TDP simili ti puoi permettere anche un IPC inferiore, cosa che se fai X8 devi avere invece uguale.

paolo.oliva2
15-08-2015, 23:39
Sto iniziando a giochicchiare con l'8350 e la crossahir z.

Ho benchato a cinebench r15 a 4,4ghz a vdef (turbo off obviously), 701 punti.

Il problema è che non riesco a monitorare le temp....hwinfo64 mi crasha all'apertura quando carica la 380....asus probe 2 dal sito asus non mi si installa... occt e altri non rilevano le temp.....mmmm......capitato a qualcuno? :mbe:

Io sono oramai 4 anni che non smanetto più con gli FX con una moto seria... Non mi ricordo più una mazza...

isomen
16-08-2015, 01:11
Sto iniziando a giochicchiare con l'8350 e la crossahir z.

Ho benchato a cinebench r15 a 4,4ghz a vdef (turbo off obviously), 701 punti.

Il problema è che non riesco a monitorare le temp....hwinfo64 mi crasha all'apertura quando carica la 380....asus probe 2 dal sito asus non mi si installa... occt e altri non rilevano le temp.....mmmm......capitato a qualcuno? :mbe:

Nn ho la crosshair Z ma hwinfo ha dato questo problema anche a me... risolto scaricando la versione aggiornata, altrimenti c'é hwmonitor... da meno informazioni, ma anche meno problemi.

;) ciauz

]Fl3gI4s[
16-08-2015, 10:57
sono rimasto un po indietro con le cpu, ma la fx8350 di qualche anno fà rappresenta la soluzione piu' veloce di amd in ambito mainstream giusto?

davo30
16-08-2015, 11:38
Fl3gI4s[;42766214']sono rimasto un po indietro con le cpu, ma la fx8350 di qualche anno fà rappresenta la soluzione piu' veloce di amd in ambito mainstream giusto?

Purtroppo si. Gli FX8xxx sono il meglio che ci offre AMD attualmente

Amorph
16-08-2015, 11:42
Purtroppo si. Gli FX8xxx sono il meglio che ci offre AMD attualmente

il meglio non è l'FX9590?:confused:

lidel
16-08-2015, 12:04
il meglio non è l'FX9590?:confused:
Spendere la cifra richiesta per il 9590 e' una follia, per non parlare dei consumi esageratissimi. A quella cifra trovi i7 o xeon 1230 nel mercatino dell'usato e forse risparmi anche qualcosa. Di amd la cpu 8320 e' forse l'unica cpu che vale l'acquisto

Amorph
16-08-2015, 12:19
Spendere la cifra richiesta per il 9590 e' una follia, per non parlare dei consumi esageratissimi. A quella cifra trovi i7 o xeon 1230 nel mercatino dell'usato e forse risparmi anche qualcosa. Di amd la cpu 8320 e' forse l'unica cpu che vale l'acquisto

si parlava del meglio e non del più vantaggioso

]Fl3gI4s[
16-08-2015, 12:33
Dato una rapida occhiata ma il 9590 ha tdp di 220w, non ricordo di aver visto mai un tdp simile..

batou83
16-08-2015, 13:27
Fl3gI4s[;42766520']Dato una rapida occhiata ma il 9590 ha tdp di 220w, non ricordo di aver visto mai un tdp simile..

Il migliore in assoluto è l'FX 9590 per le alte frequenze, però il più conveniente è l'FX 8370 che teoricamente dovrebbe richiedere meno vcore rispetto all' FX 8350.

FroZen
16-08-2015, 13:36
Provo hwmonitor...a me sembra di aver installato tutti i driver della mobo...strano che con una piattaforms cosi vecchia scazzi...

Cmq in media fli 8350 a vdef che frequenze tirano?

isomen
16-08-2015, 14:35
Provo hwmonitor...a me sembra di aver installato tutti i driver della mobo...strano che con una piattaforms cosi vecchia scazzi...

Cmq in media fli 8350 a vdef che frequenze tirano?

Hai provato la versione 5.02 di hwinfo?

Sui 4,4ghz... ma il voltaggio default cambia anche di oltre 0,1 da un esemplare all'altro.

;) ciauz

isomen
16-08-2015, 14:42
Il migliore in assoluto è l'FX 9590 per le alte frequenze, però il più conveniente è l'FX 8370 che teoricamente dovrebbe richiedere meno vcore rispetto all' FX 8350.

Ho un 8370E che con 1,16 tiene 4ghz... ma a 4,6 le differenze con l'8350 sono già molto risicate.

;) ciauz

tuttodigitale
16-08-2015, 16:05
E quale mia frase ti fa capire diversamente?
Scrivendo nella prima incarnazione intendo dire che al suo debutto Zen sarà solo CPU senza GPU mentre molto probabilmente dopo la versione apu EX vedremo quella Zen.

Rileggendo meglio, ho fatto un 1+1 di troppo. Avevo capito che un apu non possa essere indirizzata al mercato High-end, dove in realtà è proprio li che dovrebbe puntare tutto il progetto HSA, visto i costi di sviluppo sul software sarebbero compensati da una potenza di calcolo e soprattutto efficienza molto più elevata.
Concretamente, credo che non la prima ma la seconda revisione di Zen avrà un igp integrata. E non parlo di versioni ridotte a 4 core. Credo infatti che sia tutto un problema di tempistiche.


P.s: però avete notato che sono spariti i derivati dei core Jaguar dalle slide?

Considera che oggi un modulo excavator richiede solo 2,5W per girare a 1,7GHz (AVFS e HDL fanno letteralmente miracoli a questa frequenza)...Un die shrink a 14-16 nm, e potrebbe diventare una buona architettura per smartphone e tablet.
Quindi la cancellazione di jaguar potrebbe non essere un problema, anche se faccio notare che la compatibilità dello zoccolo FP-4 non taglia definitivamente fuori la possibilità di fare apu di 7 gen con core di derivazione jaguar (ricordo che carrizo-L non ha core xv).

In realtà non c'è scritto così, c'è scritto fx cpu ma anche 8800p è un fx :rolleyes:

in questo caso mi sento di dare ragione a george. Per l'appunto c'è scritto fx cpu

http://www.tomshw.it/data/thumbs/9/5/8/2/amd-financial-analyst-day-2015-07-55f67c92811f643d6a18ee0e39f1df875.jpg
in questa slide però, c'è un chiaro riferimento di apu indirizzato al mercato HPC e workstation. Chissà se già siano partite le ordinazioni da parte di chi progetta certe macchine.
PS il fatto che ci sia la scritta new generation, mi fa ipotizzare che siano basati ancora su excavator. Vuoi vedere che le prossime apu desktop avranno si cpu excavator ma un numero di core superiore a 4.


Ricordo che il pc precedente era un Athlon 64 3200+ Venice pagato 200€ (84mm^2 di die)
avresti ottenuto più o meno le stesse prestazioni comprando un Sempron 3100+, che considero il best-buy del 2004, e occarlo di 200MHz.
Il bello, di quel periodo, che con una cpu da 100-120 euro se avevi c..o, potevi potarti a casa le prestazioni di cpu ben superiore:
http://www.xbitlabs.com/articles/cpu/display/sempron-3100-oc.html

oggi fare qualcosa del genere è impensabile. Le cpu low-budget sono molto più lente dei corrispettivi top di gamma.


Ricordo che il pc precedente era un Athlon 64 3200+ Venice pagato 200€ (84mm^2 di die), con 2x512mb ddr e mobo Sapphire bolsa, seppur pagata sui 100€. E 200€ di x800gto2, con i suoi mitici sm 2.0b :muro
Sulle memorie hai in effetti ragione. Costavano tanto. Ma oggi la situazione si sta ripresentando in maniera subdola: le richieste di spazio stanno aumentando, sia per il software sia per i contenuti, mentre il prezzo al GB è rimasto stabile, ad essere ottimisti.
Sulla x800gto2, valeva indiscutibilmente il suo prezzo.

FroZen
16-08-2015, 16:31
Hai provato la versione 5.02 di hwinfo?

Sui 4,4ghz... ma il voltaggio default cambia anche di oltre 0,1 da un esemplare all'altro.

;) ciauz

Ho provato l'ultima disponibile stabile, ma per una architettura di tre anni ripeto mi fa strano... Si freeza o subito o al caricamento della
Gpu...non so a che tensione e temp si assesta in oc e quindi sono cieco...

davo30
16-08-2015, 20:53
il meglio non è l'FX9590?:confused:

non l'ho volutamente preso in cosniderazione quell'insulto di cpu

george_p
16-08-2015, 21:34
In realtà non c'è scritto così, c'è scritto fx cpu ma anche 8800p è un fx :rolleyes:

Edit: che poi probabilmente sarà anche così, ma non è quella slide che lo dice.
Ma poi siamo qua a discutere delle slide? :D
Dai Paolo è così in hype che vede indizi anche dall'altezza dei quadratini :asd:


E' a maggior ragione che c'è scritto FX cpu che le apu sono inizialmente escluse, poi se le slide saranno cambiate è un altro conto.
Amd ha dichiarato tramite Lisa Su di voler tornare attiva nel settore High end e server puntando tutto su zen, quindi è anche logico che prima di un apu zen faccia il suo debutto con le cpu FX.

Le slide sono quelle confermate ufficialmente da amd quindi, che si concretizzino o meno ad oggi questi sono i loro piani se ehm... coff coff... cough... glofo glielo permette :stordita: ergo servono (le slide) come punto di riferimento per il nostro discorso FX cpu e apu.



Rileggendo meglio, ho fatto un 1+1 di troppo. Avevo capito che un apu non possa essere indirizzata al mercato High-end, dove in realtà è proprio li che dovrebbe puntare tutto il progetto HSA, visto i costi di sviluppo sul software sarebbero compensati da una potenza di calcolo e soprattutto efficienza molto più elevata.
Concretamente, credo che non la prima ma la seconda revisione di Zen avrà un igp integrata. E non parlo di versioni ridotte a 4 core. Credo infatti che sia tutto un problema di tempistiche.

http://www.tomshw.it/data/thumbs/9/5/8/2/amd-financial-analyst-day-2015-07-55f67c92811f643d6a18ee0e39f1df875.jpg
in questa slide però, c'è un chiaro riferimento di apu indirizzato al mercato HPC e workstation. Chissà se già siano partite le ordinazioni da parte di chi progetta certe macchine.
PS il fatto che ci sia la scritta new generation, mi fa ipotizzare che siano basati ancora su excavator. Vuoi vedere che le prossime apu desktop avranno si cpu excavator ma un numero di core superiore a 4.




Infatti.
Se con la settima generazione di apu utilizzeranno Excavator come penso che sia, e il processo produttivo utilizzato sarà almeno sui 16 nm FF+ allora son sicuro ne faranno una versione 8x, visto che dal 28nm bulk al 16 (o al 14 nm) ci sono ben due nodi di differenza.

Amorph
16-08-2015, 21:42
non l'ho volutamente preso in cosniderazione quell'insulto di cpu

non ho mai capito cosa cambiava rispetto agli 8000 per giustificarne il prezzo altissimo e i 200w

DanieleRC5
16-08-2015, 22:08
non ho mai capito cosa cambiava rispetto agli 8000 per giustificarne il prezzo altissimo e i 200w

I 9xxx sono cpu nate per l'overclock ma non sono nulla di piu' di esemplari "scelti" delle versioni 8xxx con un limite di tdp portato a 220w. Detto quanto sopra comunque anche alla luce del tdp e dellla vocazione all'overclock venivano vendute prima senza alcun dissipatore e poi con possibilita' di averle con in dotazione un dissy aio.
Io continuo a Non pentirmi dell'acquisto del 9590 ( pagato circa 350€). Mi sono divertito prima e continuo tuttora a divertirmi tantissimo alla ricerca di qualche briciola di performance qua' e la' con un buon kit a liquido custom sto a 5.1 ghz nell'uso di tutti i giorni con temperature bassissime anche i estate e consumi tutto sommato "ragionevoli" ( sto installando win 7 e nella presa a muro leggo un consumo di circa 220w, navigando sto sui 155)

Inviato dal mio SM-N9005 utilizzando Tapatalk

Amorph
16-08-2015, 22:11
ricordo male io oppure quando è uscito costava 800 o 900€ il 9590?

DanieleRC5
16-08-2015, 22:17
Si quando e' uscito era intorno a quelle cifre ma dopo qualche tempo i prezzi sono (giustamente.....) crollati

Inviato dal mio SM-N9005 utilizzando Tapatalk

Amorph
16-08-2015, 22:20
Si quando e' uscito era intorno a quelle cifre ma dopo qualche tempo i prezzi sono (giustamente.....) crollati

Inviato dal mio SM-N9005 utilizzando Tapatalk

ricordavo bene allora

paolo.oliva2
17-08-2015, 10:41
I 9xxx sono cpu nate per l'overclock ma non sono nulla di piu' di esemplari "scelti" delle versioni 8xxx con un limite di tdp portato a 220w. Detto quanto sopra comunque anche alla luce del tdp e dellla vocazione all'overclock venivano vendute prima senza alcun dissipatore e poi con possibilita' di averle con in dotazione un dissy aio.
Io continuo a Non pentirmi dell'acquisto del 9590 ( pagato circa 350€). Mi sono divertito prima e continuo tuttora a divertirmi tantissimo alla ricerca di qualche briciola di performance qua' e la' con un buon kit a liquido custom sto a 5.1 ghz nell'uso di tutti i giorni con temperature bassissime anche i estate e consumi tutto sommato "ragionevoli" ( sto installando win 7 e nella presa a muro leggo un consumo di circa 220w, navigando sto sui 155)

Inviato dal mio SM-N9005 utilizzando Tapatalk
Penso che tutt'oggi il 9590 abbia senso, perché rappresenta un'alternativa all'8370 (mi sembra costi 20€ in più) perché fino ai 4,6GHz sono simili, forse con l'8370 più parco nei consumi, ma il 9590 si occa ancora benissimo mentre l'8370 si siede. La scelta è tutta in base alla dissipazione adottata, perché credo che il liquido con l'8370 sia inutile (nel senso che arriva un limite silicio prima di un TDP alto da liquido) mentre il 9590 ha un senso solamente con accoppiato il liquido (anche se ad aria salirebbe di più di un 8350).

Io prenderò un 8370... Perché non so quale max TDP potrò reggere in Africa. Per Zen ci vorrà parecchio tempo ancora, ma presumo che un upgrade all'8150 con un 9590 sarà possibile a prezzi ultra-scontati in concomitanza all'uscita di Zen.
Zen uscirà nel 2016, richiederà le DDR4, mobo nuova e quant'altro, va bene l'acquisto di un sistema, ma per chi vuole avere anche un muletto, un sistema AM3+ (con modo di fascia alta) che supporti 9590/8370 rimarrebbe sempre un ottimo sistema secondario per spiccioli.

MICENE89
17-08-2015, 13:06
Veramente per server hanno già annunciato un'apu da 32 core e 32Gb di HBM o sbaglio?

Qui: AMD: l'APU next-gen (EHP) per i futuri supercomputer exascale (http://www.bitsandchips.it/9-hardware/5858-amd-exascale-heterogeneous-processor) parlano di 16 core e 32 thread.

george_p
17-08-2015, 14:26
Veramente per server hanno già annunciato un'apu da 32 core e 32Gb di HBM o sbaglio?

Se me ne fanno una 4-6 core con 4-8Gb di HBM per il mercato consumer potrei essere interessato, dopo aver visto i benchmark ovviamente.

Mmmh no, non mi pare proprio per niente.
Fonte?

paolo.oliva2
17-08-2015, 16:20
Qui: AMD: l'APU next-gen (EHP) per i futuri supercomputer exascale (http://www.bitsandchips.it/9-hardware/5858-amd-exascale-heterogeneous-processor) parlano di 16 core e 32 thread.

Secondo me, li è relivamente semplice il tutto, nel senso che HSA è un progetto valido ma che deve entrare nel software di massa, mentre con "quella APU", si raggiungerebbe un risparmio hardware/consumo tale da permettere qualsiasi costo di un software "su misura".

Zen deve assolutamente entrare come X86 e non APU perché HSA non è maturo, quindi avere più margine TDP sui core significa raggiungere potenze più elevate a parità di potenzialità nuova architettura Zen, sia tramite frequenza del e/o max numero di core.

Mia idea (ma personalissima e discutibile) è che AMD una sorta di sicurezza sul nuovo PC la deve avere, perché partiamo da un punto: il core Excavator deve comunque essere trasportato dal bulk al nuovo silicio (che ha tutte le sigle tranne bulk), quindi se non ci fosse disponibilità di un PP idoneo a 95W/125W, avrebbe comunque potuto usare il 22nm SOI sempre di GF cioè quello della catena power8. Non so le peculiarità, ma per certo sopporta >300W TDP e frequenze di 5GHz, per quanto intoppo ci possa essere da non X86 a X86, il vantaggio sul 32nm SOI in tutti i casi sarebbe enorme.
Quindi mi pare improbabile che AMD possa annunciare Zen e determinati obiettivi su un silicio non HP 14/16nm.

Tralasciando il discorso =<X4, il vero prb di AMD è stato il silicio, perché per quanto possa incidere l'IPC, la catastrofe vera e propria è stata la potenza max a die dentro un determinato TDP. Non è che voglia sminuire l'IPC, ma è innegabile che il passaggio dal 32nm SOI che doveva riuscire a raggiungere i 20 core (2 * X10) nei 140W, e ci si è fermati a 16 (2 * X8), un 22nm con un buon TDP garantirebbe una performance doppia a die.

tuttodigitale
17-08-2015, 17:25
HSA, o meglio l'intero progetto fusion, aveva come obiettivo primario proprio il mercato high end. Proprio in virtù del fatto che un aumento di efficienza significa risparmiare moltissimi dindi, il mercato HPC ben volentieri sposerà la causa HSA se questa si reputerà all'altezza (.

Per me non è vero che HSA non sia maturo. Può migliorare certo, ma già oggi offre un livello di flessibilità sconosciuto alle soluzioni discrete.
Secondo mr, il debutto con soluzioni cpu only è solo per anticipare l'entrata di ZEN

http://www.bitsandchips.it/cache/550x502-equal_images_2015_08_01_AMD-exascale.png
perché in questo disegno i core sono 32?

MICENE89
17-08-2015, 18:24
Me lo stavo chiedendo anch'io. Forse hanno scelto di rappresentare graficamente sia i core fisici che quelli "virtuali".

george_p
17-08-2015, 19:03
Non ne sono sicuro ma quell'immagine non è una grafica amd.

el-mejo
17-08-2015, 20:44
Penso che tutt'oggi il 9590 abbia senso, perché rappresenta un'alternativa all'8370 (mi sembra costi 20€ in più) perché fino ai 4,6GHz sono simili, forse con l'8370 più parco nei consumi, ma il 9590 si occa ancora benissimo mentre l'8370 si siede. La scelta è tutta in base alla dissipazione adottata, perché credo che il liquido con l'8370 sia inutile (nel senso che arriva un limite silicio prima di un TDP alto da liquido) mentre il 9590 ha un senso solamente con accoppiato il liquido (anche se ad aria salirebbe di più di un 8350).

Io prenderò un 8370... Perché non so quale max TDP potrò reggere in Africa. Per Zen ci vorrà parecchio tempo ancora, ma presumo che un upgrade all'8150 con un 9590 sarà possibile a prezzi ultra-scontati in concomitanza all'uscita di Zen.
Zen uscirà nel 2016, richiederà le DDR4, mobo nuova e quant'altro, va bene l'acquisto di un sistema, ma per chi vuole avere anche un muletto, un sistema AM3+ (con modo di fascia alta) che supporti 9590/8370 rimarrebbe sempre un ottimo sistema secondario per spiccioli.

Il problema del 9590 è un tdp fuori da ogni logica per un chip da 250mm^2: vorrei vedere dopo un paio di anni 24/7 come son messi i circuiti con l'elettromigrazione...
Se con chip di quelle dimensioni son sempre stati otto i 140w di tdp un motivo ci sarà.

Per quanto riguarda l'Africa: hai proprio necessità di portare un desktop?

MICENE89
17-08-2015, 21:05
Perché te lo avevo detto che parlavano di 32 core e non 16c/32t :D
http://hardware.hdblog.it/2015/08/03/AMD-ZEN-sara-una-APU-da-32-Core-e-memorie-HBM2/

Controllando più approfonditamente noterai che la fonte di HDBlog è TweakTown, la cui fonte è WCCFTech, la cui fonte principale è proprio Bits and Chips. Ora, non so se quelli di bits and chips abbiano sbagliato il conteggio o cosa, ma sinceramente credo più a quello che scrivono loro piuttosto che a quello che riportano tutti gli altri.

Inoltre mi chiedo anche come AMD possa creare un'APU che unisce 32 core fisici + HBM + una parte grafica del genere... al momento nemmeno intel riuscirebbe a creare qualcosa del genere, figurarsi AMD (che di certo non naviga nell'oro).

Infatti WCCFTech aggiunge:

This brings us to our third deduction. A 2.5D interposer has been used in the EHP (APU) and the CPU and GPU cores all togethery are too numerous (and huge) to have been manufactured as a single die. Not only would the yields on such a monstrosity be beyond imagining, it would be pretty impossible to manufacture such a thing in the first place. The likely conclusion is therefore, that the two compute and graphic portions of the APU are manufactured separately and put together on the interposer later on in assembly (possibly at UMC’s Fab 12 foundry in Singapore, which is already used to assemble Fiji dies). So basically, AMD is fabricating the compute side of the Scale Heterogeneous Processor (EHP) in dies with 16 Zen cores each, for a total of 2 computing and 1 graphics die assembled on the interposer (ignoring the HBM).

isomen
17-08-2015, 23:10
Probabilmente chiedo la luna, ma si sa qualcosa sulla compatibilità dei dissi?
Perché mi trovo a dover comprare un dissi e se so che va bene pure per Zen ne prendo un bello spendendo qualcosa in più, ma non vorrei spenderci troppo e poi scoprire che Zen è un bel prodotto ma non compatibile con il mio dissi.

Visto che il nuovo socket si chiama AM4 hai buone speranze xhe sia compatibile, da am2 nn ha mai cambiato... oppure prendi un noctua e se nn va bene, ti mandano le clip per il nuovo sckt gratis :asd:

;) ciauz

paolo.oliva2
18-08-2015, 01:20
Il problema del 9590 è un tdp fuori da ogni logica per un chip da 250mm^2: vorrei vedere dopo un paio di anni 24/7 come son messi i circuiti con l'elettromigrazione...
Se con chip di quelle dimensioni son sempre stati otto i 140w di tdp un motivo ci sarà.

Per quanto riguarda l'Africa: hai proprio necessità di portare un desktop?

Il die degli FX sopporta 230W, il TDP nominale è quanto si vuole applicare.
Qui chi ha preso un FX alla prima uscita, l'ha ancora montato senza alcun problema da 4 anni (ed occato) . L'FX BD 32nm SOI di difetti ne ha, ma in quanto a robustezza silicio e morti per OC, penso che non sia mai successo in tutto il TH.
Il chip di un 8350 è sui 315mm2.. Ma il 32nm SOI, per quanto al di sotto delle aspettative, è molto robusto. Il Vcore max è circa 1,625V, dopo degrada. Il Vcore per OC io non ho superato 1,6V, ma pensa che la stessa AMD applica ad un 9590 1,55V in turbo, diciamo +0,025V in più del necessario, appunto perché, a parte il calore, il silicio prb non ne dà.

Io in Africa ci abito... Per la precisione Alepe, 40km da Abidjan, sono a meno di un grado dallo zero dell'equatore. Mi sono trasferito da quasi 4 anni. Purtroppo è stata una necessità, diciamo che là io "lavoro" (per modo di dire) 3 mesi l'anno, ma lavoro per me, in Italia ne lavori 12 di cui solo 3 per te ed il resto per... non si sa bene per chi.

el-mejo
18-08-2015, 09:42
Il die degli FX sopporta 230W, il TDP nominale è quanto si vuole applicare.
Qui chi ha preso un FX alla prima uscita, l'ha ancora montato senza alcun problema da 4 anni (ed occato) . L'FX BD 32nm SOI di difetti ne ha, ma in quanto a robustezza silicio e morti per OC, penso che non sia mai successo in tutto il TH.
Il chip di un 8350 è sui 315mm2.. Ma il 32nm SOI, per quanto al di sotto delle aspettative, è molto robusto. Il Vcore max è circa 1,625V, dopo degrada. Il Vcore per OC io non ho superato 1,6V, ma pensa che la stessa AMD applica ad un 9590 1,55V in turbo, diciamo +0,025V in più del necessario, appunto perché, a parte il calore, il silicio prb non ne dà.

Io in Africa ci abito... Per la precisione Alepe, 40km da Abidjan, sono a meno di un grado dallo zero dell'equatore. Mi sono trasferito da quasi 4 anni. Purtroppo è stata una necessità, diciamo che là io "lavoro" (per modo di dire) 3 mesi l'anno, ma lavoro per me, in Italia ne lavori 12 di cui solo 3 per te ed il resto per... non si sa bene per chi.

Non circordavo che PD avesse un die così grande! E non credevo che questo PP fosse così robusto, seppur queste frequenze sono ben distanti dallo sweet spot.

Imho anche in Africa un 9590 puoi tenerlo, basta che usi un dissipatore aio (meglio se dual slot) o uno buono ad aria come i Noctua top di gamma.
Che temperature massime hai li in casa?

paolo.oliva2
18-08-2015, 11:18
Non circordavo che PD avesse un die così grande! E non credevo che questo PP fosse così robusto, seppur queste frequenze sono ben distanti dallo sweet spot.

Imho anche in Africa un 9590 puoi tenerlo, basta che usi un dissipatore aio (meglio se dual slot) o uno buono ad aria come i Noctua top di gamma.
Che temperature massime hai li in casa?

Il problema all'equatore non è il procio in sé, ma la mobo. Detto papale, il procio ha tutta una serie di protezioni al suo interno che lo proteggono dalle temp ed è impossibile (praticamente) bruciare. Ma per la mobo non c'è nulla da fare e credo che tutte le mobo mi siano saltate per questo, ma non perché le dissipazioni sulla mobo non bastassero, ma proprio per fusione delle piste attorno al socket.
Allora, io avevo una cf v-z, una cf-v, una cf-iv ed una asrock 95W massimi senza dissipazione sulla parte alimentazione.
Il mio impianto di dissipazione è a liquido, in Italia 4,6GHz con temp max 45 gradi, OC bench 5,217GHz 1,6V, RS circa 5,1GHz e RS DU max 1,5V. In Africa, 1,425V per 65 gradi e 4,3GHz,e mi sono saltate 3 modo. Con la Asrock invece ho fatto 6 mesi appunto perché reggendo max 95W, tenevo il procio a 2,2GHz come X8 o 3,2/3,4GHz come X6, e la moto non aveva alcun sistema di dissipazione.
Da qui mi sono fatto l'idea che ci sia proprio un problema di TDP procio che si riversa sulla mobo che la temp ambiente non permette di smaltire. La temp ambiente di per sé non è altissima, 32/36 gradi massimi, ma arrivo a 40 nella stanza. Quando ritorno ho in progetto di fare un serbatoio interrato per l'acqua da 65.000 litri e di fianco ci faccio la cantina. L'idea è quella di avere 20-25 gradi ambiente, temp liquido uguale, posso far funzionare un deumidificatore e di qui il Wc quando voglio benchare. Se tutto va bene e riscontro di non avere più moria di mobo, allora posso pensare ad un 140W Intel e magari allo sfizio di un 9590.

Piedone1113
18-08-2015, 12:17
Il problema all'equatore non è il procio in sé, ma la mobo. Detto papale, il procio ha tutta una serie di protezioni al suo interno che lo proteggono dalle temp ed è impossibile (praticamente) bruciare. Ma per la mobo non c'è nulla da fare e credo che tutte le mobo mi siano saltate per questo, ma non perché le dissipazioni sulla mobo non bastassero, ma proprio per fusione delle piste attorno al socket.
Allora, io avevo una cf v-z, una cf-v, una cf-iv ed una asrock 95W massimi senza dissipazione sulla parte alimentazione.
Il mio impianto di dissipazione è a liquido, in Italia 4,6GHz con temp max 45 gradi, OC bench 5,217GHz 1,6V, RS circa 5,1GHz e RS DU max 1,5V. In Africa, 1,425V per 65 gradi e 4,3GHz,e mi sono saltate 3 modo. Con la Asrock invece ho fatto 6 mesi appunto perché reggendo max 95W, tenevo il procio a 2,2GHz come X8 o 3,2/3,4GHz come X6, e la moto non aveva alcun sistema di dissipazione.
Da qui mi sono fatto l'idea che ci sia proprio un problema di TDP procio che si riversa sulla mobo che la temp ambiente non permette di smaltire. La temp ambiente di per sé non è altissima, 32/36 gradi massimi, ma arrivo a 40 nella stanza. Quando ritorno ho in progetto di fare un serbatoio interrato per l'acqua da 65.000 litri e di fianco ci faccio la cantina. L'idea è quella di avere 20-25 gradi ambiente, temp liquido uguale, posso far funzionare un deumidificatore e di qui il Wc quando voglio benchare. Se tutto va bene e riscontro di non avere più moria di mobo, allora posso pensare ad un 140W Intel e magari allo sfizio di un 9590.
Se si sono spente normalmente e mai più ripartite è facile che si formi condensa sotto al socket (e se non sbaglio dovresti avere alta umidità ambiente).
c'erano delle asrock che avevano la funzione anticondensa (prima di dare corrente a tutto facevano un preriscaldamento della mobo per asciugare la condensa), ma non so se ci sono per am3+ e se davvero funzionino.

tuttodigitale
18-08-2015, 14:24
La concorrenza oggi si ferma a 18core per 145W, non usa ne HDL ne AVFS, che intorno a 2 GHz sono come un die shrink ben riuscito. Con Broadwell dovrebbe addirittura spingersi a 22 core.un eventuale APU, anche per il tipo di calcolo per cui è destinata, potrebbe fare a meno della l3, a favore di un buffer più ampio e comunque molto veloce.
un core Skylake con cache l2 occupa solo 10mmq...(anche la cache l3 è molto piccola), e comunque l'intera cpu a netto dell'igp occupa 75mmq.

In sostanza in 40mmq dove prima entrava un modulo BD con l2 , entrano 4 core skylake con l2.. estendendo il ragionamento a ZEN, questo significa che un apu con 8 core Zen e una igp da 1024sp avrebbe un die size minore di 200mmq.
Quindi si, è fisicamente possibile far rientrare 32core ZEN (che da soli occuperebbero circa 300mmq) e una igp da 2048sp (circa 90-100mmq), in 600mmq di die size .

sul lato tdp non dovrebbe esserci problema alcuno, visto le caratteristiche nominali del fx8800p

FedeGata
18-08-2015, 15:21
Visto che il nuovo socket si chiama AM4 hai buone speranze xhe sia compatibile, da am2 nn ha mai cambiato... oppure prendi un noctua e se nn va bene, ti mandano le clip per il nuovo sckt gratis :asd:

;) ciauz

Effettivamente Noctua si fa pagare alla grande, ma i loro dissipatori sono eterni, sopratutto per il supporto post vendita.

el-mejo
18-08-2015, 15:48
Il problema all'equatore non è il procio in sé, ma la mobo. Detto papale, il procio ha tutta una serie di protezioni al suo interno che lo proteggono dalle temp ed è impossibile (praticamente) bruciare. Ma per la mobo non c'è nulla da fare e credo che tutte le mobo mi siano saltate per questo, ma non perché le dissipazioni sulla mobo non bastassero, ma proprio per fusione delle piste attorno al socket.
Allora, io avevo una cf v-z, una cf-v, una cf-iv ed una asrock 95W massimi senza dissipazione sulla parte alimentazione.
Il mio impianto di dissipazione è a liquido, in Italia 4,6GHz con temp max 45 gradi, OC bench 5,217GHz 1,6V, RS circa 5,1GHz e RS DU max 1,5V. In Africa, 1,425V per 65 gradi e 4,3GHz,e mi sono saltate 3 modo. Con la Asrock invece ho fatto 6 mesi appunto perché reggendo max 95W, tenevo il procio a 2,2GHz come X8 o 3,2/3,4GHz come X6, e la moto non aveva alcun sistema di dissipazione.
Da qui mi sono fatto l'idea che ci sia proprio un problema di TDP procio che si riversa sulla mobo che la temp ambiente non permette di smaltire. La temp ambiente di per sé non è altissima, 32/36 gradi massimi, ma arrivo a 40 nella stanza. Quando ritorno ho in progetto di fare un serbatoio interrato per l'acqua da 65.000 litri e di fianco ci faccio la cantina. L'idea è quella di avere 20-25 gradi ambiente, temp liquido uguale, posso far funzionare un deumidificatore e di qui il Wc quando voglio benchare. Se tutto va bene e riscontro di non avere più moria di mobo, allora posso pensare ad un 140W Intel e magari allo sfizio di un 9590.

In effetti l'oc con quelle temperature è problematico, ma mi fa strano tutti quei problemi con mobo di alte qualità e senza oc. Io ho 30 °c in camera e la mobo arriva a 60 senza problemi e oc, e ho letto che la portano anche oltre...
Più probabile che sia condensa, oppure problemi all'erogazione elettrica della zona in cui abiti, o dell'alimentatore direttamente.