|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1321 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
|
|
|
|
|
|
#1322 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#1323 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31993
|
Ma dai...
Se un modulo XV ha 100 transistor e processa tranquillamente 2 TH, AMD avrebbe speso soldi per abbandonare il CMT, passare all'SMT e realizzerebbe 1 core che ha gli stessi transistor di 1 modulo XV ma solamente un +40% rispetto ad 1 core XV e sotto al modulo XV? Allora non era 100 volte meglio non spendere 1 lira e realizzare un 16350 (8350 8 core 16350 16 core) e santa pace per tutti? A 200€
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 |
|
|
|
|
#1324 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
La cache esclusiva andava bene quando le cache erano piccole, così si sommavano le capacità e c'erano pochi o un core, quindi il traffico di coerenza era ridotto... Ma ora con capacità enormi e tanti core, la cache esclusiva è un INCUBO. Passare da 256K a 512K compensava questo problema... Ma passare da 8MB a 8.5MB (inclusiva vs esclusiva) non cambia nulla...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
#1325 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Ah e non dimentichiamo che in BD la cache L2 è di 2MB e condivisa tra 2 core... Quindi questo aumenta la latenza rispetto a una piccola (512KB) cache ad uso esclusivo di un core... Già solo questo raddoppia la banda usabile di cache L2 perchè il numero di cache sarà doppio...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
#1326 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
|
|
|
|
|
|
#1327 | ||
|
Senior Member
Iscritto dal: Apr 2011
Città: Funky Town
Messaggi: 3396
|
Quote:
Ad ogni modo non sottovaluto affatto la L3, la ritengo importantissima. Quote:
Di conseguenza con la (finalmente) libertà data agli ingegneri, il "tutto" dovrebbe realmente rendere al meglio. P.S. Puoi usare tranquillamente terminologie più tecniche, non siamo tutti salumieri Scrivi pure 'blocchi'
__________________
......... |
||
|
|
|
|
#1328 |
|
Senior Member
Iscritto dal: Apr 2016
Messaggi: 391
|
qualcuno di voi ha acquistato il nuovo athlon 845 (a 60€) con nuova architettura excavator? ho letto su un sito che a 3,8Ghz lavora quanto una cpu/apu kaveri overclockata a 4.3Ghz, niente male visto che ZEN avrà prestazioni superiori del 40%
|
|
|
|
|
#1329 | ||||
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Quote:
pipeline lunghe=ipc alla broadwell, possibile ma non certo. Quote:
Voglio rimanere con i piedi per terra. Quote:
PS tra skylake e conroe, c'è lo stesso buco, esistente tra un ZEN con ipc basso e BD nel ST quindi ocio, Quote:
Credo che le due ALU siano di supporto. e non avranno minimamente la complessità delle ALU dei core XV, che sono in grado di eseguire mul e div...tanto è vero che secondo bjt2, AMD si è presa il lusso di ridurre i cicli necessari al MUL, tanto c'è solo una unità su 4 in grado di eseguire questo tipo di operazioni... Lato integer, potrebbere essere molto più snella (ipotizzo): MODULO XV 4 AGU + 2 ALU 0 (MUL) + 2ALU 1 (DIV) core ZEN 2 AGU+1 ALU_0 (MUL) + 1ALU_1 (DIV) + 1ALU_2 (shift?)+ 1ALU_3(branch) i decoder passano da 8 a 4, e anche lo scheduler int passa da 2 a 1, e non è detto che il numero di voci sia il medesimo. 4 decoder sono grandi circa 1/3 della FPU. Quest'ultimo occupa il 17% della superficie di un modulo. Anche se un modulo BD avesse avuto 2 FPU, una per core, sarebbe stato comunque molto più piccolo di SB... La L0, cache e quant'altro, a me appaiono necessari per aumentare l'ipc nel ST del 10-20%. Non c'è niente che mi faccia pensare ad un +40% secco, salvo la FP. ma in quel caso potrebbe essere indispensabile per aumentare il throughput con le istruzioni a 256 bit...ho il presentimento che le 2 AGU, tra le altre cose. faranno da collo di bottiglia nello scaling. L'unica cosa che può far pensare ad un raddoppio della superficie o quasi è un aumento vertiginoso dell'ipc. Ci sta, potrebbe essere, ma è un ipotesi tanto valida quanto quella di un core non tanto più grande di k10...(piccolissimo rispetto al corrispettivo Intel..) e nettamente più piccolo di un modulo XV... Ultima modifica di tuttodigitale : 07-04-2016 alle 22:29. |
||||
|
|
|
|
#1330 |
|
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
non capisco il ragionamento, cosa vuol dire 95% più di efficienza?
|
|
|
|
|
#1331 | |
|
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
possibilità di rettifica ma con storico (cioè salvare le vecchie previsioni) Ultima modifica di digieffe : 07-04-2016 alle 22:32. |
|
|
|
|
|
#1332 | |
|
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
TDP 95-125w significa prendersi un margine di ~500mhz più la variabilità di 3.6-3.7 significa che ci prenderai in ogni caso |
|
|
|
|
|
#1333 |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Previsioni Prestazioni ZEN (pendolinate)
digieffe
Zen 95w IPC ST ~82..88% di Skylake Frequenza base ~3.2ghz Frequenza turbo ~3.7ghz gridracedriver IPC ~90% BW (CineBench r11.5/r15) (simile a digieffe in effetti lui si riferisce a SL) SMT +50% (CineBench r11.5/r15) TDP 125w Zen 8c/16th Top 3.7ghz def 4.2ghz turbo tuttodigitale IPC MT ~75% Skylake IPC ST ~ 82% skylake SMT +25% TDP ? 4.3 ghz def 5.3 ghz turbo Prestazioni MT = +14% i7 5960x == 85% i7 6950x prestazioni ST = 98% i7 6700k bjt2 4GHz (base) / 4.8GHz (turbo max) Veradun Zen x8 TDP 95W 4.0 GHz (x8) -> 4.2 GHz (x4) -> 4.6 GHz (x2) -> 5.0 GHz (x1) ziobepi Zen x8 (16th) <3GHz ![]() Free Gordon Zen 16threads TDP 95W Base clock 3.5ghz Boost clock (1 core) 4.0ghz Prestazioni MT = 5-10% sotto 6900K Prestazioni ST = 10% sotto SKL MisterD Visto che ci siamo per me Zen x8/16th avrà queste frequenze 3,6 GHz base 3,8 all core se temp < tCase max 4,0 Ghz 6 core 4,4 Ghz 4 core 4,8 Ghz 2 core TDP 95 watt. Prezzo 500 euro se grazie all'ipc e alla frequenze più alte avrà prestazioni in linea con i7 6900k (in alcuni test un filo meglio e in altri un filo meno) Ultima modifica di tuttodigitale : 19-08-2016 alle 16:15. |
|
|
|
|
#1334 |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
|
|
|
|
|
#1335 |
|
Senior Member
Iscritto dal: Sep 2008
Messaggi: 36493
|
Si ma poco. Più che altro fa un po' ridere che si stimi l'IPC di una architettura che non esiste ancora con un'altra che ancora non è in commercio realmente di cui non si sa l'IPC (e che storicamente non è mai stato uguale alla controparte non -E)
__________________
Ryzen 5950x PBO2 - Asus B550m TUF- G.Skill 32GB 3200Mhz - ZOTAC 3080 12GB OC - 990 PRO 1TB - 970 EVO 1TB - 860 EVO 250GB
Asus ROG Ally Z1 Extreme |
|
|
|
|
#1336 |
|
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
preciso: quando mi riferisco alle architetture intendo cpu desktop, quindi skylake=6700, haswell=4770
Ultima modifica di digieffe : 07-04-2016 alle 23:35. |
|
|
|
|
#1337 | |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31993
|
Quote:
Il core Zen ha l'FP proprietaria, il modulo XV ha circa la stessa FP. Il fatto dei 4 decoder/8 decoder, alla fine sono i medesimi (non rispetto core Zen vs modulo XV, ma rispetto a 1 FP a core (4 decoder * 2 core = 8 decoder) e sempre 1 FP nel modulo su 2 core. Per l'introduzione dell'SMT... come farebbe ad avere un'architettura più snella del CMT, quando per logica il CMT condivide parti (e quindi ha lo scopo di ridurre i transistor totali) mentre l'SMT potenzia il core, aumentando il numero di transistor (con la logica di ottenere una potenza superiore con un minimo di transistor in più). Come farebbe ad essere il core Zen più piccolo del core XV o per meglio dire che un modulo XV corrisponderebbe a 2 core Zen? (discorso a parte sulle cache). P.S. Allora Tuttodigitale... sparo anche io il mio prognostico su Zen. - sulla base che l'ES BD era 2,8GHz e si arrivò a 3,6GHz e poi 4GHz, matematicamente dall'ES Zen 3GHz direi che si possa arrivare ~3,9GHz nei 95W, quindi secondo me commercialmente avremo Zen a partire da 3,6GHz nei 95W e modello di punta >4GHz su TDP 125W. Non penso che AMD sforni un modello di Zen a 140W, perchè se Zen+ sarà APU, non penso voglia realizzare un Zen X86 con clock superiore alla versione APU. - per la potenza, io la faccio nel modo più semplice. Il 14nm secondo me abbasserebbe il TDP del 50% a parità di potenza vs 32nm SOI, quindi se un 14nm FinFet permetterebbe 8 moduli PD nei 125W TDP, vorrebbe dire che 8 core Zen non potrebbero fornire una potenza inferiore rispetto ad un 6 moduli/12 core PD. Stima al minimo, perchè in campo oltre al silicio entrerebbe le HDL e quant'altro che potrebbero variare la proporzione del solo silicio vs silicio. - Il turbo dipenderà solamente da quanto scala il silicio in frequenza rispetto al TDP, però siccome Zen è un'architettura fatta per girare a frequenze più alte di quelle Intel, ci vedrei una possibilità concreta di un range di aumento frequenza anche di +500MHz a salire (magari con la possibilità di più frequenze Turbo a seconda di 4 o 2 core usati). Per me Zen si baserebbe sul core XV (almeno per FO4 e Pipeline) ed era logico visto il tempo, hanno tolto il CMT potenziando quello che pregiudicava la potenza di BD, a tal punto da poter supportare l'SMT. Non mi pronuncio sull'IPC semplicemente perchè Zen comunque partirebbe da un numero di core "popolare" di 8/16 TH che per il momento è offerto solamente da Intel a prezzi direi non popolari, ed il prox Zen APU lo vedo X4+4 anche nel mobile, dove oggi Intel piazza gli I7 X2+2, quindi non mi è chiaro del perchè AMD sembra orientata a dimezzare il prezzo dei TH vs Intel... non ci vedo -50% dei prezzi e potenze simili a Intel, sarei più optato a pensare a un -25% di prestazioni a parità di core/TH, ma reputo possibilissimo un netto vantaggio almeno del 25% tra TDP/potenza su Intel.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 |
|
|
|
|
|
#1338 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31993
|
Doppio, Internet africana
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 Ultima modifica di paolo.oliva2 : 08-04-2016 alle 17:30. |
|
|
|
|
#1339 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
@paolo @tuttodigitale @tutti
Io non paragonerei la FP di BD con quella di Zen: quella di BD fa schifo su AVX sia come latenze, che come throughput... Infatti sembra che utilizzeranno il team di Jaguar: la FPU di Jaguar ha una latenza in cicli di clock e in nanosecondi più bassa persino di quella INTEL sulle AVX (quei test che ho postato ieri). Il problema di Jaguar è che è una CPU a basso consumo e basso costo e quindi ha clock basso e 1/4 della potenza per ciclo di INTEL. Se vediamo Zen come una versione a basso FO4 e raddoppiata di Jaguar (ha anche la cache L2 condivisa e il blocco di 4 CPU come Zen), con in più checkpointing, cache L0, code allungate, SMT, cache inclusiva ed L3, possiamo stimare meglio sia transistor, dimensioni e potenza: per quest'ultima, supponendo che l'aumento di FO4 non faccia perdere IPC, in ST avremo un IPC molto maggiore di Jaguar, per il fatto di avere il doppio delle risorse a disposizione di un solo thread, in MT (2 thread) avremo la cache L0 che non ci farà rimpiangere i doppi decoder e 2 thread che in coda unica si contendono il doppio delle risorse e dalla teoria delle code, coda unica è meglio di code separate. Poi le altre migliorie, non ultima la cache L3 e inclusiva, mi spingono a predirre che il throughput di un core Zen su 2 thread, sarà maggiore, a parità di clock, di due core Jaguar messi insieme e che le prestazioni di un singolo thread, ad esempio in cinebench, saranno 1/1.5=0.66=-33% rispetto a 2 thread, quindi un ST stratosferico.
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
#1340 | |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Quote:
Tra avere una maggiore complessità rispetto al singolo core XV, giustificata dal maggior ipc (10-20-40-80, quello che è) e averne una pari al modulo, ci sono tante possibilità intermedie... Se ZEN avesse un throughput superiore del 80% rispetto ad un singolo core XV, e sarebbe grande come un modulo, si avrebbe addirittura una regressione della potenza per transistore.. credo, che qualora 1 core ZEN avesse la stessa complessità di un modulo, avrrebbe prestazioni, secondo me, doppie rispetto al core XV , proprio perchè le risorse possono essere equilibrate meglio: ho fatto l'esempio delle MUL, e un esempio di un raddoppio delle ALU ad un costo irrisorio. Ma lo stesso vale per lo scheduling, e per tutte le risorse dedicate al core.il smt2, nel primo p4, costava il 5% e dava il 15-20%. Nel power5 costava il 30% e dava il 50%. bjt2 ha pronosticato un aumento del 80% nel SMT2, chi lo sa.. |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 22:05.




















