|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1301 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
PS: in un precedente post, senza citare Amdhal, l'avevo scritto del caso software parellelizzabile o no e del caso ottimizzazione software |
|
|
|
|
|
#1302 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Ma quello rientra nei margini... Ti dicono che supporta 140W: vuol dire che ti garantiscono che funziona a 140W... Poi se tu fai OC e ti va di culo, può anche andare bene a 200W...
Quote:
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#1303 | |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4386
|
Se una persona intende con ipc per core, l'ipc di un core comprendente anche il SMT, sbaglia? Direi di no.
E' lecito scrivere che quella slide non è chiara e volutamente ambigua? Direi di si Diversi studi, scrivono single thread(ed) ipc, IPC for single thread., e il termine throughput viene usato indistintamente per il ST o il MT. Quote:
Se guardiamo quelle potenziali, un core BD surclasserebbe sandy bridge...quindi attenzione anche il numero delle porte, potrebbe assolutamente non essere indicativo dello scaling. credo che tu non sia il solo pignolo. Tuttavia non si può far finta che con il termine throughput uno può riferirsi, sia alle prestazioni nel singolo che nel multi-thread..è un termine generico, che va contestualizzato... Ultima modifica di tuttodigitale : 07-04-2016 alle 16:09. |
|
|
|
|
|
#1304 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
Ripeto visto che le unità che elaborano le istruzioni sono sempre le stesse in un core con SMT attivo o no. Che il marketing sia volutamente poco chiaro direi che non lo scopriamo oggi, ti pare? 1) AMD ha contato sempre i core come le unità integer e un FX8, giustamente, è un 8 core; 2) nell'altra slide dichiara SMT for high throughput e non SMT for high IPC; 3) è difficile fare previsione su quanto apporto darà il SMT visto che è VARIABILE a seconda del software utilizzato. |
|
|
|
|
|
#1305 | ||
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4386
|
Quote:
Quote:
più che altro mi chiedo che senso ha non pubblicizzare l'ipc MT, quando il mercato di riferimento di ZEN è quello server... Ultima modifica di tuttodigitale : 07-04-2016 alle 16:50. |
||
|
|
|
|
#1306 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
Perché se fosse che hanno confrontato davvero un core XV (1th) con un core ZEN (ma 2 th) e la differenza è solo il 40% a parità di frequenza verrebbe veramente una schifezza. Ti faccio 2 calcoli core XV 1th 100 core Zen 2th 140 Ipotetico FX8 basato su core XV = (100+90)*4= 760 Ipotetico 4 core ZEN = 140*4=560 Ipotetico 8 core ZEN = 140*8= 1120 A parità di frequenza e di th ZEN perderebbe con XV e con il doppio dei thread andrebbe solo il +47%. Ho capito bene la tua ipotesi? Sinceramente spero proprio di no |
|
|
|
|
|
#1307 |
|
Senior Member
Iscritto dal: Sep 2005
Messaggi: 2177
|
Pur accogliendo il ragionamento di entrambi do ragione a mister D per quanto riguarda la slide sul +40%, se no da zen si passa a scem.
__________________
__________ Configurazione: Mainboard Gigabyte G1.Sniper A88X (rev. 3.0) ; APU A10 7850K ; HDD Western Digital SATA III WD Blue 1 TB ; Ram Corsair 1866 mhz 16 gb ; OS Seven premium 64 bit |
|
|
|
|
#1308 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Io mi ricordo di aver letto da qualche parte esplicitamente che si riferiva all'ST...
Solo che sono vecchio e non fatemi sforzare la memoria... Poi comunque un confronto equo deve essere almeno a parità di thread... Quindi o 1vs1 e allora è l'"IPC ST" O 2vs2 e quindi è modulo vs core zen+SMT e allora Zen in ST è un mostro... Non vedo motivo per paragonare 1 thread vs 2 in qualsiasi direzione... Augh! Ho parlato!
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
#1309 | ||
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
Mi autoquoto: Quote:
|
||
|
|
|
|
#1310 | ||
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4386
|
Quote:
Secondo me siamo un pò tutti condizionati dalle prestazioni dei prodotti basate su bulldozer, eppure sono convinto che XV, come archittettura, non abbia molto da invidiare ad haswell nel ST... No, per darvi sempre contro Non oso immaginare quanto sarebbe complesso un core ZEN con l'ipc alla broadwell, , visto che ha una penalità da predizione errate ASSAI più alte. E comunque proprio perchè 2core ZEN andrebbequel +47% è circa un + 85% su PD,,,non è poco, o irrilevante. Anzi proprio perchè è una misura di per sé notevole ( e sottolineo NOTEVOLE), resterei con i piedi per terra: 4GHz (ma potrebbero essere ben di più persino a default) con ipc basso, come dite voi, sarebbe pari ad un esacore Intel, e in 95W non è assolutamente un risultato scarso. Ci siamo capiti.. 2 ZEN core (4thread) andrebbero 85-90% di un modulo PD (2thread), e mi pare già un incremento NOTEVOLE. Lo scaling per il SMT potrebbe essere anche ridotto, per quel che ne sappiamo, pari al primo pentium 4...15-20%, quel tanto che basta per incrementare l'efficienza. Le numerosissime porte portano a pensare il contrario lo so.... Quote:
A 4GHz se i miei presupposti fossero confermati, sarebbe già tanto se consumasse 65W (e già così avrebbe un'efficienza esagerata)...secondo me se si fermano a 95W è perchè le frequenze sono già notevoli... Se mi sbaglio, nessun problema... PS 3-3,5GHz 95W non sembra credibile con un fo4 che sembra basso....sarebbe piuttosto conveniente per AMD usare tutto il margine termico a disposizione... Ultima modifica di tuttodigitale : 07-04-2016 alle 19:53. |
||
|
|
|
|
#1311 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Ma con tutte le porte, tutte le unità, la cache L0, il checkpointing, il nuovo branch prediction, le cache inclusive e chissà quali altre diavolerie, come fate a essere pessimisti con l'IPC? Io non lo sono...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
#1312 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
171*1,9*4*0,94= 1222 punti circa in cine R11.5 a 4 GHz Più bassa della mia che a 3,2 GHz fa 1384 punti e circa il doppio di un attuale FX8350. Solo che il FX8350 ha: 8 int 4 fp e 8 th. Zen avrebbe invece 8 int 8 fp e 16 th. A me non sembra così notevole. Anzi verrebbe da dire che facevano prima a fare solo lo shrink di XV a 14 nm finfet senza toccare nulla e si otteneva di più e si teneva il tanto bistratto CMT. Questo in MT e in ST quanto andrebbe? Senza fare i calcoli, sempre a parità di frequenza, andrebbe poco meno di un core XV??? No secondo me ti stai proprio sbagliando. Keller dovrebbe aver bevuto assai per partorire una cosa così. |
|
|
|
|
|
#1313 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
Cioè se prendo i risultati dei miei calcoli e gli applico le frequenze di questi ultimi giorni viene fuori un mostro di cpu. Ora un ipotetico Zen 8c/16 th a 3,2 GHz Turbo_max_1core 4 GHz avrebbe in ST 153 e MT 2th 230 ma in MT 16th avrebbe 1730*3,2/4= 1384 punti. Partiamo da questi e diciamo che la cpu sia 3,8 GHz di base e 4,6 di turbo su un core (2th): ST 153/4*4,6=176 punti MT 2th 1 core 230/4*4,6= 265 punti MT 16 th 8 core 1384/3,2*3,8= 1644 punti. E siamo nel caso 1 core ZEN = 1 core XV+40% in ST. |
|
|
|
|
|
#1314 | ||
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4386
|
Quote:
Quote:
Parti dal presupposto tutto da dimostrare che un core ZEN sia molto più complesso di metà modulo XV. Se, numeri a caso, ZEN fosse grande solo il 30% più grande di XV? Una regressione lato prestazioni sarebbe normale, ma allo stesso tempo possiamo anche ipotizzare che nello stesso spazio di un modulo ci siano due core... in quel caso (2vs2 thread) le prestazioni di ZEN sarebbero gonfiate dalla penalizzazione del CMT di XV. |
||
|
|
|
|
#1315 | |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4386
|
Quote:
![]() PS non sono per niente pessimista. le prestazioni saranno elevatissime, e molto del merito andrà alle frequenze monstre anche a 95W
Ultima modifica di tuttodigitale : 07-04-2016 alle 20:26. |
|
|
|
|
|
#1316 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Se l'ES BD era 2.8GHz e a quanto è arrivato? 4GHz? Questo ES sembrerebbe a 3GHz, quindi a quanto arriveremmo? 4.3GHz?
EDIT: con un ES già a 3GHz, io non riesco proprio ad immaginare una CPU definitiva nè di 3.2GHz e nè di 3.5GHz...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
#1317 | |
|
Senior Member
Iscritto dal: Apr 2011
Città: Funky Town
Messaggi: 3396
|
Quote:
Tuttavia, non mi spiego la capacità della cache L2 di 512 KB. Vero che Keller è intrippato coi 512 KB, ma se veramente è migliorato il Branch Predictor, sarebbero stati meglio 384 KB IMO. A meno che serva per l'SMT...ma pure così, mi sembrano troppi 512 KB;potrebbero essere controproducenti e creare cache-miss. Di ufficiale cmq non c'è nulla ancora...
__________________
......... |
|
|
|
|
|
#1318 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
Io non credo che sia così...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#1319 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
Se la fanno bene potrebbero avere una latenza di solo 1-2 cicli max in più o anche la stessa latenza, ma con cache doppia, si va meglio... Io non sottovaluterei la L3... La latenza L3 di INTEL è alta, specialmente con molti core, perchè c'è una topologia a doppio anello con "fette" al max di 2.5MB, una per core... In AMD le "fette" sono da 8MB e sono una per ogni 4 core, quindi solo due fette su un die x8... Il collegamento tra le due fette è banale, è velocissimo e occupa poco spazio... Ecco anche il motivo per avere die non più grandi di x8: un core x16 avrebbe 4 fette da 8MB da collegare assieme, con collegamenti incrociati che occupano spazio... Invece con l'MCM su interposer questi collegamenti si fanno esterni e non occupano spazio... Poi con la cache inclusiva le prestazioni dovrebbero decollare...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! Ultima modifica di bjt2 : 07-04-2016 alle 20:47. |
|
|
|
|
|
#1320 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
Io capisco il tuo ragionamento e vediamo se dico bene: tu vedendo le ultime info ipotizzi che dato che il FO4 è identico se non più basso, allora la complessità dell'architettura non può essere drammaticamente diversa ergo l'IPC ST non è cambiato molto ergo quel +40% è da intendersi come IPC MT 2th, compreso di SMT. Ok ma io ripeto (non a te ma qua nel thread sarà la terza volta) a mo di provocazione: ma chi vi da la certezza che non si possa aumentare del +40% l'IPC in ST e contemporaneamente tenere le stesse frequenze o addirittura alzarle? Tradotto chi vi dice che Keller non sia riuscito nel trovare la Chimera delle cpu ergo FO4 relativamente basso (17 o poco meno) e IPC ST +40% rispetto alla precedente arch? Per me per uno come Keller era molto più sfizioso tentare l'impresa che progettare l'ennesima arch ad alto IPC (alto FO4 tipo 22-24) e bassa frequenza. Se è una persona con un personalità forte (come lascia intendere il fatto che si dice abbai preteso carta bianca dalla dirigenza) ha pensato che accettando una sfida quasi impossibile sarebbe stato ricordato a lungo. Va beh sembra quasi uno di quei film della Disney. Dai gliela scriverò io la sceneggiatura ah ah ah Ultima modifica di Mister D : 07-04-2016 alle 21:02. |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 16:29.




















