|
|
|
![]() |
|
Strumenti |
![]() |
#21201 | |
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Quote:
Abbiamo un task multithread perfettamente parallelizzabile da eseguire su due processori: - uno composto da un modulo BD con CMT - uno composto da due core completi di BD (senza CMT) Nel primo caso avresti un calo del 20% nelle prestazioni. Il 20% naturalmente è una stima media, dipende dal task in questione. |
|
![]() |
![]() |
#21202 |
Senior Member
Iscritto dal: May 2008
Città: Shanghai - Roma - Londra
Messaggi: 1954
|
7 ottobre RAGE
2 novembre Battlefield 3 11 novembre The Elder Scrolls V: Skyrim secondo voi farà in tempo amd? di solito quali sono le tempistiche tra presentazione e disponibilità effetiva nei negozi? io per battlefield 3 vorrei avere un pc nuovo. |
![]() |
![]() |
#21203 |
Senior Member
Iscritto dal: Aug 2009
Città: san giovanni la punta (CT)
Messaggi: 1994
|
Per quelle date spero proprio di si!!!!
__________________
Phenom II X6 1055T @4 cooled by EK Supreme HF 240 ![]() ![]() ![]() |
![]() |
![]() |
#21204 | ||
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Quote:
Il compromesso che si ha con CMT è una logica che deve servire due core. Quando li serve entrambi deve suddividere la sua capacità di fornire le operazioni ai core (perchè il suo throughput è sempre lo stesso, che serva uno o due core), e questo provoca il calo di prestazioni quantificato nel -20% (nell'approssimazione di cui abbiamo parlato sopra). Vorrei far notare che se non fosse così il progetto BD perderebbe moltissimo del suo appeal. É proprio la possibilità di usare le risorse condivise su un singolo core aumentando l'ipc quando per i task poco parallelizzati a rendere questa architettura vincente. Altrimenti non avrebbe senso la scelta fatta con il CMT, che a causa di quel -20% stimato da AMD, condannerebbe BD ad essere sempre molto inferiore alla concorrenza (che non ha questo handicap) nella applicazioni single thread, seppure magari efficiente in quelle multithread, mantenendo quello che è ora il difetto principale dei k10 rispetto alla concorrenza. Quote:
Ossia... l'utente che ha fatto i calcoli che sono il pomo della discordia, ha supposto un IPC identico nelle applicazioni single thread. Quindi è ovvio che nel momento in cui si utilizzino tutti i core dei moduli, sia necessario applicare quel -20%. E da li nasce tutto il ragionamento. |
||
![]() |
![]() |
#21205 | |
Senior Member
Iscritto dal: Jan 2009
Messaggi: 688
|
Quote:
![]() è proprio questo che si contesta... AMD non ha dichiarato assolutamente sto fatto... è una vostra interpretazione che definire opinabile è anche riduttivo... |
|
![]() |
![]() |
#21206 | |
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Quote:
Ma è un'interpretazione che su questo topic nessuno ha mai contestato da quando sono emerse le prime specifiche sull'architettura. Anche perchè basata su un ragionamento logico: AMD ha dichiarato che il calo di prestazioni è dovuto alla condivisione di risorse. Nel momento in cui il secondo core del modulo è inattivo, non c'è nulla da condividere e non c'è più motivo per quel calo. E aggiungo, se così non fosse, gli ingegneri AMD si sarebbero bevuti il cervello, eliminando uno dei principali vantaggi di un'architettura di questo tipo. Prima vanno a dire che SMT non è una buona tecnologia perchè in certi contesti fa perdere prestazioni, poi ne implementano una loro che invece fa perdere il 20% in TUTTE le condizioni. La cosa è senza senso. Ultima modifica di calabar : 26-08-2011 alle 17:33. |
|
![]() |
![]() |
#21207 | |
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Quote:
Inoltre sei davvero sicuro che tale situazione non sia invece simulabile, anche se non in maniera precisa, semplicemente mettendo a dormire un core nel modulo? Sicuro che BD non lo permetta? Io credo che lo sia, e che BD potrà in questo modo avere prestazioni interessanti in single thread. Se così non fosse, ripeto, sarebbe fallimentare, perchè non risolverebbe il problema maggiore che hanno ora i k10 rispetto ai processori della concorrenza: prestazioni deludenti in ST. |
|
![]() |
![]() |
#21208 | |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
Quote:
Il discorso io l'ho precisato sul guadagno di avere 8 core al posto di 6 core e mi hai postato che un 8 core guadagnerebbe solamente il 7% sul 6 core per calcoli fatti da altri. Il costo di produzione di un BD X6 nativo rispetto ad un BD X8 nativo non ha nulla a che vedere con il CMT di BD nei confronti del Thuban, ma rimane sempre valido tra un CMT X6 ed un CMT X8. Detto papale... valutando che MC, I/O ed altro sono fissi indipendentemente dal numero dei core, un BD X8 avrebbe 2 core, 1MB di L2, 2MB di L3 che aumenterebbero il costo produzione (superficie silicio quindi die a wafer e aumento delle possibilità di scarto per transistor fallati), mettiamo solamente del 25%. Ora... chi aumenterebbe i costi del 25% con aumenti prestazionali solamente del 7% quando questo guadagno sarebbe già ottenibile dalla frequenza più alta perché sicuramente un X6 avrebbe il 7% in meno di TDP rispetto ad un X8? BD X8 125W TDP 3,6/4,2GHz, un BD X6 nativo non penso che avrebbe problemi ad essere 3,850/4,5GHz (+7%) e rientrare nei 125W TDP. Io ti ho solo fatto vedere che con Cinebench si guadagna il 50% da un X4 ad un X6 e che quindi, comunque, il discorso CMT non incide nel mio ragionamento, in quanto già un BD X6 è composto da 3 moduli, quindi il valore ottenuto da 3 moduli di MT rispecchierà papale papale la linea con il 4° modulo. Se poi vogliamo fare il confronto con il Thuban, sarebbe ipotizzabile che questo guadagna il 50%, un BD 6 da un X4 il 50% -20% teorizzato da AMD, quindi sarebbe il 40%. Proiettandolo su BD, ammesso che il ragionamento CMT si applichi, da un teorico +33% si passerebbe a 33% -20% = 26% e rotti, ma comunque sempre piuttosto distanti dal 7%. Poi tutto ciò sarà ampiamente verificabile, in quanto mi rendo disponibile a fare tutti i test quando avrò BD, disabilitando 1 o più moduli. P.S. Poi, tra parentesi, rifletto anche su un altro punto che è in contrasto con quanto dici. Ti ricordi quando discutevamo di far "lavorare" 1TH a modulo supponendo che così un 4 moduli potesse operare con 4TH senza il calo di CMT? JF aveva risposto che BD "rendeva" comunque meglio con il discorso di 2 TH a modulo. Ora... basta fare questa riflessione: un BD X8 lavora a 3,6GHz con 4 moduli e 4,2GHz con 2 moduli. Ora... se noi facessimo lavorare 4 TH su 4 moduli (cioè 1 TH a modulo), rinunceremmo alla frequenza Turbo che è di 600MHz, a favore di 2 moduli con 4 TH con 600MHz di frequenza superiore. Se noi applicassimo il -20% per il CMT, cosa otterremmo? Che i core dovrebbero lavorare ad una frequenza maggiore del 20% per confermare il -20% del CMT, e per confermare quanto detto da JF da 3,6GHz si dovrebbe passare ad almeno 4,340GHz per ottenere unaparità ed almeno 4,4-4,5GHz per essere vantaggioso. A questo punto mi sembra chiaro che il discorso 20% o è sbagliato, oppure le frequenze turbo dovrebbero essere maggiori. Visto che ormai i +600MHz del turbo sembrano confermati... mi sembra chiaro che la teoria del -20% debba necessariamente essere differente, presumibilmente AMD avrà attuato cambiamenti/ottimizzazioni agli ES B0 di dicembre 2010, visto che comunque quel 20% era stato tirato fuori in quel periodo. Vedi, io concordo che senza avere dati precisi tutto è discutibile, ma non vedo il motivo per il quale tutto debba essere necessariamente visto verso il basso. Fino ad ora tutto quanto era negativo è puntualmente caduto, vedi frequenze basse e tanto altro. Mi sa che anche altri presupposti negativi svaniranno. Edit Comincio a capire come sia scappato fuori quel +7%. Per me hanno ipotizzato una perdita del 20% ogni 2 core tra BD a Thuban, quindi 4 moduli BD, 8 core, perderebbe il 20% ogni modulo, arrivando al fatto che 4 moduli perderebbero l'80% di 8 core stile Thuban, e quindi da qui il 7% ipotizzato. Ma questo fa acqua da tutte le parti, perché parte già dal presupposto che BD abbia un IPC uguale a quello del Phenom II e che quindi AMD avrebbe investito soldi e tempo in questi 5 anni unicamente per progettare un procio con meno transistor e meno TDP aumentando unicamente il numero totale dei core. Mi sembra una vaccata pazzesca.... Al più il CMT perde il 20%, ma questo è tutt'altra storia rispetto all'IPC di BD e quindi ad un teorico BD non CMT e BD CMT, ma nulla a che vedere tra BD e Thuban.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 Ultima modifica di paolo.oliva2 : 26-08-2011 alle 19:04. |
|
![]() |
![]() |
#21209 |
Senior Member
Iscritto dal: Mar 2005
Città: Mareno di Piave (TV)
Messaggi: 6102
|
AMD Bulldozer to ship ‘within the next week or so’
__________________
AMD Ryzen R7 9700x (130/105/165 + CO + IF 2133MHz) + Arctic Freezer II 280mm, Gigabyte B850I Aorus Pro, 2x16GB Patriot 7200@6200MHz CL28, AMD Radeon 6800, Sabrent Rocket 4.0 1TB + Crucial MX500 500GB + WD Blue 2TB 2,5", Corsair SF750, SSupd Meshlicious, LG 27GL850 - Trattative - [GUIDA] all'overclock dell'AMD K10 - [GUIDA] all'overclock di AMD Ryzen |
![]() |
![]() |
#21210 | |
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Quote:
Il famoso "+7%" dell'esempio era relativo ad un BD x8 con CMT nei confronti di un x6 senza CMT. Che sia un x6 thuban o un x6 BD non CMT non importa, dato che stavamo assumendo che avessero ipc identico. Poniamo però che, come dici tu, si tratti appunto di un x6 BD non CMT, dato che conosciamo l'incremento di dimensione del modulo (dichiarato da AMD) e questo permette il confronto. Rimane il fatto che il BD x8 CMT dovrebbe occupare meno area del BD x6 non CMT, ed è ciò che dovrebbe rendere il primo conveniente (uso il condizionale perchè non ricordo esattamente a cosa fosse riferito quel 12%). Ultima modifica di calabar : 26-08-2011 alle 18:46. |
|
![]() |
![]() |
#21211 | ||
Registered User
Iscritto dal: Dec 2009
Messaggi: 127
|
Quote:
Quote:
![]() |
||
![]() |
![]() |
#21212 |
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
No, ma neanche il contrario
![]() JF si riferiva alle prestazioni complessive (in multithreading) quando ha tirato fuori quella percentuale. L'architettura condivisa di BD ha fatto dedurre a molti (non sono il solo a pensarla così, basta rileggere le ultime centinaia di pagine di questo topic) che tale calo fosse imputabile esclusivamente ad una situazione in cui entrambi i core cmt venivano utilizzati. Un calo generalizzato dell'ipc single thread del 20% sarebbe assolutamente deleterio. Ultima modifica di calabar : 26-08-2011 alle 19:01. |
![]() |
![]() |
#21213 | |
Registered User
Iscritto dal: Dec 2009
Messaggi: 127
|
Quote:
|
|
![]() |
![]() |
#21214 | |
Registered User
Iscritto dal: Dec 2009
Messaggi: 127
|
Quote:
|
|
![]() |
![]() |
#21215 | |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
Quote:
![]() Ribalto con questa domanda. Quanto renderà di più un BD CMT X8 rispetto ad un BD CMT X6 in MT? Concordi che sarà più del 7% o no?
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 |
|
![]() |
![]() |
#21216 | ||||||||
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
fatto sta che BD nell'utilizzo di un modulo completo, ha un calo del 20% di throughput rispetto al doppio dell'ipc del singolo core (dello stesso BD) Poi per ovviare a questa penalità di throughput (soprattuto rispetto al thuban) hanno alzato il clock e l'ipc... e quindi a meno di un fail (nel quale non credo) BD sarà sempre superiore a Thuban in ipc (ST) e Throughput (MT) Quote:
Quote:
![]() anche se personalmente il chip mi sembra un pò grande 315mm^2 per un (4 core+12%), sarà tutta quella cache L2 (8MB) + altri 2MB di L3, sarà il silicio non pronto... mah Quote:
se non fissiamo un linguaggio comune sarà facile non intendersi mai, non vanno bene i termini che ho scritto? va bene, decidiamone un paio in modo convenzionale e facciamo riferimento ad essi ...quindi AMD ha detto che avrà un ipc più alto, se lo ha detto sarà cosi... IPOTIZZIAMO un +X% di ipc: un singolo core di un modulo sarà a parità di clock il +X% più veloce di un core Thuban, ok? questo però non vuol dire che un modulo con entrambi i core sotto carico sia +X% più veloce di 2 core Thuban, ma +X% -20% (?). Quote:
Quote:
Quote:
vado a ritrovare il post ![]() Quote:
![]() Preciso che appena finito di rispondere leggerò il link da te postato (è già troppo lungo questo post da tenerlo in sospeso). Da quanto tu affermi, ed immagino sia citato nel link, si potrebbe allora supporre che con la progettazione CMT NON ci siano perdite di prestazioni tra l'utilizzare solo un core del modulo o due? ma queste perdite ci sarebbero state solo rispetto ad una progettazione non CMT? |
||||||||
![]() |
![]() |
#21217 | ||
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Quote:
![]() Quote:
Afferma cioè che l'architettura CMT causa una perdita (media stimata) del 20% sempre, anche usando un solo core del modulo (cosa che secondo lui non avverrà perchè piuttosto BD spegnerà gli altri moduli per risparmiare corrente e salire di frequenza). Io non sono d'accordo, e ovviamente spero che si sbagli ![]() Ultima modifica di calabar : 26-08-2011 alle 20:14. |
||
![]() |
![]() |
#21218 | |
Senior Member
Iscritto dal: Dec 2004
Città: IV Reich
Messaggi: 18597
|
Quote:
poi se è vero non lo so ![]()
__________________
Wind3 4G CA |
|
![]() |
![]() |
#21219 | |
Bannato
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
|
Quote:
Il fatto che amd continui ad indicare che l'ipc di un core BD sia superiore a quello di Thuban è noto, ma riferito a single th esclusivo per il modulo, all'ipc del singolo core in multi-th, oppure a single th con l'altro core del modulo impegnato con un altro th ? Quel famoso 20% in meno di prestazioni sui due core del singolo modulo è una media?, il caso peggiore? o quello migliore? (credo che a seconda del software dovremmo avere scenari diversi), e se come credo quel - 20% è riferito al solo ipc dell'fpu, be allora tutto lo scenario cambia di brutto, o sbaglio?. |
|
![]() |
![]() |
#21220 | ||
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Quote:
Direi che visto che si parlava di core, quindi di core int, la fpu è da escludere. Quote:
Ovvio che un thread su due moduli vada meno... userebbe un solo core di un solo modulo! ![]() |
||
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 23:19.