|
|
|
![]() |
|
Strumenti |
![]() |
#12881 | |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
Quote:
Io non posso mettere becco perché non ci capisco una mazza ![]() La mia personale opinione, è che sicuramente BD aumenterà l'IPC e probabilmente aumenterà la capacità nell'MT rispetto al Phenom II. Il clock ormai sappiamo che sarà alto rispetto ai Phenom (si passerà dai 3,3GHz per un X6 a sopra i 4GHz per un X8 tra def + turbo su tutti i core, e si passerà anche sopra a +1GHz rispetto alle massime frequenze turbo dei Phenom II), e perlomeno dall'intenzione di AMD a portare un X8 per la massa, ragionevolmente il prezzo dovrebbe essere MOLTO più basso nel rapporto prezzo-performances attuale. Se tutto ciò si traducesse in realtà, dovremmo avere un notevole salto di potenza rispetto ai Thuban con una spesa superiore inferiore al guadagno di potenza.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 |
|
![]() |
![]() |
#12882 |
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
http://translate.googleusercontent.c...803_dxGokMdU5A
so già che dovrebbe essere postato nel thread sulla disparita di trattamento del compilatore intel ma voglio informare anche voi!!! Intel C / C++ 11.1 0.93 / 1,24 (SPECint_2006base / SPECfp_2006base) Intel C / C++ 12.0 1,10 / 1,42 (SPECint_2006base / SPECfp_2006base) other compilers 1,00 / 1,00 (SPECint_2006base / SPECfp_2006base) * * Best of Visual Studio 2010 and PGI 1,10 / 0,93 = 1,18 (+18%) 1,42 / 1,24 = 1,14 (+14%) complimenti a tutti i possessori di processori amd diventati più veloci del 18% sugli int e 14% sui fp ![]() EDIT: con questi dati qual'è la reale differenza tra k10 e SB? e quale sarà tra Bd e SB???
__________________
spesso, è solo quando sai che non ti resta molto tempo che ne apprezzi il reale valore quote: "some users are a classic example of the inverse ratio between the size of the mouth and the size of the brain" * se non vi rispondo è perché siete (200+) nella mia ignore list * mi chiedo perché chi è nella ignore list è spesso sospeso e, prima o poi, viene bannato * Ultima modifica di digieffe : 24-04-2011 alle 14:09. |
![]() |
![]() |
#12883 | |
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
A quanto pare le aglu sono capaci di fare INC e DEC (incrementi e decrementi). Sono molto comuni come istruzioni. Inoltre mi pare di capire dal grafico postato un pò di tempo fa sulla L3 che essa è banked in 2mb e vi si può accedere tramite un bus di 256bit. Rispetto a quello attuale di 64bit. Per la load to use latency della L2 anche a me par alta ma sicuramente sarà compensata da clock alti e prefetch intelligente.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita |
|
![]() |
![]() |
#12884 | |
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
si confermo l'enorme miglioria di banda alla l3, ho letto di migliorie anche alla cross bar per evitare che diventi collo di bottiglia ma non trovo il link... mi è venuto un dubbio: il k10 con le sue 3 pipeline (composte ognuna da 1 alu + 1 agu) esegue (per pipeline) contemporaneamente (1 mop = 1 alu + 1 agu) oppure no (le serializza)? farebbe una enorme differenza!
__________________
spesso, è solo quando sai che non ti resta molto tempo che ne apprezzi il reale valore quote: "some users are a classic example of the inverse ratio between the size of the mouth and the size of the brain" * se non vi rispondo è perché siete (200+) nella mia ignore list * mi chiedo perché chi è nella ignore list è spesso sospeso e, prima o poi, viene bannato * Ultima modifica di digieffe : 24-04-2011 alle 14:30. |
|
![]() |
![]() |
#12885 | |
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
Si, ma bisogna pensare che comunque non si può complicare troppo il discorso dei flag, anche se ad onor del vero, una agu per poter calcolare un indirizzo deve poter comunque disporre di un adder a 3 vie, quindi il silicio per fare add e sub c'è. ![]() Per il discorso k10: esso può eseguire al massimo 3 op logico aritmetiche e 2 di memoria (la 3 agu è li solo per simmetria) ovviamente le uop di memoria devono essere della stessa mop della uop aritmetico logica inoltre, se non erro, ci sono solo 3 bus di result, mentre BD ne ha 4. Ovviamente vi sarà il caso in cui avere una alu in meno penalizzerà un poco ma lo schema di bd pare più flessibile.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita |
|
![]() |
![]() |
#12886 | |
Senior Member
Iscritto dal: Jul 2010
Città: San dona di Piave
Messaggi: 856
|
Quote:
p.s scusa il caps lock !
__________________
Affari conclusi con: Max_p, El Korki, the_fire12, daigodaimon, Teo_86, AndreFra, Corsaronero333, mmoderni.... e altri Ultima modifica di iGio : 24-04-2011 alle 17:02. |
|
![]() |
![]() |
#12887 | |
Senior Member
Iscritto dal: Jul 2010
Città: San dona di Piave
Messaggi: 856
|
Quote:
__________________
Affari conclusi con: Max_p, El Korki, the_fire12, daigodaimon, Teo_86, AndreFra, Corsaronero333, mmoderni.... e altri |
|
![]() |
![]() |
#12888 | |
Senior Member
Iscritto dal: Jan 2002
Città: non ti interessa
Messaggi: 5627
|
Quote:
A livello concettuale intel, a mio modo di vedere, sfrutta la parallelizzazione intrinseca di un'ambiente operativo multithreading per meglio rifornire le pipeline. Secondo me non è mai stata una cattiva idea, neanche ai tempi dei pentium 4.
__________________
[url="http://www.hwupgrade.it/forum/showthread.php?t=2119003"]- Compilatore Intel e disparità di trattamento verso processori AMD/VIA |
|
![]() |
![]() |
#12889 |
Senior Member
Iscritto dal: Jan 2002
Città: non ti interessa
Messaggi: 5627
|
Una riflessione su bulldozer e i sistemi operativi, scaturita dal mio post precedente.
Bulldozer avrà due core integer + una singola fpu per modulo. Siccome in passato le occasioni fallaci non sono mancate (il tanto famigerato quanto finto bug del cool&quiet sotto windows) ho il forte dubbio delle capacità degli scheduler dei sistemi operativi di approcciare la cosa. Cosa succede, per esempio, se ho due thread che fanno uso intensivo della fpu e, malauguratamente, lo scheduler li assegna entrambi allo stesso modulo e quindi alla stessa FPU? Non sarebbe meglio se li spedisse a due moduli diversi così da occupare due FPU separate? Un problema simile ce l'aveva intel con hyperthreading: il sistema operativo vedeva come core fisici anche i core logici "condivisi", non sfruttando appieno le potenzialità e a volte peggiorando addirittura la situazione. Con windows 7 ci hanno messo una pezza con il core parking: in pratica i core logici diventano core di "serie B" che vengono scelti come destinatari di un processo solo se tutti i core fisici di "serie A" sono già occupati. Ora leggevo tempo fa che con bulldozer tutti i core saranno mostrati come core fisici, mi domandavo quindi se è una buona scelta, oppure se non sia ipotizzabile che un core per modulo diventi logico per ingannare windows e sfruttare il core parking per meglio utilizzare le varie fpu.
__________________
[url="http://www.hwupgrade.it/forum/showthread.php?t=2119003"]- Compilatore Intel e disparità di trattamento verso processori AMD/VIA |
![]() |
![]() |
#12890 | |
Senior Member
Iscritto dal: Jul 2010
Città: San dona di Piave
Messaggi: 856
|
Quote:
__________________
Affari conclusi con: Max_p, El Korki, the_fire12, daigodaimon, Teo_86, AndreFra, Corsaronero333, mmoderni.... e altri |
|
![]() |
![]() |
#12891 | |
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
![]() EDIT: se trovate bench fatti bene sulla virtualizz. con ht e senza fatemi sapere , grazie ![]()
__________________
spesso, è solo quando sai che non ti resta molto tempo che ne apprezzi il reale valore quote: "some users are a classic example of the inverse ratio between the size of the mouth and the size of the brain" * se non vi rispondo è perché siete (200+) nella mia ignore list * mi chiedo perché chi è nella ignore list è spesso sospeso e, prima o poi, viene bannato * |
|
![]() |
![]() |
#12892 | |
Senior Member
Iscritto dal: Jan 2002
Città: non ti interessa
Messaggi: 5627
|
Quote:
__________________
[url="http://www.hwupgrade.it/forum/showthread.php?t=2119003"]- Compilatore Intel e disparità di trattamento verso processori AMD/VIA |
|
![]() |
![]() |
#12893 | |
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
__________________
spesso, è solo quando sai che non ti resta molto tempo che ne apprezzi il reale valore quote: "some users are a classic example of the inverse ratio between the size of the mouth and the size of the brain" * se non vi rispondo è perché siete (200+) nella mia ignore list * mi chiedo perché chi è nella ignore list è spesso sospeso e, prima o poi, viene bannato * |
|
![]() |
![]() |
#12894 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
C'era stato in passato un post molto interessante sulla potenza di un procio.
A grandi linee, lo ripropongo giusto per mettere in luce altri aspetti che fanno un procio potente. All'inizio, c'era stata la corsa al clock sempre più alto per aumentare la potenza del procio, fino a che si giunse ai limiti (esempio PIV). In un secondo tempo, si scelse la via del multicore (il numero massimo di core es AMD) e dell'SMT (Intel), ma ora come ora qual'è il limite reale contro cui combattere per aumentare la potenza del procio? Il TDP. Ora, se vogliamo, le idee attuali dovrebbero essere l'hyperthreading (che di fatto aumenta l'IPC del procio con un ridotto aumento del TDP in proporzione) e la filosofia BD (che diminuisce alla radice l'aumento del TDP perché condivide parti dei core con il risultato che il TDP a parità di potenza risulta inferiore). Fermo restando che non voglio intavolare il discorso né su chi l'abbia più lungo né su chi abbia ragione, come al solito la scelta vincente sarà nella somma dei pregi e limiti di ciascuna casa. Però, in ogni caso un dato su cui riflettere l'avremmo già: AMD deve misurarsi con Intel e deve comunque in ogni caso poter offrire un prodotto (BD) la cui potenza necessariamente deve essere simile a quella di SB. Allora, perché BD X4, X6 e X8 avrebbe solamente 95W e unicamente il top degli X8 sarebbe 125W? Perché AMD ha più volte annunciato che non produrrà BD nella versione 140W? Anche BD X10 sarà 125W. In quest'ottica, mi pare scontato che AMD non possa coniugare il fatto di dover essere competitivo con i prodotti Intel e nello stesso tempo castrare BD di 30W TDP. La mia riflessione è questa: se BD avesse un IPC basso, a maggior ragione AMD dovrebbe aumentarne il clock e di conseguenza offrire BD a 125W e magari pure a 140W. Se AMD non agisce in questo modo, o il 32nm AMD + architettura BD permettono insieme di arrivare a clock super con un TDP ridotto, o l'IPC comunque sarebbe ottimo e non ci sarebbe bisogno di arrivare a TDP limiti per ottenere una determinata potenza. Vedremo.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 |
![]() |
![]() |
#12895 | |
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
Comunque appena avrò un pò di tempo verificherò qualche fonte affidabile incominciando da anand. Sperando che le fonti siano in buona fede. EDIT: una precisazione IMHO i bench fatti con una sola virtual machine (soprattutto se poi affinizzata ad un tot di core) non sono granche utili a valutare la situazione, per ciò che mi riguarda. Servirebbero bench che avessero da 1..4 core fisici per ogni VM (senza impostazione affinità) e da 2 a 6 VM per CPU (4 .. 8 core fisici).
__________________
spesso, è solo quando sai che non ti resta molto tempo che ne apprezzi il reale valore quote: "some users are a classic example of the inverse ratio between the size of the mouth and the size of the brain" * se non vi rispondo è perché siete (200+) nella mia ignore list * mi chiedo perché chi è nella ignore list è spesso sospeso e, prima o poi, viene bannato * Ultima modifica di digieffe : 24-04-2011 alle 18:25. |
|
![]() |
![]() |
#12896 | |||
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Quote:
Quote:
Per BD è esattamente la stessa cosa, solo che parte della pipeline intera non è condivisa, ma è implementata in posizioni diverse della CPU. Quindi il core parking funzionerà esattamente allo stesso modo anche su BD, il quale trarrà vantaggio dalla priorità all'allocazione dei thread ai moduli liberi e solo successivamente ai core battezzati di "serie B". Anche perché ricordiamoci che le prestazioni con un solo core sfruttato per modulo saranno maggiori. In pratica i thread visti dalla CPU sono a tutti gli effetti logici al pari di Intel, solo che l'implementazione della tecnologia che permette eseguire due thread per modulo è assolutamente più performante, tanto da rendere di fatto le prestazioni intere paragonabili a quelle di due core fisici. Quindi anche sul discorso del calcolo delle prestazioni, semplicemente si dovrà fare allocando il numero massimo dei thread che la CPU può gestire. Quote:
Tra l'altro solo qualche pagina fa avevo puntato il dito su questa questione... Ultima modifica di cionci : 24-04-2011 alle 18:24. |
|||
![]() |
![]() |
#12897 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
Ma con le AVX mi sembra che non ci possano essere "partigianità" e forse qualche cosa Windows 8 dovrebbe cambiare, spero.
La cosa migliore per verificare effettivamente la potenzialità di un procio sarebbe quella di testarla in ambiente linux ![]() Comunque sarebbe interessante se qualcuno intentasse una violazione dei diritti del consumatore, in quanto "preso in giro" sul fatto di far apparire proci di una marca ben più potenti e quindi praticamente giustificando il concetto "più potenza = + costo". In effetti, se il tutto si fermasse al "chi l'ha più lungo", ci si farebbe solamente una risata, peccato che il tutto è voluto unicamente per incassare di più. ![]()
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 Ultima modifica di paolo.oliva2 : 24-04-2011 alle 18:38. |
![]() |
![]() |
#12898 | |
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
Scusami, ma si sa qualcosa di certo sull compiler dei driver nvidia? Anche se per un driver l'aggiornamento del compiler non dovrebbe essere cosi traumatico, sono convito che le disparità tra una scheda nvida su sistema amd ed una amd su sitema amd siano da imputare a come le due architettura gestiscano gli state changes e il passaggio tra modalità kernel ed user. (costano qualcosa come 5000 cicli di cpu tanto tempo a far nulla ![]() Ovviamente a mia opinione e dunque ciò scritto potrebbe essere completamente sbagliato.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita |
|
![]() |
![]() |
#12899 | |
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Quote:
Dici che non sia traumatico ? Secondo te ci sono poche istruzioni SIMD in un driver video ? Te lo chiedo perché sinceramente non ne ho idea. |
|
![]() |
![]() |
#12900 | |
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
nella mia ignoranza provo a fare 2 calcoli... con linux kernel 2.6.35, cpu in idle ho circa 1000 context switch al secondo (1 solo core attivo) 1000*5000=5.000.000 allora se è così la cpu perde 5 mhz a girarsi i pollici? se faccio fare degli accessi al disco salgo a 3000 se aggiungo il play un video da youtube (streaming rete + visualizzazione) e faccio ballare le finestre 3d a video arrivo a 8000 quindi arriverei a perdere 40 mhz (40M cicli). Bingo ogni istanza di glxgears (diagnostico sistema grafico x) mi genera circa 4000 cambi di contesto al secondo. (20M cicli persi) .... mmm .... premesso che stiamo parlando di sistemi diversi è come se il caso nvidia riuscisse a fare meno chiamate al kernel space ps: senza intenzione di voler mettere in dubbio ciò ch scrivi ma per capire, come si formano quei 5000 cicli?
__________________
spesso, è solo quando sai che non ti resta molto tempo che ne apprezzi il reale valore quote: "some users are a classic example of the inverse ratio between the size of the mouth and the size of the brain" * se non vi rispondo è perché siete (200+) nella mia ignore list * mi chiedo perché chi è nella ignore list è spesso sospeso e, prima o poi, viene bannato * |
|
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 00:17.