Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming
Questo mouse ultraleggero, con soli 36 grammi di peso, è stato concepito per offrire un'esperienza di gioco di alto livello ai professionisti degli FPS, grazie al polling rate a 8.000 Hz e a un sensore ottico da 33.000 DPI. La recensione esplora ogni dettaglio di questo dispositivo di gioco, dalla sua agilità estrema alle specifiche tecniche che lo pongono un passo avanti
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni
Dal richiamo di Enrico Letta alla necessità di completare il mercato unico entro il 2028 alla visione di Nokia sul ruolo dell’IA e delle reti intelligenti, il Nokia Innovation Day 2025 ha intrecciato geopolitica e tecnologia, mostrando a Vimercate come la ricerca italiana contribuisca alle sfide globali delle telecomunicazioni
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza
OPPO Reno14 F 5G si propone come smartphone di fascia media con caratteristiche equilibrate. Il device monta processore Qualcomm Snapdragon 6 Gen 1, display AMOLED da 6,57 pollici a 120Hz, tripla fotocamera posteriore con sensore principale da 50MP e generosa batteria da 6000mAh con ricarica rapida a 45W. Si posiziona come alternativa accessibile nella gamma Reno14, proponendo un design curato e tutto quello che serve per un uso senza troppe preoccupazioni.
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 13-05-2011, 09:04   #13801
The3DProgrammer
Senior Member
 
Iscritto dal: May 2000
Messaggi: 1459
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Nuovi bench Buldozer.

http://wccftech.com/2011/05/13/amd-b...hmarks-leaked/

E' un BD X6 ES a 3GHz, le prestazioni sono da pena.
Però 1,456V per 3GHz sinceramente a me sembrano per un ES proprio ES...

Boh... da questo sembra che l'IPC sia basso, a meno che il procio/bios e altro non abbiano creino problemi.

Comunque la cosa che mi sembra plateale è che c'è una discrepanza tra il valore del Vcore e le frequenze ottenute e pure l'IPC.

Se voglio pensarla da ottimista... direi che AMD conceda di violare l'NDA dando dei risultati bassi (combinati tra clock procio e primi ES) per poi via via postare clock sempre più alti e di conseguenza con risultati superiori.
In fin dei conti, hanno postato un BD X6 a 3GHz, di 300MHz più basso in frequenza di un Thuban 1100T, sul 32nm HKMG ULK... . Difficile pensare che sia il massimo.
Non mi piace per niente, mi ricorda sempre + il lancio di barcelona. Tanta fuffa e silenzio, bench in cui sembrava fosse un mostro alternati ad altri in cui faceva cagare, alla fine si sono rivelati veri quelli in cui faceva cagare. Spero veramente per amd che non facciano quella fine.
The3DProgrammer è offline  
Old 13-05-2011, 09:04   #13802
Vash_85
Senior Member
 
L'Avatar di Vash_85
 
Iscritto dal: Jan 2002
Messaggi: 10337
Quote:
Originariamente inviato da heddie Guarda i messaggi
MI sa che non hai capito molto
Se que bench è reale è stato eseguito con un core o un modulo e senza il turbo...
Non capisco il secondo perche scrive 3,.... non sarebbe possobile che un solo core faccia quel punteggio, sarebbe impressionante
Diciamo che mi sono fatto una teoria.
Il 1 risultato riguarda il punteggio di un solo core efettivo, il secondo risultato riguarda solo un modulo (2core) ma comunque sarebbe impressionante lo stesso
Allora quel 3.xx è effettivamente riferito ad un modulo.... quindi vuol dire che l'x6 con tutti e tre i moduli fa effettivamente qualcosa come 9 punto e qualcosa...

P.s. il risultato di un solo core mi sembra bassino però..... un athlon II x2 265 fa un punteggio sul single core di 1.xx
Vash_85 è offline  
Old 13-05-2011, 09:08   #13803
heddie
Senior Member
 
Iscritto dal: Sep 2006
Messaggi: 1249
Quote:
Originariamente inviato da Vash_85 Guarda i messaggi
Allora quel 3.xx è effettivamente riferito ad un modulo.... quindi vuol dire che l'x6 con tutti e tre i moduli fa effettivamente qualcosa come 9 punto e qualcosa...

P.s. il risultato di un solo core mi sembra bassino però..... un athlon II x2 265 fa un punteggio sul single core di 1.xx
Infatti.. è quello che non torna
Se efettivamente quel 3, qualcosa, fosse riferito a un modulo tanto di cappello.
__________________
Case: haf 922, Processore: Intel core i7 2600k 4500mhz v core 1.28 Dissipatore: noctua nh-d14, Scheda Madre: Asus P8P67 PRO,Ram:corsair dominator 1600mhz cl8, Scheda video: Nvidia POW GTX 570 , Schermo: ASUS LED 21.5 MS228H full hd, Hard disk 2 westerndigital caviar blu 320 gb raid 0, Alimentatore:
heddie è offline  
Old 13-05-2011, 09:09   #13804
The3DProgrammer
Senior Member
 
Iscritto dal: May 2000
Messaggi: 1459
Quote:
Originariamente inviato da bicchiere Guarda i messaggi
Mah... a mio parere come ho gia' scritto
il 6 core è in realtà un tricore dal punto di vista del calcolo in virgola mobile.

Io quei risultati te li so spiegare.
Usando un thread usa una FPU.
Usando 6 threads usa tre FPU.
esatto. Le unità separate (FMAC) hanno un throughput che è uguale alla metà di una FPU di K10. Quindi, non considerando le migliorie che comunque ci sono (varie istruzioni a latenza ridotta, raddoppio delle unita' MMX, migliori prestazioni nello shuffle, possibilità di processare ADD e MUL in parallelo etc etc) in termini di throughput puro una FPU di BD va quanto quella di K10. chiaro quindi che se ci sono 4 thread FPU intensive in cui ogni thread occupa al massimo tutta l'FPU (cosa che cmq ritengo difficile avvenga onestamente) un BD X3 andrä probabilmente meno di un PII X4.
The3DProgrammer è offline  
Old 13-05-2011, 09:15   #13805
liberato87
Senior Member
 
L'Avatar di liberato87
 
Iscritto dal: Jan 2010
Città: Campobasso _________________________ ID ORIGIN/STEAM : DEMfiKNOW
Messaggi: 10281
Ma questi bench se non ricordo male erano già usciti e già se ne era discusso.. Tra l altro non si era dato grande rilievo visto loscreen di cpuz con vcore troppo alto per quella freq (ricoriamoci che e un 32m il range dovrebbe essere Max 1,3). Poi i risultati in single sono ridicoli..
Chi pensa che un otto core di nuova architettura possa fare metà del thuban secondo me o è un disfattista (tra l altro il solito) oppure ha seri problemi.
Personalmente non do tanto importanza a questo bench e se ci fosse qualcosa di vero probabilmente come
Detto da Paolo riguarda uno dei primissimi es
__________________
liberato87 è offline  
Old 13-05-2011, 09:25   #13806
calabar
Senior Member
 
L'Avatar di calabar
 
Iscritto dal: Oct 2001
Messaggi: 14736
Quote:
Originariamente inviato da The3DProgrammer Guarda i messaggi
Le unità separate (FMAC) hanno un throughput che è uguale alla metà di una FPU di K10.
Ma... non si era detto qualche pagina fa che ogni FMAC aveva a 128bit un throughput simile a quello di una fpu k10?


In ogni caso ho comunque qualche difficoltà a far tornare i punteggi.
Se 0,87 fosse il punteggio di un core, allora se consideriamo 3,62 (EDIT: 3.14)
- "ancora come punteggio si un singolo core": e che significa? 0,87 cosa sarebbe allora?
- "come punteggio di un modulo": che senso avrebbe moltiplicare di 4 volte il punteggio di un solo core passando a due?
- "come punteggio di tutti i core, contando una fpu per modulo": anche in questo caso, avremo un miglioramento che va oltre il 3x massimo che ci si potrebbe auspicare passando da una a tre unità di calcolo.
- "come punteggi di tutti i core, con 3x2 fpu", qui il valore avrebbe più senso, ma mi pare in assoluto piuttosto basso...

Questo fa pensare che a me (e a molti) sfugga qualcosa sul modo in cui lavora cinebench.
- Innanzi tutto, se lavora solo la fpu, che senso ha parlare di prestazioni per core (dato che i core sono int e un modulo contiene una fpu, per quanto "doppia")?
- Se si considera solo una fpu per core, che senso ha parlare di differenze tra prestazioni con un core e con un modulo?
- Forse è possibile eseguire cinebench con e senza sfruttamento della fpu, tanto che lo 0,87 è il punteggio del core int, e 3,62 (EDIT: 3.14) quello con utilizzo della fpu?

Ultima modifica di calabar : 13-05-2011 alle 09:56.
calabar è offline  
Old 13-05-2011, 09:29   #13807
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Io posto tutto quello che compare in rete... anche perché poi ognuno dice la sua .

Io con il Thuban a 1,458V sono RS DU a liquido a 4,350GHz, quel BD è un X6 e manco arriva a 3GHz... letteralmente impossibile con un'architettura più parca nei consumi del 20%, il passaggio dal 45nm al 32nm, l'aggiunta dell'HKMG e dell'ULK. Se la frequenza procio fosse proporzionato al Vcore applicato, si dovrebbe avere una frequenza almeno di 1,5GHz superiore al che il risultato sarebbe più alto del 50%.

Quindi secondo me il tutto ha un valore piuttosto relativo, perché la potenza del procio è data dall'IPC correlato alla frequenza con cui lavora il procio. L'IPC da solo non dice nulla, come ugualmente pure la frequenza da sola.

In ogni caso a me sembra sbagliato estrapolare sentenze definitive su proci che non rispecchiano certamente quelli commerciali.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
Old 13-05-2011, 09:33   #13808
bicchiere
Bannato
 
Iscritto dal: Apr 2004
Messaggi: 957
Quote:
Originariamente inviato da calabar Guarda i messaggi
In ogni caso ho comunque qualche difficoltà a far tornare i punteggi.
Se 0,87 fosse il punteggio di un core, allora se consideriamo 3,62
Il punteggio con utilizzo dei 6 thread è 3.14, non 3.62

3.62 è il fattore di scala (che è decisamente + simile a 3 che a 6)

0.87 * 3.62 = 3.14
bicchiere è offline  
Old 13-05-2011, 09:33   #13809
Athlon 64 3000+
Bannato
 
Iscritto dal: Dec 2003
Città: Monteveglio(Bo)
Messaggi: 10006
http://www.chiphell.com/thread-196966-1-1.html

Per me è un fake clamoroso.
Guarda caso proprio con la mia scheda madre hanno fatto delle immagini con abbinato un FX-8110.
E guarda caso la scheda madre me la sono andata a riprendere sostituita in RMA proprio 2 giorni fà.

Ultima modifica di Athlon 64 3000+ : 13-05-2011 alle 09:39.
Athlon 64 3000+ è offline  
Old 13-05-2011, 09:39   #13810
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Quote:
Originariamente inviato da calabar Guarda i messaggi
Ma... non si era detto qualche pagina fa che ogni FMAC aveva a 128bit un throughput simile a quello di una fpu k10?


In ogni caso ho comunque qualche difficoltà a far tornare i punteggi.
Se 0,87 fosse il punteggio di un core, allora se consideriamo 3,62
- "ancora come punteggio si un singolo core": e che significa? 0,87 cosa sarebbe allora?
- "come punteggio di un modulo": che senso avrebbe moltiplicare di 4 volte il punteggio di un solo core passando a due?
- "come punteggio di tutti i core, contando una fpu per modulo": anche in questo caso, avremo un miglioramento che va oltre il 3x massimo che ci si potrebbe auspicare passando da una a tre unità di calcolo.
- "come punteggi di tutti i core, con 3x2 fpu", qui il valore avrebbe più senso, ma mi pare in assoluto piuttosto basso...

Questo fa pensare che a me (e a molti) sfugga qualcosa sul modo in cui lavora cinebench.
- Innanzi tutto, se lavora solo la fpu, che senso ha parlare di prestazioni per core (dato che i core sono int e un modulo contiene una fpu, per quanto "doppia")?
- Se si considera solo una fpu per core, che senso ha parlare di differenze tra prestazioni con un core e con un modulo?
- Forse è possibile eseguire cinebench con e senza sfruttamento della fpu, tanto che lo 0,87 è il punteggio del core int, e 3,62 quello con utilizzo della fpu?
Non ci metto becco perché non ne capisco una mazza...

Però... tempo addietro si era ipotizzato che se tutta la logica di un modulo venisse sfruttata da 1 core, non si potrebbero creare degli stalli.
Cioè... da quello che ho capito, finche non si usano AVX a 256 bit, chiaramente la FPU lavora come se fosse una doppia FPU a 128 bit, quindi, a tutti gli effetti è come se fossero 2 FPU. Diverso sarebbe se entrambi i core dovessero elaborare delle istruzioni AVX a 256 bit, al che una dovrebbe aspettare che finisca l'altra (non so se ho scritto una cavolata).

Cioè, il numero di FPU in un procio non conta una mazza, conta l'effettiva capacità di quella FPU. Se un BD X8 avesse una singola FPU per tutti i core ma fosse a 8192 bit, che senso avrebbe dire che il procio va di meno perché ci sarebbe una sola FPU?

Aggiungerei una cosa. Tempo addietro JF aveva risposto (sempre con il suo linguaggio che praticamente non ti dice nulla) che far lavorare 2 moduli con 1 solo core era controproducente rispetto ad 1 modulo con 2 core.
Penso che il motivo sia da cercare nel Turbo. Probabilmente... la logica di BD non permette di spegnere il core dentro ad un modulo, ma solamente il modulo. Quindi entrerebbe un discorso di TDP.
Forse, ma è una mia idea, probabilmente il vantaggio di un superiore IPC sarebbe inferiore al vantaggio di frequenza del Turbo.
Tipo.

2 moduli attivi con 1 core attivo a modulo = 10% incremento di IPC ma incremento frequenza 0%
1 modulo attivo con 2 core = 0 incremento di IPC ma +15% di clock.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593

Ultima modifica di paolo.oliva2 : 13-05-2011 alle 09:49.
paolo.oliva2 è offline  
Old 13-05-2011, 09:42   #13811
The3DProgrammer
Senior Member
 
Iscritto dal: May 2000
Messaggi: 1459
Quote:
Originariamente inviato da calabar Guarda i messaggi
Ma... non si era detto qualche pagina fa che ogni FMAC aveva a 128bit un throughput simile a quello di una fpu k10?
si l'ho letto da varie parti anche io (non solo in questo thread) ma una rapida lettura del software development guide ha smentito. L'unica situazione in cui si ha un throughput doppio dovrebbe essere quando viene richiesta una add e c'è già una mul nelle pipe (l'FPU del k10 si fermava in questa situazione dimezzando il throughput a conti fatti). Questo sempre se ho letto bene, l'ho letto da qualche parte ma non ricordo dove e non posso verificare.
The3DProgrammer è offline  
Old 13-05-2011, 09:51   #13812
Pat77
Senior Member
 
L'Avatar di Pat77
 
Iscritto dal: Nov 1999
Città: Ceranova (PV)
Messaggi: 10382
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Non ci metto becco perché non ne capisco una mazza...

Però... tempo addietro si era ipotizzato che se tutta la logica di un modulo venisse sfruttata da 1 core, non si potrebbero creare degli stalli.
Cioè... da quello che ho capito, finche non si usassero AVX a 256 bit, chiaramente la FPU lavorerebbe come se fosse una doppia FPU a 128 bit, quindi, a tutti gli effetti è come se fossero 2 FPU. Diverso sarebbe se entrambi i core dovessero elaborare delle istruzioni AVX a 256 bit, al che una dovrebbe aspettare che finisca l'altra (non so se ho scritto una cavolata).

Cioè, il numero di FPU in un procio non conta una mazza, conta l'effettiva capacità di quella FPU. Se un BD X8 avesse una singola FPU per tutti i core ma fosse a 8192 bit, che senso avrebbe dire che il procio va di meno perché ci sarebbe una sola FPU?

Aggiungerei una cosa. Tempo addietro JF aveva risposto (sempre con il suo linguaggio che praticamente non ti dice nulla) che far lavorare 2 moduli con 1 solo core era controproducente rispetto ad 1 modulo con 2 core.
Penso che il motivo sia da cercare nel Turbo. Probabilmente... la logica di BD non permette di spegnere il core dentro ad un modulo, ma solamente il modulo. Quindi entrerebbe un discorso di TDP.
Forse, ma è una mia idea, probabilmente il vantaggio di un superiore IPC sarebbe inferiore al vantaggio di frequenza del Turbo.
Tipo.

2 moduli attivi con 1 core attivo a modulo = 10% incremento di IPC ma incremento frequenza 0%
1 modulo attivo con 2 core = 0 incremento di IPC ma +15% di clock.
Potrebbe essere, quello che so è che quel presunto bench su un ES con voltaggio da paura, è molto molto sospetto, io nemmeno lo considero, come minimo un esa BD deve andare meglio di un quad Deneb, se così non fosse o ci sono problmei nel bench stesso o AMD si prepara ha fare il più grosso passo falso della sua storia (perchè il primo Phenom checche se ne dica andava molto, ma molto meglio di Athlon X2).
__________________
Sometimes it is the people no one can imagine anything of who do the things no one can imagine. (Alan Turing)
Pkappa Pc: R7 2700x, 16 Gb G.skill TridentZ RGB 2993 mhz 14-14-14-34, Rx Vega 64 8 Gb HBM2, Nzxt 340 elite, Asus MG279Q.
Lord Fx: FX 8350, 16 Gb ram Hyperx 1866 10-11-10-30, Rx 580 8 Gb Nitro+ Sapphire, Corsair 400r, Samsung C24FG73.
Pat77 è offline  
Old 13-05-2011, 09:54   #13813
calabar
Senior Member
 
L'Avatar di calabar
 
Iscritto dal: Oct 2001
Messaggi: 14736
@The3DProgrammer

Ecco, questa la frase che riportavi in precedenza:

"[...] ma se è corretto quello che c'è scritto nel sw optimization guide le 2 FMAC insieme con istruzioni SSE da 128 bit hanno lo stesso identico throughput dell'FPU di K10 (quindi per il singolo thread) [...]"

Dove in seguito si era notato che ti riferivi al throughput per singolo thread.
Questo significa che su due thread il throughput dovrebbe rivelarsi di fatto doppio rispetto ad una singola fpu del k10.
Ed è proprio questo il caso che stiamo considerando, dato che qui si è affarmato che un BD 6 core è come se avesse 3fpu, mentre sarebbe da considerare come se ne avesse 3x2, dato che i thread su cui lavora sono 6.

@Bicchiere
Ooops, pardon, svista da copiaincolla! Grazie della correzione.
In ogni caso il discorso rimane lo stesso, con sole 3 fpu la vedo difficile superare il triplo delle prestazioni rispetto alla fpu singola.

Ultima modifica di calabar : 13-05-2011 alle 09:58.
calabar è offline  
Old 13-05-2011, 09:55   #13814
The3DProgrammer
Senior Member
 
Iscritto dal: May 2000
Messaggi: 1459
Quote:
Originariamente inviato da Pat77 Guarda i messaggi
(perchè il primo Phenom checche se ne dica andava molto, ma molto meglio di Athlon X2).
nella sua prima forma era un 10% scarso + veloce in single core (in alcuni bench era addirittura + lento a causa delle latenze aggiunte dalla L3 che nella prima versione erano veramente terribili). Il Phenom II poi ha cambiato la situazione, ma non è bastato nemmeno quello (ancora oggi il PII è leggermente inferiore clock to clock ad un core 2 duo).
The3DProgrammer è offline  
Old 13-05-2011, 09:56   #13815
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
Quote:
Originariamente inviato da Pat77 Guarda i messaggi
Potrebbe essere, quello che so è che quel presunto bench su un ES con voltaggio da paura, è molto molto sospetto, io nemmeno lo considero, come minimo un esa BD deve andare meglio di un quad Deneb, se così non fosse o ci sono problmei nel bench stesso o AMD si prepara ha fare il più grosso passo falso della sua storia (perchè il primo Phenom checche se ne dica andava molto, ma molto meglio di Athlon X2).
Io penso che sicuramente AMD deve darsi una mossa a far vedere qualche cosa di meglio UFFICIALMENTE, magari non a clock massimi.

A 2 settimane al massimo 3, non ha ormai alcun senso l'NDA... perchè Intel con 14 giorni in meno o in più non capisco cosa possa fare.

L'unica mossa ipotizzabile per tempi così brevi sarebbe quella che Intel abbassi i listini... ma in ogni caso AMD potrebbe comunque annunciare i suoi... e poi comunque non vedo differenze di sorta, tanto Intel in ogni caso abbasserà i listini.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593
paolo.oliva2 è offline  
Old 13-05-2011, 10:00   #13816
Athlon 64 3000+
Bannato
 
Iscritto dal: Dec 2003
Città: Monteveglio(Bo)
Messaggi: 10006
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
Io penso che sicuramente AMD deve darsi una mossa a far vedere qualche cosa di meglio UFFICIALMENTE, magari non a clock massimi.

A 2 settimane al massimo 3, non ha ormai alcun senso l'NDA... perchè Intel con 14 giorni in meno o in più non capisco cosa possa fare.

L'unica mossa ipotizzabile per tempi così brevi sarebbe quella che Intel abbassi i listini... ma in ogni caso AMD potrebbe comunque annunciare i suoi... e poi comunque non vedo differenze di sorta, tanto Intel in ogni caso abbasserà i listini.
Per quello che ne capisco io sono d'accordo con te.
Io mi sono stancato di questa NDA cosi ferreo visto che poi mancano 3 settimane alla presentazione ufficiale.
Athlon 64 3000+ è offline  
Old 13-05-2011, 10:03   #13817
The3DProgrammer
Senior Member
 
Iscritto dal: May 2000
Messaggi: 1459
Quote:
Originariamente inviato da calabar Guarda i messaggi
@The3DProgrammer

Ecco, questa la frase che riportavi in precedenza:

"Wi ma se è corretto quello che c'è scritto nel sw optimization guide le 2 FMAC insieme con istruzioni SSE da 128 bit hanno lo stesso identico throughput dell'FPU di K10 (quindi per il singolo thread) [...]"

Dove in seguito si era notato che ti riferivi al throughput per singolo thread.
Questo significa che su due thread il throughput dovrebbe rivelarsi di fatto doppio rispetto ad una singola fpu del k10.
Ed è proprio questo il caso che stiamo considerando, dato che qui si è affarmato che un BD 6 core è come se avesse 3fpu, mentre sarebbe da considerare come se ne avesse 3x2, dato che i thread su cui lavora sono 6.
EDIT: Sorry non avevo letto bene la frase che avevo quotato. E' corretta, significa che se un solo thread occupa interamente una FPU, K10 e bulldozer hanno lo stesso throughput. Quindi 1 FPU di K10 = una FPU di BD, in termini di raw throughput. Per cui un X6 che esegua 3 thread FPU intensive avrà le stesse prestazioni di un K10 X3 (a meno cmq delle notevoli ottimizzazioni di cui abbiamo giä parlato).

Two 128-bit FMAC units. Each FMAC supports four single precision or two double-precision
ops.


quindi ha un throughput di 2 ops per ciclo di clock con istruzioni SSE a 128 bit, esattamente la metä di una FPU (intera) di K10.

Qui:

http://abinstein.blogspot.com/2011/0...bulldozer.html

c'è un articolo estremamente interessante e abbastanza recente che fa una specie di riassunto del SW optimization guide. Sull'FPU dice:

Quote:
From a layman's viewpoint, the shared FPU seems to offer only half the throughput of two K10 cores for independent FMUL and FADD operations. However, in previous Opteron, vectorized loads and stores also share the FMUL and FADD pipelines; in Bulldozer, vectorized loads are either "free" or handled by the IMMX pipelines. Note that when FPU is throughput bottleneck, each arithmetic operation should be paired with on average one load or store. A perhaps more significant overhead saving comes from various vectorized register moves which can now be dispatched concurrently to separate IMMX pipelines. Thus the shared FPU in Bulldozer is actually a very balanced design.

Ultima modifica di The3DProgrammer : 13-05-2011 alle 10:24.
The3DProgrammer è offline  
Old 13-05-2011, 10:03   #13818
bicchiere
Bannato
 
Iscritto dal: Apr 2004
Messaggi: 957
Quote:
Originariamente inviato da calabar Guarda i messaggi
In ogni caso il discorso rimane lo stesso, con sole 3 fpu la vedo difficile superare il triplo delle prestazioni rispetto alla fpu singola.
Mica vuoi rimangiarti tutto quello che hai detto nei vari post precedenti!

IN PARTE la fpu del modulo gestisce i due thread contemporaneamente.

IN PARTE = 3.62 / 3 = 1.21 (che non è comunque 2, somiglia piu' a 1)
bicchiere è offline  
Old 13-05-2011, 10:17   #13819
calabar
Senior Member
 
L'Avatar di calabar
 
Iscritto dal: Oct 2001
Messaggi: 14736
Quote:
Originariamente inviato da bicchiere Guarda i messaggi
Mica vuoi rimangiarti tutto quello che hai detto nei vari post precedenti!
E chi rimangia nulla?
Quella era una riflessione relativa al caso in cui si considerasse il modulo di BD come dotato di una sola fpu e che il punteggio 0,87 sia riferito ad una di queste.
In ogni caso parliamo di valori superiori al triplo triplicando il numero di fpu, cosa che a me pare anomala.

Quote:
Originariamente inviato da The3DProgrammer Guarda i messaggi
EDIT: Sorry non avevo letto bene la frase che avevo quotato. [...]
Pardon... dopo l'edit non ti seguo più!
Quindi l' "equivalenza" con la fpu del k10 vale solo con un thread singolo?
Nel caso di due thread che lavorano entrambi sulla stessa fpu in BD, possiamo considerare un throughput maggiore?

EDIT: riguardando questa vecchia slide sulla roadmap AMD, stavo notando come si prevedesse un aumento della potenza FP in interlagos nel 2011.
Questo sarebbe in contraddizione con chi vede la singola FP di BD come un passo indietro in questo senso.

Ultima modifica di calabar : 13-05-2011 alle 10:27.
calabar è offline  
Old 13-05-2011, 10:17   #13820
scrat1702
Bannato
 
Iscritto dal: Apr 2010
Messaggi: 2019
Quote:
Originariamente inviato da bicchiere Guarda i messaggi
Finalmente le prestazioni verosimili.

Cinebench lo vede correttamente come 6 core 6 thread.

0.87 per core
3.14 per cpu

A conferma che, con OTTIMA approssimazione
scorecpu = 3 * scorecore
perchè le FPU sono TRE.

BULLDOZER non rende dal lato FPU come sostenevo.

L'8 core dovrebbe quindi fare 4.19 circa (se a parita' di watt)
Molto al di sotto dei quad intel
Si addirittura BD 8X andra meno di un AthlonII X4!!!
Perche non vai a trollare in un altro thread?
scrat1702 è offline  
 Discussione Chiusa


Un fulmine sulla scrivania, Corsair Sabre v2 Pro ridefinisce la velocità nel gaming Un fulmine sulla scrivania, Corsair Sabre v2 Pro...
Nokia Innovation Day 2025: l’Europa ha bisogno di campioni nelle telecomunicazioni Nokia Innovation Day 2025: l’Europa ha bisogno d...
Sottile, leggero e dall'autonomia WOW: OPPO Reno14 F conquista con stile e sostanza Sottile, leggero e dall'autonomia WOW: OPPO Reno...
Destiny Rising: quando un gioco mobile supera il gioco originale Destiny Rising: quando un gioco mobile supera il...
Plaud Note Pro convince per qualità e integrazione, ma l’abbonamento resta un ostacolo Plaud Note Pro convince per qualità e int...
Tamron 25-200mm F/2.8-5.6 Di III VXD G2:...
Il rover NASA VIPER arriverà sull...
Il MagSafe Battery Pack ha la stessa bat...
Il tri-fold di Samsung sta arrivando e s...
Prezzi a picco su Amazon nel weekend: 25...
6 accessori Amazon per pulire in maniera...
Tesla riprogetterà le sue iconich...
iPhone 17 Pro e Pro Max, eccoli tutti su...
Amazon abbatte il prezzo: scopa elettric...
Super sconti Amazon: 5 ottimi smartphone...
iPhone Air non è solo sottile: &e...
Energia in Italia ad agosto: consumi in ...
SpaceX guarda ai primi voli orbitali del...
Il prototipo del razzo spaziale riutiliz...
Blue Origin mostra uno spettacolare vide...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 15:33.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v