PDA

View Full Version : Test amd 64 x2, chi mi aiuta


pier4reich
02-06-2006, 09:37
ragazzi sto facendo una lista di prestazioni con sciencemark 2.0 final ( www.sciencemark.org ), il miglior programma, a mio avviso, mai scritto free per determinare prestazioni obbiettive di velocita' pura di una cpu, in particolare il BLAS bench sgemm.

Pero' fin ora ho trovato bench sui pentium EE fino a 3.7 giga, sugli fx singolo core, sugli amd 64 normali.

Siccome il programma e' scritto soprattutto per il multi-core, volevo sapere come andava su un amd 64 x2. Qualcuno cortesemente puo' provarlo?

Grazie!

edit: Step per sciencemark
1. www.sciencemark.org
2. download
3. unzip in una cartella a muzzo
4. primo passo:
http://img217.imageshack.us/img217/663/sciencemarkstep17ty.th.jpg (http://img217.imageshack.us/my.php?image=sciencemarkstep17ty.jpg)
5.secondo passo
http://img226.imageshack.us/img226/25/sciencemarkstep29yh.th.jpg (http://img226.imageshack.us/my.php?image=sciencemarkstep29yh.jpg)
6.terzo passo
http://img159.imageshack.us/img159/3008/sciencemarkstep32kl.th.jpg (http://img159.imageshack.us/my.php?image=sciencemarkstep32kl.jpg)
7. quarto passo
http://img159.imageshack.us/img159/2161/sciencemarkstep40yg.th.jpg (http://img159.imageshack.us/my.php?image=sciencemarkstep40yg.jpg)
8. Poi postate result

PS: cercate di fare il test con meno processi attivi per dare il masismo (io infatti ho fatto 6096, mentre ora ne dava 5900 quasi ;) )

int main ()
02-06-2006, 09:39
ragazzi sto facendo una lista di prestazioni con sciencemark 2.0 final ( www.sciencemark.org ), il miglior programma, a mio avviso, mai scritto free per determinare prestazioni obbiettive di velocita' pura di una cpu, in particolare il BLAS bench sgemm.

Pero' fin ora ho trovato bench sui pentium EE fino a 3.7 giga, sugli fx singolo core, sugli amd 64 normali.

Siccome il programma e' scritto soprattutto per il multi-core, volevo sapere come andava su un amd 64 x2. Qualcuno cortesemente puo' provarlo?

Grazie!
ma dai ke ci vuole a sapere come và basta ke fai il bench e posti il risultato quà e ti aiuteranno quelli ke l'hanno già testato cn quel prog ;) cmq perkè intanto nn dici ke procio hai :D ? :ciapet:

pier4reich
02-06-2006, 10:19
i spiace, io purtroppo non ho amd 64 x2, per questo volevo saperlo..

Con un palomino 1667 (xp2000+) ho un massimo di
3800 Mflops (sgemm 3dnow opt)

con un barton 1917 (xp2600+) ho un massimo di
4280 Mflops (sgeem 3dnow opt)

con un venice 2200mhz (3200+ OC 200mhz+) ho un massimo di
6096 Mflops (sgeem sse opt [usa le sse2/3 invece che le sse])

volevo sapere su un amd 64 x2 che risultati dava :)

gi0v3
02-06-2006, 10:29
scusa, il test lo fai con sisoftware sandra? basta che scarichi l'ultimo e ha anche i dati degli x2..perchè dannarsi l'anima a cercare a mano i risultati?se vuoi solo i mflops quella è la strada

pier4reich
02-06-2006, 10:38
ma, per curiosita', hai letto il post?

Non lo faccio con sisoft sandra, anche perche' non e' un test di con metodi lineare ma whetstones...

lo faccio con sciencemark ch secondo me e' 6 volte meglio (ed infatti usa il BLAS) ... per questo volevo che qualche anima pia lo facesse.
Sciencemark sono 300K, uno lo unzippa, lo fa' girare e posta result, facile.

runk
02-06-2006, 11:09
Vuoi sapere solo l'ultimo test?il BLAS?
in overall mi da 1294.10...dove posso confrontare i punteggi?

Alex23
02-06-2006, 11:20
Mi passate il link così provo 'stò bench? Grazie... :D

ByeZ!
ALEX23
:D

pier4reich
02-06-2006, 11:20
non lo so' dove si confermano, credo sul forum ma senza fare ALL benchmark, scegli blas sgemm clikka sse/3dnow e fai girare, poi leggi il peak Megaflops con il FLOPs/cycle nel riquadro in basso a sinistra e lo riporti.

Grazie

Edit: ale il link e' nel primo post

runk
02-06-2006, 11:21
Mi passate il link così provo 'stò bench? Grazie... :D

ByeZ!
ALEX23
:D

http://www.sciencemark.org/frame.php?frame=40

runk
02-06-2006, 11:23
non lo so' dove si confermano, credo sul forum ma senza fare ALL benchmark, scegli blas sgemm clikka sse/3dnow e fai girare, poi leggi il peak Megaflops con il FLOPs/cycle nel riquadro in basso a sinistra e lo riporti.

Grazie

Edit: ale il link e' nel primo post

sse o 3dnow?non me li fa selezionare entrambi....o forse nelle 3d sono già comprese queste istruzioni?

Alex23
02-06-2006, 11:30
ragazzi sto facendo una lista di prestazioni con sciencemark 2.0 final ( www.sciencemark.org ), il miglior programma, a mio avviso, mai scritto free per determinare prestazioni obbiettive di velocita' pura di una cpu, in particolare il BLAS bench sgemm.
Ho scaricato il software...
Ke cosa faccio x farlo partire? Impostazioni particolari?
Fammi sapere così procedo subito...

ByeZ!
ALEX23
:D

runk
02-06-2006, 11:31
Allora:

Blas Bench---->SGEMM---->3dnow!

Peak MFLOPS: 6892.83
FLOPS/cycle : 2.87

com'è?

pier4reich
02-06-2006, 11:34
bene considerando che hai 2 core a 2.4 ghz...

mumbkle, li ha rilevati all'inizio quando dice Ready to execute?

fatto sta che 6892 con un flops/cycle 2.87 (efficentissimo tra l'altro! I pentium al max fanno 2.07)

6892/2.87 = valuta la velocita' su un solo core, infatti da esattamente 2400... Quindi evidentemente nel sgemm non prende l'applicazione multithread su 2 core :(

quindi effettivamente tu avresti: 13.784! Cazzo, non hai una cpu, hai un supercomputer!

prova a farne girare 2 di fila e vedi se si rallentano (se si vuol dire che operano su un solo core e basta anche s ene hai 2) oppure danno gli stessi risultati (in questo caso vuol dire che per ogni core ci vuole un test)

runk
02-06-2006, 11:38
bene considerando che hai 2 core a 2.4 ghz...

mumbkle, li ha rilevati all'inizio quando dice Ready to execute?

fatto sta che 6892 con un flops/cycle 2.87 (efficentissimo tra l'altro! I pentium al max fanno 2.07)

6892/2.87 = valuta la velocita' su un solo core, infatti da esattamente 2400... Quindi evidentemente nel sgemm non prende l'applicazione multithread su 2 core :(

quindi effettivamente tu avresti: 13.784! Cazzo, non hai una cpu, hai un supercomputer!

prova a farne girare 2 di fila e vedi se si rallentano (se si vuol dire che operano su un solo core e basta anche s ene hai 2) oppure danno gli stessi risultati (in questo caso vuol dire che per ogni core ci vuole un test)

ok,nn ho capito un @azz@ del tuo discorso :D
cmq vuoi che ne faccio girar due?

pier4reich
02-06-2006, 11:41
allora guarda, scusa per il cirillico :D

Quando ti da' i risultati, e' facile vedere se esamina 1 solo core o 2.

prendi i megaflops, li dividi per il Flops/cycle e vedi quello che ti da'. Ora per un singolo core e' scontato che da' la velocita' del core. Ma per due core dovrebbe darne il doppio (di logica).

Ma da te da' 2400mhz, effettivamente a quanto viaggia 1 singolo core. Quindi teoricamente tu hai prestazioni doppie, appunto 13.784 (che e' impressionante). Potresti provare a farne girare due in contemporanea, e vedere se mantengono comuqnue risultati alti. Se si vuol dire che ogni thread prende 1 core, altrimenti sciencemark lavora comunque su un solo core.

Prova :)

runk
02-06-2006, 11:42
Blas Bench---->SGEMM---->3dnow!

Peak MFLOPS: 6553.02
FLOPS/cycle : 2.73

--------

Peak MFLOPS: 6643.81
FLOPS/cycle : 2.77

non ho impostato l'affinità col task,va bene ugualmente?

runk
02-06-2006, 11:44
allora guarda, scusa per il cirillico :D

Quando ti da' i risultati, e' facile vedere se esamina 1 solo core o 2.

prendi i megaflops, li dividi per il Flops/cycle e vedi quello che ti da'. Ora per un singolo core e' scontato che da' la velocita' del core. Ma per due core dovrebbe darne il doppio (di logica).

Ma da te da' 2400mhz, effettivamente a quanto viaggia 1 singolo core. Quindi teoricamente tu hai prestazioni doppie, appunto 13.784 (che e' impressionante). Potresti provare a farne girare due in contemporanea, e vedere se mantengono comuqnue risultati alti. Se si vuol dire che ogni thread prende 1 core, altrimenti sciencemark lavora comunque su un solo core.

Prova :)

capito adesso,grazie ;)
il test l'ho fatto,allora è come dicevi tu,ho prestazioni raddoppiate.

pier4reich
02-06-2006, 11:46
2 insieme? con quei result?

PORCA TROIA!

Se non e' un'apparenza (che un thread girava prima ed uno dopo sullo stesso core) ma all'incirca c'han mesos lo stesso tempo di quando ne hai fatto girare solo 1, allora si, il test e' single thread e sene devon far girare due insieme, bhe' sommali ed hai la velocita'...

13.196 ~ 13.200 megaflops, complimenti i 64 x2!

(ps sempre se confermi che c'han messo lo stesso tempo di 1 solo insieme)

ReDeX
02-06-2006, 11:46
non lo so' dove si confermano, credo sul forum ma senza fare ALL benchmark, scegli blas sgemm clikka sse/3dnow e fai girare, poi leggi il peak Megaflops con il FLOPs/cycle nel riquadro in basso a sinistra e lo riporti.

Grazie

Edit: ale il link e' nel primo post

Io ho ottenuto un punteggio di 5870.35 mflops, ergo non sfrutta i dualcore.

Letto ora gli altri post, devo considerare il doppio di quello che ho ottenuto. :)

runk
02-06-2006, 11:48
2 insieme? con quei result?

PORCA TROIA!

Se non e' un'apparenza (che un thread girava prima ed uno dopo sullo stesso core) ma all'incirca c'han mesos lo stesso tempo di quando ne hai fatto girare solo 1, allora si, il test e' single thread e sene devon far girare due insieme, bhe' sommali ed hai la velocita'...

13.196 ~ 13.200 megaflops, complimenti i 64 x2!

(ps sempre se confermi che c'han messo lo stesso tempo di 1 solo insieme)

si lo stesso tempo....ho clikkaro...2sec e ho cliccato l'altro...hanno finito uno prima e l'altro con 2 sec di ritardo! ;)
dovrei pèrovare con l'affinità dei core?

pier4reich
02-06-2006, 11:50
Si, s enon lo sfrutta, fanne partire 2!

Ho adesso provato con il mio, che ha 1 solo core...

Dovete stare attenti ai grafici, se ne fate partire 2, ed in entrambi i grafici non crollano mai (nota, se si tiene uno sciencemark in primo piano, e l'altro dietro, il grafico di quello dietro crolla molto di piu', da qui ve ne accorgete) allora ogni sciencemark sfrutta 1 core. Se invece uno dei due grafici crolla, allora lavora comunque su un solo core.

pier4reich
02-06-2006, 11:50
Non so' cosa sia l'affinita' dual core, prova... :p

runk
02-06-2006, 11:53
Non so' cosa sia l'affinita' dual core, prova... :p

decido di far partire un determinato programma su un solo core! ;)

pier4reich
02-06-2006, 11:58
ah ecco, e decidi di far partire unos ciencemark su un core, e l'altro su un'altro, vedi che da' e controlla i grafici, s enon crollano allora hai un mostro di cpu (com'e giusto) e dopo vi pasos anche i result dei processori singolo core :)

runk
02-06-2006, 12:04
ah ecco, e decidi di far partire unos ciencemark su un core, e l'altro su un'altro, vedi che da' e controlla i grafici, s enon crollano allora hai un mostro di cpu (com'e giusto) e dopo vi pasos anche i result dei processori singolo core :)

Con affinità sui core:

Blas Bench---->SGEMM---->3dnow!

Peak MFLOPS: 6586.03 (migliorato)
FLOPS/cycle : 2.74

--------

Peak MFLOPS: 6334.88 (peggiorato)
FLOPS/cycle : 2.64

i grafici non sono mai caduti! ;)

pier4reich
02-06-2006, 12:10
bene, puo' darsi che e' peggiorato perche' gira qualche procesos in piu', prova a toglierlo e vedi se i grafici cadono (vabbe' escluso prima dei 512x512), se non cadono vuol dire che basta farne girare 2

:)

E ragazzi non avete idea di quanto cacchio rullano gli amd x2!

Cioe' un pentium 4 670 fa approssimativamente 2.10 Flops/cycle pari a 7.980 megaflops con 3800mhz

Voi ne fate, diciamo 13.200 con 2400x2 ... se foste un pentium sareste pari a: 6.285 mhz!

altro che 4600+ (perche' il tuo manchester overclokkato e' pari ad un 4600+) !!!

bella ;9 ora esco postate result!

runk
02-06-2006, 12:13
bene, puo' darsi che e' peggiorato perche' gira qualche procesos in piu', prova a toglierlo e vedi se i grafici cadono (vabbe' escluso prima dei 512x512), se non cadono vuol dire che basta farne girare 2

:)

E ragazzi non avete idea di quanto cacchio rullano gli amd x2!

Cioe' un pentium 4 670 fa approssimativamente 2.10 Flops/cycle pari a 7.980 megaflops con 3800mhz

Voi ne fate, diciamo 13.200 con 2400x2 ... se foste un pentium sareste pari a: 6.285 mhz!

altro che 4600+ (perche' il tuo manchester overclokkato e' pari ad un 4600+) !!!

bella ;9 ora esco postate result!

vabbè mi son seccato...pomeriggio testo a 2.8ghz! :O

ciauzzzz :D

Alex23
02-06-2006, 13:16
Ecco il mio punteggio:

Peak MFLOPS: 6701.33
FLOPS/cycle : 2.78

Ecco anke allegato il relativo screen (cliccare x ingrandire):

http://apicci.interfree.it/hwup/ScienceMark2_little.JPG (http://apicci.interfree.it/hwup/ScienceMark2.jpg)

Ora lo testo con i due core, poi vi faccio sapere! :D

ByeZ!
ALEX23
:D

runk
02-06-2006, 13:27
Ecco il mio punteggio:

Peak MFLOPS: 6701.33
FLOPS/cycle : 2.78

Ecco anke allegato il relativo screen (cliccare x ingrandire):

http://apicci.interfree.it/hwup/ScienceMark2_little.JPG (http://apicci.interfree.it/hwup/ScienceMark2.jpg)

Ora lo testo con i due core, poi vi faccio sapere! :D

ByeZ!
ALEX23
:D

quanto me + o -.....parte la sfida??? :D

ps:ma come mai gli dai tutti quei volts al procio?

Alex23
02-06-2006, 13:30
ps:ma come mai gli dai tutti quei volts al procio?
E' CPU-Z ke sbarella con i volts... :D
Dal bios ho impostato 1,35V, ossia in default!!

ByeZ!
ALEX23
:D

runk
02-06-2006, 13:31
E' CPU-Z ke sbarella con i volts... :D
Dal bios ho impostato 1,35V, ossia in default!!

ByeZ!
ALEX23
:D

ah ecco...arrivi fino a 2.6ghz con vcore default,no?

pier4reich
02-06-2006, 13:33
vai alex provalo a farlo partire doppio ed occhio ai grafici!

runk
02-06-2006, 13:41
molto meglio:

http://img19.imageshack.us/img19/3503/test20ek.th.jpg (http://img19.imageshack.us/my.php?image=test20ek.jpg)

pier4reich c'è un'irregolarità in uno dei grafici vero?o no?

Alex23
02-06-2006, 13:50
ah ecco...arrivi fino a 2.6ghz con vcore default,no?
A vcore default vado tranquillo a 2.5GHz, a 2.6Ghz nn saprei...
Ma credo di no! Nn mi resta ke provare, cmq... :D

ByeZ!
ALEX23
:D

runk
02-06-2006, 13:59
http://img48.imageshack.us/img48/55/test28ghz4du.th.jpg (http://img48.imageshack.us/my.php?image=test28ghz4du.jpg)

:read: :Prrr:

pier4reich
02-06-2006, 14:06
molto meglio:

http://img19.imageshack.us/img19/3503/test20ek.th.jpg (http://img19.imageshack.us/my.php?image=test20ek.jpg)

pier4reich c'è un'irregolarità in uno dei grafici vero?o no?

si il secondo si abbassa troppo e poi da' un risultato alto (6600)... non dovrebbe andar bene, salvo che non l'hai spostato nel mentre dell'esecuzione...

Dovrebbero essere tutti e due a crescere... magari non con lo stesso picco, ma non dovrebbero abbassarsi (salvo che a 256x256 non ha fatto 9000 di picco! :p )

runk
02-06-2006, 14:08
si il secondo si abbassa troppo e poi da' un risultato alto (6600)... non dovrebbe andar bene, salvo che non l'hai spostato nel mentre dell'esecuzione...

Dovrebbero essere tutti e due a crescere... magari non con lo stesso picco, ma non dovrebbero abbassarsi

non metto compiler ma 3dnow!forse l'ho spostato,ma nn ricordo...cmq c'è il nuovo test che dovrebbe essere perfetto!

pier4reich
02-06-2006, 14:10
http://img48.imageshack.us/img48/55/test28ghz4du.th.jpg (http://img48.imageshack.us/my.php?image=test28ghz4du.jpg)

:read: :Prrr:

ecco in questa esecuzione (ripeto salvo nell'immagine di prima a 256x256 non ha fatto un picco assurdo) c'e precisamente quello che voglio dire. I due grafici crescono e non crollano mai... Sicuro ognuno sta su un core separato, e che potenza!

runk
02-06-2006, 14:13
ecco in questa esecuzione (ripeto salvo nell'immagine di prima a 256x256 non ha fatto un picco assurdo) c'e precisamente quello che voglio dire. I due grafici crescono e non crollano mai... Sicuro ognuno sta su un core separato, e che potenza!

ottimo allora! ;)
volevo chiederti invece se in questo test contano molto anche le ram(frequenza e timngs o solo uno dei due)....????

ciauzzzz

pier4reich
02-06-2006, 14:16
certo, conta la cache e le ram in modo pauroso.

Devi sapere che all'aumentare della matrice aumentano anche i singoli elementi della matrice (che in un prodotto 1536x1536 saranno 4.718.592 elementi) ed ognuno di questi almeno pesa 32bit (in singola precisione) quindi alla fine pesa 18.874.368 byte. Ora sai meglio di me che 18 mega nella cache L1 non ci vanno, manco nella cache L2, stanno solo nella ram.
Tu dirai, e perche' allora non mi da' un picco astrale con la matrice piccola? Perche' non riesce a sfoderare tutta la potenza evidentemente, e la fa a lungo... ma piu' cache hai (o ram veloce) piu' il risultato pian paino si alza, se qualcuno ha le ram overclokkate potremmo verificarlo.

pier4reich
02-06-2006, 14:19
Io direi che avendo fatto sto test, se i mod mi spiegano dove si puo' mettere, si potrebbe fare anche un thread ufficiale sulle prestazioni in Megaflops su sciencemark 2.0

runk
02-06-2006, 14:19
certo, conta la cache e le ram in modo pauroso.

Devi sapere che all'aumentare della matrice aumentano anche i singoli elementi della matrice (che in un prodotto 1536x1536 saranno 4.718.592 elementi) ed ognuno di questi almeno pesa 32bit (in singola precisione) quindi alla fine pesa 18.874.368 byte. Ora sai meglio di me che 18 mega nella cache L1 non ci vanno, manco nella cache L2, stanno solo nella ram.
Tu dirai, e perche' allora non mi da' un picco astrale con la matrice piccola? Perche' non riesce a sfoderare tutta la potenza evidentemente, e la fa a lungo... ma piu' cache hai (o ram veloce) piu' il risultato pian paino si alza, se qualcuno ha le ram overclokkate potremmo verificarlo.

io le ho cloccate le ram....posso provare o a 200mhz o a 240mhz...servirebbe qualcuno che può testare 200 e 280 ad esempio...vorrei sapere anche se contano di + i timings...nel superpi i timings fanno paura!

runk
02-06-2006, 14:20
Io direi che avendo fatto sto test, se i mod mi spiegano dove si puo' mettere, si potrebbe fare anche un thread ufficiale sulle prestazioni in Megaflops su sciencemark 2.0

già,ci stavo pensando pure io!
credo in benchmark!

pier4reich
02-06-2006, 14:20
io le ho cloccate le ram....posso provare o a 200mhz o a 240mhz...servirebbe qualcuno che può testare 200 e 280 ad esempio...vorrei sapere anche se contano di + i timings...nel superpi i timings fanno paura!

prova (se non ti scoccia) metti i timings normali, e poi quelli attuali, vedi che cambia, credo basti eseguire anche 1 solo sciencemark

edit: dov'e benchmark?

runk
02-06-2006, 14:21
prova (se non ti scoccia) metti i timings normali, e poi quelli attuali, vedi che cambia, credo basti eseguire anche 1 solo sciencemark

a parità di frequenza???credo sia ovvio che sono migliri dei timings aggressivi!

pier4reich
02-06-2006, 14:23
si ma per vedere se cambiano le prestazioni, secondo me, per la spiegazione sopra, cambiano eccome, in quanto nella matrice piu' grande vengono allocati 18 mega, pero' se uno non e' convinto...

runk
02-06-2006, 14:25
si ma per vedere se cambiano le prestazioni, secondo me, per la spiegazione sopra, cambiano eccome, in quanto nella matrice piu' grande vengono allocati 18 mega, pero' se uno non e' convinto...

http://www.hwupgrade.it/forum/forumdisplay.php?f=82

proverò....adesso per nn ho tempo! ;)