View Full Version : Compilatore Intel e disparità di trattamento verso processori AMD/VIA
blackshard
07-01-2010, 10:32
E' stato appurato da terze parti che il compilatore C/C++ x86 di Intel, uno dei compilatori spesso utilizzati per produrre codice molto ottimizzato, produce dei file binari eseguibili che non sempre sono ottimali per le nostre CPU.
Questo thread discute sul problema riguardante i software compilati con il compilatore Intel che non rispecchiano le reali prestazioni ottenibili con CPU di altro marchio (quindi AMD e VIA, attuali concorrenti nel settore delle cpu x86). Dagli studi che sono stati fatti, sembra che nel caso in cui venga rilevato un processore non prodotto da Intel, viene mandato in esecuzione il codice senza alcune ottimizzazioni, attivate invece quando viene riconosciuto il processore Intel. Essendo il compilatore Intel utile a produrre codice molto ottimizzato, il suo ambito di utilizzo prediletto riguarda casi in cui la potenza computazionale è molto sfruttata, ad esempio Videogiochi, programmi di benchmarking, alcuni tipi di driver, codec e generalmente applicazioni cpu-bound.
Molto recentemente è stata pubblicata questa notizia:
http://www.osnews.com/story/22683/Intel_Forced_to_Remove_quot_Cripple_AMD_quot_Function_from_Compiler_
che tiene in conto di tutte le problematiche ed i fatti avvenuti fino ad ora riguardo il compilatore Intel.
Dal punto di vista tecnico ci si è accorti che una componente posta nel binario compilato, il CPU Dispatcher, controlla la CPU nel sistema ed attiva il codice eseguibile più ottimizzato solo in presenza di CPU Intel, mentre attiva il codice eseguibile più lento disponibile nel caso vengano trovate CPU non-Intel (quindi attualmente vale per AMD e per VIA).
Il CPU Dispatcher, ad esempio, manda in esecuzione il codice ottimizzato utilizzando istruzioni SIMD SSE/SSE2/SSE3 solo se l'istruzione CPUID restituisce "GenuineIntel" associata ai processori Intel, mentre manda in esecuzione il codice "safe" (senza istruzioni SIMD) se non trova tale stringa.
Alcune voci fanno presente che Intel possa garantire il corretto funzionamento dell'eseguibile con istruzioni SIMD solo sui suoi processori, e quindi il CPU Dispatcher non attiva l'esecuzione del codice ottimizzato su processori non Intel per evitare problemi di compatibilità.
Altri però fanno notare che la stessa istruzione CPUID restituisce dei flag che indicano la presenza delle istruzioni SIMD SSE/SSE2/SSE3 indipendentemente dal produttore della CPU e del modello della CPU, e se il produttore della CPU possiede una implementazione fallace di tali istruzioni tale da provocare problemi di compatibilità, questo è un problema del produttore della CPU, non di Intel ne' del suo compilatore.
Alcuni riscontri indiretti di questo tipo sono esposti in diversi articoli. Un articolo su ars technica mostra come sia stato possibile incrementare il memory score del software di benchmarking PCMark2005 semplicemente modificando la stringa di riconoscimento di una CPU Nano VIA e facendola riconoscere come Intel:
http://arstechnica.com/hardware/reviews/2008/07/atom-nano-review.ars/6
In particolare la questione dei benchmark, come messo in evidenza da PCMark2005, è particolarmente critica perchè disturba la valutazione di un processore da parte di un software che dovrebbe fornire un riscontro oggettivo.
Inoltre moltri altri test e testimonianze sono raccolti nel blog di Agner Fog:
http://www.agner.org/optimize/blog/read.php?i=49&v=t
Un altro riscontro indiretto è dato dai test effettuati in ambito Linux utilizzando una suite di test completamente opensource e compilata utilizzando il compilatore opensource gcc.
http://www.phoronix.com/scan.php?page=article&item=amd_phenom2_x3&num=4
Ed anche qui (con turbo mode disabilitato, a causa di sporadici problemi di prestazioni, come indicato nell'ultima pagina dei test):
http://www.phoronix.com/scan.php?page=article&item=intel_lynnfield&num=5
dove la superiorità dei processori Intel è maggiormente livellata.
Alcuni inoltre tendono a sottolineare che i test sono stati ripetuti con risultati molto più vantaggiosi per i processori intel:
http://www.phoronix.com/scan.php?page=article&item=intel_lynnfield_add&num=1
Purtroppo però i test pubblicati nell'ultimo link sono stati ripetuti internamente da Intel e solo pubblicati da Phoronix. Quindi mancano di un riscontro di oggettività, non essendo stati prodotti da un ente indipendente.
Perchè AMD/VIA dovrebbero chiedere un trattamento equo sebbene sia Intel a produrre il proprio compilatore e a spenderci risorse?
Il problema non è tanto di AMD/VIA, quanto piuttosto delle software house che utilizzano il compilatore Intel, che viene fornito anche in modo gratuito. Le software house stesse potrebbero anche non essere a conoscenza di questo tipo di ottimizzazioni selettive.
La Federal Trade Commision (vedi: primo link in alto) ha comunque definito il compilatore Intel come "difettoso" ed ha obbligato la correzione del comportamento succitato al fine di garantire un comportamento più equo:
Requiring that, with respect to those Intel customers that purchased from Intel a software compiler that had or has the design or effect of impairing the actual or apparent performance of microprocessors not manufactured by Intel ("Defective Compiler"), as described in the Complaint:
1. Intel provide them, at no additional charge, a substitute compiler that is not a Defective Compiler;
2. Intel compensate them for the cost of recompiling the software they had compiled on the Defective Compiler and of substituting, and distributing to their own customers, the recompiled software for software compiled on a Defective Compiler; and
3. Intel give public notice and warning, in a manner likely to be communicated to persons that have purchased software compiled on Defective Compilers purchased from Intel, of the possible need to replace that software.
In caso di omissioni od inesattezze, fate presente la cosa in modo da permetterne la correzione.
AGGIORNAMENTO DEL 16 GENNAIO 2010
Lo stesso sito che ha fornito dei test su una piattaforma neutra (Phoronix) afferma di aver ordinato un core i3 per effettuare dei test sotto Linux. La news originale si trova qui:
http://www.phoronix.com/scan.php?page=news_item&px=Nzg4NA
Nella news viene affermato che Intel non ha fornito alla testata un processore i3/i5 al lancio, come invece aveva fatto nell'altra occasione con il processore i7, per cui la testata Phoronix ha dovuto necessariamente ordinare ed acquistare un processore per conto proprio per poter condurre dei test. A breve dovrebbero essere forniti dei benchmark che descrivono le performance dei processori i3 in ambito Linux con un compilatore neutro.
AGGIORNAMENTO DEL 30 GENNAIO 2010
Phoronix ha pubblicato la recensione sul core i3 530 a 2.93 ghz:
http://www.phoronix.com/scan.php?page=article&item=intel_corei3_530&num=1
Il confronto è con un phenom II x3 a 2.6 ghz e un Intel Core 2 Duo E8400 a 3.0 Ghz
Per il mio modesto parere, l'articolo è di difficile lettura perchè sono stati mischiati processori con 2 e 3 core fisici con uno con 2 core fisici e 4 logici. Inoltre la differenza di frequenza fra il Phenom e gli altri due processori Intel introduce un'altra variabile di cui tenere conto. Infine non sono stati indicati quali sono i test single threaded e quali i test che fanno uso di più thread, quindi non è facile comprendere quale è l'impatto (sia in positivo che in negativo) dell'Hyperthreading.
Ciò che appare evidente è che il phenom II X3 710 in alcune occasioni è di un bel po' dietro, solitamente è appaiato, poco dietro o poco avanti, e in alcune altre occasioni (ad esempio alcuni test su crittografia) è anche molto avanti. Da quanto detto, deduco che la recensione non è molto utile ai nostri scopi (cioè comprendere quale sia l'impatto del compilatore) perchè non è chiaro quando entra in gioco il terzo core del Phenom e quando invece la frequenza operativa è discriminante.
AGGIORNAMENTO DEL 15 FEBBRAIO 2010
Ho raccolto alcune notizie e blog che mostrano l'effettivo impatto prestazionale su alcuni carichi di lavoro.
Nel post che segue (datato 16-01-2007) viene mostrato come il patching dell'eseguibile permetta di ridurre il tempo di calcolo da 31 secondi a 27 secondi, con un incremento delle prestazioni del 15%. L'autore del post afferma che applicando la patch all'eseguibile, i tempi diventano proporzionalmente paragonabili con un core 2 duo a 3 ghz rispetto al suo athlon 4400+
http://terapix.iap.fr/forum/showthread.php?tid=134
In questo blog (datato 2005!) viene mostrato come l'applicazione della patch al compilatore Fortran per rimuovere il controllo sul processore Intel porti anche in questo caso vantaggi quantificabili all'incirca del 10%.
E' da notare il fatto che, utilizzando i flag -axW durante la compilazione vengono completamente disattivate le SSE/SSE2 per i processori non intel, ma queste rimangono attive sui processori intel, infatti il processore Opteron 248 preso in considerazione passa da 54,4 secondi a ben 123,4 secondi per completare il test "Simplex", risultando addirittura più lento del Pentium 4 1.7 Ghz preso come confronto!
La versione invece ottimizzata e opportunamente "patchata" per saltare il controllo migliora il tempo di esecuzione dai suddetti 54,4 secondi ai 49,1 secondi.
http://www.swallowtail.org/naughty-intel.shtml
Altri articoli dell'epoca che mostrano come questa questione fosse già ampiamente conosciuta e dibattuta sui siti del settore:
http://www.betanews.com/article/Suit-Intel-Sabotaged-Compiler-for-AMD/1121274628
http://techreport.com/discussions/8547
AGGIORNAMENTO DEL 24 MARZO 2010
|Pheonix| ha trovato un piccolo software che permette di analizzare un'insieme di file alla ricerca di controlli sul processore.
Verosimilmente esso cerca la presenza del CPU dispatcher del compilatore Intel all'interno dei compilati e lo modifica in modo da far riconoscere tutte le CPU come Intel. Attualmente il software è sotto analisi da parte degli utenti che seguono il thread, a breve saranno pubblicate notizie al riguardo.
E' possibile scaricare il software qui:
http://www.softpedia.com/get/Programming/Patchers/Intel-Compiler-Patcher.shtml
AGGIORNAMENTO DEL 23 APRILE 2010:
L'utente slemmer87 ha ottenuto dei significativi guadagni prestazionali applicando effettuando il patching dell'eseguibile tramite il programma indicato nell'aggiornamento precedente.
Altri dettagli e screenshot sono disponibili qui (http://www.hwupgrade.it/forum/showpost.php?p=31732040&postcount=290)
AGGIORNAMENTO DEL 22 GIUGNO 2010
Intel pronta a sborsare milioni all'Antitrust USA. Clicca qui per andare al post #339 con ulteriori dettagli (http://www.hwupgrade.it/forum/showpost.php?p=32387296&postcount=339)
AGGIORNAMENTO DEL 5 AGOSTO 2010
L'FTC ha emesso un accordo nel quale specifiche i termini della condotta sleale di Intel e impone a quest'ultima alcune importanti restrizioni riguardo il compilatore, e in materia di concorrenza.
La notizia è qui:
http://www.businessmagazine.it/news/intel-e-ftc-i-dettagli-dell-accordo_33449.html
oppure qui:
http://www.hwupgrade.it/forum/showthread.php?p=32773566#post32773566
AGGIORNAMENTO DEL 01/11/2010
Anche se non è direttamente correlato con l'argomento del thread, riporto che Negative_Creep a questo post (http://www.hwupgrade.it/forum/showpost.php?p=33521394&postcount=381) segnala che è divenuto presente, in una nota catena di merceologia elettronica presente in italia, il primo prodotto AMD. Questa notizia può essere intesa come una conferma della validità delle sanzioni imposte ad Intel dalla UE ed una possibile conferma delle pratiche di abuso di posizione dominante perpetrate di Intel.
AGGIORNAMENTO DEL 24/04/2011
digieffe mette in risalto i risultati SPECint e SPECfp ottenuti aggiornando il compilatore intel dalla versione 11.1 alla 12.0.
I risultati, a parità di configurazione hardware, mostrano un incremento del 18% delle performance sugli interi e del 14% delle performance sui floating point. Ciò può essere (ma non è detto che lo sia) legato alle condanne ricevute da intel e all'obbligo di rendere neutrale il suo compilatore.
Maggiori info qui: http://www.hwupgrade.it/forum/showpost.php?p=35008739&postcount=436
E' stato appurato da terze parti che il compilatore C/C++ x86 di Intel, uno dei compilatori spesso utilizzati per produrre codice molto ottimizzato, produce dei binari che non sempre sono ottimali per le nostre CPU.
molto recentemente è stata pubblicata questa notizia:
http://www.osnews.com/story/22683/Intel_Forced_to_Remove_quot_Cripple_AMD_quot_Function_from_Compiler_
che tiene in conto di tutte le problematiche ed i fatti avvenuti fino ad ora riguardo il compilatore Intel.
Dal punto di vista tecnico ci si è accorti che una componente posta nel binario, il CPU Dispatcher, controlla la CPU nel sistema ed attiva il codice eseguibile più ottimizzato solo in presenza di CPU Intel, mentre attiva il codice eseguibile più lento disponibile nel caso vengano trovate CPU non-Intel (quindi attualmente vale per AMD e per VIA).
Il CPU Dispatcher, ad esempio, manda in esecuzione il codice ottimizzato utilizzando istruzioni SIMD SSE/SSE2/SSE3 solo se l'istruzione CPUID restituisce "GenuineIntel" associata ai processori Intel, mentre manda in esecuzione il codice "safe" (senza istruzioni SIMD) se non trova tale stringa.
Alcune voci fanno presente che Intel possa garantire il corretto funzionamento dell'eseguibile con istruzioni SIMD solo sui suoi processori, e quindi il CPU Dispatcher non attiva l'esecuzione del codice ottimizzato su processori non Intel per evitare problemi di compatibilità.
Altri però fanno notare che la stessa istruzione CPUID restituisce dei flag che indicano la presenza delle istruzioni SIMD SSE/SSE2/SSE3 indipendentemente dal produttore della CPU e del modello della CPU, e se il produttore della CPU possiede una implementazione fallace di tali istruzioni tale da provocare problemi di compatibilità, questo è un problema del produttore della CPU, non di Intel ne' del suo compilatore.
Alcuni riscontri indiretti di questo tipo sono esposti in diversi articoli. Un articolo su ars technica mostra come sia stato possibile incrementare il memory score del software di benchmarking PCMark2005 semplicemente modificando la stringa di riconoscimento di una CPU Nano VIA e facendola riconoscere come Intel:
http://arstechnica.com/hardware/reviews/2008/07/atom-nano-review.ars/6
Questo pone un serio problema perchè i software compilati con il compilatore Intel non rispecchiano le reali prestazioni ottenibili con CPU di altro marchio. Essendo il compilatore Intel utile a produrre codice molto ottimizzato, il suo ambito di utilizzo prediletto riguarda casi in cui la potenza computazionale è molto sfruttata, vedi ad esempio Videogiochi, programmi di benchmarking, alcuni tipi di driver, codec e generalmente applicazioni cpu-bound.
In particolare la questione dei benchmark, come messo in evidenza da PCMark2005, è particolarmente critica perchè disturba la valutazione di un processore da parte di un software che dovrebbe fornire un riscontro oggettivo.
Inoltre moltri altri test e testimonianze sono raccolti nel blog di Agner
http://www.agner.org/optimize/blog/read.php?i=49&v=t
Un altro riscontro indiretto è dato dai test effettuati in ambito Linux utilizzando una suite di test completamente opensource e compilata utilizzando il compilatore opensource gcc:
http://www.phoronix.com/scan.php?page=article&item=amd_phenom2_x3&num=4
http://www.phoronix.com/scan.php?page=article&item=intel_lynnfield&num=5
dove la superiorità dei processori Intel è maggiormente livellata.
Alcuni inoltre tendono a sottolineare che i test sono stati ripetuti con risultati molto più vantaggiosi per i processori intel:
http://www.phoronix.com/scan.php?page=article&item=intel_lynnfield_add&num=1
Purtroppo però i test pubblicati nell'ultimo link sono stati ripetuti internamente da Intel e solo pubblicati da Phoronix. Quindi mancano di un riscontro di oggettività, non essendo stati prodotti da un ente indipendente.
Perchè AMD/VIA dovrebbero chiedere un trattamento equo sebbene sia Intel a produrre il proprio compilatore e a spenderci risorse?
Il problema non è tanto di AMD/VIA, quanto piuttosto delle software house che utilizzano il compilatore Intel, che viene fornito anche in modo gratuito. Le software house stesse potrebbero anche non essere a conoscenza di questo tipo di ottimizzazioni selettive.
La Federal Trade Commision (vedi: primo link in alto) ha comunque definito il compilatore Intel come "difettoso" ed ha obbligato la correzione del comportamento succitato al fine di garantire un comportamento più equo:
Bravo! hai fatto bene!lo faremo diventare un thread ufficiale!!
capitan_crasy
07-01-2010, 10:42
eccomi
fastleo63
07-01-2010, 10:43
Sottoscritto!
suneatshours86
07-01-2010, 10:46
presente.
07/01/2010
"Speriamo sia la volta buona"
Simpatici come un calcio nelle P@.... questi di intel non c'è che dire.... :D
Prima la storia degli accordi con i rivenditori e gli assemblatori poi il compilatore che rallenta VOLUTAMENTE le cpu non intel.....
Che dire .....gente seria al lavoro....
Curioso, me lo segui questo thread.
Seguo anch'io
in questi giorni tral'altro facendo dei bench (Athlon X2 vs Athlon II X2) ad un certo punto con PCMark 2005 mi trovo valori strani, in particolare a parità di frequenza di testing (2.7 Ghz) i valori del K8 risultano bassissimi, tipo la metà del K10
stessa cosa con il benchmark sui browser sempre della FutureMark, il Peacekeeper
poi cercando di forzare le ram a CL3 anche overvoltandole di brutto, il sistema non parte obbligandomi ad un ClearCMOS
questa volta il processore parte da bios a 216x12.5 (2700mhz) mentre prima l'avevo impostato a 215x5 e poi da Windows alzavo il moltiplicatore a 12.5
i valori di PCMark e Peacekeeper si impennano dando l'idea adesso di essere veramente attendibili, perlomeno in paragone all'Athlon II
con gli altri bench, es. Cinebech R10, Nuclearus Multicore, Powerflasher, Encoding video x264 e Xvid nessuna variazione
è evidente quindi che i bench della Futuremark si fanno influenzare da altri fattori, e bisogna stare attenti a considerarli attendibili
jrambo92
07-01-2010, 12:08
Simpatici come un calcio nelle P@.... questi di intel non c'è che dire.... :D
Prima la storia degli accordi con i rivenditori e gli assemblatori poi il compilatore che rallenta VOLUTAMENTE le cpu non intel.....
Che dire .....gente seria al lavoro....
Già.. sprizzano serietà da tutti i pori :D
Alcune analisi sulle ottimizzazioni in un confronto K8 e core2
http://abinstein.blogspot.com/search/label/SPEC%20CPU
chassis fuori servizio
07-01-2010, 12:28
la facciamo un class action? :D
scherzi a parte, complimenti e grazie per il trhead :friend:
gianni1879
07-01-2010, 12:37
eccomi anch'io vediamo di non sfociare nella solita battaglia che vi banno tutti :D
Athlon 64 3000+
07-01-2010, 12:50
Mi iscrivo anche io!
Visto che non mi è mai stata simpatica Intel vediamo come si evolve la situazione.
matt92tau
07-01-2010, 12:54
Ci sono!!
ivano444
07-01-2010, 12:55
che buffoni
eccomi anch'io vediamo di non sfociare nella solita battaglia che vi banno tutti :D
Tu appartieni al lato oscuro....:D :D :sofico: :sofico:
Tu appartieni al lato oscuro....:D :D :sofico: :sofico:
che la forza sia con noi!!!
che la forza sia con noi!!!
Ma anche l'accelerazione... :O
E la massa... :O (e Carrara... :O )
Ma anche l'accelerazione... :O
E la massa... :O (e Carrara... :O )
Nooooo..........
Basso livello...
Dre@mwe@ver
07-01-2010, 14:44
Iscritto, questa faccenda dei compilatori mi incuriosisce parecchio :)
Iscritto, sono molto curioso di vedere come si evolve la questione:O vergogna!
Eccomi, sempre nell'attesa di prendere un PII e testarlo insieme all'i7 con compilatore icc e gcc sotto gentoo con pts.
Thunderx
07-01-2010, 15:09
iscritto.
|Phoenix|
07-01-2010, 15:16
Ci sono anche io.Qualcuno ha provato OpenSourceMark?
Ci sono anche io.Qualcuno ha provato OpenSourceMark?
Provvedo io e vi faccio sapere;)
gianni1879
07-01-2010, 15:53
Tu appartieni al lato oscuro....:D :D :sofico: :sofico:
ho più cpu amd di quanto tu possa immaginare :D
ho più cpu amd di quanto tu possa immaginare :D
http://www.youtube.com/watch?v=8uZlH1jHgLc
:sofico:
Ho fatto il test completo che comprende 3 cicli, per un totale di circa 1:25:)
http://www.pctunerup.com/up/results/_201001/th_20100107203557_1Dotoi-8db46365188b0e2009239a64c8cbd156.jpg (http://www.pctunerup.com/up/image.php?src=_201001/20100107203557_1Dotoi-8db46365188b0e2009239a64c8cbd156.jpg)
|Phoenix|
07-01-2010, 17:27
Ho fatto il test completo che comprende 3 cicli, per un totale di circa 1:25:)
[url=http://www.postimage.org/image.php?v=gx1Dotoi][img=http://s1
Come ti è sembrato come test? impressioni?
stasera se posso lo faccio al piccolo k8
Funziona su 7 pro 64?
Come ti è sembrato come test? impressioni?
stasera se posso lo faccio al piccolo k8
Funziona su 7 pro 64?
l'ho proprio testato sul seven 64bit;) sembra molto accurato, si parte dalla simulazione di compessione con 7 zip, ad altri vari test, tipo apertura di pagine web, simulazione di encoding mp3 etc, però è parecchio palloso:D lunghetto è dire poco xd.
matt92tau
07-01-2010, 17:30
Ho fatto il test completo che comprende 3 cicli, per un totale di circa 1:25:)
http://www.postimage.org/image.php?v=gx1Dotoi
Adesso lo provo anche io, con il mio x3
Adesso lo provo anche io, con il mio x3
Allora auguri:sofico: è parecchio lunghetto spero che tu abbia qualcosa da fare nel contempo:asd:
|Phoenix|
07-01-2010, 17:34
Piu o meno una suite di test che copre l'uso quotidiano del pc potremmo dire.
Magari poi ci spieghi come si legge quel grafico :stordita:
Piu o meno una suite di test che copre l'uso quotidiano del pc potremmo dire.
Magari poi ci spieghi come si legge quel grafico :stordita:
Guarda neanche io ho molto chiaro quel risultato, aspettiamo qualche luminare che ne sappia di più:D Ps: proponiamo ad hwupgrade di inserire anche questo test quando negli articoli vengono comparate le cpu;)
|Phoenix|
07-01-2010, 17:40
Infatti sarebbe buono includerlo,gianni se sei in ascolto raccogli la richiesta :oink: :p
blackshard
07-01-2010, 17:45
Non ho ben capito il risultato del test però.
Nell'istogramma più la barra è alta, migliore è il risultato del processore?
Non ho ben capito il risultato del test però.
Nell'istogramma più la barra è alta, migliore è il risultato del processore?
Dal risultato sembra distruggere senza pietà l'e6600:sofico: in attesa di qualcono che sappia dare delle delucidazioni sui risultati di questo test:)
|Phoenix|
07-01-2010, 17:51
però c'è solo la barra nera nell'e6600 forse è stato fatto un solo test su quella cpu. Ok che è un quad vs dual ma 50.000 punti contro piu di un milione.... :sofico:
Aspettiamo gli altri temerari per confrontare i risultati:cool:
però c'è solo la barra nera nell'e6600 forse è stato fatto un solo test su quella cpu. Ok che è un quad vs dual ma 50.000 punti contro piu di un milione.... :sofico:
Aspettiamo gli altri temerari per confrontare i risultati:cool:
E' già, sembra più che altro un confronto col pentium 2:sofico:
Infatti sarebbe buono includerlo,gianni se sei in ascolto raccogli la richiesta :oink: :p
Purtroppo credo che gianni non possa fare niente visto che è "solo" un moderatore (con tutto il rispetto per gianni, che è una persona che stimo, fatta eccezione per i pessimi gusti che ha sulla scelta delle cpu :sofico: )
Credo bisognerebbe chiedere a qualche amministratore se non allo stesso Corsini, ma non credo che sarà una cosa facile, visto che potrebbero avere anche grane....
blackshard
07-01-2010, 18:03
Bene, c'ho dato un'occhiata, però mi sembra ancora molto acerba come suite di test.
In particolare, alcuni test vengono dichiarati "CPU", però sono test su primitive grafiche e quindi penso che in quel caso intervenga troppo la scheda video.
Nel grafico postato infatti vedo che una marea di punti (un milione, più o meno :D ) sono ottenuti dal test di alpha blending :)
|Phoenix|
07-01-2010, 18:07
Forse selezionando solo quelli che riguardano la cpu potremmo avere il quadro chiaro,capire se è utile come test non infetto :fagiano: o meno...
Forse selezionando solo quelli che riguardano la cpu potremmo avere il quadro chiaro,capire se è utile come test non infetto :fagiano: o meno...
Riprovo a fare solo quelle che riguardano la cpu e riposto;)
Edit: come faccio a selezionare i test?
masty_<3
07-01-2010, 18:16
M'iscrivo anche io, sono curioso di capire anche io sta questione dei compilatori che ho già letto da qualche parte, e se dovesse servire una cpu dei "cattivi" benvenga :D
M'iscrivo anche io, sono curioso di capire anche io sta questione dei compilatori che ho già letto da qualche parte, e se dovesse servire una cpu dei "cattivi" benvenga :D
Benvenuto:) spremi per bene il cattivone:D e facci sapere:sofico:
da dove si scarica la suite? ne ho trovata una beta ma è poco funzionante
da dove si scarica la suite? ne ho trovata una beta ma è poco funzionante
Io ho testato con quella...:)
Io ho testato con quella...:)
cavolo a me non parte nessun bench...da una finestra d'errore e poi stoppa...
Mah! Il compilatore Intel non poteva non favorire HW Intel :asd:
Mi ricordo che tempo fa nel 3D ufficiale del Ph II chiesi se nessuno avesse mai fatto bench con Linux (e quindi GCC) proprio per curiosità. Io non posso perché ho un K8 "primitivo" (Athlon 64 3000+) che però, devo dire, a me basta per ora (l'anno scorso avevo un K7 2100+@2600+ :sofico: ).
Resta il fatto che, stante la superiorità di i7, pure mi è sempre sembrato troppo strano un divario così grande, anche se le due generazioni non sono direttamente confrontabili.
Che dire quindi? Che i nodi vengono al pettine alla fine :asd: e questo non tanto per una fanboyata quanto per capire come la concorrenza non sia solo sul silicio :rolleyes:
Ah, dimenticavo: avevo letto, sempre nel 3D ufficiale, che in ambiente 64 bit il Ph II non sfigurava affatto anzi... nessuno ricorda nulla di questo dettaglio?
al di fuori dei bench l'utente finale non noterebbe neanche la differenza da un i7 ad un 965, figuriamoci se gli leviamo i compilatori:O
Serve qualcuno dotato di i5/i7 che faccia il test.... chi si offre?
Ovviamente su os 64 bit
noxycompany
07-01-2010, 18:49
Io ho testato con quella...:)
anche io..ma è poco user friendly...:cry: :cool:
matt92tau
07-01-2010, 19:20
Ho fatto il test completo che comprende 3 cicli, per un totale di circa 1:25:)
http://www.postimage.org/image.php?v=gx1Dotoi
Ecco i miei risultati.
http://www.pctunerup.com/up/results/_201001/th_20100107202017_Cattura.JPG (http://www.pctunerup.com/up/image.php?src=_201001/20100107202017_Cattura.JPG)
Mi sembra un po' bassino il punteggio rispetto al tuo.
Tu hai cambiato qualche impostazione?
Ecco i miei risultati.
http://www.pctunerup.com/up/results/_201001/th_20100107202017_Cattura.JPG (http://www.pctunerup.com/up/image.php?src=_201001/20100107202017_Cattura.JPG)
Mi sembra un po' bassino il punteggio rispetto al tuo.
Tu hai cambiato qualche impostazione?
Allora il mio è durato 3 cicli, con più di un ora di test, io ho semplicemente aperto il programma e cliccato in alto a sx su official run;)
matt92tau
07-01-2010, 19:33
Allora il mio è durato 3 cicli, con più di un ora di test, io ho semplicemente aperto il programma e cliccato in alto a sx su official run;)
Anche io ho fatto così
Anche io ho fatto così
Strana sta cosa:confused: si attendono altri riscontri.
Strana sta cosa:confused: si attendono altri riscontri.
Prova a rifare il test....
matt92tau
07-01-2010, 20:17
Prova a rifare il test....
Appena ho tempo dato che dura un bel po'.
blackshard
07-01-2010, 23:03
Comunque questo bench non mi sembra molto affidabile come è ora, quantomeno perchè mischia test su gpu confondendoli con test con gpu.
E' incredibile che il phenom x4 di prima faceva un milione e mezzo di punti e il phenom x3 ne fa 75000...
Comunque penso che se volete testare il processore, sarebbe buona cosa utilizzare il custom run e selezionare solo i test pesantemente multithreaded (quelli sottolineati) e lasciare vuoti gli altri. Ovviamente poi il riferimento con l'e6600 non è più valido.
carlottoIIx6
08-01-2010, 02:20
meno male che si
è aperta qui la discussione!
sta diventando troppo estesa!
per focalizzare meglio i test, occorre fare confronti e vedere quindi dati relativi tra due piattaforme confrontabili!
dare valori assoluti non fa capire nulla!
inoltre per calibrare la cose, bisogna cercare dei confronti con i test già
effettuati, in modo da vedere se è possibile capire le differenze e l'affidabilità del test!
una volta calibrato, si cercano due piattaforme da confrontare... dal confronto si ripossono commentare i test "vecchi" di
riferimento!
provare quindi ad estrapolare il contributo della differenza di compilazione.
inutile che vi dico che quest è un proggetto ambizioso,
serve quindi tutta la vostra competenza!
suggerisco che qualcuno raccolga i dati per renderli immediatamente fruibili!
sto scaricando il test ci vorrebbe qualcuno con intel però
sto scaricando il test ci vorrebbe qualcuno con intel però
Infatti..qualcuno con intel si faccia avanti :D..Cmq lo sto scaricando pure io cosi più tardi posto i risultati
fastleo63
08-01-2010, 12:33
Prima CPU, Intel "Conroe" Pentium E2220 @ 2.40GHz:
http://www.pctunerup.com/up/results/_201001/th_20100108133404_sshot-1.jpg (http://www.pctunerup.com/up/image.php?src=_201001/20100108133404_sshot-1.jpg)
* CPU Name: Intel(R) Pentium(R) Dual CPU E2220 @ 2.40GHz (Intel Intel(R) Pentium(R) Dual CPU E2220 @ 2.40GHz 2400MHz)
* Vendor ID: GenuineIntel
* Core ID: Family: 6, Model: 15, Stepping: 13
* Number of CPUs (real, virtual): 1, 2
* CPU Features: L1i (kB): 16; L1d (kB): 32; L2 (kB): 1024; FPU; CX8; APIC; CMOV; PAE; PAT; MMX; SSE; SSE2; SSE3; HyperThreading; EnhancedSpeedStep; NX; AMD64
* Windows MHz: 2399
* COSBI CPU Clock speed is 2.400.067.431 Hz
* CPU External Clock: 200 MHz
* Motherboard: Gigabyte Technology Co., Ltd., Model G31M-S2L
* BIOS: Award Modular BIOS v6.00PG, Version: GBT - 42302e31
* Graphics adapter: ATI Radeon HD 3400 Series
* Graphics adapter memory: 1.024 MB
* Graphics driver: 6.14.10.7028
* Memory Amount (MB): 2048
* Hard drive model: MAXTOR STM3160215AS, Size: 160,0 GB
* Screen Resolution: 1680x1050x32@60Hz
* OS Name: Microsoft Windows XP
* Version: 5.1
* Build: 2600
* Service Pack: Service Pack 3
Risultati:
http://www.pctunerup.com/up/results/_201001/th_20100108133506_sshot-2.jpg (http://www.pctunerup.com/up/image.php?src=_201001/20100108133506_sshot-2.jpg)
fastleo63
08-01-2010, 12:40
Altra CPU Intel (Yorkfield Q9400 @ 2.66GHz):
http://www.pctunerup.com/up/results/_201001/th_20100108133754_sshot-1.jpg (http://www.pctunerup.com/up/image.php?src=_201001/20100108133754_sshot-1.jpg)
* CPU Name: Intel(R) Core(TM)2 Quad CPU Q9400 @ 2.66GHz (Intel Intel(R) Core(TM)2 Quad CPU Q9400 @ 2.66GHz 2660MHz)
* Vendor ID: GenuineIntel
* Core ID: Family: 6, Model: 7, Stepping: 10
* Number of CPUs (real, virtual): 1, 4
* CPU Features: L1i (kB): 16; L1d (kB): 32; L2 (kB): 3072; FPU; CX8; APIC; CMOV; PAE; PAT; MMX; SSE; SSE2; SSE3; HyperThreading; EnhancedSpeedStep; NX; AMD64
* Windows MHz: 2660
* COSBI CPU Clock speed is 2.660.056.364 Hz
* CPU External Clock: 1333 MHz
* Motherboard: Hewlett-Packard, Model HP Compaq dc7900 Convertible Minitower
* BIOS: Default System BIOS, Version: HPQOEM - 20090305
* Graphics adapter: Intel(R) Q45/Q43 Express Chipset
* Graphics adapter memory: 1.024 MB
* Graphics driver: 6.14.10.5047
* Memory Amount (MB): 2048
* Hard drive model: Volume0, Size: 500,1 GB
* Screen Resolution: 1024x768x32@60Hz
* OS Name: Microsoft Windows Server 2003 R2
* Version: 5.2
* Build: 3790
* Service Pack: Service Pack 2
Risultati:
http://www.pctunerup.com/up/results/_201001/th_20100108133934_sshot-2.jpg (http://www.pctunerup.com/up/image.php?src=_201001/20100108133934_sshot-2.jpg)
E' il meglio che sono riuscito a trovare qui in ufficio... Faccio notare che il PC con il Q9400 è un piccolo server con dischi in RAID-1 ed O.S. Windows 2003, quindi i due risultati non sarebbero molto ben comparabili tra loro...
A casa proverò con il mio AM2+ 940BE.
noxycompany
08-01-2010, 12:53
meno male che si
è aperta qui la discussione!
sta diventando troppo estesa!
per focalizzare meglio i test, occorre fare confronti e vedere quindi dati relativi tra due piattaforme confrontabili!
dare valori assoluti non fa capire nulla!
inoltre per calibrare la cose, bisogna cercare dei confronti con i test già
effettuati, in modo da vedere se è possibile capire le differenze e l'affidabilità del test!
una volta calibrato, si cercano due piattaforme da confrontare... dal confronto si ripossono commentare i test "vecchi" di
riferimento!
provare quindi ad estrapolare il contributo della differenza di compilazione.
inutile che vi dico che quest è un proggetto ambizioso,
serve quindi tutta la vostra competenza!
suggerisco che qualcuno raccolga i dati per renderli immediatamente fruibili!
esempi di piattaforme comparabili??
masty_<3
08-01-2010, 15:16
Scusate ma non riesco a trovare il link del bench, me lo passate?
Comunque sicuri che non è influenzato dalla vga? Perchè ho sta cosa che mi farebbe fare 2 punti... comunque quanto tempo dura il test?
Raga..ho fatto il test ma il grafico non mi è uscito..mi sono usciti solo i risultati per ogni test..qualcuno sa il motivo?
fastleo63
08-01-2010, 22:06
Se non vado errato il grafico dei risultati viene visualizzato solo dopo aver eseguito un Official Run... O no?
blackshard
08-01-2010, 22:14
Mah io non mi fido troppo a dire il vero.
Fra un po' dovrebbe essere resa disponibile la Phoronix Test Suite per Windows, che viene usata già su una marea di piattaforme diverse.
Quella dovrebbe essere maggiormente affidabile.
blackshard
08-01-2010, 22:23
Comunque una volta ho scritto un programmino per fare benchmark e burn-in test che usa, fra le altre cose, le SSE.
Adesso per curiosità l'ho fatto girare sia sul Turion ZM a 2.1 Ghz che sull'E5200 @ 3.2Ghz.
Sul Turion mi da' una bandwidth di circa 14800 kb/s, sull'E5200 circa 22000 kb/s.
Se faccio la proporzione con la frequenza, viene fuori che i due proci hanno un IPC molto simile! :eek: :eek:
Comunque un altro test che da' spesso risultati simili a parità di clock fra AMD e Intel è wprime.
fastleo63
08-01-2010, 23:13
Ecco i risultati del test con il mio sistema in firma (O.S. Microsoft Windows 7 Ultimate x64):
http://www.pctunerup.com/up/results/_201001/th_20100109000221_sshot-1.jpg (http://www.pctunerup.com/up/image.php?src=_201001/20100109000221_sshot-1.jpg)
Dal grafico occorrerebbe togliere i 34.000 punti totalizzati dal benchmark disco (ho un RAID-5 che influenza pesantemente - in senso positivo - il risultato). Lo score netto è di circa 80.000 punti.
Togliendo i circa 20.000 punti del test disco anche dal grafico da me precedentemente ottenuto con il sistema Core 2 Quad Q9400, si ha un netto di 73.000 punti.
Capisco che comunque i risultati sono condizionati dalla presenza, sul mio sistema AMD, di un adattatore video discreto (il PC HP con il Quad Core Intel ha invece un sottosistema video di tipo IGP, con prestazioni sicuramente inferiori).
Tant'è, non ho potuto, per motivi di tempo, provare altre combinazioni di tests.
Se non vado errato il grafico dei risultati viene visualizzato solo dopo aver eseguito un Official Run... O no?
Si si è proprio quello che ho fatto..ma di grafico niente...mi da errore :muro: ...bo..domani riprovo vediamo un pò
fastleo63
08-01-2010, 23:26
Al di là dell'attendibilità complessiva del test, mi pare che comunque si possa evincere che il divario prestazionale tra le due architetture non sia così grande.
Penso che comunque sia indubbia la superiorità dei Nehalem, sperando che a breve qualche possessore di Core i7 voglia provare questo interessante OpenSourceMark o magari la futura versione Windows della suite di Phoronix...
Scusate ma non riesco a trovare il link del bench, me lo passate?
Comunque sicuri che non è influenzato dalla vga? Perchè ho sta cosa che mi farebbe fare 2 punti... comunque quanto tempo dura il test?
Ecco il link: http://sourceforge.net/projects/opensourcemark/
carlottoIIx6
09-01-2010, 11:02
Al di là dell'attendibilità complessiva del test, mi pare che comunque si possa evincere che il divario prestazionale tra le due architetture non sia così grande.
Penso che comunque sia indubbia la superiorità dei Nehalem, sperando che a breve qualche possessore di Core i7 voglia provare questo interessante OpenSourceMark o magari la futura versione Windows della suite di Phoronix...
perchè non fai un grafico dove metti la differenza percentuale tra
le tue proposte!
ci interessa capire anche
l'influenza del
compilatore
oltre al divario!
tra le architetture interessanti c'è quella intel i5
o i7 (così capiamo se si accorcia la distanza con gli i7)
e quella amd 965!
Mah io non mi fido troppo a dire il vero.
Fra un po' dovrebbe essere resa disponibile la Phoronix Test Suite per Windows, che viene usata già su una marea di piattaforme diverse.
Quella dovrebbe essere maggiormente affidabile.
Anche senza aspettare che esca la versione 2.4 di PTS si possono fare test con
la PTS desktop live, e' un live cd di linux con preinstallati molti test, l'unico neo e'
che usa la versione 2.0 e che e' circa 1 giga da scaricare e mettere su DVD
Quello che ho detto anche io nell'altra discussione.
Comunque mi pare di capire che è questione di poco per il supporto win: ho letto che tra poco uscirà una comparativa win/linux su un Eee PC 1201N.
Parlando di questo netbook dice:
While benchmarks will come out soon that compare Windows to Linux (and maybe OpenSolaris and BSD too, since they are all supported by the Phoronix Test Suite), Windows 7 continues to run quite well and have the upper-hand over Linux in some areas. However, stay tuned for more information on that matter.
link (http://www.phoronix.com/scan.php?page=news_item&px=Nzg2Ng)
blackshard
09-01-2010, 19:55
Anche senza aspettare che esca la versione 2.4 di PTS si possono fare test con
la PTS desktop live, e' un live cd di linux con preinstallati molti test, l'unico neo e'
che usa la versione 2.0 e che e' circa 1 giga da scaricare e mettere su DVD
Questo è vero, però sarebbe anche interessante osservare le prestazioni sotto Windows.
suneatshours86
09-01-2010, 20:59
spero di sbagliarmi ma ora come ora vedo solo risultati postati a casaccio e poca logica nei confronti del thread. oltretutto stiamo totalmente dimenticando una eventuale comparativa con i calcolatori VIA.
blackshard
09-01-2010, 23:44
Io direi che potrebbe essere interessante scaricare la live di pts e fare i test utilizzando quella distribuzione.
Almeno lì i test sono ben definiti e di uso comune. Anche se si tratta di linux, le performance sono comunque generali e assolutamente indipendenti dal compilatore ed è più semplice isolare i test fortemente dipendenti da scheda video oppure dal disco, invece dell'opensourcemark che fa' di tutta l'erba un fascio e ti da' un unico punteggio.
Con la suite opensourcemark non si riesce neppure a capire quali sono i punti di forza e quelli di debolezza del processore.
suneatshours86
09-01-2010, 23:57
Io direi che potrebbe essere interessante scaricare la live di pts e fare i test utilizzando quella distribuzione.
Almeno lì i test sono ben definiti e di uso comune. Anche se si tratta di linux, le performance sono comunque generali e assolutamente indipendenti dal compilatore ed è più semplice isolare i test fortemente dipendenti da scheda video oppure dal disco, invece dell'opensourcemark che fa' di tutta l'erba un fascio e ti da' un unico punteggio.
Con la suite opensourcemark non si riesce neppure a capire quali sono i punti di forza e quelli di debolezza del processore.
a mio avviso prima di partire sui test c'è la necessita di trovare benchmark che a parità di utilizzo mettano in mostra le disparità tra i processori amd via e intel.
Per spiegarmi meglio:
di solito nelle comparative viene usata una suite simile di programmi
Queste le applicazioni utilizzate nel confronto prestazionale:
* Povray 3.7 beta 32 - 64bit
* Cinebench 10 - 64bit
* 3ds Max 2009 x64 - Dragon_character_rig.max
* Blender 2.48 - render flyingsquirrerblend
* Euler 3D - benchmark (in Hz)
* Divx 6.8.5 - Virtualdub 1.8.8
* AutoMVK 0.98.4
* Windows Media Encoder 9
* Mainconcept Reference Encoder and Decoder 1.6.1
* TMPEG 4.7.1.284
* x264 benchmark
* Unreal Tournament 3 - no AA anis 16x; ShangriLa
* Half Life 2 Episode 2 - AA 8xCSAA anis 16x
* Crysis (DX9 - high - anis 16x)
* Far Cry 2
* Far Cry 2 - AA
* World in Conflict
* Winrar 3.90 beta 2 x64 . test integrato
* 7-Zip 4.65 x64
ora supponendo che questi siano tra i benchmark più famosi sul mercato e che possano rientrare nel gruppo dei programmi che usano curiosamente il supporto Geniune Intel, troviamo qualcosa di meno utilizzato e più "undergound" che li equivalga per vedere se, dati alla mano, notiamo gli stessi raffronti tra le varie cpu.
blackshard
10-01-2010, 00:15
Cioè intendi dire di cercare applicativi equivalenti o simili che sono certamente compilati in modo pulito?
Sono convinto che più pulito della pts non ci sia nulla, però trovare una suite pulita per windows per fare test potrebbe essere una scelta ragionevole, anche se è più difficile capire come è stata compilata.
L'ideale sarebbe prendere l'eventuale eseguibile compilatore con ICC e taroccarlo in modo da fargli riconoscere qualunque processore come Intel :)
suneatshours86
10-01-2010, 00:26
Cioè intendi dire di cercare applicativi equivalenti o simili che sono certamente compilati in modo pulito?
Sono convinto che più pulito della pts non ci sia nulla, però trovare una suite pulita per windows per fare test potrebbe essere una scelta ragionevole, anche se è più difficile capire come è stata compilata.
L'ideale sarebbe prendere l'eventuale eseguibile compilatore con ICC e taroccarlo in modo da fargli riconoscere qualunque processore come Intel :)
esattamente.
Terrei a sottolineare come per un thread del genere vi sia questa necessita:
L'ideale sarebbe prendere l'eventuale eseguibile compilatore con ICC e taroccarlo in modo da fargli riconoscere qualunque processore come Intel
esattamente come verrà dimostrato in tribunale.
http://www.hwupgrade.it/forum/showthread.php?t=2119615 Thread ufficiale del bench;)
capitan_crasy
10-01-2010, 09:28
http://www.hwupgrade.it/forum/showthread.php?t=2119615 Thread ufficiale del bench;)
Mi permetto di darti un consiglio:
Posta un paio di pagine nel tuo thread, in modo da tenere un eventuale classifica in prima pagina per i risultati del bench...
http://www.hwupgrade.it/forum/showthread.php?t=2119615 Thread ufficiale del bench;)
L'immagine di apertura mi sembra lasci intendere l'esistenza di un complotto ordito da qualche oscura setta massonica. E' voluto?
Non è un po' eccessivo?
blackshard
10-01-2010, 16:44
L'immagine di apertura mi sembra lasci intendere l'esistenza di un complotto ordito da qualche oscura setta massonica. E' voluto?
Non è un po' accessivo?
E' proprio quello il simbolo di opensourcemark :)
noxycompany
10-01-2010, 16:54
L'immagine di apertura mi sembra lasci intendere l'esistenza di un complotto ordito da qualche oscura setta massonica. E' voluto?
Non è un po' accessivo?
:asd:
E' proprio quello il simbolo di opensourcemark :)
Ah...
Bhè, qualcosa vorrà rappresentare...
I Grandi Architetti dei Benchmark?
aggiunto un primo risultato sul thread ufficiale;)
fastleo63
10-01-2010, 22:44
perchè non fai un grafico dove metti la differenza percentuale tra le tue proposte!...tra le architetture interessanti c'è quella intel i5 o i7...
Purtroppo non ho più a disposizione né i PC né i risultati, ho sempre poco tempo a disposizione e non ho potuto copiarmi i risultati dei tests.
Secondo me per avere risultati confrontabili e significativi occorrerebbe provare sistemi completi utilizzando una VGA PCI-E ed un disco SATA 3Gbps per così dire "di riferimento" (cioè lo stesso modello per tutte le piattaforme provate).
Oppure solo il disco fisso, per testare le performance complessive delle mainboards dotate di grafica IGP.
Questo Cosbi OpenSourceMark ha bisogno di essere un pò "esplorato" nelle sue componenti per individuare solo i test legati a CPU e RAM, perchè ce ne sono parecchi che a "lume di naso" chiamano in causa la GPU...
P.S.: non ho altri sistemi Intel, tantomeno i5 od i7...
Life bringer
11-01-2010, 06:44
Scusate se m'intrometto... Io mi rendo disponibile a fare un test comparativo (non ora perchè sto aspettando i processori c3 dual core di amd se e quando mai usciranno :rolleyes: ).
Non ho intenzione di scaricare quell'accozzaglia di programma in prima pagina, d'altra parte nell'ultimo mese ho fatto molti RUN con il phoronix test suite sulla mia macchina debian (e amd) come programma è ottimo, "fa tutto" lui salvo alcune correzioni da fare ai file che scarica, con i quali ho perso un po' di tempo. La mia idea era quella di usare il live cd, le 2 macchine sarebbero le seguenti:
Intel E8500
Asus P5Q-E
4 gb di ram 1066 mhz
più altre componenti che non dovrebbero influenzare i test in ogni caso.
Amd Phenom X2 555 BE
AOD790GX/128M
8 gb di ram 800 mhz
Le frequenze dei processori sono "simili", posso downcloccare le ram dell'intel a 800mhz e partire con i test.
Il "problema" è che la suite phoronix implementa una quantità di test INDUSTRIALE, si possono dividere in suite, ma la domanda è comunque: quale suite è opportuno usare? Se non sbaglio ve ne è una che si chiama CPU Suite.
Ma comunque altri consigli son bene accetti.
Ma perché questo topic non è in evidenza? Anche solo a titolo informativo!
blackshard
11-01-2010, 18:36
Scusate se m'intrometto... Io mi rendo disponibile a fare un test comparativo (non ora perchè sto aspettando i processori c3 dual core di amd se e quando mai usciranno :rolleyes: ).
Non ho intenzione di scaricare quell'accozzaglia di programma in prima pagina, d'altra parte nell'ultimo mese ho fatto molti RUN con il phoronix test suite sulla mia macchina debian (e amd) come programma è ottimo, "fa tutto" lui salvo alcune correzioni da fare ai file che scarica, con i quali ho perso un po' di tempo. La mia idea era quella di usare il live cd, le 2 macchine sarebbero le seguenti:
Intel E8500
Asus P5Q-E
4 gb di ram 1066 mhz
più altre componenti che non dovrebbero influenzare i test in ogni caso.
Amd Phenom X2 555 BE
AOD790GX/128M
8 gb di ram 800 mhz
Le frequenze dei processori sono "simili", posso downcloccare le ram dell'intel a 800mhz e partire con i test.
Il "problema" è che la suite phoronix implementa una quantità di test INDUSTRIALE, si possono dividere in suite, ma la domanda è comunque: quale suite è opportuno usare? Se non sbaglio ve ne è una che si chiama CPU Suite.
Ma comunque altri consigli son bene accetti.
Al momento sono un po' occupato, però ho dato un'occhiata sul sito alla suite live di phoronix. Sembra molto interessante, senza dubbio se dovessimo scegliere quella come test di riferimento sicuramente considereremmo soltanto la suite per la cpu.
In ogni caso si attende il rilascio della suite per windows e l'aggiornamento della live, che dovrebbe avvenire relativamente a breve.
In ogni caso nessuna news ancora per quanto riguarda la questione compilatore.
blackshard
11-01-2010, 18:36
Ma perché questo topic non è in evidenza? Anche solo a titolo informativo!
Devo chiedere ad un moderatore immagino.
Adesso chiedo e vedo cosa mi dicono :)
naumakos
16-01-2010, 00:25
Mi associo. Ma come fa Intel a non vergognarsi
l'avevo gia' scritto altre volte che il problema era il compiler .Infatto sotto linux dove il compiler piu' usato e' il gcc (opensource) l'architettura amd ha risultati migliori rispetto a intel (vedi recensioni phoronix)
A proposito di phoronix, è stata annunciata la beta di Phoronix Test Suite 2.4, che introduce un primo supporto a windows.
Con l'uscita dei nuovi Clarkdale Intel non ha mandato nessun processore da testare a phoronix, cosa che invece aveva fatto con i Lynnfield quando gli aveva fornito un i5 750 ed un i7 870 (di cui abbiamo visto i test).
Quindi si procurerà a sue spese un i3 530 ed entro un paio di settimane saranno pubblicati i test cpu e gpu.
Devo dire che non è la prima volta che questo sito viene ignorato all'uscita di nuove componenti hw importanti come appunto le cpu, pur essendo praticamente l'unico sito che si occupa di hw per linux. Se non ricordo male è successa la stessa cosa con i primi Nehalem: avevano ricevuto una scheda X58 dalla Asrock, ma nessun i7 9xx da Intel, per cui ne hanno dovuto acquistare uno (un 920).
phicrand_6358
16-01-2010, 14:15
troppo obiettivi per i loro gusti....:read: :banned:
blackshard
16-01-2010, 14:15
A proposito di phoronix, è stata annunciata la beta di Phoronix Test Suite 2.4, che introduce un primo supporto a windows.
Con l'uscita dei nuovi Clarkdale Intel non ha mandato nessun processore da testare a phoronix, cosa che invece aveva fatto con i Lynnfield quando gli aveva fornito un i5 750 ed un i7 870 (di cui abbiamo visto i test).
Quindi si procurerà a sue spese un i3 530 ed entro un paio di settimane saranno pubblicati i test cpu e gpu.
Devo dire che non è la prima volta che questo sito viene ignorato all'uscita di nuove componenti hw importanti come appunto le cpu, pur essendo praticamente l'unico sito che si occupa di hw per linux. Se non ricordo male è successa la stessa cosa con i primi Nehalem: avevano ricevuto una scheda X58 dalla Asrock, ma nessun i7 9xx da Intel, per cui ne hanno dovuto acquistare uno (un 920).
Si infatti. Sul sito viene addirittura riportato tra le news che hanno ordinato un core i3. Pensavo di trovare già l'articolo, ma evidentemente il processore non è ancora arrivato. Comunque attendiamo con ansia quest'altra recensione.
Ho idea che la phoronix test suite per windows sarà un punto di frattura interessante che metterà definitivamente in luce (o in ombra) le ottimizzazioni selettive del compilatore intel.
maumau138
16-01-2010, 15:23
L'ideale sarebbe prendere l'eventuale eseguibile compilatore con ICC e taroccarlo in modo da fargli riconoscere qualunque processore come Intel :)
Non so se è possibile farlo, ma IMHO avrebbe più senso prendere il sorgente e compilarlo con due compilatori diversi (Intel e Open Source), vedere quindi le variazioni sia su macchine AMD sia su macchine Intel.
Magari lo si potrebbe fare prendendo qualche software OpenSource per l'encoding o per la compressione file.
blackshard
16-01-2010, 15:36
Non so se è possibile farlo, ma IMHO avrebbe più senso prendere il sorgente e compilarlo con due compilatori diversi (Intel e Open Source), vedere quindi le variazioni sia su macchine AMD sia su macchine Intel.
Magari lo si potrebbe fare prendendo qualche software OpenSource per l'encoding o per la compressione file.
A fare si può fare. Dipende solo quanto è complicato farlo :)
Di sicuro è più semplice rompere il check del CPU Dispatcher: invece di fargli cercare la stringa GenuineIntel, gli si fa' cercare la stringa GenuaneIntel e magicamente il check dovrebbe saltare, facendo eseguire anche ai processori Intel il path riservato agli altri. Non è escluso che, se mi gira, ci studio un po' e ci faccio una utility per questa cosa...
maumau138
16-01-2010, 15:55
A fare si può fare. Dipende solo quanto è complicato farlo :)
Di sicuro è più semplice rompere il check del CPU Dispatcher: invece di fargli cercare la stringa GenuineIntel, gli si fa' cercare la stringa GenuaneIntel e magicamente il check dovrebbe saltare, facendo eseguire anche ai processori Intel il path riservato agli altri. Non è escluso che, se mi gira, ci studio un po' e ci faccio una utility per questa cosa...
Se è semplice come dici (mi fido ciecamente) allora forse è meglio la tua idea; ma se puoi rompere il check, non è che puoi anche falsare il risultato? Ovvero fare in modo che riceva sempre la risposta Genuine Intel?
Se è semplice come dici (mi fido ciecamente) allora forse è meglio la tua idea; ma se puoi rompere il check, non è che puoi anche falsare il risultato? Ovvero fare in modo che riceva sempre la risposta Genuine Intel?
Si può fare tutto. Ci vuole solo un software che ricostruisce il checksum dei file eseguibili. Con il formato PE non si può semplicemente sostituire GenuineIntel con AuthenticAMD... Con i file .com si poteva fare...
blackshard
16-01-2010, 20:06
Si può fare tutto. Ci vuole solo un software che ricostruisce il checksum dei file eseguibili. Con il formato PE non si può semplicemente sostituire GenuineIntel con AuthenticAMD... Con i file .com si poteva fare...
C'è un checksum per i PE? In passato ho patchato diversi eseguibili Win32, però non mi sono mai posto il problema del checksum, infatti poi funzionavano...
blackshard
16-01-2010, 20:08
Se è semplice come dici (mi fido ciecamente) allora forse è meglio la tua idea; ma se puoi rompere il check, non è che puoi anche falsare il risultato? Ovvero fare in modo che riceva sempre la risposta Genuine Intel?
Si, diciamo che è più difficile però, perchè devi andare a cercare dove sta il salto condizionato e invertirlo. Mentre così basta cambiare la stringa di confronto (che di solito è facilmente rilevabile) e in quel modo il confronto sarà sempre falso.
TheDarkAngel
17-01-2010, 09:44
mi ero perso il 3d ufficiale sul compilatore intel :eek:
prima di sperare in un benchmark imparziale c'è da sperare che le sw inizino a ottimizzare per tutti i processori, credo poco non sappiano del comportamento del compilatore intel :(
C'è un checksum per i PE? In passato ho patchato diversi eseguibili Win32, però non mi sono mai posto il problema del checksum, infatti poi funzionavano...
Ero convinto che ci fosse... :stordita:
Se non fosse così, basterebbe anche l'Hex editor di Virtualdub, per patchare tutti gli eseguibili e DLL di un software e provare... Io non posso perchè ho INTEL...
netcrusher
17-01-2010, 20:40
bello questo topic complimenti, seguo con grandissimo interesse!!
bello questo topic complimenti, seguo con grandissimo interesse!!
già ottimo!
***
avevo letto in giro (tipo su the inquirer) questa notizia ma poi... non ho più sentito nulla... :/
Meno male che qualcuno ne parla ancora! attendo sviluppi, 3d added!
Ma avete fatto richiesta per mettere il thread in rilievo?
Ma anche l'accelerazione... :O
E la massa... :O (e Carrara... :O )
Ma come si riconoscono subito gli ingegneri:asd:
Comunque la notizia è gravissima, anche se purtroppo cose simili si verificano in tutti i campi.
blackshard
19-01-2010, 13:34
Ma avete fatto richiesta per mettere il thread in rilievo?
No, ancora no.
Non ho capito a chi devo chiedere :(
No, ancora no.
Non ho capito a chi devo chiedere :(
In teoria dovresti chiedere a uno dei mod di sezione quindi a Gianni1879
No, ancora no.
Non ho capito a chi devo chiedere :(
Basta chiedere ad un mod di sezione
gianni1879
20-01-2010, 07:05
In teoria dovresti chiedere a uno dei mod di sezione quindi a Gianni1879
fatto
blackshard
20-01-2010, 12:43
Grazie :)
Negative_creep
20-01-2010, 13:34
Nella news viene affermato che Intel non ha fornito alla testata un processore i3/i5 al lancio, come invece aveva fatto nell'altra occasione con il processore i7, per cui la testata Phoronix ha dovuto necessariamente ordinare ed acquistare un processore per conto proprio per poter condurre dei test. A breve dovrebbero essere forniti dei benchmark che descrivono le performance dei processori i3 in ambito Linux con un compilatore neutro.
che gran figli di......:muro:
Non vedo l'ora di vedere i risultati....Grazie per questo thread Blackshard!!! Lo stò linkando e diffondendo a quante più persone posso! ;)
dart maul
21-01-2010, 13:49
Ho trovato 2-3 programmi che dovrebbero cambiare il "nome" alla cpu
Cambiando il nome della cpu con il nome originale di una intel funzionerebbe???si dovrebbe cambiare il CPUID
CPUID AMD : http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/25481.pdf
Discussione sulla mod CPUID:http://forums.amd.com/devforum/messageview.cfm?catid=203&threadid=95754 (inglese)
dart maul
21-01-2010, 14:07
Chameleon dovrebbe risolvere il problema
http://img709.imageshack.us/i/chameleon1.png/
&
http://img709.imageshack.us/i/chameleon2.png/
matt92tau
21-01-2010, 15:47
Chameleon dovrebbe risolvere il problema
http://img709.imageshack.us/i/chameleon1.png/
&
http://img709.imageshack.us/i/chameleon2.png/
Dove si trova questa funzione chameleon?
roccia1234
21-01-2010, 16:09
Chameleon dovrebbe risolvere il problema
http://img709.imageshack.us/i/chameleon1.png/
&
http://img709.imageshack.us/i/chameleon2.png/
Dove si trova questa funzione chameleon?
ehm, veramente nel post successivo il tizio che ha linkato le due immagini afferma che sono immagini rielaborate da lui, in cui si è inventato la feature del cambio di cpuid, chiamandola chameleon. Nulla di questo esiste per il momento (purtroppo) :(
dart maul
21-01-2010, 16:25
comunque ci sono altri programmi che fanno ciò
matt92tau
21-01-2010, 16:39
comunque ci sono altri programmi che fanno ciò
Quali?
dart maul
21-01-2010, 16:42
per ora ho trovato:una guida per la modifica in codice binario e un programma solo che adesso che vedo meglio non credo che cambia le info avanzate(produttore,genuine intel)ne avevo visto un altro ma lo perso nella cronologia:doh:
se lo ritrovo lo posto
matt92tau
21-01-2010, 16:52
per ora ho trovato:una guida per la modifica in codice binario e un programma solo che adesso che vedo meglio non credo che cambia le info avanzate(produttore,genuine intel)ne avevo visto un altro ma lo perso nella cronologia:doh:
se lo ritrovo lo posto
ok, posta posta
dart maul
21-01-2010, 16:55
girando per i siti ho visto che molti link riguardanti la mod della cpu
sono legati alle hack di macintosh
visto che macintosh supporta solo intel,se sono riusciti a installarlo su amd credo che abbiano usato qualche tool loro per settare le info per farlo riconoscere come intel
le mod hacintosh sono ovviamente illegali .sara dura trovare qualche soluzione legale.
comunque se loro ci sono riusciti si può fare :D
dart maul
21-01-2010, 16:57
ho trovato una discussione la posto http://www.insanelymac.com/forum/lofiversion/index.php/t67917-0.html
dart maul
21-01-2010, 17:00
questo non so cosa sia (programma o guida)
lo posto http://hackage.haskell.org/packages/archive/cpuid/0.2/doc/html/System-Cpuid.html
matt92tau
21-01-2010, 17:14
Ho trovato questo che sembra interessante http://forum.pcstats.com/showthread.php?t=30446
dart maul
21-01-2010, 17:19
Ho trovato questo che sembra interessante http://forum.pcstats.com/showthread.php?t=30446
modifica solo il nome = non ti riconosce la cpu come genuineintel
Negative_creep
22-01-2010, 10:04
Edit...
Sul blog di Agner sono riportate alcune interessanti discussioni sulla legalità dell CPU dispatcher presente nel compiler ICC. Interessante sopratutto il commento che fa Agner Fog sulla presentazione di Intel su come lavora il disptacher del loro compiler:
Author: Agner Fog Date: 2010-01-22 04:04
Intel have just published an article on how the CPU dispatching works in the Intel Performance Primitives (IPP) function library, see software.intel.com/en-us/articles/intel-integrated-performance-primitives-intel-ipp-understanding-cpu-optimized-code-used-in-intel-ipp/
The article indicates a fair handling of non-Intel processors in the IPP library. This is in accordance with my test results.
What the article doesn't mention is the unfair CPU dispatching in several other Intel function libraries :-)
http://www.agner.org/optimize/blog/read.php?i=49
blackshard
30-01-2010, 14:06
Phoronix ha fornito la recensione con il processore i3 530 a 2.93 ghz.
http://www.phoronix.com/scan.php?page=article&item=intel_corei3_530&num=1
Nella recensione viene usato come paragone il phenom II x3 710 a 2.6 ghz e il core 2 duo e8600 a 3 ghz.
Trovo che la recensione sia in parte inconsistente, anche perchè sono stati testati i processori intel fino ai loro limiti in overclock, mentre il phenom è stato testato sempre a clock di default.
In ogni caso la recensione è comunque imho di difficile lettura, perchè non viene specificato quali test sono in singolo thread e quali in multithread, quindi non è ben chiaro quando è il clock a valere e quando è il numero di thread. Perciò non è chiaro quale è l'intervento di Hyperthreading e come tre core fisici del phenom possano contrastare 4 core logici del core i3.
Ho chiesto nel forum queste informazioni, ma non ho avuto alcuna risposta. :(
mafferri
30-01-2010, 20:52
Seguo anch'io
in questi giorni tral'altro facendo dei bench (Athlon X2 vs Athlon II X2) ad un certo punto con PCMark 2005 mi trovo valori strani, in particolare a parità di frequenza di testing (2.7 Ghz) i valori del K8 risultano bassissimi, tipo la metà del K10
stessa cosa con il benchmark sui browser sempre della FutureMark, il Peacekeeper
poi cercando di forzare le ram a CL3 anche overvoltandole di brutto, il sistema non parte obbligandomi ad un ClearCMOS
questa volta il processore parte da bios a 216x12.5 (2700mhz) mentre prima l'avevo impostato a 215x5 e poi da Windows alzavo il moltiplicatore a 12.5
i valori di PCMark e Peacekeeper si impennano dando l'idea adesso di essere veramente attendibili, perlomeno in paragone all'Athlon II
con gli altri bench, es. Cinebech R10, Nuclearus Multicore, Powerflasher, Encoding video x264 e Xvid nessuna variazione
è evidente quindi che i bench della Futuremark si fanno influenzare da altri fattori, e bisogna stare attenti a considerarli attendibili
l'avevo notato anche io questo quando all'epoca aumentavo il bus del 945 tramite software che quei benchmark non variavano di una virgola ,e non variavano neanche se diminuivo il bus O.o
Però nello stesso periodo ho visto che alcuni giochi giravano + velocemente, esempio gioco di moto ero in vantaggio , anche se mi ero scontrato un fottio di volte, però visto che anche il mio tempo girava + velocemente di quello degli altri , in classifica ero in fondo
oppure con farcry sempre online, correvamo verso la bandiera e io avevo il turbo XD infatti mi accusavano di chettare
matt92tau
31-01-2010, 17:00
Phoronix ha fornito la recensione con il processore i3 530 a 2.93 ghz.
http://www.phoronix.com/scan.php?page=article&item=intel_corei3_530&num=1
Nella recensione viene usato come paragone il phenom II x3 710 a 2.6 ghz e il core 2 duo e8600 a 3 ghz.
Trovo che la recensione sia in parte inconsistente, anche perchè sono stati testati i processori intel fino ai loro limiti in overclock, mentre il phenom è stato testato sempre a clock di default.
In ogni caso la recensione è comunque imho di difficile lettura, perchè non viene specificato quali test sono in singolo thread e quali in multithread, quindi non è ben chiaro quando è il clock a valere e quando è il numero di thread. Perciò non è chiaro quale è l'intervento di Hyperthreading e come tre core fisici del phenom possano contrastare 4 core logici del core i3.
Ho chiesto nel forum queste informazioni, ma non ho avuto alcuna risposta. :(
Quoto
sui processori VIA nano e' possibile cambiare il cpuID.. guardate un po' che cosa succede:
http://arstechnica.com/hardware/reviews/2008/07/atom-nano-review.ars/6
http://media.arstechnica.com/reviews/hardware/atom-nano-review.media/PCM2K5-2.jpg
lol, a voi le considerazioni.. :oink:
Life bringer
02-02-2010, 13:09
Ieri ho ordinato il x2 555 dovrei averlo per il fine settimana, rinnovo la mia disponibilità per quanto riguarda il fare i test con la live di phoronix, x2 555 vs e8500.
Molto interessante quello che leggo su questo forum amd
http://forums.amd.com/devforum/messageview.cfm?catid=203&threadid=95754
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=137269
A quanto sembra forse amd farà in modo che sulle sue prossime cpu sia possibile manipolare il codice della cpu.....
Life bringer
05-02-2010, 03:20
Mi è arrivato il phenom x2 555.
Qualche giorno fa è stata rilasciata la nuova versione del phoronix test suite, purtroppo la live è ancora ferma alla 2.0 che non prevede alcun test per la cpu, quindi devo rimandare i test fino a quando non verrà rilasciata.
B|4KWH|T3
05-02-2010, 23:54
Molto interessante quello che leggo su questo forum amd
http://forums.amd.com/devforum/messageview.cfm?catid=203&threadid=95754
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=137269
A quanto sembra forse amd farà in modo che sulle sue prossime cpu sia possibile manipolare il codice della cpu.....
No, era una proposta di un utente di quel forum!
La cosa interessante comunque è che con l'accordo fra AMD ed Intel le prossime versioni del compilatore/delle librerie non dovrebbe trattare più diversamente i due processori
Negative_creep
08-02-2010, 10:53
No, era una proposta di un utente di quel forum!
La cosa interessante comunque è che con l'accordo fra AMD ed Intel le prossime versioni del compilatore/delle librerie non dovrebbe trattare più diversamente i due processori
Se è veramente così ne vedremo delle belle...visto che i nuovi esacore con sigla T hanno tecnologia AMD simile al Turbo Boost di Intel.
Vero che [forse] le prossime versioni del compilatore intel non dovrebbero essere più "razziste" ma i risultati si vederanno solo negli anni....:rolleyes:
Sarebbe stato molto più immediato cambiare stringa alla cpu e via.... i famosi "ingegneri" di intel in quel caso avrebbero dovuto attaccarsi solamente.
Thunderx
08-02-2010, 12:40
sui processori VIA nano e' possibile cambiare il cpuID.. guardate un po' che cosa succede:
http://arstechnica.com/hardware/reviews/2008/07/atom-nano-review.ars/6
http://media.arstechnica.com/reviews/hardware/atom-nano-review.media/PCM2K5-2.jpg
lol, a voi le considerazioni.. :oink:
ma cacchio le prestazioni sono state segate del 33%:muro: :muro:
Life bringer
09-02-2010, 08:15
Mi son già stufato di attendere, stamattina ho aperto un topic sul forum di phoronix chiedendo se è possibile avere una versione aggiornata della pts live, vediamo un po'... son curioso di condurre i test...
blackshard
09-02-2010, 16:10
Mi son già stufato di attendere, stamattina ho aperto un topic sul forum di phoronix chiedendo se è possibile avere una versione aggiornata della pts live, vediamo un po'... son curioso di condurre i test...
Anche io, e infatti la sto aspettando con la stessa smania.
Comunque mi hanno segnalato un interessante programma per il calcolo dei decimali del pi-greco (Y-Cruncher) che sfrutta le SSE3 sia con Intel che con AMD, e difatti i risultati premiano le architetture AMD.
sui processori VIA nano e' possibile cambiare il cpuID.. guardate un po' che cosa succede:
-img-
lol, a voi le considerazioni.. :oink:
impressionante lo screen... :eek: :eek:
scusate ma aldilà del correggere, prima o poi, questo "problema" :D , si sa già se gli avvocati di VIA e AMD si stanno muovendo?
EDIT: ho visto ora in 1a pag:
"La Federal Trade Commision (vedi: primo link in alto) ha comunque definito il compilatore Intel come "difettoso" ed ha obbligato la correzione del comportamento succitato al fine di garantire un comportamento più equo:"
ma mi resta il dubbio, nel senso che è difficile che l'avvantaggiare sistematicamente le cpu Intel sia accaduto per errore... non dovrebbe essere difficilissimo dimostrare il dolo in questa fattispecie e quindi il configurarsi e l'imputabilità di un reato di violazione delle norme sulla concorrenza, o no??? chiedo scusa se la domanda è sciocca... :/
blackshard
09-02-2010, 17:20
impressionante lo screen... :eek: :eek:
scusate ma aldilà del correggere, prima o poi, questo "problema" :D , si sa già se gli avvocati di VIA e AMD si stanno muovendo?
EDIT: ho visto ora in 1a pag:
"La Federal Trade Commision (vedi: primo link in alto) ha comunque definito il compilatore Intel come "difettoso" ed ha obbligato la correzione del comportamento succitato al fine di garantire un comportamento più equo:"
ma mi resta il dubbio, nel senso che è difficile che l'avvantaggiare sistematicamente le cpu Intel sia accaduto per errore... non dovrebbe essere difficilissimo dimostrare il dolo in questa fattispecie e quindi il configurarsi e l'imputabilità di un reato di violazione delle norme sulla concorrenza, o no??? chiedo scusa se la domanda è sciocca... :/
La domanda non è sciocca.
Agner Fox (il professore di cui ho linkato il blog in prima pagina) ha scambiato delle mail con i tecnici Intel ed ha avuto come risposta il fatto che loro ottimizzano "per processore" e non per set di istruzioni. Questa cosa, secondo lui, tenderebbe a dare meno responsabilità ad Intel, anche se come si è visto l'FTC comunque ha decretato che il compilatore va' sistemato. E in ogni caso è stupido non utilizzare i flag appositi per le SSE e invece basarsi sul riconoscimento del processore.
Life bringer
09-02-2010, 18:09
Anche io, e infatti la sto aspettando con la stessa smania.
Comunque mi hanno segnalato un interessante programma per il calcolo dei decimali del pi-greco (Y-Cruncher) che sfrutta le SSE3 sia con Intel che con AMD, e difatti i risultati premiano le architetture AMD.
Mi hanno risposto che dovrebbe uscire prima di fine mese, speriamo bene...
Se mi dici il nome del programma mi attrezzo anche io per provarlo, sempre che funzioni sotto windows... sotto linux sarebbe più difficoltoso.
:dissident:
09-02-2010, 18:22
Boh io ho guardato alcuni dei test di Phoronix (in particolare questo (http://www.phoronix.com/scan.php?page=article&item=intel_lynnfield&num=10) ) e mi sembra che abbiano risultati troppo sballati per essere veritieri delle reali performance. In test simili (ray casting) si hanno classifiche completamente stravolte con un software piuttosto che l'altro. In alcuni casi l'i5 supera gli i7, addirittura.
blackshard
09-02-2010, 18:45
Boh io ho guardato alcuni dei test di Phoronix (in particolare questo (http://www.phoronix.com/scan.php?page=article&item=intel_lynnfield&num=10) ) e mi sembra che abbiano risultati troppo sballati per essere veritieri delle reali performance. In test simili (ray casting) si hanno classifiche completamente stravolte con un software piuttosto che l'altro. In alcuni casi l'i5 supera gli i7, addirittura.
Anche a me sembrano a volte veramente sballati, specialmente quando confrontano diverse distribuzioni linux. Sto aspettando che esca la live apposta per verificare di persona quanto siano attendibili i benchmark.
blackshard
09-02-2010, 18:50
Mi hanno risposto che dovrebbe uscire prima di fine mese, speriamo bene...
Se mi dici il nome del programma mi attrezzo anche io per provarlo, sempre che funzioni sotto windows... sotto linux sarebbe più difficoltoso.
Si chiama Y-Cruncher, l'avevo scritto :D
Comunque sul forum di notebookreview qualcuno ha fatto dei test con i nuovi Athlon II per portatili e i risultati su questo test fpu-bound sono molto incoraggianti per i processori AMD.
...
Agner Fox (il professore di cui ho linkato il blog in prima pagina) ha scambiato delle mail con i tecnici Intel ed ha avuto come risposta il fatto che loro ottimizzano "per processore" e non per set di istruzioni. Questa cosa, secondo lui, tenderebbe a dare meno responsabilità ad Intel...
E' qui che mi sfugge il passaggio logico... :D
ottimizzare per processore equivale ad ottimizzare per produttore >> e quindi nel processo c'è una discriminazione degli altri produttori.
La candida ammissione d'aver scartato la strada dell'ottimizzazione per set di istruzioni poi mi sembra benzina sul fuoco :mc: :sofico: ma sicuramente l'avranno motivata...
cmq vado a leggere meglio tnx :)
La domanda non è sciocca.
Agner Fox (il professore di cui ho linkato il blog in prima pagina) ha scambiato delle mail con i tecnici Intel ed ha avuto come risposta il fatto che loro ottimizzano "per processore" e non per set di istruzioni. Questa cosa, secondo lui, tenderebbe a dare meno responsabilità ad Intel, anche se come si è visto l'FTC comunque ha decretato che il compilatore va' sistemato. E in ogni caso è stupido non utilizzare i flag appositi per le SSE e invece basarsi sul riconoscimento del processore.
Ciao
c'è da capire anche il fatto che in ogni release di ICC gli ingegneri di intel si prendano la briga di mantenere un un dual path per i flag con cui si setta il compiler, che certamente richiede risorse invece che mantenere un unica path per set di istruzioni supportate e flag.
C'è da pensare vero?
...e quindi nel processo c'è una discriminazione degli altri produttori... (scusate se mi quoto)
Solo se poi non si fa un lavoro di ottimizzazione di livello camparabile per gli altri produttori, beninteso!
ma se basta "ingannare" i programmi (es, PcMark) circa il processore che stanno utilizzando per avere tutto un altro genere di risultati (+47% il Nano... anche se in una sola suite di test) per i programmatori del compilatore non c'è nemmeno la scusante di poter dire d'aver fatto un lavoro con i piedi per le altre cpu... in un senso o nell'altro (mancata ottimizzazione, o castrazione) è proprio fatto apposta diamine! :banned: :D
Life bringer
10-02-2010, 07:22
Ecco qui, ho eseguito il test con il programma indicato dal buon blackshard, in breve i risultati da me ottenuti credo non siano in linea con i suoi...
Macchina intel:
Cpu: C2D E8500 @ default (3.160 mhz)
MB: Asus P5Q-E
Ram: 4gb a 800mhz (native 1066)
Macchina amd:
Cpu: Phenom 2 x2 555 C3 (3.200 mhz)
MB: AsRock AOD790GX-128M
Ram: 8gb a 800mhz
Informazioni sparse: il test è stato condotto su windows 7 home premium a 64bit e in ambo i computer c'è il sistema di risparmio dell'energia (quindi speed step & cnq) attivi.
Istruzioni supportate (secondo il programma)
cpu Intel:
x64, 64-bit OS, MMX, SSE, SSE2, SSE3, SSE4.1
Version: x64 SSE4.1 ~ Nagisa
cpu Amd:
x64, 64-bit OS, MMX, SSE, SSE2, SSE3, SSE4a
Version: x64 SSE3 ~ Kasumi
Risultato single-threaded (hotkey 0-0-4)
Intel
Summing Series: 17,628,420 terms
Time: 461.947 seconds ( 0.128 hours )
InvSqrt...
Time: 16.118 seconds ( 0.004 hours )
Final Multiply...
Time: 9.793 seconds ( 0.003 hours )
Pi: 487.865 seconds ( 0.136 hours )
Constructing Base Conversion Table:
Time: 23.538 seconds ( 0.007 hours )
Base Converting (Primary Cutting Parameters):
Time: 116.615 seconds ( 0.032 hours )
Total Computation Time: 628.071 seconds ( 0.174 hours )
Total Time (including writing digits): 634.113 seconds ( 0.176 hours )
CPU Utilization: 99.8293 %
Multi-core Efficiency: 49.9147 %
Version: 0.4.4 Build 7762b (fix 2) (x64 SSE4.1 - Windows ~ Nagisa)
Processor(s): Intel(R) Core(TM)2 Duo CPU E8500 @ 3.16GHz
CPU Frequency: 3,172,597,855 Hz (frequency may be inaccurate)
Thread(s): 1
Digits: 250,000,000
Total Time: 628.071 seconds
Checksum: f2f98e1714f710001192b2ac31d0301c
Amd
Summing Series: 17,628,420 terms
Time: 500.580 seconds ( 0.139 hours )
InvSqrt...
Time: 16.941 seconds ( 0.005 hours )
Final Multiply...
Time: 10.513 seconds ( 0.003 hours )
Pi: 528.039 seconds ( 0.147 hours )
Constructing Base Conversion Table:
Time: 23.789 seconds ( 0.007 hours )
Base Converting (Primary Cutting Parameters):
Time: 124.609 seconds ( 0.035 hours )
Total Computation Time: 676.479 seconds ( 0.188 hours )
Total Time (including writing digits): 684.359 seconds ( 0.190 hours )
CPU Utilization: 99.8944 %
Multi-core Efficiency: 49.9472 %
Version: 0.4.4 Build 7762b (fix 2) (x64 SSE3 - Windows ~ Kasumi)
Processor(s): AMD Phenom(tm) II X2 555 Processor
CPU Frequency: 3,193,122,607 Hz (frequency may be inaccurate)
Thread(s): 1
Digits: 250,000,000
Total Time: 676.479 seconds
Checksum: 43c8a9c6d855145a1002e4f71d7048df
Risultato multi-threaded (hotkey 0-1-4)
Intel
Summing Series: 17,628,420 terms
Time: 241.596 seconds ( 0.067 hours )
InvSqrt...
Time: 8.988 seconds ( 0.002 hours )
Final Multiply...
Time: 5.381 seconds ( 0.001 hours )
Pi: 255.971 seconds ( 0.071 hours )
Constructing Base Conversion Table:
Time: 12.822 seconds ( 0.004 hours )
Base Converting (Primary Cutting Parameters):
Time: 61.977 seconds ( 0.017 hours )
Total Computation Time: 330.824 seconds ( 0.092 hours )
Total Time (including writing digits): 336.598 seconds ( 0.093 hours )
CPU Utilization: 196.52 %
Multi-core Efficiency: 98.2598 %
Version: 0.4.4 Build 7762b (fix 2) (x64 SSE4.1 - Windows ~ Nagisa)
Processor(s): Intel(R) Core(TM)2 Duo CPU E8500 @ 3.16GHz
CPU Frequency: 3,172,566,064 Hz (frequency may be inaccurate)
Thread(s): 2
Digits: 250,000,000
Total Time: 330.824 seconds
Checksum: b122d055435b445d17ba8a2a1fbf3804
Amd
Summing Series: 17,628,420 terms
Time: 256.140 seconds ( 0.071 hours )
InvSqrt...
Time: 9.045 seconds ( 0.003 hours )
Final Multiply...
Time: 5.365 seconds ( 0.001 hours )
Pi: 270.555 seconds ( 0.075 hours )
Constructing Base Conversion Table:
Time: 12.717 seconds ( 0.004 hours )
Base Converting (Primary Cutting Parameters):
Time: 64.698 seconds ( 0.018 hours )
Total Computation Time: 348.012 seconds ( 0.097 hours )
Total Time (including writing digits): 355.848 seconds ( 0.099 hours )
CPU Utilization: 195.99 %
Multi-core Efficiency: 97.9948 %
Version: 0.4.4 Build 7762b (fix 2) (x64 SSE3 - Windows ~ Kasumi)
Processor(s): AMD Phenom(tm) II X2 555 Processor
CPU Frequency: 3,193,135,407 Hz (frequency may be inaccurate)
Thread(s): 2
Digits: 250,000,000
Total Time: 348.012 seconds
Checksum: 64831f42424379a10be84b3cd31463b6
Insulti, commenti, proposte indecenti:
Personalmente, mi aspettavo una situazione di vantaggio per quanto riguarda la cpu amd, calcolando che con le ram a 1066 (per intel) il vantaggio era più ampio, c'è da dire però che ritengo l'architettura intel migliore per questo genere di calcoli, in virtù della cache di secondo livello più grande. La differenza di tempi per quanto riguarda il test su singolo core è di 50,246 secondi a vantaggio della cpu blu, passando al test multi, il vantaggio si riduce in modo più che proporzionale, ovverso cala a "soli" 20 secondi circa (qualcosa meno) per quanto riguarda questo test direi proprio che... intel inside amd outsider :asd:
Integrazione:
Facendo girare l'eseguibile con sse3 sulla macchina intel i tempi in single threaded sono questi:
Total Computation Time: 635.409 seconds ( 0.177 hours )
Total Time (including writing digits): 641.309 seconds ( 0.178 hours )
Ma io ho sempre letto che il test Pi è considerato una va***ta...
Come dici tu tra l'altro è molto dipendente dalla cache e dalla ram.
Life bringer
10-02-2010, 08:46
Purtroppo in attesa del pts i programmi a disposizione non sono molti...
Ma su intel hai usato le sse4.1 mentre su amd le sse3...:mbe:
Prova a fare i test con sse3 per entrambi
Life bringer
10-02-2010, 11:15
Ma su intel hai usato le sse4.1 mentre su amd le sse3...:mbe:
Prova a fare i test con sse3 per entrambi
:asd:
Chissà perchè mi aspettavo questa uscita (che sembra un po' un'entrata siamo sinceri), ho ripetuto il test anche con le sse3, l'ho integrato proprio un paio di ore fa ;)
non si possono fare confronti a prescindere dal costo delle cpu (imho). siccome le architetture sono molto diverse bisognerebbe quantomeno avere l'onestà intellettuale di dire questa va meglio su questi test ma costa il doppio..
Ecco qui, ho eseguito il test con il programma indicato dal buon blackshard, in breve i risultati da me ottenuti credo non siano in linea con i suoi...
Macchina intel:
Cpu: C2D E8500 @ default (3.160 mhz)
MB: Asus P5Q-E
Ram: 4gb a 800mhz (native 1066)
Macchina amd:
Cpu: Phenom 2 x2 555 C3 (3.200 mhz)
MB: AsRock AOD790GX-128M
Ram: 8gb a 800mhz
Informazioni sparse: il test è stato condotto su windows 7 home premium a 64bit e in ambo i computer c'è il sistema di risparmio dell'energia (quindi speed step & cnq) attivi.
Istruzioni supportate (secondo il programma)
cpu Intel:
x64, 64-bit OS, MMX, SSE, SSE2, SSE3, SSE4.1
Version: x64 SSE4.1 ~ Nagisa
cpu Amd:
x64, 64-bit OS, MMX, SSE, SSE2, SSE3, SSE4a
Version: x64 SSE3 ~ Kasumi
Risultato single-threaded (hotkey 0-0-4)
Intel
Summing Series: 17,628,420 terms
Time: 461.947 seconds ( 0.128 hours )
InvSqrt...
Time: 16.118 seconds ( 0.004 hours )
Final Multiply...
Time: 9.793 seconds ( 0.003 hours )
Pi: 487.865 seconds ( 0.136 hours )
Constructing Base Conversion Table:
Time: 23.538 seconds ( 0.007 hours )
Base Converting (Primary Cutting Parameters):
Time: 116.615 seconds ( 0.032 hours )
Total Computation Time: 628.071 seconds ( 0.174 hours )
Total Time (including writing digits): 634.113 seconds ( 0.176 hours )
CPU Utilization: 99.8293 %
Multi-core Efficiency: 49.9147 %
Version: 0.4.4 Build 7762b (fix 2) (x64 SSE4.1 - Windows ~ Nagisa)
Processor(s): Intel(R) Core(TM)2 Duo CPU E8500 @ 3.16GHz
CPU Frequency: 3,172,597,855 Hz (frequency may be inaccurate)
Thread(s): 1
Digits: 250,000,000
Total Time: 628.071 seconds
Checksum: f2f98e1714f710001192b2ac31d0301c
Amd
Summing Series: 17,628,420 terms
Time: 500.580 seconds ( 0.139 hours )
InvSqrt...
Time: 16.941 seconds ( 0.005 hours )
Final Multiply...
Time: 10.513 seconds ( 0.003 hours )
Pi: 528.039 seconds ( 0.147 hours )
Constructing Base Conversion Table:
Time: 23.789 seconds ( 0.007 hours )
Base Converting (Primary Cutting Parameters):
Time: 124.609 seconds ( 0.035 hours )
Total Computation Time: 676.479 seconds ( 0.188 hours )
Total Time (including writing digits): 684.359 seconds ( 0.190 hours )
CPU Utilization: 99.8944 %
Multi-core Efficiency: 49.9472 %
Version: 0.4.4 Build 7762b (fix 2) (x64 SSE3 - Windows ~ Kasumi)
Processor(s): AMD Phenom(tm) II X2 555 Processor
CPU Frequency: 3,193,122,607 Hz (frequency may be inaccurate)
Thread(s): 1
Digits: 250,000,000
Total Time: 676.479 seconds
Checksum: 43c8a9c6d855145a1002e4f71d7048df
Risultato multi-threaded (hotkey 0-1-4)
Intel
Summing Series: 17,628,420 terms
Time: 241.596 seconds ( 0.067 hours )
InvSqrt...
Time: 8.988 seconds ( 0.002 hours )
Final Multiply...
Time: 5.381 seconds ( 0.001 hours )
Pi: 255.971 seconds ( 0.071 hours )
Constructing Base Conversion Table:
Time: 12.822 seconds ( 0.004 hours )
Base Converting (Primary Cutting Parameters):
Time: 61.977 seconds ( 0.017 hours )
Total Computation Time: 330.824 seconds ( 0.092 hours )
Total Time (including writing digits): 336.598 seconds ( 0.093 hours )
CPU Utilization: 196.52 %
Multi-core Efficiency: 98.2598 %
Version: 0.4.4 Build 7762b (fix 2) (x64 SSE4.1 - Windows ~ Nagisa)
Processor(s): Intel(R) Core(TM)2 Duo CPU E8500 @ 3.16GHz
CPU Frequency: 3,172,566,064 Hz (frequency may be inaccurate)
Thread(s): 2
Digits: 250,000,000
Total Time: 330.824 seconds
Checksum: b122d055435b445d17ba8a2a1fbf3804
Amd
Summing Series: 17,628,420 terms
Time: 256.140 seconds ( 0.071 hours )
InvSqrt...
Time: 9.045 seconds ( 0.003 hours )
Final Multiply...
Time: 5.365 seconds ( 0.001 hours )
Pi: 270.555 seconds ( 0.075 hours )
Constructing Base Conversion Table:
Time: 12.717 seconds ( 0.004 hours )
Base Converting (Primary Cutting Parameters):
Time: 64.698 seconds ( 0.018 hours )
Total Computation Time: 348.012 seconds ( 0.097 hours )
Total Time (including writing digits): 355.848 seconds ( 0.099 hours )
CPU Utilization: 195.99 %
Multi-core Efficiency: 97.9948 %
Version: 0.4.4 Build 7762b (fix 2) (x64 SSE3 - Windows ~ Kasumi)
Processor(s): AMD Phenom(tm) II X2 555 Processor
CPU Frequency: 3,193,135,407 Hz (frequency may be inaccurate)
Thread(s): 2
Digits: 250,000,000
Total Time: 348.012 seconds
Checksum: 64831f42424379a10be84b3cd31463b6
Insulti, commenti, proposte indecenti:
Personalmente, mi aspettavo una situazione di vantaggio per quanto riguarda la cpu amd, calcolando che con le ram a 1066 (per intel) il vantaggio era più ampio, c'è da dire però che ritengo l'architettura intel migliore per questo genere di calcoli, in virtù della cache di secondo livello più grande. La differenza di tempi per quanto riguarda il test su singolo core è di 50,246 secondi a vantaggio della cpu blu, passando al test multi, il vantaggio si riduce in modo più che proporzionale, ovverso cala a "soli" 20 secondi circa (qualcosa meno) per quanto riguarda questo test direi proprio che... intel inside amd outsider :asd:
Integrazione:
Facendo girare l'eseguibile con sse3 sulla macchina intel i tempi in single threaded sono questi:
Total Computation Time: 635.409 seconds ( 0.177 hours )
Total Time (including writing digits): 641.309 seconds ( 0.178 hours )
Ciao
Molto interessante questo test.
Potresti postare il test con ram ad 800mhz ed timing eguali per ambedue le piattaforme? In questo modo si potrebbe capire quanto incida la ram nella computazione del Pi.
Grazie.
Edit:
Siccome nella macchina amd hai anche 8gb di ram prova a rimuovere 2 banchi, in modo da avere 4 gb per ognuna ed a settare l'MHC su ganged.
:asd:
Chissà perchè mi aspettavo questa uscita (che sembra un po' un'entrata siamo sinceri), ho ripetuto il test anche con le sse3, l'ho integrato proprio un paio di ore fa ;)
bravo :asd: :asd: :asd:
adesso metti le ram alla stessa frequenza ed integra
Life bringer
10-02-2010, 12:48
bravo :asd: :asd: :asd:
adesso metti le ram alla stessa frequenza ed integra
Veramente ho scritto che erano entrambe a 800 ;)
Macchina intel:
Cpu: C2D E8500 @ default (3.160 mhz)
MB: Asus P5Q-E
Ram: 4gb a 800mhz (native 1066)
Macchina amd:
Cpu: Phenom 2 x2 555 C3 (3.200 mhz)
MB: AsRock AOD790GX-128M
Ram: 8gb a 800mhz
:)
Non pensavo di essere capitato in un topic di fanboy amd :\
Veramente ho scritto che erano entrambe a 800 ;)
Macchina intel:
Cpu: C2D E8500 @ default (3.160 mhz)
MB: Asus P5Q-E
Ram: 4gb a 800mhz (native 1066)
Macchina amd:
Cpu: Phenom 2 x2 555 C3 (3.200 mhz)
MB: AsRock AOD790GX-128M
Ram: 8gb a 800mhz
:)
Non pensavo di essere capitato in un topic di fanboy amd :\
Ciao
Scusami
Letto male io.
Comunque Windows vista 32bit:
Single threaded. Ram 800mhz 5-5-5-15-20
y-cruncher v0.4.4 Build 7762b (fix 2)
Detecting Hardware...
x64 = Yes
64-bit OS = No
MMX = Yes
SSE = Yes
SSE2 = Yes
SSE3 = Yes
SSSE3 = No
SSE4a = Yes
SSE4.1 = No
SSE4.2 = No
AVX = No
FMA = No
Version: x86 SSE3
A 32-bit OS has been detected on an x64 SSE3 capable processor.
To achieve maximum performance, you must run a 64-bit OS.
Defaulting to fastest supported x86 binary...
Premere un tasto per continuare . . .
Launching y-cruncher...
================================================================
y-cruncher v0.4.4 Build 7762b (fix 2) ( www.numberworld.org )
Copyright 2008-2009 Alexander J. Yee ( a-yee@northwestern.edu )
Distribute Freely - Please Report any Bugs
Version: x86 SSE3 - Windows
0 Benchmark Pi
1 Batch Benchmark Pi (run multiple benchmarks)
2 Stress Test (beta)
3 Custom Compute a Constant
- Compute other constants (e, Golden Ratio, etc...)
- Choose your own settings
4 Digit Viewer (view digits from .txt and .ycd files)
5 Compare Digits (compare digits from different runs)
6 Advanced Options
7 About
8 A Word of Warning...
Enter your choice:
option: 0
Benchmark Pi:
Select a Benchmark Type:
0 Single-Threaded
1 Multi-Threaded
option: 0
Select a Benchmark Size:
Option Decimal Digits Approx. Memory Needed
1 25,000,000 130 MB
2 50,000,000 260 MB
3 100,000,000 456 MB
4 250,000,000 1.19 GB
0 I prefer SuperPi sizes... (1M, 2M, 4M...)
option: 4
Constant : Pi
Algorithm: Chudnovsky Formula
Decimal Digits : 250,000,000
Hexadecimal Digits: Disabled
Threads: 1
Mode : Ram Only
Start Time: Wed Feb 10 13:42:24 2010
Allocating and Reserving Memory... 1.19 GB
Constructing FFT lookup tables...
Begin Computation:
Summing Series: 17,628,420 terms
Time: 764.643 seconds ( 0.212 hours )
InvSqrt...
Time: 27.274 seconds ( 0.008 hours )
Final Multiply...
Time: 16.500 seconds ( 0.005 hours )
Pi: 808.430 seconds ( 0.225 hours )
Constructing Base Conversion Table:
Time: 38.856 seconds ( 0.011 hours )
Base Converting (Primary Cutting Parameters):
Time: 200.878 seconds ( 0.056 hours )
Writing Decimal Digits: 250,000,001 digits written
End Time: Wed Feb 10 13:59:59 2010
Total Computation Time: 1048.222 seconds ( 0.291 hours )
Total Time (including writing digits): 1054.269 seconds ( 0.293 hours )
CPU Utilization: 99.8835 %
Multi-core Efficiency: 24.9709 %
Last Digits:
3673748634 2742427296 0219667627 3141599893 4569474921 : 249,999,950
9958866734 1705167068 8515785208 0067520395 3452027780 : 250,000,000
Benchmark Successful. The digits appear to be OK.
Version: 0.4.4 Build 7762b (fix 2) (x86 SSE3 - Windows)
Processor(s): AMD Phenom(tm) II X4 810 Processor
CPU Frequency: 3,120,190,891 Hz (frequency may be inaccurate)
Thread(s): 1
Digits: 250,000,000
Total Time: 1048.22 seconds
Checksum: a87ce2f2b08a70990b8894239093e6b8
Premere un tasto per continuare . . .
Life bringer
10-02-2010, 13:23
Fra quelli proposti il prossimo test che farò sarà con la modalità ganged invece che unganged, quando ho fatto la prova della banda passante notai che quella modalità permetteva valori superiori in lettura ma inferiori in scrittura, per quanto riguarda il togliere 2 banchi di ram mi sembra sinceramente ininfluente, comunque stamane ho anche mandato un pm a bjt2 chiedendogli di passare quando avesse tempo per dare il suo parere, che per quanto mi riguarda considero autorevole e sempre interessante, se dirà che in effetti 4 banchi invece di 2 possono influenzare il test in modo sensibile farò anche quella prova.
blackshard
10-02-2010, 13:27
Ma io ho sempre letto che il test Pi è considerato una va***ta...
Come dici tu tra l'altro è molto dipendente dalla cache e dalla ram.
Super-Pi è un test sintetico molto favorevole ad Intel, oltre ad essere single-threaded, ergo non si può considerarlo come indicativo delle prestazioni di una macchina/processore.
Veramente ho scritto che erano entrambe a 800 ;)
Macchina intel:
Cpu: C2D E8500 @ default (3.160 mhz)
MB: Asus P5Q-E
Ram: 4gb a 800mhz (native 1066)
Macchina amd:
Cpu: Phenom 2 x2 555 C3 (3.200 mhz)
MB: AsRock AOD790GX-128M
Ram: 8gb a 800mhz
:)
Non pensavo di essere capitato in un topic di fanboy amd :\
Sai come è, ultimamente i fanboy intel non sono simpatici a nessuno :asd: :asd:
Fra quelli proposti il prossimo test che farò sarà con la modalità ganged invece che unganged, quando ho fatto la prova della banda passante notai che quella modalità permetteva valori superiori in lettura ma inferiori in scrittura, per quanto riguarda il togliere 2 banchi di ram mi sembra sinceramente ininfluente, comunque stamane ho anche mandato un pm a bjt2 chiedendogli di passare quando avesse tempo per dare il suo parere, che per quanto mi riguarda considero autorevole e sempre interessante, se dirà che in effetti 4 banchi invece di 2 possono influenzare il test in modo sensibile farò anche quella prova.
4 banchi su un sistema AMD potrebbero dare un leggero vantaggio...
Per quanto riguarda i risultati del test: mi aspettavo che il core 2 fosse leggermente più veloce a parità di clock... Ma i Phenom esistono (a stock) a frequenze più elevate... E poi sarebbe interessante fare un confronto con le DDR3 (che dovrebbero favorire AMD che ha il controller integrato)...
blackshard
10-02-2010, 13:47
Ecco qui, ho eseguito il test con il programma indicato dal buon blackshard, in breve i risultati da me ottenuti credo non siano in linea con i suoi...
[...cut...]
Integrazione:
Facendo girare l'eseguibile con sse3 sulla macchina intel i tempi in single threaded sono questi:
Total Computation Time: 635.409 seconds ( 0.177 hours )
Total Time (including writing digits): 641.309 seconds ( 0.178 hours )
Molto molto interessante, grazie per i test.
Dunque, i test che sono stati fatti sul forum di notebookreview riguardavano un Turion II X2 M520 (cache L2 da 512kb per core, no cache L3, frequenza 2.3 Ghz) e un Intel Core2 Duo T6600 (cache L2 da 2 Mb, no cache L3, frequenza 2.2 Ghz).
Grossomodo c'era una equivalenza fra i risultati dei due processori, con un leggero vantaggio per gli AMD per via del clock. Per Intel stiamo comunque parlando di una CPU con 2 Mb di cache L2, e non avendo il memory controller integrato questo è abbastanza penalizzante. Comunque il test era stato fatto su 25 milioni di decimali.
Ovviamente ci sono delle piccole differenze dovute alla configurazione specifica del computer, però grossomodo la computazione veniva completata in circa 35 secondi, similmente ad un P8400 che ha una frequenza di 2.26 Ghz ma cache L2 da 3 Mb, quindi più o meno siamo lì con i risultati del test che hai postato tu.
Direi che, dal punto di vista delle unità esecutive, del controller della memoria e della cache abbiamo un quasi completo pareggio fra Core 2 e i Phenom II, almeno per ciò che riguardano le prestazioni sintetiche.
E' interessante notare che nel multicore abbiamo una differenza di prestazioni (a parità di clock sostanzialmente) del 5% a favore del top di gamma Intel.
Se si osservano molti benchmark sintetici commerciali i risultati sono molto diversi e solitamente i processori AMD compaiono da poco a molto indietro rispetto ai corrispettivi Intel, e questo non è chiaro da cosa derivi, o meglio, lo si può ben immaginare!
blackshard
10-02-2010, 13:52
Fra quelli proposti il prossimo test che farò sarà con la modalità ganged invece che unganged, quando ho fatto la prova della banda passante notai che quella modalità permetteva valori superiori in lettura ma inferiori in scrittura, per quanto riguarda il togliere 2 banchi di ram mi sembra sinceramente ininfluente, comunque stamane ho anche mandato un pm a bjt2 chiedendogli di passare quando avesse tempo per dare il suo parere, che per quanto mi riguarda considero autorevole e sempre interessante, se dirà che in effetti 4 banchi invece di 2 possono influenzare il test in modo sensibile farò anche quella prova.
La modalità ganged nella pratica gestisce il doppio controller della memoria come se fosse un'unico controller con un bus da 128 bit, mentre la modalità unganged lo usa come appunto un doppio controller a 64 bit.
Nel caso di workload di tipo streamed (tipo questo test sintetico) credo che la modalità ganged sia più efficace di quella unganged. Non resta che provare! ;)
capitan_crasy
10-02-2010, 14:00
Posto i miei risultati tanto per avere dei dati:
Test single Core opzione 4
http://www.pctunerup.com/up/results/_201002/th_20100210145739_Test_single_core_720_3300_01.jpg (http://www.pctunerup.com/up/image.php?src=_201002/20100210145739_Test_single_core_720_3300_01.jpg)
Test Multi core opzione 4
http://www.pctunerup.com/up/results/_201002/th_20100210145819_Test_multi_core_720_3300_01.jpg (http://www.pctunerup.com/up/image.php?src=_201002/20100210145819_Test_multi_core_720_3300_01.jpg)
La cosa strana però è che nel test in single core il programma non utilizzava il 100% di un solo core ma una media del 50%/25%/25% per i tre core...
http://www.pctunerup.com/up/results/_201002/th_20100210145957_Test_single_core_720_3300_02.jpg (http://www.pctunerup.com/up/image.php?src=_201002/20100210145957_Test_single_core_720_3300_02.jpg)
Questa volta in multithread:
y-cruncher v0.4.4 Build 7762b (fix 2)
Detecting Hardware...
x64 = Yes
64-bit OS = No
MMX = Yes
SSE = Yes
SSE2 = Yes
SSE3 = Yes
SSSE3 = No
SSE4a = Yes
SSE4.1 = No
SSE4.2 = No
AVX = No
FMA = No
Version: x86 SSE3
A 32-bit OS has been detected on an x64 SSE3 capable processor.
To achieve maximum performance, you must run a 64-bit OS.
Defaulting to fastest supported x86 binary...
Premere un tasto per continuare . . .
Launching y-cruncher...
================================================================
y-cruncher v0.4.4 Build 7762b (fix 2) ( www.numberworld.org )
Copyright 2008-2009 Alexander J. Yee ( a-yee@northwestern.edu )
Distribute Freely - Please Report any Bugs
Version: x86 SSE3 - Windows
0 Benchmark Pi
1 Batch Benchmark Pi (run multiple benchmarks)
2 Stress Test (beta)
3 Custom Compute a Constant
- Compute other constants (e, Golden Ratio, etc...)
- Choose your own settings
4 Digit Viewer (view digits from .txt and .ycd files)
5 Compare Digits (compare digits from different runs)
6 Advanced Options
7 About
8 A Word of Warning...
Enter your choice:
option: 0
Benchmark Pi:
Select a Benchmark Type:
0 Single-Threaded
1 Multi-Threaded
option: 1
Select a Benchmark Size:
Option Decimal Digits Approx. Memory Needed
1 25,000,000 139 MB
2 50,000,000 262 MB
3 100,000,000 458 MB
4 250,000,000 1.20 GB
0 I prefer SuperPi sizes... (1M, 2M, 4M...)
option: 4
Constant : Pi
Algorithm: Chudnovsky Formula
Decimal Digits : 250,000,000
Hexadecimal Digits: Disabled
Threads: 4
Mode : Ram Only
Start Time: Wed Feb 10 14:04:46 2010
Allocating and Reserving Memory... 1.20 GB
Constructing FFT lookup tables...
Begin Computation:
Summing Series: 17,628,420 terms
Time: 193.981 seconds ( 0.054 hours )
InvSqrt...
Time: 7.856 seconds ( 0.002 hours )
Final Multiply...
Time: 4.269 seconds ( 0.001 hours )
Pi: 206.113 seconds ( 0.057 hours )
Constructing Base Conversion Table:
Time: 11.067 seconds ( 0.003 hours )
Base Converting (Primary Cutting Parameters):
Time: 50.880 seconds ( 0.014 hours )
Writing Decimal Digits: 250,000,001 digits written
End Time: Wed Feb 10 14:09:20 2010
Total Computation Time: 268.105 seconds ( 0.074 hours )
Total Time (including writing digits): 274.021 seconds ( 0.076 hours )
CPU Utilization: 383.1 %
Multi-core Efficiency: 95.7749 %
Last Digits:
3673748634 2742427296 0219667627 3141599893 4569474921 : 249,999,950
9958866734 1705167068 8515785208 0067520395 3452027780 : 250,000,000
Benchmark Successful. The digits appear to be OK.
Version: 0.4.4 Build 7762b (fix 2) (x86 SSE3 - Windows)
Processor(s): AMD Phenom(tm) II X4 810 Processor
CPU Frequency: 3,120,194,056 Hz (frequency may be inaccurate)
Thread(s): 4
Digits: 250,000,000
Total Time: 268.105 seconds
Checksum: 51d7d38531e2507112e6390dbfee2c01
Premere un tasto per continuare . . .
La modalità ganged nella pratica gestisce il doppio controller della memoria come se fosse un'unico controller con un bus da 128 bit, mentre la modalità unganged lo usa come appunto un doppio controller a 64 bit.
Nel caso di workload di tipo streamed (tipo questo test sintetico) credo che la modalità ganged sia più efficace di quella unganged. Non resta che provare! ;)
Ciao
Infatti, avevo proposto pure io di effettuare il test in ganged.
Aggiungiamoci il fatto che comunque le differenze potrebbero essere minime in quanto i k10 integrano a livello del MHC un prefetcher specifico che salva i dati in un buffer all'interno del MHC, quindi mitigando di molto penalità dall'utilizzo di un singolo controller di mem in accessi di memoria asincroni, ad ex core 1 che legge core 2 che scrive
Life bringer
10-02-2010, 14:54
Eccomi, vado un po' di fretta perchè devo uscire, settaggi identici a quelli di stamane (ho solo cambiato la voce da unganged a ganged nel bios):
Single:
Total Computation Time: 678.477 seconds ( 0.188 hours )
Total Time (including writing digits): 686.335 seconds ( 0.191 hours )
Multi:
Total Computation Time: 348.605 seconds ( 0.097 hours )
Total Time (including writing digits): 356.461 seconds ( 0.099 hours )
Sembra migliore la modalità unganged. Anche se parliamo di pochi secondi.
La perplessità nasce dal fatto che in multi il divario fra amd e intel sembra assottigliarsi, mentre in teoria dovrebbe essere opposto il comportamento.
Comunque si tratta sempre di un bench sintetico, imho la prova del fuoco sarà il pts, che, per inciso, mi aspetto veda amd in testa...
Edit: confermo il comportamento sottolineato dal capitano, in single tende a usare i core al 50% (dual core), invece che 1 core al 100% ho riscontrato questa cosa sia con intel che con amd.
blackshard
10-02-2010, 15:08
Eccomi, vado un po' di fretta perchè devo uscire, settaggi identici a quelli di stamane (ho solo cambiato la voce da unganged a ganged nel bios):
Single:
Total Computation Time: 678.477 seconds ( 0.188 hours )
Total Time (including writing digits): 686.335 seconds ( 0.191 hours )
Multi:
Total Computation Time: 348.605 seconds ( 0.097 hours )
Total Time (including writing digits): 356.461 seconds ( 0.099 hours )
Sembra migliore la modalità unganged. Anche se parliamo di pochi secondi.
La perplessità nasce dal fatto che in multi il divario fra amd e intel sembra assottigliarsi, mentre in teoria dovrebbe essere opposto il comportamento.
Comunque si tratta sempre di un bench sintetico, imho la prova del fuoco sarà il pts, che, per inciso, mi aspetto veda amd in testa...
Edit: confermo il comportamento sottolineato dal capitano, in single tende a usare i core al 50% (dual core), invece che 1 core al 100% ho riscontrato questa cosa sia con intel che con amd.
Ok grazie per la riprova.
Comunque quel comportamento è banale ed è così da tempo immemore con Windows.
Quel comportamento è la causa del famigerato bug del c&q dei Phenom I che, sottolineo, non è affatto un bug! I Phenom I (e anche i Turion ZM/RM e QL, piattaforma Puma) hanno la possibilità di cambiare frequenza operativa per singolo core, invece che tutti assieme come nei Phenom II e i Core 2. Questo causa problemi allo scheduler di windows che invece è pensato per funzionare su sistemi multiprocessore dove tutti i processori hanno la stessa frequenza operativa. Quindi lo scheduler passa i thread da un core all'altro in continuazione al fine di bilanciare il carico. Sui phenom I questo giochetto causa fino ad un 25% di prestazioni in meno.
Al contrario, lo scheduler di Linux lavora molto meglio da questo punto di vista.
edit: ho anche alcuni dubbi sul turbo mode dei processori i7/i5. Il comportamento dello scheduler è appurato, come sia possibile che il turbo mode funzioni correttamente è probabilmente dovuto al fatto che Windows 7 ha introdotto il "core parking": se non è necessario che un core sia attivo, lo si può parcheggiare e non utilizzarlo per alcun thread. Questa feature a quanto pare è attiva solo con i5 e i7, mentre gioverebbe in modo notevole anche sui processori Phenom I e Phenom II, visto che anche i Phenom II possono variare la frequenza operativa per core (la famosa modalità unganged di k10stat, che non ha nulla a che fare con i memory controller) ma espongono via ACPI solo l'interfaccia per variare la frequenza per tutti i core contemporaneamente. Inoltre schedulare sempre sullo stesso core un thread ha il vantaggio di migliorare l'hit rate della cache, e uno scheduler come quello di windows privilegia processori con grandi e veloci cache L2 condivise come i Core 2 a discapito delle piccole cache L2 separate dei Phenom.
Life bringer
10-02-2010, 15:47
Si avevo intuito che ci fosse lo zampino di winzoz, che dire a maggior ragione io attendo questa dannata pts live... ormai controllo ogni giorno se si degnano di buttarla fuori... :D
Il mio scarsissimo sempron 2800+ con su win xp sp3 x32
http://img3.imageshack.us/img3/8213/2800c.th.jpg (http://img3.imageshack.us/i/2800c.jpg/)
Ok grazie per la riprova.
Cut
edit: ho anche alcuni dubbi sul turbo mode dei processori i7/i5. Il comportamento dello scheduler è appurato, come sia possibile che il turbo mode funzioni correttamente è probabilmente dovuto al fatto che Windows 7 ha introdotto il "core parking": se non è necessario che un core sia attivo, lo si può parcheggiare e non utilizzarlo per alcun thread. Questa feature a quanto pare è attiva solo con i5 e i7, mentre gioverebbe in modo notevole anche sui processori Phenom I e Phenom II, visto che anche i Phenom II possono variare la frequenza operativa per core (la famosa modalità unganged di k10stat, che non ha nulla a che fare con i memory controller) ma espongono via ACPI solo l'interfaccia per variare la frequenza per tutti i core contemporaneamente. Inoltre schedulare sempre sullo stesso core un thread ha il vantaggio di migliorare l'hit rate della cache, e uno scheduler come quello di windows privilegia processori con grandi e veloci cache L2 condivise come i Core 2 a discapito delle piccole cache L2 separate dei Phenom.
Ciao
Scusami mi sono perso, in che senso?
Casomai schedulare lo stesso thread sullo stesso core aumenta la branch hit rate, visto che cosi si riempono le History tables sia locali che globali con le informazioni di quel thread e dunque se il core ha sbagliato prima non sbaglia dopo in caso di branch, nell'instruction fetch visto che l'ha riportato nelle History tables.
Mi sono perso qualcosa?
blackshard
10-02-2010, 21:29
Ciao
Scusami mi sono perso, in che senso?
Casomai schedulare lo stesso thread sullo stesso core aumenta la branch hit rate, visto che cosi si riempono le History tables sia locali che globali con le informazioni di quel thread e dunque se il core ha sbagliato prima non sbaglia dopo in caso di branch, nell'instruction fetch visto che l'ha riportato nelle History tables.
Mi sono perso qualcosa?
Beh migliora anche l'hit ratio della cache perchè nel caso dei processori AMD con cache L1 e L2 separate per ciascun core, devi duplicare i dati per ogni core, lasciando quindi meno spazio per gli altri thread. Poi entra in gioco la L3 condivisa, però la L3 ha anche tempi di accesso molto più lunghi, e quindi poi aumenta la latenza.
Nei Core 2, che invece hanno una cache L2 grande e veloce, la penalità di passare lo stesso thread fra più core è molto meno marcata.
Comunque basta fare una prova: semplicemente lanciare un test single threaded confrontare i risultati ottenuti con affinità su tutti i core e affinità su un singolo core.
Beh migliora anche l'hit ratio della cache perchè nel caso dei processori AMD con cache L1 e L2 separate per ciascun core, devi duplicare i dati per ogni core, lasciando quindi meno spazio per gli altri thread. Poi entra in gioco la L3 condivisa, però la L3 ha anche tempi di accesso molto più lunghi, e quindi poi aumenta la latenza.
Nei Core 2, che invece hanno una cache L2 grande e veloce, la penalità di passare lo stesso thread fra più core è molto meno marcata.
Comunque basta fare una prova: semplicemente lanciare un test single threaded confrontare i risultati ottenuti con affinità su tutti i core e affinità su un singolo core.
Ciao
Hai ragione, non avevo pensato che la L2 nei k10 è esclusiva.
Strano però che in w7 i k10 non guadagnano nulla in ipc col core parking, magari è una feature che è abilitata solo con gli i7?
blackshard
10-02-2010, 23:25
Ciao
Hai ragione, non avevo pensato che la L2 nei k10 è esclusiva.
Strano però che in w7 i k10 non guadagnano nulla in ipc col core parking, magari è una feature che è abilitata solo con gli i7?
Beh in realtà non mi è ben chiaro il concetto di esclusività fra più core.
Mi spiego meglio: ai tempi degli athlon xp cache L1 e L2 erano esclusive, cioè quello che c'è nella L1 non c'è nella L2 e viceversa. Ok, perfetto.
Ora, con l'avvento del multicore, il concetto di esclusivo non ho ben capito se si estende anche fra core, nel senso che ad esempio una linea di cache L2 del core 0 non può stare contemporaneamente anche nella cache L2 del core 1.
Se così fosse, IMHO la caduta di prestazioni sarebbe notevole perchè questo genererebbe cache miss ogni volta che il thread verrebbe spostato da una parte all'altra, con conseguente traffico intercore per spostare le linee di cache interessate. Certo, in un'implementazione con la L3 inclusiva questo traffico sarebbe mitigato (ma nemmeno tanto, vista la latenza della L3), ma credo che in un Athlon II senza L3 ciò procurerebbe dei notevoli rallentamenti!
Quindi penso che i dati sono semplicemente replicati in entrambe le cache L1/L2 di ogni core e le cache L1 ed L2 fra di loro rimangono esclusive, mentre l'eventuale L3 è inclusiva e condivisa.
Per il core parking, dalle ricerche che ho fatto, mi risulta che viene attivato solo in presenza di hyperthreading (cioè di processori logici, sembra fatto apposta per Intel giusto quando Intel ha tirato fuori Nehalem).
Da quello che vedo qui:
http://blogs.technet.com/mattmcspirit/archive/2009/05/07/seeing-core-parking-in-action.aspx
non ce n'è traccia sul mio dual core (mai vista la scritta "Parked").
Beh in realtà non mi è ben chiaro il concetto di esclusività fra più core.
Mi spiego meglio: ai tempi degli athlon xp cache L1 e L2 erano esclusive, cioè quello che c'è nella L1 non c'è nella L2 e viceversa. Ok, perfetto.
Ora, con l'avvento del multicore, il concetto di esclusivo non ho ben capito se si estende anche fra core, nel senso che ad esempio una linea di cache L2 del core 0 non può stare contemporaneamente anche nella cache L2 del core 1.
Se così fosse, IMHO la caduta di prestazioni sarebbe notevole perchè questo genererebbe cache miss ogni volta che il thread verrebbe spostato da una parte all'altra, con conseguente traffico intercore per spostare le linee di cache interessate. Certo, in un'implementazione con la L3 inclusiva questo traffico sarebbe mitigato (ma nemmeno tanto, vista la latenza della L3), ma credo che in un Athlon II senza L3 ciò procurerebbe dei notevoli rallentamenti!
Quindi penso che i dati sono semplicemente replicati in entrambe le cache L1/L2 di ogni core e le cache L1 ed L2 fra di loro rimangono esclusive, mentre l'eventuale L3 è inclusiva e condivisa.
Per il core parking, dalle ricerche che ho fatto, mi risulta che viene attivato solo in presenza di hyperthreading (cioè di processori logici, sembra fatto apposta per Intel giusto quando Intel ha tirato fuori Nehalem).
Da quello che vedo qui:
http://blogs.technet.com/mattmcspirit/archive/2009/05/07/seeing-core-parking-in-action.aspx
non ce n'è traccia sul mio dual core (mai vista la scritta "Parked").
Ciao
Provo a chiarire questo concetto, non me ne volere se è nebuloso il mio modo di spiegare in quanto non sono espertissimo, mi occupo di "altri" tipi di tecnologie informative nella relatà.
Il concetto di esclusività è valido per il blocco L1-L2 di uno stesso core, questo è stato fatto in modo da avere una cache di dimensioni maggiori, dotata di una parte veloce L1 ed una lenta L2 contente il maggior numero di dati possibili in quanto tutte e due hanno informazioni diverse.
Questo non implica però che il blocco funzionale L1-L2 del core 0 abbia informazioni esclusivamente diverse del blocco funzionale L1-L2 del core 1!
Qualora il core 0 necessita di informazioni contentenute nel bocco funzionale L1-L2 del core 1 se lo va a cercare nella L3 che è inclusiva e shared, nel senso che contiene le informazioni delle L2 degli altri core che sono state "evicted" nella L3, ovvero le linee delle L2 vengono copiate nella L3.
Le cache dunque L1-L2 anche negli athlon II non sono inclusive ma esclusive. In questi core k10 per poter avere accesso a informazioni contenute nelle cache di altri core comporta una DMA del mem controller ed quindi un accesso alla mem di sistema. Il fatto che comunque negli athlon II le prestazioni non crollino in caso di traffico tra core, vista la mancaza di L3 è imputabile al fatto che nei k10.5 è presente un prefetcher nel mem controller, che mitiga le latenze di questo tipo di transazioni in quanto salva le informazioni in uno speciale buffer che viene copiato nella L1 del core richiedente.
A che serve la L3 dunque?
Nei programmi che lavorano molto con la memoria, serve a disambiguare le latenze di accesso random alla ram in quanto è molto probabile che le informazioni necessarie siano presenti in essa. In pratica la sua utilità è evitare il più possibile accessi non lineari, streamed, verso la ram.
Spero di aver fatto un discorso logico.
http://www.xbitlabs.com/articles/cpu/display/amd-k10_8.html#sect3
blackshard
11-02-2010, 22:58
Ciao
Provo a chiarire questo concetto, non me ne volere se è nebuloso il mio modo di spiegare in quanto non sono espertissimo, mi occupo di "altri" tipi di tecnologie informative nella relatà.
Il concetto di esclusività è valido per il blocco L1-L2 di uno stesso core, questo è stato fatto in modo da avere una cache di dimensioni maggiori, dotata di una parte veloce L1 ed una lenta L2 contente il maggior numero di dati possibili in quanto tutte e due hanno informazioni diverse.
Questo non implica però che il blocco funzionale L1-L2 del core 0 abbia informazioni esclusivamente diverse del blocco funzionale L1-L2 del core 1!
Qualora il core 0 necessita di informazioni contentenute nel bocco funzionale L1-L2 del core 1 se lo va a cercare nella L3 che è inclusiva e shared, nel senso che contiene le informazioni delle L2 degli altri core che sono state "evicted" nella L3, ovvero le linee delle L2 vengono copiate nella L3.
Le cache dunque L1-L2 anche negli athlon II non sono inclusive ma esclusive. In questi core k10 per poter avere accesso a informazioni contenute nelle cache di altri core comporta una DMA del mem controller ed quindi un accesso alla mem di sistema. Il fatto che comunque negli athlon II le prestazioni non crollino in caso di traffico tra core, vista la mancaza di L3 è imputabile al fatto che nei k10.5 è presente un prefetcher nel mem controller, che mitiga le latenze di questo tipo di transazioni in quanto salva le informazioni in uno speciale buffer che viene copiato nella L1 del core richiedente.
A che serve la L3 dunque?
Nei programmi che lavorano molto con la memoria, serve a disambiguare le latenze di accesso random alla ram in quanto è molto probabile che le informazioni necessarie siano presenti in essa. In pratica la sua utilità è evitare il più possibile accessi non lineari, streamed, verso la ram.
Spero di aver fatto un discorso logico.
http://www.xbitlabs.com/articles/cpu/display/amd-k10_8.html#sect3
Ok, grazie per la spiegazione. Era esattamente come immaginavo che fosse, a parte il discorso del prefetcher del memory controller di cui ignoravo beatamente l'esistenza :)
Life bringer
12-02-2010, 06:50
Una domanda, in quali condizioni conviene tenere il memory controller in modalità ganged?
Lo chiedo perchè sia con i test di qualche pagina fa, sia quando ho provato il benchmark di un gioco, con questa modalità le prestazioni sono leggermente inferiori.
Una domanda, in quali condizioni conviene tenere il memory controller in modalità ganged?
Lo chiedo perchè sia con i test di qualche pagina fa, sia quando ho provato il benchmark di un gioco, con questa modalità le prestazioni sono leggermente inferiori.
Ciao
Penso che ganged dia le performance migliori in caso di applicativi single threaded. Se il giochino in questione sfrutta anche solo due core le prestazioni migliori si avranno con unganged.
Poi nopn vorrei dire una cazzata, ma mi sa che oggi quasi tutti i driver di vga sono multithreaded in quanto separano il carico di lavoro della cpu su più thread.
blackshard
15-02-2010, 00:52
Ho aggiunto alcuni articoli/blog/post in prima pagina del 2005-2007 che quantificano le differenze prestazionali con alcuni software specifici intorno al 10-15%. La versione del compilatore utilizzata all'epoca era la 8 e la 9, mentre ora siamo alla 10.
Life bringer
15-02-2010, 09:40
Se non sbaglio, quando ho scaricato i compilatori intel, mi pare fosse la versione 11.
Certo sarebbe bello poterli fare in casa dei test, purtroppo io non ne ho le conoscenze ma metto a disposizione le 2 macchine. (in una c'è linux, quindi per compilare dovrebbe pure essere meglio)
DarKilleR
19-02-2010, 13:31
ragazzi se c'è bisogno, io non ho l'esperienza e competenza per compilarmi un programma e farci dei test, però se qualcuno di voi lo può fare io metto a disposizione il mio parco macchine, sono 5 pc..
AMD Athlon XP 2500+@3200+
AMD Athlon64 X2 5200+ AM2
Intel Core 2 Duo T9300 2500Mhz
Intel Core 2 Quad Q8200
Intel Core 2 Duo E8500
Life bringer
26-02-2010, 06:10
Buongiorno signori, ieri è uscita finalmente la live aggiornata, purtroppo non son tutte notizie positive, la suite di test per la cpu comprende anche 2 benchmark (2 giochi, rtcw e un altro di cui non ricordo il nome), in più, la live non funziona correttamente con 4gb di ram (sul pc amd con 8 tutto ok), volevo fornire i risultati oggi perch poi nel weekend ho la fidanzata in casa e se mi vede dietro al computer mi bastona, penso che non farò in tempo, però ho una soluzione. Invece fare il test di tutta la suite cpu, farò i test singoli (in un'unica sessione) defalcando tutti quelli che sono influenzati dalla scheda video. Onde evitare che qualche soggetto mi dia del fanboy intel (quando in realtà dovrebbero solo saper leggere, ma vabbeh) come l'ultima volta, i test li farò con ram a 800mhz su amd e 667 su intel, se poi i risultati saranno vergognosamente pro amd allora ripeterò i test a 800 (e magari 1066).
Buongiorno signori, ieri è uscita finalmente la live aggiornata, purtroppo non son tutte notizie positive, la suite di test per la cpu comprende anche 2 benchmark (2 giochi, rtcw e un altro di cui non ricordo il nome), in più, la live non funziona correttamente con 4gb di ram (sul pc amd con 8 tutto ok), volevo fornire i risultati oggi perch poi nel weekend ho la fidanzata in casa e se mi vede dietro al computer mi bastona, penso che non farò in tempo, però ho una soluzione. Invece fare il test di tutta la suite cpu, farò i test singoli (in un'unica sessione) defalcando tutti quelli che sono influenzati dalla scheda video. Onde evitare che qualche soggetto mi dia del fanboy intel (quando in realtà dovrebbero solo saper leggere, ma vabbeh) come l'ultima volta, i test li farò con ram a 800mhz su amd e 667 su intel, se poi i risultati saranno vergognosamente pro amd allora ripeterò i test a 800 (e magari 1066).
Ciao
Buona notizia. Magari dopo che effettui i test, potresti tipo fare un post in cui si speiga come montare la live su winzoz?
Thunderx
26-02-2010, 09:56
Ciao
Penso che ganged dia le performance migliori in caso di applicativi single threaded. Se il giochino in questione sfrutta anche solo due core le prestazioni migliori si avranno con unganged.
Poi nopn vorrei dire una cazzata, ma mi sa che oggi quasi tutti i driver di vga sono multithreaded in quanto separano il carico di lavoro della cpu su più thread.
è esattamente così...inoltre nel caso dell'athlon II la mancanza della l3 si avverte poco anche per la presenza di un bus cpu- ram molto veloce!
non a caso le cpu core hanno cache molto abbondanti
Life bringer
26-02-2010, 10:39
Ciao
Buona notizia. Magari dopo che effettui i test, potresti tipo fare un post in cui si speiga come montare la live su winzoz?
Ciao, intanto inizio con il dire che sono in attesa dei test della macchina intel (aveva finito ma ho fatto un guaio dei miei, li ho mergiati con una macchina di riferimento -_-)
Sinceramente credo che la tua richiesta non sia fattibile, la pts live da quel che ho letto è un'ubuntu modificata e ottimizzata, il problema è che i benchmark proposti sono tutti da scaricare a parte! (questo comporta la saturazione della ram, almeno nella macchina da 4gb). Come dicevo penso sia impossibile far quello che chiedi e se fosse possibile sarebbe probabilmente poco sano, visto che facendola girare su una macchina virtuale i risultati potrebbero essere falsati. Non capisco nemmeno la motivazione di tale richiesta in quanto, essendo live, posso garantire che non tocca nulla sugli hd.
A più tardi con i risultati!
blackshard
26-02-2010, 11:12
In realtà era stato annunciato che la PTS avrebbe dovuto apparire in forma nativa anche per windows, ma dall'epoca dell'annuncio ancora non si è visto nulla.
Ciao, intanto inizio con il dire che sono in attesa dei test della macchina intel (aveva finito ma ho fatto un guaio dei miei, li ho mergiati con una macchina di riferimento -_-)
Sinceramente credo che la tua richiesta non sia fattibile, la pts live da quel che ho letto è un'ubuntu modificata e ottimizzata, il problema è che i benchmark proposti sono tutti da scaricare a parte! (questo comporta la saturazione della ram, almeno nella macchina da 4gb). Come dicevo penso sia impossibile far quello che chiedi e se fosse possibile sarebbe probabilmente poco sano, visto che facendola girare su una macchina virtuale i risultati potrebbero essere falsati. Non capisco nemmeno la motivazione di tale richiesta in quanto, essendo live, posso garantire che non tocca nulla sugli hd.
A più tardi con i risultati!
Ciao
Mi sono espresso male. Era stata annunciata una live per windows. Non intendo infatti far girare i bench su una macchina virtuale in quanto probabilmente macchine con meno di 2gb di ram annasperanno di sicuro. Aggiungo il fatto che le tecnologie di virtualizzazione amd ed intel sono diverse e quindi non direttamente comparabili.
In realtà era stato annunciato che la PTS avrebbe dovuto apparire in forma nativa anche per windows, ma dall'epoca dell'annuncio ancora non si è visto nulla.
Ciao
Grazie era proprio quello che intendevo.
Life bringer
26-02-2010, 13:07
Ciao
Mi sono espresso male. Era stata annunciata una live per windows. Non intendo infatti far girare i bench su una macchina virtuale in quanto probabilmente macchine con meno di 2gb di ram annasperanno di sicuro. Aggiungo il fatto che le tecnologie di virtualizzazione amd ed intel sono diverse e quindi non direttamente comparabili.
A quanto ne so i tempi per una versione di windows sono abbastanza lunghi, leggevo sul forum che si parlava di una versione 3 come perfettamente funzionante su windows.
Ecco i risultati:
Formato pdf: http://nemoitaly.gotdns.com/test.pdf
Non riesco a far visualizzare la versione html...
Purtroppo vado di fretta, a quanto pare amd ne esce bene, però aspetto il parere di qualcuno più esperto...
:dissident:
26-02-2010, 13:16
A quanto ne so i tempi per una versione di windows sono abbastanza lunghi, leggevo sul forum che si parlava di una versione 3 come perfettamente funzionante su windows.
Ecco i risultati:
Formato pdf: http://nemoitaly.gotdns.com/test.pdf
Non riesco a far visualizzare la versione html...
Purtroppo vado di fretta, a quanto pare amd ne esce bene, però aspetto il parere di qualcuno più esperto...
Scusa ma se per tua stessa ammissione sulla macchina Intel arrivavi a saturare la RAM, come possono essere in qualche modo significativi questi test? :confused:
Se la vista non mi inganna sulla macchina amd sono stati utilizzati addirittura 8gb di ram mentre l'e8500 ne ha la metà...
Non dovrebbe influire negativamente sui test della macchina intel?:confused:
blackshard
26-02-2010, 15:19
Scusa ma se per tua stessa ammissione sulla macchina Intel arrivavi a saturare la RAM, come possono essere in qualche modo significativi questi test? :confused:
A me ricordano molto da vicino i risultati che si ottengono comparando i vari amd/intel nelle altre recensioni di phoronix.
Non credo che la questione ram sia davvero un problema.
Il punto è che se si usa la live, ovviamente il problema sussiste perchè tutti i test che normalmente risiederebbero su disco vanno a finire su un ramdisk, e quindi ad occupare la ram e potenzialmente falsare i risultati.
Installando la PTS su hard disk (come credo sia stato fatto in tutte le recensioni, comprese quelle del pdf citato) il problema della quantità ram non credo sia discriminante, tant'è che viene usata anche per testare i netbook con 1/2 gb di ram.
:dissident:
27-02-2010, 01:06
A me ricordano molto da vicino i risultati che si ottengono comparando i vari amd/intel nelle altre recensioni di phoronix.
Non credo che la questione ram sia davvero un problema.
Pero' in questo stesso topic si era discusso di come anche gli stessi test di phoronix presentassero molte incongruenze dal punto di vista dei risultati, tanto che in alcuni test dello stesso tipo (ray casting) addirittura in alcuni casi l'i5 era davanti all'i7, in altri avveniva il contrario...Mi sembra un comportamento troppo poco lineare per poter essere significativo..
Pero' in questo stesso topic si era discusso di come anche gli stessi test di phoronix presentassero molte incongruenze dal punto di vista dei risultati, tanto che in alcuni test dello stesso tipo (ray casting) addirittura in alcuni casi l'i5 era davanti all'i7, in altri avveniva il contrario...Mi sembra un comportamento troppo poco lineare per poter essere significativo..
Ciao
Probabilmente hai ragione. In alcuni test l'i5 era davanti all'i7 e ciò non è molto lineare. Bisogna considerare però se nel test di ray tracing l'i7 avesse l'HT attivo e se il test non sfrutti la tecnologia di HT.
blackshard
27-02-2010, 11:23
C'era anche il fatto che i test di phoronix erano a frequenza fissa, senza il turbo mode.
Diciamo che più guardo i test di phoronix e più mi rendo conto che Michael Larabel non sa fare i test, perchè miscela tante di quelle variabili e non pone dei riferimenti fissi che i risultati dei benchmark sono veramente difficili da comprendere.
Per esempio, nell'ultimo test sugli i3 mette appunto un i3, un core 2 duo e un phenom x3 a confronto. Beh è curioso confrontare tre processori che hanno 2, 3, e 4 core (seppur logici). Chi legge (o almeno io) non capisce quando è l'architettura a dare un vantaggio, quando è il numero di core oppure quando è la frequenza operativa, quindi aldilà del singolo applicativo, non puoi capire quale è la reale validità di un processore nel confronto.
C'era anche il fatto che i test di phoronix erano a frequenza fissa, senza il turbo mode.
Diciamo che più guardo i test di phoronix e più mi rendo conto che Michael Larabel non sa fare i test, perchè miscela tante di quelle variabili e non pone dei riferimenti fissi che i risultati dei benchmark sono veramente difficili da comprendere.
Per esempio, nell'ultimo test sugli i3 mette appunto un i3, un core 2 duo e un phenom x3 a confronto. Beh è curioso confrontare tre processori che hanno 2, 3, e 4 core (seppur logici). Chi legge (o almeno io) non capisce quando è l'architettura a dare un vantaggio, quando è il numero di core oppure quando è la frequenza operativa, quindi aldilà del singolo applicativo, non puoi capire quale è la reale validità di un processore nel confronto.
Ciao
Questo è verissimo. Ma il problema secondo me è che questi test servano a dare una comparazione di differenti piattaforme più che a livello di differenza di cpu.
Vi sono test che reagiscono in maniera differente a seconda della frequenza del numero di core. L'unica sarebbe che si muovessero a rilasciare la live per winzoz e che ci mettiamo di santa pazienza ad esaminare bench per bench.
dav1deser
28-02-2010, 14:29
Io mi offro volontario per testare il mio E7300 su windows 7 (il resto della config è in firma).
Life bringer
01-03-2010, 12:20
Se la vista non mi inganna sulla macchina amd sono stati utilizzati addirittura 8gb di ram mentre l'e8500 ne ha la metà...
Non dovrebbe influire negativamente sui test della macchina intel?:confused:
:asd:
Scusa ma se per tua stessa ammissione sulla macchina Intel arrivavi a saturare la RAM, come possono essere in qualche modo significativi questi test? :confused:
Eh? dove avrei scritto una cosa del genere, forse prima di dire certe cose sarebbe meglio conoscere i retroscena. Visto che nel precedente test condotto, mi era stato chiesto d'impostare i medesimi timing per le ram sia su intel che su amd (poi vabbeh c'è stato un tizio che pensava le avessi testate a 1066, ma questi sono evidenti problemi di lettura...) ho pensato bene di fare i test a 667 per intel e 800 per amd, non ho problemi a integrare con una passata a 800 (o a 1066, sempre per intel).
Riflessione a parte: certo che questo topic è pieno di gente che si sente pronta a criticare e giudicare, un po' meno a proporre, vabbeh...
:asd:
Visto che sei in grado di rispondere con le faccine o di gridare al fanboy...
:ahahah: :asd:
Life bringer
02-03-2010, 06:38
Visto che sei in grado di rispondere con le faccine o di gridare al fanboy...
:ahahah: :asd:
Veramente sei tu che hai gridato al fanboy, sbagliando anche a leggere oltretutto, già questo definisce la tua credibilità :)
Rispondo alle domande come meritano, visto che tu sai solo scagliare il sasso senza portare alcun contenuto, direi che una faccina è già troppa, non la devi nemmeno leggere, così siamo sicuri che non sbagli :asd:
....
cut
Non pensavo di essere capitato in un topic di fanboy amd :\
Veramente sei tu che hai gridato al fanboy,
Certo
sbagliando anche a leggere oltretutto, già questo definisce la tua credibilità :)
Credibilità di che?:mbe:
Rispondo alle domande come meritano, visto che tu sai solo scagliare il sasso senza portare alcun contenuto, direi che una faccina è già troppa, non la devi nemmeno leggere, così siamo sicuri che non sbagli :asd:
Con scagliare il sasso intendi fare una domanda?:confused:
Allora ti "scaglio un altro sasso" ti rendi conto di cosa scrivi?
Credo di no....:rolleyes:
gianni1879
02-03-2010, 12:48
dateci un taglio a quella graziosa polemica, altrimenti il thread va chiuso
M'iscrivo al thread. :rolleyes:
digieffe
03-03-2010, 01:30
vorrei farvi una proposta: cercare la verità.
Il mio obiettivo e quello di capire come stanno sul serio i fatti. sono disposto a dedicare del tempo a questo obiettivo (sperando di averne a disposizione) naturalmente con il contributo di tutti.
E' da anni oramai che seguo phoronix ma non mi ha dato mai soddisfazione perché non mi piace la metodologia (non ho detto non è giusta).
Dovremmo iniziare a definire una metodologia altrimenti i volontari avranno le richieste più disparate e difficilmente saremo soddisfatti.
Sarà necessario decidere quali test scegliere in base a cosa sarà necessario capire.
Tutto ciò si potrebbe fare per discussione o in extremis per votazione.
Ciò scritto, mi chiedo: quando uscirà pts 3 per windows?
premetto che io non l' ho neanche guardata la pts però in base a quanto letto, se non mi richiede troppa difficoltà o tempo potrei cercare di integrare i test in un live dvd (se qualcuno mi aiuta è anche meglio).
concludo il papiro scrivendo che prima dobbiamo decidere cosa vogliamo capire e con quale metodologia, dopo si parte in modo organizzato (IMHO)...
es: vogliamo clock to clock a parità di memorie? ognuno con le proprie memorie? a parità di costo? solo dellla cpu o della soluzione? a parità di core o ....
Iniziamo a proporre cosa vogliamo capire, selezioniamo bene a cosa siamo interessati, individuiamo i test giusti e la relativa metodologia e via...
Ps: sono in grado di compilare un programma sotto linux è da un pò che non ne compilo sotto windows ma non sarà un problema. Il problema è solo il tempo se trovassi qualcun altro che se ne intende...
digieffe
03-03-2010, 12:30
mentre installavo pts gironzolavo sul sito ed ho trovato questo
http://global.phoronix-test-suite.com/
anche se ora non ho tempo di analizzarlo...
blackshard
03-03-2010, 14:00
Beh diciamo che il non-plus ultra sarebbe quello di sviluppare un tool che modifichi il dispatcher del compilatore intel per modificare gli eseguibili e far eseguire il codice ottimizzato sugli intel.
digieffe
04-03-2010, 15:02
Beh diciamo che il non-plus ultra sarebbe quello di sviluppare un tool che modifichi il dispatcher del compilatore intel per modificare gli eseguibili e far eseguire il codice ottimizzato sugli intel.
ok ammesso di fare tale modifica dopo quali bench si compilano?
blackshard
04-03-2010, 18:26
ok ammesso di fare tale modifica dopo quali bench si compilano?
Io parlo di modificare il compilato non il compilatore.
In prima pagina ho messo alcuni riferimenti e persone che hanno modificato gli eseguibili per far riconoscere al dispatcher un processore genuine intel anche se non lo era e i risultati hanno mostrato degli incrementi nelle prestazioni.
NEON_GENESIS
05-03-2010, 17:39
io ci sono ^^
suneatshours86
19-03-2010, 15:24
sui processori VIA nano e' possibile cambiare il cpuID.. guardate un po' che cosa succede:
http://arstechnica.com/hardware/reviews/2008/07/atom-nano-review.ars/6
http://media.arstechnica.com/reviews/hardware/atom-nano-review.media/PCM2K5-2.jpg
lol, a voi le considerazioni.. :oink:
santo iddio. veramente drammatica la situazione. è peggio di quanto pensassi :doh:
" Swap CentaurHauls for AuthenticAMD, and Nano's performance magically jumps about 10 percent. Swap for GenuineIntel, and memory performance goes up no less than 47.4 percent. This is not a test error or random occurrence; I benchmarked each CPUID multiple times across multiple reboots on completely clean Windows XP installations. The gains themselves are not confined to a small group of tests within the memory subsystem evaluation, but stretch across the entire series of read/write tests. Only the memory latency results remain unchanged between the two CPUIDs.
At the very least, this suggests some incredibly sloppy coding on Futuremark's part, as the company may be enabling or disabling CPU optimizations based on a processor's vendor name in CPUID instead of actually checking CPUID for SIMD support. In this case, PCMark 2005's memory subsystem test doesn't appear to be aware that Nano supports SSE2 and SSE3, and is instead running a decidedly less-optimized code path. There are two factors, however, that make this explanation a bit difficult to swallow.
First, there's the issue of timing. PCMark 2005 was released (obviously) in 2005, and was obviously coded with an eye towards supporting current and future processors. This is standard operating procedure for Futuremark, which always builds benchmarks designed to last for at least a year, and often two. VIA's C5N-T (Nehemiah) core may have only supported MMX and 3DNow!, but the C7 launched in 2005, and that processor supported SSE2 and SSE3 from day one. Even if proper extension support wasn't built into the first version of PCM2K5, we tested version 1.2.0, and that patch was released on or around 11-29-2006.
Second, there's the issue of performance when Nano is identified as AuthenticAMD
If performance between the AMD and Intel CPUIDs was identical, there wouldn't really be a story here, but it isn't, and that's curious. Futuremark could plausibly argue that VIA's C3/C7 processors weren't exactly on the radar back in 2004-2005, but AMD and K8 certainly were, and K8 launched with full SSE and SSE2 support, with SSE3 added in 2005.
None of this constitutes proof of wrongdoing, but it flies in the face of Futuremark's neutrality claims. Bad code is a fact of life, but companies that write benchmarks for a living and sell those benchmarks as evaluation tools have a responsibility to ensure that their software delivers the neutral framework that it promises. Based on the information I've gathered thus far, it seems Futuremark may have created three paths—one for Intel, one for AMD, and one generic "other" path. There's nothing wrong with optimized code paths, but our results would seem to indicate that some paths are decidedly more optimized than others. "
Viene quindi da domandarsi: perchè anche solo suite di test gratuiti debbano ottimizzare in modo non equo i codici amd, intel e via?
siamo tutti consapevoli del fatto che la risposta sta in un semplice simbolo....
$
matt92tau
20-03-2010, 17:10
santo iddio. veramente drammatica la situazione. è peggio di quanto pensassi :doh:
" Swap CentaurHauls for AuthenticAMD, and Nano's performance magically jumps about 10 percent. Swap for GenuineIntel, and memory performance goes up no less than 47.4 percent. This is not a test error or random occurrence; I benchmarked each CPUID multiple times across multiple reboots on completely clean Windows XP installations. The gains themselves are not confined to a small group of tests within the memory subsystem evaluation, but stretch across the entire series of read/write tests. Only the memory latency results remain unchanged between the two CPUIDs.
At the very least, this suggests some incredibly sloppy coding on Futuremark's part, as the company may be enabling or disabling CPU optimizations based on a processor's vendor name in CPUID instead of actually checking CPUID for SIMD support. In this case, PCMark 2005's memory subsystem test doesn't appear to be aware that Nano supports SSE2 and SSE3, and is instead running a decidedly less-optimized code path. There are two factors, however, that make this explanation a bit difficult to swallow.
First, there's the issue of timing. PCMark 2005 was released (obviously) in 2005, and was obviously coded with an eye towards supporting current and future processors. This is standard operating procedure for Futuremark, which always builds benchmarks designed to last for at least a year, and often two. VIA's C5N-T (Nehemiah) core may have only supported MMX and 3DNow!, but the C7 launched in 2005, and that processor supported SSE2 and SSE3 from day one. Even if proper extension support wasn't built into the first version of PCM2K5, we tested version 1.2.0, and that patch was released on or around 11-29-2006.
Second, there's the issue of performance when Nano is identified as AuthenticAMD
If performance between the AMD and Intel CPUIDs was identical, there wouldn't really be a story here, but it isn't, and that's curious. Futuremark could plausibly argue that VIA's C3/C7 processors weren't exactly on the radar back in 2004-2005, but AMD and K8 certainly were, and K8 launched with full SSE and SSE2 support, with SSE3 added in 2005.
None of this constitutes proof of wrongdoing, but it flies in the face of Futuremark's neutrality claims. Bad code is a fact of life, but companies that write benchmarks for a living and sell those benchmarks as evaluation tools have a responsibility to ensure that their software delivers the neutral framework that it promises. Based on the information I've gathered thus far, it seems Futuremark may have created three paths—one for Intel, one for AMD, and one generic "other" path. There's nothing wrong with optimized code paths, but our results would seem to indicate that some paths are decidedly more optimized than others. "
Viene quindi da domandarsi: perchè anche solo suite di test gratuiti debbano ottimizzare in modo non equo i codici amd, intel e via?
siamo tutti consapevoli del fatto che la risposta sta in un semplice simbolo....
$
Quoto
Alekos Panagulis
23-03-2010, 11:23
sui processori VIA nano e' possibile cambiare il cpuID.. guardate un po' che cosa succede:
http://arstechnica.com/hardware/reviews/2008/07/atom-nano-review.ars/6
http://media.arstechnica.com/reviews/hardware/atom-nano-review.media/PCM2K5-2.jpg
lol, a voi le considerazioni.. :oink:
Oh porca vacca :doh:
Questa sarebbe camorra!!
Alekos Panagulis
23-03-2010, 11:27
A quanto pare alcune CPU AMD permetterebbero di cambiare il CPUID. La guida qui: http://forum.pcstats.com/showthread.php?t=30446
Sarebbe bello se qualcuno con un AMD provasse a testare PCMARK prima con il procio con ID normale e poi modificato.
Volontari?
|Phoenix|
23-03-2010, 14:03
A quanto pare alcune CPU AMD permetterebbero di cambiare il CPUID. La guida qui: http://forum.pcstats.com/showthread.php?t=30446
Sarebbe bello se qualcuno con un AMD provasse a testare PCMARK prima con il procio con ID normale e poi modificato.
Volontari?
Ma cambierebbe solo il nome visualizzato, oppure i test leggerebbero l' id genuine intel attivando le ottimizzazioni ( o per meglio dire non entrano in funzione i rallentamenti se non sono intel) ? Qualche utente più esperto dovrebbe intervenire sull'argomento.
Secondo questo link che solleva il problema dei compilatori http://www.programmazione.it/index.php?entity=eitem&idItem=43608 "modifica del CPUID dei processori AMD usando le istruzioni di virtualizzazione della stessa AMD" si potrebbero rendere i test imparziali
blackshard
23-03-2010, 15:28
Ma cambierebbe solo il nome visualizzato, oppure i test leggerebbero l' id genuine intel attivando le ottimizzazioni ( o per meglio dire non entrano in funzione i rallentamenti se non sono intel) ? Qualche utente più esperto dovrebbe intervenire sull'argomento.
Secondo questo link che solleva il problema dei compilatori http://www.programmazione.it/index.php?entity=eitem&idItem=43608 "modifica del CPUID dei processori AMD usando le istruzioni di virtualizzazione della stessa AMD" si potrebbero rendere i test imparziali
Si ma solo sotto virtualizzazione.
Per quanto riguarda AMD, si può cambiare solo la stringa del nome del processore, difattti il "nome" al processore viene assegnato dal bios della scheda madre in fase di boot e lo si può cambiare in qualunque momento. Tuttavia l'identificativo AuthenticAMD non si può cambiare (mentre con i VIA si può cambiare) ne si possono cambiare le altre informazioni come famiglia, stepping, etc... ed è per questo che nel benchmark riportato sopra è stata usata una CPU VIA.
|Phoenix|
23-03-2010, 15:50
I have already did such an investigation and even more . For example:
1) ABBYY Fine Reader 8.0's ScanMan.exe contains the CPU dispatcher which blocks the SSE2 code path (and chooses x87) on CPU with Vendor = "AuthenticAMD" and Base Family = 0Fh, i.e. on K8 & K10!
2) Several DivX 6.x versions contain similar CPU dispatcher which blocks SSE's (and chooses MMX) on CPU with Vendor != "GenuineIntel".
What unfair play!
preso da http://forums.amd.com/devforum/messageview.cfm?catid=203&threadid=95754&STARTPAGE=1&FTVAR_FORUMVIEWTMP=Linear
blackshard
23-03-2010, 16:04
I have already did such an investigation and even more . For example:
1) ABBYY Fine Reader 8.0's ScanMan.exe contains the CPU dispatcher which blocks the SSE2 code path (and chooses x87) on CPU with Vendor = "AuthenticAMD" and Base Family = 0Fh, i.e. on K8 & K10!
2) Several DivX 6.x versions contain similar CPU dispatcher which blocks SSE's (and chooses MMX) on CPU with Vendor != "GenuineIntel".
What unfair play!
preso da http://forums.amd.com/devforum/messageview.cfm?catid=203&threadid=95754&STARTPAGE=1&FTVAR_FORUMVIEWTMP=Linear
Tutto molto bello, poi divx6 ce lo troviamo nei benchmark fra i7 e phenom... :stordita:
|Phoenix|
23-03-2010, 16:10
Benchmarks beware
In many of not most benchmarks, the Intel compiler produces the fastest code of any F77/F90 compiler. However, care needs to be taken on non-Intel chips. Code compiled with -axW, for example, will not use ANY SSE or SSE2 instructions on non-Intel chips. This will almost certainly greatly impact performance. If the use of SSE2 is forced with -xW (which is what Intel sort-of-recommend for Opterons), then some SSE2 code will be used (as the code in the main program will use SSE2 instructions), but calls to the vectorised single-precision math instrinsics will use SSE, not SSE2.
In most of not all cases, then, code compiled with the Intel Fortran Compiler (and presumably icc as well, although I haven't tested it) will run slower than it should on non-Intel CPUs due to deliberate targeting of non-Intel CPUs by the compiler engineers. Benchmarks comparing the performance of AMD and Intel CPUs should beware of using the Intel compilers for this reason.
As an example, some (internal) code was compiled with ifc version 8.1.028 build 20050520Z twice. For the second compile, the Intel CPU check was patched out of the compiler and replaced with a no-op. The code is otherwise identical, compiled with '-O3 -fpp -tpp6 -ip -pad -w95 -cm -Vaxlib -static-libcxa'. The machines used are a dual-Opteron 248 and a P4 1.7 GHZ, values are seconds (lower is better, and note that the 'confs' test has a stochastic element and hence the times can vary by ~5% between runs).
CPU Flags Code 'Clique' 'Simplex' 'Confs'
Opteron -xW Original 15.6 54.4 92.2
Opteron -axW Original 26.7 123.4 114.2
Opteron -xW Patched 14.8 49.1 96.5
Opteron -axW Patched 15.1 49.7 91.4
P4 -xW Origina 25.7 78.4 171.2
P4 -axW Origin 26.3 79.7 171.2
P4 -xW Patched 25.8 78.9 172.6
P4 -axW Patched 26.4 78.1 169.9
The results for all unit tests of the software were identical between the original and patched versions. As can be seen, patching out the 'GenuineIntel' check makes no difference to the P4, but increases the performance of the Opteron by up to 10%. If the code was compiled with '-axW', then the Opteron really suffers: the 'Simplex' test is more than two times slower (it uses lots of exp() calls, and hence really benefits from vectorisation).
Preso da http://www.swallowtail.org/naughty-intel.shtml li si legge bene la tabella.
Sarebbe bello se hwupgrade si muoverebbe come testata a fare qualche test con i loro mezzi
|Phoenix|
23-03-2010, 16:24
ragazzi è una caxxta questo programma?
http://www.softpedia.com/get/Programming/Patchers/Intel-Compiler-Patcher.shtml
blackshard
23-03-2010, 16:47
ragazzi è una caxxta questo programma?
http://www.softpedia.com/get/Programming/Patchers/Intel-Compiler-Patcher.shtml
Se funziona hai fatto la scoperta del secolo! :D
Mo' guardo subito cosa dovrebbe fare, ma sembra promettente.
edit: si, dal readme sembra decisamente promettente! Speriamo solo che non abbiano cambiato il modo in cui il compilatore fa i controlli negli eseguibili.
suneatshours86
23-03-2010, 17:01
ragazzi è una caxxta questo programma?
http://www.softpedia.com/get/Programming/Patchers/Intel-Compiler-Patcher.shtml
assolutamente no pare:
"Intel Compiler Patcher scans your hard drive for executable files compiled with the Intel C++ Compiler making it possible to disable the CPU dispatcher in detected files, thus, increasing performance of the software that uses these files with CPUs other than Intel. Give Intel Compiler Patcher a try to see what it's really capable of!"
la prima cosa da fare è provare con i test sui quali si ha la certezza che avvengano disparità in termini di compilatore:
- 3D mark
- Cinebench
|Phoenix|
23-03-2010, 17:21
non posso per ora provare se funziona perchè sono fuori col pentium-m, ma facendo uno scan per ora mi ha trovato silveright di ms
Found at pos: 000BBFC1 cmpl [ebp][-04],0756E6547 ;"Genu"
Found at pos: 000BBFCA cmpl [ebp][-0C],049656E69 ;"Ieni"
Found at pos: 000BBFD3 cmpl [ebp][-14],06C65746E ;"letn"
capitan_crasy
23-03-2010, 17:29
assolutamente no pare:
"Intel Compiler Patcher scans your hard drive for executable files compiled with the Intel C++ Compiler making it possible to disable the CPU dispatcher in detected files, thus, increasing performance of the software that uses these files with CPUs other than Intel. Give Intel Compiler Patcher a try to see what it's really capable of!"
la prima cosa da fare è provare con i test sui quali si ha la certezza che avvengano disparità in termini di compilatore:
- 3D mark
- Cinebench
Provo con il mio 720 e Cinebench...
Provo con il mio 720 e Cinebench...
Facci sapere... :)
Se funziona, facciamo partire immediatamente una segnalazione alla redazione per stimolare la scrittura di un articolo prova... Almeno per Cinebench...
capitan_crasy
23-03-2010, 18:03
Facci sapere... :)
Se funziona, facciamo partire immediatamente una segnalazione alla redazione per stimolare la scrittura di un articolo prova... Almeno per Cinebench...
Ho eseguito Cinebench 9.5/R10 e 11; ora la patch sta cercando i files incriminati:
Secondo il programma ci sono alcuni codec come il Dixv, alcuni dll di nero, praticamente tutta la cartella di PowerDVD 10.
Naturalmente ha beccato subito i Cinebench 9.5/R10 e...
PORCA TROTA!!!!!
Ha beccato anche OpenSaurceMark V1 beta!!!:eek: :eek: :eek: :eek:
http://www.pctunerup.com/up/results/_201003/20100323190933_ScreenHunter_45.jpg
Ho eseguito Cinebench 9.5/R10 e 11; ora la patch sta cercando i files incriminati:
Secondo il programma ci sono alcuni codec come il Dixv, alcuni dll di nero, praticamente tutta la cartella di PowerDVD 10.
Naturalmente ha beccato subito i Cinebench 9.5/R10 e...
PORCA TROTA!!!!!
Ha beccato anche OpenSaurceMark V1 beta!!!:eek: :eek: :eek: :eek:
http://www.pctunerup.com/up/results/_201003/20100323190506_ScreenHunter_45.jpg
Fatti una copia degli exe e prova entrambe le versioni... Sono ESTREMAMENTE curioso... :)
Alekos Panagulis
23-03-2010, 18:09
Ho eseguito Cinebench 9.5/R10 e 11; ora la patch sta cercando i files incriminati:
Secondo il programma ci sono alcuni codec come il Dixv, alcuni dll di nero, praticamente tutta la cartella di PowerDVD 10.
Naturalmente ha beccato subito i Cinebench 9.5/R10 e...
PORCA TROTA!!!!!
Ha beccato anche OpenSaurceMark V1 beta!!!:eek: :eek: :eek: :eek:
http://www.pctunerup.com/up/results/_201003/20100323190506_ScreenHunter_45.jpg
Cosa significa? Che tutti questi programmi vengono fatti girare male in presenza di CPU non Intel?
matt92tau
23-03-2010, 18:15
Dal Readme:
La ricerca di file non è una replica coppie di registri - questo meglio essere spiegato in dettaglio. Di solito la procedura di controllo dei tipi di CPU nei compilatori Intel assume tre confrontare le istruzioni per verificare "Genu", "INEI", e "ntel" ogni essere nel registro della CPU stessa, ossia solo EAX o ecc EDX solo Tuttavia, ci sono eseguibili file per i quali il controllo sulla stringa venditore è fatto in diversi registri della CPU, per esempio:
cmp eax, "Genu"; cmp ebx, "INEI"; edx cmp, "ntel"
Tale algoritmo di confronto di solito è usato solo per l'identificazione della CPU e non dimostra che il programma controllata è stato compilato con il compilatore Intel. D'altra parte, il confronto di base del dispatcher Intel CPU (confronto con i registri della CPU stessa) può andare prima e in seguito alla fine non ci può essere il controllo di tipo CPU, inserita da uno sviluppatore. Per impostazione predefinita questo parametro è disabilitato. Non è raccomandato per consentire, se non sei completamente sicuro di quello che stai facendo.
Tradotto con Google Traduttore
Questo programma vede, se non ho capito male, se i programmi hanno una funzione per riconoscere le cpu e non se hanno la modalità per penalizzare le cpu non intel
blackshard
23-03-2010, 18:50
Allora ho fatto un test con cinebench r10 64 bit, ed effettivamente mi ha cambiato il risultato!! Solo che con l'eseguibile patchato le prestazioni sono calate di un buon 20%, sono passato da 3700 CB-CPU a 2900 CB-CPU.
Ma, perchè c'è una "ma", il mio è un Turion ZM-80 basato su unità esecutive K8, e i K8 con le SSE3 hanno sempre avuto brutte prestazioni. Bisognerebbe provare innanzitutto su un Intel, per vedere se il programma fa' si che venga eseguito il code path più lento in ogni caso, ed anche su un K10 per vedere se c'è un miglioramento o un peggioramento.
edit: un altra cosa, per quanto riguarda cinebench è necessario includere anche un'altra estensione di file (mi pare cbl) e patchare anche quelli. Potete dare un'occhiata allo screenshot fornito nel programma .
matt92tau
23-03-2010, 18:55
Allora ho fatto un test con cinebench r10 64 bit, ed effettivamente mi ha cambiato il risultato!! Solo che con l'eseguibile patchato le prestazioni sono calate di un buon 20%, sono passato da 3700 CB-CPU a 2900 CB-CPU.
Ma, perchè c'è una "ma", il mio è un Turion ZM-80 basato su unità esecutive K8, e i K8 con le SSE3 hanno sempre avuto brutte prestazioni. Bisognerebbe provare innanzitutto su un Intel, per vedere se il programma fa' si che venga eseguito il code path più lento in ogni caso, ed anche su un K10 per vedere se c'è un miglioramento o un peggioramento.
edit: un altra cosa, per quanto riguarda cinebench è necessario includere anche un'altra estensione di file (mi pare cbl) e patchare anche quelli. Potete dare un'occhiata allo screenshot fornito nel programma .
Io con cinebench r11.5 non ho cambiamenti ne in peggio ne in meglio con il mio Phenom II X3 720
|Phoenix|
23-03-2010, 18:57
Io con cinebench r11.5 non ho cambiamenti ne in peggio ne in meglio con il mio Phenom II X3 720
Hai patchato tutti i file come dice il post prima di blackshard?
digieffe
23-03-2010, 18:58
le cose si evolvono...
anche qui sembra che i tempi non siano lontani... se non ho tradotto male si parla di 2/3 settimane
http://www.phoronix.com/scan.php?page=news_item&px=ODA3Ng
io ci sono ^^
se non si dovessero sboccare vediamo di mettere mano a 'sti eseguibili...
e cmq le ottimizzazioni riguardano solo i code path di set particolari, vedi sse ecc, o anche come viene generato il codice isa x86 standard?
se qualcuno ha info le postasse grazie.
capitan_crasy
23-03-2010, 18:59
Ecco i miei risultati:
la versione Cinebench 9.5 non viene patcciata quindi non riporto i rusultati
Cinebench R10
Prima
http://www.pctunerup.com/up/results/_201003/th_20100323195350_ScreenHunter_43.jpg (http://www.pctunerup.com/up/image.php?src=_201003/20100323195350_ScreenHunter_43.jpg)
Dopo
http://www.pctunerup.com/up/results/_201003/th_20100323195535_ScreenHunter_46.jpg (http://www.pctunerup.com/up/image.php?src=_201003/20100323195535_ScreenHunter_46.jpg)
Leggero miglioramento nel single; ma nulla di eccezionale...
Cinebench R11.5
Prima
http://www.pctunerup.com/up/results/_201003/th_20100323195630_ScreenHunter_16.jpg (http://www.pctunerup.com/up/image.php?src=_201003/20100323195630_ScreenHunter_16.jpg)
Dopo
http://www.pctunerup.com/up/results/_201003/th_20100323195658_ScreenHunter_47.jpg (http://www.pctunerup.com/up/image.php?src=_201003/20100323195658_ScreenHunter_47.jpg)
Leggerissimo peggioramento...
Sembra che questa patch su Cinebench non porti benefici...:stordita:
matt92tau
23-03-2010, 18:59
edit
digieffe
23-03-2010, 19:07
è possibile effettuare dei test con winrar o 7 zip?
dovrebbero essere test che non utilizzano massicciamente istruzioni SIMD
astroimager
23-03-2010, 19:49
Ecco i miei risultati:
la versione Cinebench 9.5 non viene patcciata quindi non riporto i rusultati
Cinebench R10
Leggero miglioramento nel single; ma nulla di eccezionale...
Cinebench R11.5
Leggerissimo peggioramento...
Sembra che questa patch su Cinebench non porti benefici...:stordita:
Quello "sospetto" mi pare fosse proprio l'R10.
Ma l'open GL è passato da 5600 a 6600...
matt92tau
23-03-2010, 19:53
Ma l'open GL è passato da 5600 a 6600...
Non poco direi
|Phoenix|
23-03-2010, 20:17
Quello "sospetto" mi pare fosse proprio l'R10.
Ma l'open GL è passato da 5600 a 6600...
Non poco direi
Circa 1% nei test single e multi cpu e il 17% in openGL con Cinebench R10?
Comunque la cosa merita un approfondimento
blackshard
23-03-2010, 20:40
Guardate, a suo tempo avevamo già dato un'occhiata comparata con cinebench fra Turion II e Intel Core 2, e cinebench sembrava un test abbastanza equo, nel senso che a parità di frequenza c'era un lievissimo vantaggio per i core 2.
Comunque la cosa va assolutamente indagata perchè il cambiamento c'è, bisogna vedere in che modo viene cambiato il dispatcher, cioè se patchando si attivano le SIMD per tutti i processori oppure se si disattivano per tutti i processori.
Per questo motivo chiedevo a qualcuno che ha un Intel di verificare se patchando cinebench r10 si ottengono prestazioni inferiori.
|Phoenix|
23-03-2010, 21:50
Guardate, a suo tempo avevamo già dato un'occhiata comparata con cinebench fra Turion II e Intel Core 2, e cinebench sembrava un test abbastanza equo, nel senso che a parità di frequenza c'era un lievissimo vantaggio per i core 2.
Comunque la cosa va assolutamente indagata perchè il cambiamento c'è, bisogna vedere in che modo viene cambiato il dispatcher, cioè se patchando si attivano le SIMD per tutti i processori oppure se si disattivano per tutti i processori.
Per questo motivo chiedevo a qualcuno che ha un Intel di verificare se patchando cinebench r10 si ottengono prestazioni inferiori.
Ho provato cinebench r10 su un t2370 1,73 su windows vista h.p 32
openGl 556 Prima
openGl 556 Dopo
1cpu 1440 Prima
1cpu 1637 Dopo
Multi 3044 Prima
Multi 3068 Dopo
Ora come si spiega? :D
vBulletin® v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.