Senior Member
Iscritto dal: Nov 2003
Messaggi: 24166
|
Bench OCW sul Phenom 9600: Le impressioni di leoneazzurro!
Quote:
Originariamente inviato da leoneazzurro
Hmm.. a me una cosa che ha sempre dato da pensare nei test preliminari del Phenom è la grande differenza prestazionale di Phenom tra i test sulle applicazioni "precompilate" come ad esempio Cinebench (anche se esistono anche altri SW di rendering, eh) dove Phenom viene battuto dalle controparti Intel e quelle con applicazioni "ricompilate" (ricordo le slide sul SW di calcolo Fluent, ecc) dove anche con clock inferiore si assisteva a ottime prestazioni da parte della nuova CPU AMD. Non vorrei che per trarre vantaggio dalle nuove feature di Phenom si debba creare un path apposito.
Speriamo proprio di no.
|
Domanda di stroimager:
E' possibile che Cinebench e altri test siano stati ottimizzati nel corso di tutti questi mesi per l'architettura "core" di Intel?
Sarebbe il prezzo da pagare per il ritardo...
Quote:
Originariamente inviato da leoneazzurro
Diciamo che più che possibile è sicuro, ma il problema è che i calcoli Cinebench sono essenzialmente calcoli FP, e nel calcolo FP Phenom ha delle feature superiori alle CPU Core2: ha capacità di effettuare una istruzione a 128 bit per ciclo di clock ma anche 2 a 64 bit per ciclo di clock, ha una pipeline separata per i calcoli FP/SSE, può effettuare 2 load a 128 bit per ciclo, e dovrebbe avere tutta la banda passante necessaria per alimentare la pipeline, sia da punto di vista del controller di memoria che del data bus tra L1 e L2. Sugli interi non c'è dubbio che Core2 sia più "forte", ma a me è proprio la "mancanza" di potenza in ambito FP che sorprende...
|
Domanda di astroimager:
Il collo di bottaglia da qualche parte deve essere: mi sorprende solo che voi più esperti rimaniati sorpresi per alcuni risultati, perché significa che sulla carta il Phenom avrebbe dovuto sfoderare prestazioni migliori, specie nelle applicazioni che dovrebbero sfruttare le parti più "pompate", o meglio evolute, della nuova architettura...
Nella mia ignoranza non comprendo come si sviluppa una nuova CPU: nei test in laboratorio non ci si accorge che se le prestazioni non sono come da progetto, con i software disponibili in quel momento?
A meno che AMD non ritenga che nel 2008, quando il K10 raggiungerà presumibilmente il suo culmine, ci saranno + software/benchmark che sfruttano le nuove feature... in questo senso, il Phenom non sarebbe in ritardo, ma al contrario in anticipo.
Quote:
Originariamente inviato da leoneazzurro
Infatti un collo di bottiglia ci deve essere, bisogna vedere se è hardware (nel qual caso devono aver fumato qualcosa di strano gli ingegneri AMD) o software. Si, ci si aspettava prestazioni migliori da questo Phenom, non tanto nei giochi ma proprio nei programmi di rendering, nei programmi di calcolo, nell'encoding, dove sulla carta c'erano milglioramenti notevolissimi e nel calcolo FP, nel caso peggiore, Phenom avrebbe dovuto essere, per clock, veloce come un Core2 Duo (tralasciando le nuove SSE4 del Penryn). Così sembra non essere, a giudicare persino dai test sintetici FP (parlo di Sandra, non di SuperPi che è favorito dalle cache grandi)
|
Domanda di Efic:
ma non doveva essere un mostro in Floating Point?
ricordi i vari SpecCFP2006 di Barcelona.....
Quote:
Originariamente inviato da leoneazzurro
Infatti, ho detto che nel caso peggiore sarebbe dovuto andare come un Core2 a parità di clock, e come caso peggiore intendo la combinazione di istruzioni meno adatta a sfruttare le caratteristiche del K10. Infatti sia Il Core2 che il K10 hanno le unità SSE 128 bit, ma il K10 è avvantaggiato dal potere effettuare 2 operazioni di load a 128 bit per clock, dalla pipeline dedicata, dal maggiore numero di unità per il calcolo degli indirizzi FP, dal poter effettuare 2 istruzioni FP a 64 bit per clock. Dove stia il problema non si capisce.
|
Domanda di capitan_crasy:
E' possibile che questo "Problema" sia causato da un bios immaturo?
Quote:
Originariamente inviato da leoneazzurro
A questo punto direi di no. Non credo che ora i BIOS siano tanto immaturi da disabilitare metà delle unità FP. Sicuramente qualcosa si potrà guadagnare con il tuning delle memorie, che mi sembra ancora latiti, ma qui si parla di prestazioni FP pressocchè pari ad un K8 di pari frequenza a fronte di un 100% di unità di esecuzione in più.
|
Domanda di roccodifilippo:
Ah ecco qui....io ho letto quei risultati almeno 10 volte.....e non ora non ci capisco niente!
Era nettamente superiore ai Conroe, sembravano appartenere a due razze diverse.
E poi sugli Integer non è che andasse male....era sempre superiore a parità di frequenza.
Quelli poi sono test ultra-certificati.
Quote:
Originariamente inviato da leoneazzurro
Il fatto è che generalmente i test SPEC vengono ricompilati per la CPU in esame. Non a caso si trovano test effettuati con diversi compilatori per verificare l'efficienza di una CPU a seconda del compilatore usato.
Ad esempio uno dei migliori compilatori C++ è quello di Intel, che però ovviamente tutto fa trane che ottimizzare per le CPU AMD. Infatti con compilatori Open Source come GCC le CPU AMD si comportano in genere meglio (relativamente parlando). Ora, se queste CPU richiedessero un path apposito per poter sfruttare la potenza FPU in più, la cosa sarebbe piuttosto grave. Questo in quanto tutti sono portati ad ottimizzare per le CPU più "presenti" sul mercato e non certo per chi ha un 20% del totale. Inoltre significherebbe che su tutto il SW attuale queste CPU si comporterebbero poco meglio di un K8 di pari frequenza.
|
Domanda di roccodifilippo:
Mi sfugge il più del tuo post.....ma stai comunque dicendo che si tratta di problemi SW?
Ma se compro una macchina IBM con un Barcelona questa mi garantirà comunque risultati superiori ai Conroe e ai Penryn (forse i Penryn pareggiano negli Integer) oppure no?Cioè mi devo dar da fare io per metterla a posto?
Quote:
Originariamente inviato da leoneazzurro
E' questo il problema: al momento non è chiaro. I risultati sembrano "troppo brutti" per essere solo dovuti a BIOS immaturi. Ma se il K10 ha queste migliorie, perchè non si vedono propri lì dove dovrebbero essere?
|
Domanda di capitan_crasy:
Io più ci penso è più trovo la cosa senza senso!
Com'è possibile che AMD abbia creato una CPU Quad Core SSE a 128Bit per poi avere le stesse prestazioni di una CPU di generazione vecchia con due core in meno???
Possibile che in un anno e mezzo sviluppo del K10 non abbia riscontrato questo problema?
Quote:
Originariamente inviato da leoneazzurro
Beh no, in applicazioni multithread i 2 core in più ci sono e si sentono, ma è il single thread che stupisce, date tutte le migliorie sbandierate. Certo che cose del genere si vedono, per cui dico che il problema è o un collo di bottiglia non ancora identificato oppure è un problema SW. In entrambi i casi le cose non sono rose e fiori, anche se nel primo caso ci potrebbe essere un nuovo stepping che corregge il problema (se non è a livello concettuale).
|
__________________
AMD Ryzen 5600X|Thermalright Macho Rev. B|Gigabyte B550M AORUS PRO-P|2x16GB G.Skill F4-3200C16D-32GIS Aegis @ 3200Mhz|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Silicon Power A60 2TB + 1 SSD Crucial MX500 1TB (Games)|1 HDD SEAGATE IronWolf 2TB|Sapphire【RX6600 PULSE】8GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case In Win 509|Fans By Noctua|¦
|