|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Senior Member
Iscritto dal: Feb 2003
Città: Verona
Messaggi: 1890
|
cicli nidificati: è più veloce un p4 2,4 Ghz o un E6300?
Spesso uso dei programmi in ms-dos con molti cicli nidificati per fare dei calcoli matematici, ora posseggo un pentium 4 da 2,4 Ghz (18x133), con molti programmi implementate da me ci mettono circa 40 minuti per completare il run, ora se acquisto un nuovo pc con il processone E6300 avendo una velocità di 1,866 Ghz teoricamente ci dovrei mettere di più??? oppure essendo un core 2 duo con 2 mb L2 potrebbe andare più veloce????
Mi serve una risposta, ho paura di sbagliare processore per il mio futuro pc |
|
|
|
|
|
#2 |
|
Senior Member
Iscritto dal: Oct 2006
Messaggi: 1105
|
intanto lascia perdere la pura frequenza di clock: quello che conta è il numero di istruzioni per ciclo di clock e il core 2 duo è sicuramente più efficiente del p4... a titolo di cronaca ho un fisso p4 2.6GHz e un portatile con pentium M 1.86GHz (quindi precedente al core 2 duo): tempo fa ho scritto un programma che conteneva algoritmi di geometria computazionale... risultato: lo stesso problema veniva risolto dal pentium M in META' tempo rispetto al pentium 4 (poco meno di 1 minuto per im PM, poco più di 2 minuti il p4)... ovvio, sono dati un po' alla caxxo, ma significativi
in più sicuramente col core 2 duo hai ram e fsb più veloci |
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Feb 2003
Città: Verona
Messaggi: 1890
|
Grazie
|
|
|
|
|
|
#4 | |
|
Senior Member
Iscritto dal: Apr 2003
Città: Genova
Messaggi: 4747
|
Quote:
sarebbe interessante avere un' idea più precisa dell' algoritmo, e delle condizioni di contorno (compilatore, profilo di ottimizzazione usato, ottimizzazioni nel codice, eccetera) per fare un po' di profiling
__________________
Jappilas is a character created by a friend for his own comic - I feel honored he allowed me to bear his name Saber's true name belongs to myth - a Heroic Soul out of legends, fighting in our time to fullfill her only wish Let her image remind of her story, and of the emotions that flew from my heart when i assisted to her Fate
Ultima modifica di jappilas : 08-12-2006 alle 16:21. |
|
|
|
|
|
|
#5 | |
|
Senior Member
Iscritto dal: Oct 2006
Messaggi: 1105
|
Quote:
|
|
|
|
|
|
|
#6 | |
|
Senior Member
Iscritto dal: Apr 2003
Città: Genova
Messaggi: 4747
|
Quote:
ma proprio per questo mi chiedevo se nel tuo programma ad esempio fossero presenti molti salti, che un p4 soffirrebbe più di un PM e giustificherebbero una disparità prestazionale maggiore rispetto a quella che (se non erro) sussiste tra i rispettivi livelli di efficienza su codice normale...
__________________
Jappilas is a character created by a friend for his own comic - I feel honored he allowed me to bear his name Saber's true name belongs to myth - a Heroic Soul out of legends, fighting in our time to fullfill her only wish Let her image remind of her story, and of the emotions that flew from my heart when i assisted to her Fate
Ultima modifica di jappilas : 08-12-2006 alle 22:28. |
|
|
|
|
|
|
#7 | ||
|
Senior Member
Iscritto dal: Oct 2006
Messaggi: 1105
|
Quote:
Quote:
Ultima modifica di mad_hhatter : 08-12-2006 alle 23:20. |
||
|
|
|
|
|
#8 | ||
|
Senior Member
Iscritto dal: Apr 2003
Città: Genova
Messaggi: 4747
|
Quote:
il decoder a monte della cache L1I , ma non superscalare (quindi, una sequenza di istruzioni x86 non decodificate, deve attraversare la pipeline del front end /decoder una alla volta - laddove un A64 carica e decodifica, producendo anche un paio di risc-ops per ognuna, 3 istruzioni X86 per ciclo e Core fino a 4); la cache L1I execution trace, che pur essendo progettata per una dimensione della singola linea e del buffer di uscita, pari a 6 ( in termini di microops) , quelle che effettivamente può produrre diventano 3 sul northwood (*) e poi 4 sul prescott per via di una riorganizzazione della ETC (16k uops in linee da 4 piuttosto che 12k in linee da 6), sempre però pari o al di sotto delle microistruzioni risc-type che vengono inviate a valle del decoder in architetture come quelle più recenti, in cui l' esecuzione e in certi casi lo scheduling, avviene su gruppi di microistruzioni aggregate (che però non vengono bufferizzate ma, ridecodificate qualora il codice debba essere rieseguito) ... quindi con una ipc media tendenzialmente maggiore; la rom a sequenziazione di microcodice, che per le istruzioni X86 complesse bypassa la ETC e il decoder per alimentare una singola ALU dedicata (quindi se incontra un' istruzione X86 di tipo complesso P4 diventa per qualche ciclo un processore inorder non superscalare) l' unità sse/floating point a una sola via ma a doppia frequenza come le alu intere, e interleaved (secondo alcuni documenti, su altri è riportata una sola porta tra l' unità e la reservation station) - cosa che inficia particolarmente l' esecuzione di sezioni di codice basato su istruzioni X87 (floating point legacy) e MMX, rispetto agli altri processori , e il modo per ottimizzare l' esecuzione di SW che debba effettuare operazioni matematiche o anche di manipolazione di blocchi di dati (forzando l' uso delle SSE) Poi si aggiungono quelle che potrebbero essere le conseguenze ("bolle") del maggior numero di stadi nell' intervallo tra le fasi di trace ed execute in caso di salto condizionale e dell' assenza dello stadio di ripristino (presente sugli AMD, non mi pare però su Core)... tutto semplificando e a meno di memory fading del mio neurone ( esaminai netburst qualche anno fa, il fading è in agguato), ma spero di aver dato almeno un' idea Quote:
__________________
Jappilas is a character created by a friend for his own comic - I feel honored he allowed me to bear his name Saber's true name belongs to myth - a Heroic Soul out of legends, fighting in our time to fullfill her only wish Let her image remind of her story, and of the emotions that flew from my heart when i assisted to her Fate
Ultima modifica di jappilas : 10-12-2006 alle 13:12. |
||
|
|
|
|
|
#9 | |
|
Senior Member
Iscritto dal: Oct 2006
Messaggi: 1105
|
Quote:
per il test, è appunto un tentativo di confrontare mele e pere quindi ha poco significato, solo che la differenza prestazionale era tale da permettermi di ricordarmela |
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 23:06.



















