P4 3.06 GHz Hyper Threading, recensione con 3DS Max

P4 3.06 GHz Hyper Threading, recensione con 3DS Max

Analisi prestazionale dell'efficacia della tecnologia Hyper Threading utilizzando 3d Studio MAX 5

di pubblicata il , alle 10:42 nel canale Processori
3DSNintendo
 
47 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
NiKo8720 Dicembre 2002, 13:08 #11
Seeeeee, sono molto scettico...
PacManZ20 Dicembre 2002, 13:21 #12
jojo tu la vedi un po troppo rosea mi sa.....

nn e' proprio come dici tu....
il fatto del postino con due braccia e' il classico esempio di sistema con 2 processori
^TiGeRShArK^20 Dicembre 2002, 13:42 #13

X JOJO

ni sa ke hai le idee 1 pò confuse per quanto riguarda le pipeline......
nn è ke con l'hypertreading deve fare solo 10 stadi della pipeline per eseguire un'operazione......
mi spiego meglio:
le pipeline sono nate per effettuare una gestione concorrente dell'elaborazione dei dati come procedimento alternativo al parallelismo classico a multiprocessore, e funzionano nel seguente modo:
Supponiamo una pipeline a 3 stadi.
Essa è rappresentabile come una "catena di montaggio" fatta da unità di elaborazione messe in cascata.
Al primo ciclo di clock la prima istruzione viene elaborata dalla prima unità di esecuzione. Al secondo ciclo di clock questa istruzione viene passata alla seconda unità di elaborazione e viene elaborata, mentre, NELLO STESSO TEMPO, un'altra istruzione viene nuovamente elaborata dalla prima unità di esecuzione. Al terzo ciclo di clock, tutte e tre le istruzioni vengono elaborate nello stesso tempo dalle tre unità di esecuzione, quindi, A REGIME, si avrà un throughput di 3 istruzioni per ciclo di clock. Per questo questa situazione è paragonabile a quella di un sistema multiprocessore con tre unità di esecuzione, anche se ovviamente vi sono delle differenze sostanziali che nn sto qui a spiegare.
Ora torniamo al nostro bellissimo e potentissimo P4.
Vi siete chiesti mai perchè è necessario aumentare la lunghezza delle pipeline per salire più facilmente in frequenza?
Stando a quanto ho detto finora potrebbe sembrare che il P4 riesca in questo modo ad elaborare 20 istruzioni per ciclo di clock, che sarebbe un valore semplicemente mostruoso.
E qui casca l'asino. In realtà le istruzioni che elabora il P4 sono delle istruzioni CISC molto complesse che necessitano molto di più di un ciclo di clock per essere completate. Per questo, in mo do da sfruttare efficientemente il processore, cosa si è pensato di fare? SI è messa un'unità di "traduzione" che trasforma queste istruzioni CISC in micro-istruzioni RISC Like, che quindi necessitano solamente di un clock per essere eseguite (di solito, anche se ovviamente in realtà nn è sempre vero). Inoltre, visto che queste istruzioni possono essere eseguite in un ciclo di clock, e visto che sono strettamente sequenziali, è stato possibile inserire una pipeline per farle eseguire. Ora, ovviamente, tanti più stadi avrà la pipeline, tanto più semplici saranno le micro istruzioni da eseguire. Faccio 1 esempio, avendo una pipeline a 3 stadi che esegue un istruzione, è necessario dividere l'istruzione in 3 micro-parti, che ovviamente saranno molto più complicate da eseguire rispetto alle micro-parti ottenute dividendo la stessa istruzione in 20 sottoparti. In questo modo, essendo le micro-istruzioni più facili da eseguire tanto più lunga è la pipeline, è possibile ridurre il tempo necessario per eseguire un istruzione, e, di conseguenza, salire di clock. Ovviamente le pipeline non sono tutte rose e fiori. Vi sono delle penalità fortissime nel caso in cui un branching (un salto) viene predetto male, in quanto è necessario svuotare completamente la pipeline. Inoltre è molto probabile che vi siano delle unità di esecuzione che non fanno niente ad un certo istante, a causa del fatto che come ho detto prima non sempre è possibile terminare un'operazione in un ciclo di clock (vedi accesso alla memoria e I/o in generale). Quindi la tecnologia Hyper-treading non fa altro che ottimizzare questa situazione, andando a impiegare le unità di esecuzione che non fanno niente con un altro thread.
Penso che come spiegazione sia sufficiente, anke se ovviamente ho lasciato delle piccole imprecisioni, ma d'altro canto già questo post è diventato lungo quanto un articolo di Lithium, se mi fossi messo a sepcificare meglio tutte quelle piccole imprecisioni non avrei finito più.
Spero di essere stato chiaro cmq.
Se avete dubbi non esitate a contattarmi !
J0J020 Dicembre 2002, 16:06 #14
Avevo detto di non scendere sul tecnico
l'avevo detto io che poi il post diventava qualcos'altro!!! (eravamo partiti dalla temperatura)
Questa si che e' una predizione. hihihih

Quando mi riferivo alla frase "pipeline o come le volete chiamare" era inteso come una cosa qualsiasi che rende il p4 piu lento o meno lento al suo modo di operare.
Altrimenti e' semplice dire.. il p4 e' lento perche ne ha 20... l'amd ne ha 3 (AD ESEMPIO!!! ORA NON PRENDETEMI IN PAROLA) allora e' piu veloce l'amd... (mi davo la zappa sui piedi? io ho un p4) ehhehe

Secondo te l'esempio del pacco e del postino si adatta a pipeline, salti di predizione, istruzioni processi e clock??
Sono solo delle fantasiose metafore onomatopetizzate...
E' stata la prima cosa che mi e' saltata in mente, non voleva essere legge, ma divertente da leggere.


PacManZ
no x i 2 processori e': tu porti un pacco che io porto l'altro...
le due braccia per l'appunto e' HT perche il postino e' uno, ma virtualmente fa x due (xche usa due braccia invece di 1)

Sti postini non hanno mai voglia di lavorare!!!
Scezzy20 Dicembre 2002, 16:21 #15
quote:
------

non aumenta un bel niente... (temperatura)
Aumentano le operazioni che fa nello stesso ciclo di clock non aumentano i mhz
Un po come se fossi un corriere che per portare un pacco a destinazione, utilizzi due braccia (HT attivato) invece di una sola (P4 senza HT)... invece di fare il doppio dei viaggi perche non vuoi sforzarti troppo perche sei uno scansafatiche...

Basta alimentare queste false voci, ed anche se fosse la differenza di temperatura sarebbe di 0.2 gradi, sai che dispendio di energia.

----

Non penso proprio che sia ridotto l'aumento di temperatura e mi pare pure di averlo letto da qualche parte che sono svariati gradi.....

---

JOJO.... non so tu che mestiere fai di vita... ma se sei un assemblatore... complimentoni. Non credo che tu ne abbia mai provato uno di P4 HT altrimenti non ti accaniresti contro chi per altro dice la verita'. La temperatura non sale !? Prova... prova... e poi ci risentiamo ! Cosi' per curiosita' sai quanti watt si piglia il P4 HT !?
Duncan20 Dicembre 2002, 16:41 #16
L'HT non dovrebbe essere altro che un controller aggiuntivo che si occupa di riempire le pipeline libere appena può, in modo da recuperare tempo macchina... naturalmente se mi ricordo bene...


per precisare solo una cosa... la pipeline è appunto una specie di catena di montaggio... quindi in una pipeline di 20 stadi come quella del P4 ogni pipeline dovrebbe occuparsi di 20 parti dell'esecuzione di una istruzione diversa...

chiedo scusa sew mi son sbagliato o per la poca chiarezza
soalle20 Dicembre 2002, 18:30 #17
più logica, più transistor che commutano per ciclo di clock -> maggiore dissipazione
J0J020 Dicembre 2002, 18:39 #18
x Scezzy

e se ti dicessi che lo sono invece?
E posso anche ammettere che non l'ho ancora montato su nessun pc... per il momento.

Poi io non mi accanisco, anzi il contrario...
Da come alcuni parlano... e' come se prendesse 10 gradi in piu...
hai mai visto qualche sito che facesse una prova e dice nel post.... "si HT bella cosa.. solo ha di contro che ti sale di 10 gradi la cpu"
Non ho mai visto una nota del genere in nessuna recensione o review, ne tantomeno una jpg con la foto del prima e dopo...
Anzi ora non ricordo, dove facevano vedere la differenza di temperatura con e senza HT attivato, ed era massimo di 1-2 gradi e nemmeno (troppo poco per iniziare un linciaggio all'intel), ma sappiamo tutti che la temperatura varia per mille fattori ed oscilla di un grado piu o un grado meno e puo avvenire in qualsiasi momento a prescindere da cio che si sta facendo, infatti nei test di solito si fanno le medie (bench in genere) sulle misurazioni...
Poi io parlo di temperatura (finale della CPU a contatto col dissipatore) e non di watt (magari assorbiti dal sistema, dalla piastra e via dicendo)...

E' cambiato il sistema di gestione interno, non la velocita' di punta della CPU (mhz e voltaggio aumentano a vista d'occhio la temperatura), per giustificare un aumento cosi allarmistico...

L'ho sempre detto che e' il p4 e' fatto male... mangia come un bue e tira come una formica...
ora tira come un asinello, ma continua a mangiare come un bue ugualmente...
se tanto mi da tanto.. meglio che tiri come un asinello che come una formica...
tanto consuma uguale!

"Prova... prova... e poi ci risentiamo ! Cosi' per curiosita' sai quanti watt si piglia il P4 HT !?"

e tu per curiosita' hai provato? posta qualche jpg e senza imbrogliare
Grazie.
magomerlinopaolo20 Dicembre 2002, 18:49 #19
"Vi siete chiesti mai perchè è necessario aumentare la lunghezza delle pipeline per salire più facilmente in frequenza?"
me lo sono chiesto ma non hai risposto cmq probabilmente + è lunga la pipeline e + è stabile il processore alle alte frequenze, o una cosa del genere...
cmq non ho capito come si fanno ad avere prestazioni superiori del 500% se con l' hyperthreading puoi avere prestazioni (TEORICAMENTE...) del 200%, in quanto è come avere 2 processori(che condividono xò cache bus e tutto il resto...)
quindi,nn mi fido tanto di sto test
J0J020 Dicembre 2002, 20:26 #20
Come fa ad avere il 500% invece di 200%???

proprio perche utilizza quella parte di processore, registri, unita' o chiamatele come vi pare che in quel ciclo di clock non usa... (potenza sprecata o latente e lavora e che non lavora, mangia sempre come un bue)

Ricordiamoci che il nostro facchino... ha due braccia ma normalmente ne usa solo una... ma nel frattempo cammina, invece di ritornare al piano terra per ricevere altri ordini.... gli squilla il cellulare col capo che gli dice... quanto torni giu passa prima al 3° piano e intanto pensa a quanto fa 2+2 e riferisci il risultato al capo del piano, intanto lui ci va ci pensa durante il tragitto... da la risposta esatta che era 4 al capo chegli ordina di riandare al 10 per portare un documento e di aggiungere 1 al risultato di prima... porta sto documento al piano 10 e gli dice... il risultato di prima piu quell'altro e' 5...
Quando ritorna al piano terra il facchino, ha fatto piu cose, perche per ogni ordine non e' dovuto ritornare al piano terra e poi risalire per poi riscendere perche dal ventesimo piano ci deve passare per forza

quando hai due cpu.... le due cpu si dividono i compiti... mezza io mezza tu...
ma sempre in modo non efficente... cioe non sono sfuttate come la soluzione precedente... su e giu.... per ogni ordine prima invece ha fatto 4 cose invece di una alla volta... con lo stesso viaggio (ciclo)
Quindi hai esettamente il doppio (200%) di inefficenza... di un qualcosa che e' gia inefficente di per se... perche il nostro omino prima non faceva una mazza.... ora durante il viaggio si spacca il c..o
ecco perche raggiungi a volte e dico a volte il 500%....
Ripeto l'esempio e' banale ma ci calza a pennello...

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^