mi sono stancato di spiegare la differenza tra microcode e architettura di calcolo!!!!!!
eppure l'avro' ripetuto decine di volte!!!!!
i processori possono pure avere istruzioni a 128bit!!!!!
visto che con l'ht si simulano 2 processori!!! e quindi in teoria si potrebbero eseguire 2 operazioni FP a 64bit alla volta!!!!
ma questo non vuol certo dire che le operazioni vengono eseguite al doppio della velocità visto che le strutture di calcolo restano invariate!!!!
mentre l'itanium ha una struttura priva di microcode!!!!
ossia quello che si processa equivale alla struttura nativa delle unità di calcolo del processore!!!!
il P4 ha avuto gia' tre evoluzioni, tutte si basano sulla stessa struttura a microcode ossia le unità di calcolo vengono foraggiate in tempo reale della lunghissima pipeline, come questo avvenga e' sotto stretto segreto da parte di INTEL, quello che e' sicuro e' che le instruzioni x86 vengono letteralmente scomposte in istruzioni elementari parallelizzate e instradate nel varie unità di colcolo del P4.
ora le unità di calcolo del primo P4-del P4N e del P4 prescott sono del tutto invariate...cambia invece il modo con cui queste vengono instradate....ossia il microcode!!!!
piu' efficentemente questo processo avviene piu' le prestazioni aumentano....
il problema e' che queste operazioni richiedono che la parte del microcode sia sotto stress per ogni instruzione viene passata visto che la ricompilazione dinamica viene effettuata su tutte le istruzioni processate.
in soldoni e' come se una parte del processore non scenda durante il funzionamento sotto l'80% di time work...pertanto e' qui che tutti i watt del prescott vengono consumati....
aumentando la frequenza ossia il numero di istruzioni processabili ogni secondo aumenta il time work del microcode che risulta vicino al 100% di busy....ossia la struttura ha un collo di bottiglia proprio alla base dell'instradamento delle istruzioni alle unità di calcolo. quindi molti watt da dissipare senza possibilità di soluzione se non riprogettando il core.
l'itanium funziona in modo diverso visto che non ha microcode e le istruzioni a 32bit funzionane in emulazione...
quindi l'itanium consuma in proporzione al numero di transistor molto meno proprio perche' non deve instradare o ricompilare le istruzioni prima di processarle, addirittura non deve neppure tradurle per le unità di calcolo visto che sono tutte native.
la ragione per cui l'itanium e' poco diffuso e' proprio la difficoltà dei sistemisti ad adeguarsi ad architetture differenti a quelle x86...
a livello di prestazioni pure l'itanium2 1,2ghz e' circa 4 volte il P4 3ghz di picco e non meno del doppio in ogni condizione di calcolo nativo...quello a 32bit non si conta visto che e' in emulazione.
|