|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#41 | |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
Il P4EE a 130nm è basato sul core Xeon Gallatin (quindi di "famiglia" Northwood), e i transistor in più rispetto a un P4 "desktop" sono dovuti alla cache L3 a 2MB, che si va ad AGGIUNGERE a tutto il resto. Il P4EE a 90nm invece è basato sul core P4 Prescott. I due processori, quindi, sono completamente diversi, per cui fare confronti di questo tipo è completamente inutile, oltre che sbagliato e fuorviante. Il confronto giusto è quello fra Banias e Dothan, visto che le uniche differenze sono dovute al raddoppio della cache L2 (tutto il resto è rimasto identico) e al passaggio da 130nm ai 90nm. Anzi, si potrebbero anche confrontare i Celeron basati su Dothan, con 1MB di cache, che quindi sono a tutti gli effetti dei Banias, ma col processo produttivo a 90nm anziché a 130nm.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
|
|
#42 | ||
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
Quote:
Alla AMD sono stupidi a pagare IBM per far produrre gli A64 90nm con i processi produttivi sopra citati? Quote:
- EMT64 (disabilitate in alcuni prescott) - SSE3 che non siano questi transistor in più - Qualche KB in più nelle L1 e trace cache. Le uniche differenze stanno nei transistor che regolano i flussi della pipe che nel prescott ha una decina di stadi in più.
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. |
||
|
|
|
|
|
#43 | ||
|
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Quote:
Quote:
Qui sotto c'è la foto di entrambi...dimmi se si assomigliano... http://www.chip-architect.net/news/P..._1600x1200.jpg http://www.chip-architect.net/news/N..._1600x1200.jpg Ultima modifica di cionci : 18-04-2005 alle 15:48. |
||
|
|
|
|
|
#44 | ||
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
Non ho detto che sono inutili, e tra l'altro Intel è stata la prima a usare la tecnologia strainer silicon sui transistor delle sue CPU. Ogni azienda cerca di utilizzare delle tecnologie, a volte anche le stesse, per risolvere problemi che sono comuni a tutti: Intel, IBM, AMD, Motorola, ecc. non stanno su un altro pianeta... Quote:
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
||
|
|
|
|
|
#45 | ||||||
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
Quote:
"i 90nm da soli non bastano per consumare meno, il consumo dipende da molti fattori e in particolare dal processo produttivo nel suo complesso, il prescott è un esempio del fatto che i 90nm non bastano da soli" Fx dice: "non è vero i consumi a 90nm scendono lo stesso" Questo per me è errato, mentre tu hai appena detto il contrario. Quote:
Che poi Fx ha tirato fuori la storia dei transistor differenti peraltro senza nemmeno considerare che i transistor in una CPU attivi contemporaneamente non sono nemmeno il 30% del core e che la cache ha consumi alla lunga trascurabili; considerazione tra l'altro da inlcudere nel discorso altrimenti qualsiasi ragionamento non avrebbe senso. Io ho semplicemente detto che se le spcifiche di una CPU danno x Vcc di tensione e y Imax assorbiti il consumo è Imax*Vcc, morta lì, indipendentemente da quanti transistor metti. La scusa dei transistor in più non basta per dire "eh ma il prescott consuma di più perchè ha più transistor", primo perchè le istruzioni sono eseguite poche alla volta (principalmente una alla volta) più altri stadi singolarmente per branch prediction e pre-load/pre-store. Quindi avendo il P4 Northwood le Stesse unità logiche del Prescott, anche se la pipe è il 50% più lunga, questo non giustifica i consumi che sono di quasi il 100% maggiori di quanto si puo' ottenere con lo stesso processo produttivo in altri casi (vedi AMD) Questo spiega perchè intel ha già fatto più di 4 stepping della stessa CPU, tutti per cercare di ridurre i consumi. Quote:
Quote:
Puoi mischiare le unità spazialmente per ridurre lo skew e per omogeneizzare l'alimentazione, ma mantenendo perfettamente come prima un core. La topologia negli schemi elettronici te lo garantisce. Al massimo puoi studiare i consumi da un grafico di una pipeline, se non fosse, che come i milioni di transistor sono sempre valori da prendere con le pinze, visto che all'80% dei casi sono solo schemi informativi pubblicati nelle press release dei vari IDF. Quote:
I 160W di picco richiesti da un P4EE 3.6GHz ne sono la comprova, sono un consumo a dir poco stratosferico, e se nelle specifiche ci sono 114A di IccMax con tanto di controller che calcola un nuovo Vcc a seconda degli ampere assorbiti un motivo c'è, nessuno si mette a fare un nuovo stepping di un chip a gratis. Articolo tanto per gradire uscito ai tempi dell'A64 90nm dopo che si è saputo dei consumi ben al disotto delle aspettative: http://www.penstarsys.com/editor/tec...sil/index.html Quote:
Qualsiasi normale teoria sulle CPU tende a sconsigliare di salire oltre i 7-8 stadi con architetture RISC e i 10-12 stadi con architetture CISC: pena la riduzione pesante dell'IPC. (appunto il prescott ha un IPC nelle condizioni peggiori di 0.4, contro lo 0.5 del northwood) ovvio che le teorie sono sempre in evoluzione, ma... Il prescott ha 31 stadi nella pipe, vedi un po' tu... a me pare una scelta forzata più che una scelta architetturiale, tantovero che il prescott è stato posticipato parecchi mesi e in più la notizia dell'aumento degli stadi è stata abbastanza tardiva. O meno, se intel ha scelto di fare 31 stadi per scelta di progettazione il reparto ingegneristico ha fatto una capellata non da poco, preferisco pensare che il reparto marketing abbia detto al reparto progettazione "vogliamo più MHz" e questi si sono arrangiati come han portuto.
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. Ultima modifica di Dreadnought : 18-04-2005 alle 19:59. |
||||||
|
|
|
|
|
#46 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Guarda che noi non stiamo qui a dire che Intel ha fatto un gran processore...anzi...non mi piace e nn mi è mai piaciuta la filosofia NetBurst...
La tua afferazione era questa: "il processo produttivo a 90nm di Intel non è buono perchè il Prescott consuma di più del Northwood"...ed a questa abbiamo ribattutto dicendo che non puoi fare questo confronto perchè il Prescott e il NW sono profondamente diversi... L'unico confronto plausibile è Banias vs Dothan...ed in questo caso il Dothan ne esce vincitore... Che intendi per "le istruzioni sono eseguite poche alla volta (principalmente una alla volta)" ? |
|
|
|
|
|
#47 | ||
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
Quote:
Che il prescott consumi tanto perchè molta corrente viene dissipata per il leakage è stato affermato pure da intel. Ho semplicemente fatto 1+1 ...il fatto che ho voglia di rispondere anche andando OT (vedi milioni di transistor o altro) è perchè prendo il pretesto di controbattere ad un thread per andare a cercare anrticoli interessanti o per riguardarmi vecchi articoli letti che magari dopo 2 anni inizi a ricordarti male. Mi tengo allenato insomma, e intanto chi gli interessa si legge il thread Quote:
shl Eax,1 Al caricamento della 31esima istruzione, quante istruzioni saranno nella fase "execute"? Ora non ho lo schema della pipe del prescott, ma mi vien da dire 'una sola', non sei d'accordo?
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. Ultima modifica di Dreadnought : 18-04-2005 alle 20:52. |
||
|
|
|
|
|
#48 | |||||
|
Bannato
Iscritto dal: Dec 2000
Messaggi: 2097
|
Quote:
ho detto: anche con la prima implementazione dei 90 nm di intel, A PARITA' DI CORE (e di frequenza, ovviamente) i consumi scendono. se mi prendi il northwood vs prescott sono il primo a dirti che il prescott consuma un botto di watt in più - a parità di frequenza - e per di più performa mediamente un pelo peggio il fatto che il leakage non abbia il peso di cui tu parli lo dimostrano i dati reali rilevati (link a tomshardware) come ho già detto: a parità di core il rapporto watt per GHz praticamente non cambia (mentre se la questione leakage fosse così legata agli hz da 3.2 a 3.8 avresti un'impennata notevolissima, invece cresce linearmente) Quote:
Quote:
Quote:
Quote:
|
|||||
|
|
|
|
|
#49 | |
|
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Quote:
Comunque questo è una caso assai raro e non riguarda solo il prescott, ma anche tutte le architetture pipelined... |
|
|
|
|
|
|
#50 | |||||
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
Quote:
Quote:
Quote:
Da quella tua frase si evince che per te i consumi dipendono solo dal Vcc. Quote:
Nemmeno negli ultimi post. Tu hai sempre parlato di quantità e di core differenti, ma sempre per numero di transistor e a occhio e croce mi pare una tuqestione quantitativa. Cque quando abbiamo discusso in PM di queste cose eri un attimo più calmo, non capisco perchè ora ti scaldi subito. Bah... questa l'ho vista ora... Quote:
Poi vabeh il discorso per analizzare la potenza di fino è complesso, ma un P=V*I è una buona approssimazione.
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. Ultima modifica di Dreadnought : 19-04-2005 alle 09:39. |
|||||
|
|
|
|
|
#51 | ||||
|
Bannato
Iscritto dal: Dec 2000
Messaggi: 2097
|
Quote:
tu asserivi che con la prima tecnologia a 90 nm di intel le cpu consumavano di più rispetto ai 130 nm perchè il prescott consumava più del northwood... mentre il dothan consuma di meno del banias perchè (sempre parole tue) non era esposto a problemi di leakage in virtù delle frequenze più basse io ti ho riportato dati reali sul campo dai quali si evince: - che la potenza assorbita da un prescott stesso stepping cresce linearmente con la frequenza, quindi i fenomeni di leakage non hanno una correlazione con questa - che il core del prescott ha oltre il doppio dei transistor (cache esclusa) del northwood, cosa che spiega agevolmente il motivo per cui PUR PASSANDO AI 90 nm (che dai cazzo, l'hai detto tu che a parte casi particolari un transistor a 90 nm consuma mediamente di meno di uno a 130 nm) il p4 consuma di più e tu mi vieni a dire che avrei detto che passando a 90 nm i consumi scendono indipendentemente dalla quantità e dalla qualità dei transistor? stai dicendo che io avrei detto che un itanium 2 a 90 nm da 1 miliardo di transistor consuma di meno di un rabbit (processore risc per usi embedded) da 130 nm e poi ti lamenti che mi scaldo? inizia a non fare il furbetto... quello che qui non ha preso in considerazione il parametro transistor sei tu, non sapevi nemmeno quant'era grosso il core (ripeto, senza cache) di un northwood e di un prescott Quote:
non ho parole... che faccia di bronzo! Quote:
Quote:
|
||||
|
|
|
|
|
#52 | |
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
Quote:
Cque più che altro sto dicendo che tu non stai facendo la discussione, perchè da parte mia conosco l'argomento abbastanza da tirare fuori argomentazioni, tu invece viaggi su quello che scrivo, perchè di tuo aggiungi poco e non sai supportare le tue ipotesi.
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. Ultima modifica di Dreadnought : 19-04-2005 alle 12:36. |
|
|
|
|
|
|
#53 | |
|
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Quote:
|
|
|
|
|
|
|
#54 | |
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
Quote:
Qui parlano dell'OutOfOrder execution, in pratica puo' eseguire delle istruzioni prima di altre, perchè le ottimizza in una coda che eviti più stalli possibili, pero' comunque sono eseguite una per volta. Penso sia un riordino della pipeline, più che una parallelizzazione. Poi da quanto ricordi dal penitum3 le istruzioni SSE possono essere abbinate ai registri dedicati (penso siano i registri MMX) per eseguire operazioni vettoriali che restituiscono 4 risultati, ma questo solo in alcuni casi (3d, e trasformazioni audio-video). Pero' sinceramente non trovo informazioni sul fatto che gli stage di "fetch" e "store" della pipeline possano mettere in ram (e prendere dalla ram) il risultato di tutti gli elementi dl vettore tutti in una volta o singolarmente (quindi sprecando 3 cicli). Qua c'è qualcosa: http://www.x86.org/articles/sse_pt1/simd1.htm
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. |
|
|
|
|
|
|
#55 | |
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
Quote:
Ipotizziamo che il prescott e il northwood abbiano tutti i transistor dichiarati da intel, dividi il core in 4 tipologie di transistor 1- cache 2- controllo di flusso della pipeline + branch prediction + instruction queuing&decode + store + fetch 3- unità logiche (3ALU + SSE + Simple FP + General FP) 4- transistor disabilitati (vedi EMT64) Ora quali di questi influenzano il consumo maggiormente? e soprattutto in che percentuale i milioni di transistor sono distribuiti tra le varie tipologie? Abbiamo già escluso la cache L2 che tra l'altro a grandi linee ha 24M di transistor ogni 512KB (correggetemi se sbaglio) ovvero 6transsitro per ogni Bit + un valore di overhead del 20% per l'addressing di una 8-way. Mancano le altre 3 tipologie, considerando che il northwood ha le stesse unità logiche del prescott, con qualche modifica.
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. |
|
|
|
|
|
|
#56 | |
|
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Quote:
Se due istruzioni successive sono: ADD EAX, 1 ADD EBX, 1 Entrambe sono negli stage "execute" che solitamente sono più di uno contemporaneamente... Contando inoltre che il P4 ha due ALU in teoria potrebbero avere occupato lo stesso stage (dipende dal tipo di operazione)... |
|
|
|
|
|
|
#57 | ||
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
Quote:
Add [eax],1 Add [eax],2 *con [eax] indirizzo della ram tanto per precissare la notazione nel caso non ci capiamo. Provoca uno stallo, perchè prima di eseguire [eax]+2 bisogna aspettare la fine dell'operazione [eax]+1. O anche Sqrt eax,1 Add eax,2 dovrebbe provocare uno stallo in quanto Sqrt non so se impiega 1 ciclo per essere eseguita. Quote:
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. Ultima modifica di Dreadnought : 19-04-2005 alle 14:38. |
||
|
|
|
|
|
#58 | ||
|
Bannato
Iscritto dal: Dec 2000
Messaggi: 2097
|
Quote:
nel caso del prescott, i transistor che non consumano e non vengono usati sono la cache e al max l'EMT64: dico al max perchè basta prendere i consumi di un prescott con le estensioni a 64 bit abilitate e uno senza per vedere che se l'EMT64 davvero non è alimentato anche quando disabilitato non porta nessun consumo aggiuntivo. il grosso del core prescott non è lì. comunque ti ripeto la domanda perchè ti continui ad arrampicare sugli specchi per evitare di affrontare la questione: sei d'accordo con me che il prescott consuma di più del northwood a causa della sua architettura e non a causa dei 90 nm, e che se ci fosse un northwood a 90 nm consumerebbe DI MENO di un northwood a 130 nm? Quote:
|
||
|
|
|
|
|
#59 | |
|
Bannato
Iscritto dal: Dec 2000
Messaggi: 2097
|
Quote:
|
|
|
|
|
|
|
#60 | ||
|
Senior Member
Iscritto dal: Aug 1999
Città: Vares
Messaggi: 3831
|
ho dimenticato la f
cque si capiva eh... Quote:
Per darti una idea, nelle due ALU dual pumped del Prescott sono state aggiunte delle unità per fare SHL e SHR, ma questo non vuol dire che quando fai una ADD/MUL/SUB questi transistor siano attivi, anzi... Eppure potrebbero essere 1Milione di transistor in più, ma il consumo non cambia. Pardon, non avevo letto questo: Quote:
Ci sono troppe variabili che rendono la questione del consumo non più dipendente dal Vcc come nel passato, vedi ad esempio il dothan, che consuma meno del banias a bassi clock, ma ad alti clock arriva molto vicino al consumo del suo predecessore. Prova di questo IMHO è il fatto che i progettisti intel non siano passati al core successivo producendo il northwood a 90nm. In parole povere ribadisco: i tanti milioni di transistor in più non vorrei fossero più una scelta obbligata(dalla stabilità o dai consumi o altro) più che un progetto iniziale.
__________________
Quanto tutti sono d'accordo con me ho l'impressione di avere torto. Ultima modifica di Dreadnought : 19-04-2005 alle 17:59. |
||
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 01:07.



















