View Single Post
Old 06-12-2008, 01:20   #18605
astroimager
Senior Member
 
L'Avatar di astroimager
 
Iscritto dal: Apr 2005
Città: MC
Messaggi: 7642
Quote:
Originariamente inviato da Pihippo Guarda i messaggi
... Essendo lo shangai uscito da tempo, non avendo trovato review che mi dicano cosa hanno cambiato nel 45nm, e dubitando, per quello che ne capisco io che il 65nm andava piano solo per i bug e per la L3 lenta, vorrei sapere se qualcuno tra voi, molto più competenti di me, c'ha capito un' H su che cavolo hanno fatto nello shrink, perchè, non per essere pessimista, anzi da quello che ho capito, sempre io, se non hanno fatto qualche tweaks a livello di come il procio trova informazioni (fetching e probing nella cache) e nel prefetch in generale, il 45nm non mi sembra sarà, a livello di ipc, molto superiore al b3. Ora non sono un esperto, ma mi interessa questo aspetto della tecnologia, chiunque sappia qualcosina di più,liberissimo di bollare come "cassate" quello che ho detto, cosi magari ci capisco qualcosa in più pure io.
Dunque, sto cercando anch'io di capire cosa hanno combinato in questo shrink, e come sono giustificabili i benefici. Non ho però competenza tecnica sufficiente per spiegarti in dettaglio, ma ti riporto un pezzo di Tech Report:

"Most of Shanghai's additional transistors (versus Barcelona) come from its expanded L3 cache, whose performance benefits for many server-class workloads should be fairly obvious. A number of logic changes, many of them cache-related, consume fewer transistors but promise additional benefits. For example, along with the larger cache comes an enhanced data pre-fetch mechanism. This logic attempts to recognize data access patterns and speculatively loads likely-to-be-needed data into cache ahead of time. As caches grow, pre-fetch algorithms often become more aggressive. Shanghai can also probe the L1 and L2 caches in its cores for coherency information twice as often as Barcelona, which gives it double the probe bandwidth. This provision should be particularly helpful when a core has lowered its clock speed to conserve power while idle.

In order to make sure its larger caches don't cause data integrity problems, AMD has built in a new feature it calls L3 Cache Index Disable. This feature allows the CPU to turn off parts of the L3 cache if too many machine-check errors occur. This capability will apparently require OS-level support, and that's not here quite yet. AMD expects "select operating systems" to bring support for this feature next year."
astroimager è offline