May81
07-10-2005, 20:05
credo che ormai la tecnologia produttiva sia ora pronta ad integrare direttamnte on die una discreta quantità di memoria principale
facendo un ragionamento molto a "spanne" si può dire che anzichè integrare 4MB di cache di secondo livello (come nei pentium D) si potrebbe
benissimo utilizzare 1 MB (512kBx2) e lo spazio su die risparmiato utilizzarlo per 3x5 MB di memoria principale da utilizzare come buffer verso la ram di sistema.
questo perchè per realizzare un bit di cache servono 5 transistor mentre solo uno per una cella di ram quindi nello spazio di 3 MB di cache stanno 15 MB di ram
già oggi si potrebbero avere circa 16 MB di ram velocissima (anche in sincrono con la freq di clock) e con latenze di accesso veramente ridotte:
si può approssimare che gli amd grazie al memory controller integrato riducano di un fattore 2 la latenza essendo circa la metà la distanza tra memoria e cpu.
Per quei 16 MB di memoria la latenza penso potrebbe ridursi di un fattore almeno 10
Si è visto che le prestazioni migliorino molto diminuendo la latenza verso la ram (nell'architettura AMD ma credo anche nel pentium M) quindi credo che l'effetto sia notevole
mentre 2 MB di L2 cache non migliorano molto le performance anzi spesso 512kB o 256kB in alcune applicazioni sono anche meglio.
oltretutto all'nterno di un chip non si hanno grossi problemi ad aumentare il parallelismo (vedi ring da 512 bit dell'ultima versione delle gpu ati)
considerando che ci sono processori con memory controller integrato la cosa non avrebbe un costo così elevato
e con il passaggio a 65nm il tutto si potrebbe raddoppiare:
4 CPU
4x512kB di cache di secondo livello
32MB di ram buffer
direi l'ideale per il maggior bisogno di banda di un multicore...
scusate se sono un po' offtopic ma volevo sapere il vostro parere sulle mie affermazioni
secondo me è solo una questione di tempo: ricordo che sul P2 la cache era esterna...
facendo un ragionamento molto a "spanne" si può dire che anzichè integrare 4MB di cache di secondo livello (come nei pentium D) si potrebbe
benissimo utilizzare 1 MB (512kBx2) e lo spazio su die risparmiato utilizzarlo per 3x5 MB di memoria principale da utilizzare come buffer verso la ram di sistema.
questo perchè per realizzare un bit di cache servono 5 transistor mentre solo uno per una cella di ram quindi nello spazio di 3 MB di cache stanno 15 MB di ram
già oggi si potrebbero avere circa 16 MB di ram velocissima (anche in sincrono con la freq di clock) e con latenze di accesso veramente ridotte:
si può approssimare che gli amd grazie al memory controller integrato riducano di un fattore 2 la latenza essendo circa la metà la distanza tra memoria e cpu.
Per quei 16 MB di memoria la latenza penso potrebbe ridursi di un fattore almeno 10
Si è visto che le prestazioni migliorino molto diminuendo la latenza verso la ram (nell'architettura AMD ma credo anche nel pentium M) quindi credo che l'effetto sia notevole
mentre 2 MB di L2 cache non migliorano molto le performance anzi spesso 512kB o 256kB in alcune applicazioni sono anche meglio.
oltretutto all'nterno di un chip non si hanno grossi problemi ad aumentare il parallelismo (vedi ring da 512 bit dell'ultima versione delle gpu ati)
considerando che ci sono processori con memory controller integrato la cosa non avrebbe un costo così elevato
e con il passaggio a 65nm il tutto si potrebbe raddoppiare:
4 CPU
4x512kB di cache di secondo livello
32MB di ram buffer
direi l'ideale per il maggior bisogno di banda di un multicore...
scusate se sono un po' offtopic ma volevo sapere il vostro parere sulle mie affermazioni
secondo me è solo una questione di tempo: ricordo che sul P2 la cache era esterna...