Quote:
Originariamente inviato da astroimager
Vorrei capire su che ragionamento "concreto" ti basi, però... cioé, per es. hai fatto dei calcoli sulla richiesta di banda delle applicazioni più stressanti desktop fatte girare a 4 e più GHz, e hai fatto altrettanti calcoli sull'architettura "core" verificando che a queste frequenze non è più in grado di garantire questa banda?
I quad accroccati da 8 MB di L2 hanno FSB 1066 MHz (Q6xx0, 65nm), quelli da 12 MB sono 1333 (Q9xx0, 45nm)... l'incremento di performance, nelle apps che non sfruttano le SSE4, è davvero trascurabile... per quanto vuoi caricare in maniera pesante la CPU, da sola secondo me subisce uno strozzamento trascurabile... certo a frequenze elevatissime, su apps fortemente multi-th, il discorso potrebbe cambiare... ma c'è anche da capire quanto tutto ciò incide nella vita di tutti i giorni.
La maggior parte degli utenti ha un raffreddamento ad aria, quindi diciamo che sta sotto i 4 GHz anche in OC, qualsiasi quad a 45nm si prende in considerazione. Usando rendering, editing video, compressione file, e altre applicazioni che caricano pesantemente i quad, io sono convinto che i risultati sono più dominati dall'ottimizzazione software, le SSE, le capacità specifiche su interi o FP, etc...
In ambito server i Penryn sono effettivamente strozzati (per quanto l'esacore mi pare si difendeva molto bene nei database), ma nel desktop questa cosa, se c'è, è minima. Il modo di lavorare di questi due mondi è molto ma molto diverso, e cambia un po' anche l'architettura esterna (c'è molto più uso di HT, c'è DC,...). Non a caso il K10 è un'architettura concepita per server, la versione desktop è solo una derivazione...
|
Io ho cercato di capire se ci fosse una formula, tipo X dati elaborano i proci, X dati VGA, HD, e menate varie, e alla fine diciamo si potrebbe arrivare a un determinato valore.
Io parto da questo... la banda del Core2 è 1/3 di quella del Phenom.
Inoltre non è interamente dedicata alla memoria, ma in quella banda c'è TUTTO.
Nel Phenom, per VGA e I/O c'è l'HT che è usato unicamente per quello.
Io devo capire, e mi sembra razionale, che quando AMD ha capito che i suoi proci potevano pompare sui 4GHz e più, ha sentito la necessità di alzare sia il clock dell'NB che il clock dell'HT, e qui si parla del 3.1.
1) Allora, possibile che un AMD che ha praticamente un canale dedicato all'I/O ed un canale per le ram 3 volte più veloce del Core2 abbia questa necessità ed un Core2 non ne abbia?
2) I 6 MB di cache e i 12MB di cache non li hanno messi per fare i belli, ma li hanno messi per fare da serbatoio appunto per reggere i 3,2GHz.
Ma perché Intel non butta fuori i 3,4-3,6GHz? Perché probabilmente i 12MB di cache non basterebbero e ce ne vorrebbero 18 o addirittura 24MB.
3) C'è un altro problema... la velocità delle ram non è un toccasana, perché altrimenti un Core2 con le DDR3 avrebbe maggior IPC... secondo me siamo quasi al massimo che il transfer può dare e aumentare il clock dei core non direbbe nulla.
Fare i bench o quant'altro non dice nulla, perché durante i bench la banda è solo per la ram, ed è sufficiente, quindi il bench ti darebbe un IPC lineare. Diverso quando sei nella pratica, cioè che in quel canale ci passa tutto, allora si lo riempi... ed è quello che succede agli Xeon in ambito server.
Chiaro che lì siamo in server, ma è anche chiaro che lì "lavoriamo" a 2,5GHz, max 3,2Ghz... ma quando tu occhi un procio a 4GHz, 4,5GHz, perché i core lavorino bene, gli devi dare il doppio..., e se Intel non ha problemi di silicio, non potrebbe essere per questo? Cioé non è che non vuole ma non può salire di frequenza...
Intel con il Nehalem non ha problemi, ma se guardi la sua banda, quella del Core2 sembra un giocattolino per bambini...
probabilmente ci saranno dei test tipo il TDP o similari, in cui un modello di cpu deve garantire determinate prestazioni e non vincoli... come potrebbe essere lo Shanghai che viene commercializzato a 2,7GHz e non a 3GHz...
In ogni caso... se Intel non butta fuori un Penryn a 3,4GHz, e se vuoi un mio parere, il nehalem è un gran procio, ma costa un tot al momento il sistema completo, perché le DDR3 costano un totale ed idem le mobo, ed il margine di guadagno rispetto ad un Penryn non è elevato nell'uso casalingo.
Allora, in questa situazione in cui il Nehalem potrebbe rimanere fermo almeno per altri 6 mesi, il Phenom pompa, Intel se potesse dovrebbe buttare fuori immediatamente un 3,4GHz o 3,6GHz, e ci deve essere un problema valido. Se il TDP non è un problema, l'OC non è un problema, il silicio non è un problema... dove è sto problema? Allora prova a pensare che il problema sia la sua banda che non è sufficente... ma qui stiamo parlando solo di 200MHz in più, 3,4GHz, max 3,6GHz... e noi parliamo di OC sui 4GHz, 4,5GHz, 5GHz... siamo su un altro pianeta... inoltre, se hai notato, ad ogni 200MHz in più Intel ha sempre applicato un aumento di FSB.... questo ti potrebbe far pensare che ha sempre cercato di potenziare l'I/O in contemporanea con il clock procio. Ma quando tu occhi, l'aumento di banda non lo crei mica....
Se Intel giudica il massimo 3,2GHz per l'architettura, prova a fare sta scaletta...
2,4GHz = banda FSB XXX e cache XXX.
2,6Ghz = banda FSB XXX e cache XXX
2,8Ghz = banda FSB XXX e cache XXX
3,0Ghz = banda FSB XXX e cache XXX
3,2GHz = banda FSB XXX e cache XXX
3,4GHz
3,6GHz
3,8GHz
4,0GHz
4,2GHz
4,4GHz
4,6GHz
4,8GHz
5,0GHz
Prova a riempire le XXX con le frequenze lineari di FSB e cache proporzionate a quelle che Intel via via ha incrementato... e dimmi che valori ti trovi sui 4-4,5Ghz... e prova a pensare.
Certo, per SPI o similari non dice nulla... come se hai il procio a 5GHz e cazzeggi per internet non hai il collo di bottiglia, certo, ma i 5Ghz che ti servono in quel momento? Come del resto un bench ipotetico su un gioco non è giocarci veramente....
Con i bench non si riesce a verificare ciò... quindi ci vorrebbe un qualche cosa di intensivo che faccia realmente lavorare il procio come in una situazione reale e non una forma scarna tipo bench.
P.S.
Se hai notato, post addietro io ho chiesto se la banda del Phenom II era sufficiente per non creare colli di bottiglia sui 4,5Ghz... Se ho dei dubbi con il Phenom che praticamente nel totale è 4 volte quella del core2... mi puoi capire,