|
|
|
![]() |
|
Strumenti |
![]() |
#1941 | |
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Da quel che sento insomma pare che BD ne esca un bel po' ridimensionato.
L'unità FP da 256 bit non può dividersi in due unità FP da 128bit all'occorrenza, ma piuttosto sfruttare una sorta di SMT alla intel. Il core int è meno pompato del previsto (si parlava di 4 alu classiche per core, contro le 3 degli attuali phenom), mentre in realtà sono solo due. Per fortuna poi JF ha specificato: "Phenom is 3 pipelines, shared ALU/AGU. Bulldozer is 4 pipelines, 2 dedicated to ALU, 2 dedicated to AGU. That is a LOT better, not worse". Quindi da questo punto di vista forse c'è meno di quanto atteso, ma sicuramente un bel miglioramento. Nonostante questo, pare che JF assicuri che le prestazioni per core saranno comunque superiori a quelle del k10, cosa di cui comunque non dubito dati i miglioramenti architetturali che comunque ci si può aspettare saltino fuori dopo anni di lavoro su un progetto di questo tipo. Quote:
Un singolo modulo occupa il 5% in più di area rispetto a cosa? Ad un modulo k10? Se così fosse, anche 4 moduli occuperebbero naturalmente il 5% in più di area rispetto a 4 moduli k10, e non il 20%. Cioè, se un modulo k10 occupa "100" e u core BD "105" (+5% appunto), 4 core k10 occupano 400 e 4 core BD occupano "420" (che è sempre +5%). Insomma, discorso simile a quello che sempre abbiamo fatto per le prestazioni/core. Oppure intendevi rapportare quel 5% a qualcos'altro? |
|
![]() |
![]() |
#1942 | ||
Senior Member
Iscritto dal: Nov 2002
Messaggi: 3076
|
Quote:
"Il supporto AVX a 256bit è ottenuto sfruttando in parallelo le due unità FP a 128bit, che possono essere riorganizzate per operare come 4x64bit, 2x128bit oppure 1x256bit a seconda del tipo di applicazione utilizzata." quindi può dividersi sulle prestazioni del singolo core int (due per modulo) non mi sbilancerei perchè non conosciamo le logiche più profonde di funzionamento sulle operazioni, sappiamo solo che ogni core int ha 2 unità ALU contro le 3 delle unità int del Phenom per un totale quindi di 4 unità per modulo (dati i due core int) AMD sostiene che ci sono altri "improvements" che controbilanciano l'ipotetica perdita prestazionale per singolo core int, a partire dal decoder a 4 vie (al pari di Nehalem e Sandy Bridge) dipenderà molto anche dall'efficienza dell'unità di branch prediction dato che le pipeline sono state allungate sappiamo solo che sono delle 4-issue Bobcat avrà invece pipeline a 15 stadi 2-issue Quote:
l'impatto di un core integer aggiuntivo rapportato alla superficie complessiva del die con 4 moduli, (praticamente 4 moduli + cache L3 unificata + MC + NB) è invece pari al 5% quindi 4 core int aggiuntivi per tutto il die significa una superficie superiore del 20% il che combacia perfettamente con le indiscrezioni secondo cui un modulo BD è un po' più grande di un core Phenom questo non significa però che l'area di un modulo BD sarà necessariamente pari a 1.2 volte l'area di un ipotetico core Phenom die-shrinkato a 32nm, potrebbe anche essere più piccola dato che sono sono stati semplificati alcuni componenti e ridotti di numero altri per eliminare il più possibile le ridondanze .
Ultima modifica di GT82 : 24-08-2010 alle 15:54. |
||
![]() |
![]() |
#1943 | |
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Quote:
Ultima modifica di Ren : 24-08-2010 alle 15:47. |
|
![]() |
![]() |
#1944 |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 3076
|
|
![]() |
![]() |
#1945 |
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
@GT82
Grazie ![]() Sto leggendo ora l'articolo, quindi tutto sommato sembra la situazione sia tornata alla normalità ^___^ Ultima questione, la compatibilità AM3. Spero che l'articolo chiarisca, perchè non ho ben capito se ci sarà o meno. Qualcuno prima ha accennato ad una linea compatibile con il vecchio socket, il che non sarebbe male per fornire un adeguato upgrade, almeno all'inizio, per chi ha un sistema attuale AM3. |
![]() |
![]() |
#1946 | |
Senior Member
Iscritto dal: Jan 2007
Città: Prato
Messaggi: 1789
|
Quote:
![]()
__________________
Mercatino: 62/62 Trattative conlcuse positivamente! |
|
![]() |
![]() |
#1947 | |
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Quote:
![]() Un unico scheduler che smista allo slot di competenza con relativa alu annessa. In breve un design flessibile che condivide gli slot con integer,fp e simd. Ultima modifica di Ren : 24-08-2010 alle 16:35. |
|
![]() |
![]() |
#1948 |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 3076
|
Grazie
in rete ho trovato questo, tratto da un articolo su BD dove viene confrontato con Nehalem "[....]Like with Intel’s Nehalem, the two integer sub-cores work with 4 parallel pipelines, the floating-point part occupies two of the pipelines, each one of which is capable of 128-bit FMAC operations (multiplication and addition in one step)." sulla carta quindi non sembrano esserci differenze sulla FPU scrivo pure le latenze della cache sempre di Nehalem L1 --> 4 cicli di clock L2 --> 10 cicli L3 --> 39 cicli .
Ultima modifica di GT82 : 24-08-2010 alle 16:46. |
![]() |
![]() |
#1949 | |
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Quote:
|
|
![]() |
![]() |
#1950 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
Comunque c'è qualche cosa che non mi torna...
Ci sono schemi di Buldozer con Northbridge integrato e no. Ci sono date tipo Q2-Q3 che sarebbero troppo in là con i tempi... però potrebbero coincidere nel caso Buldozer sia fatto in 2 versioni, una "classica" con compatibilità AM3+ ed una basata su un altro socket, stile Llano e nel qual caso, Buldozer AM3+ dovrebbe uscire prima. Inoltre a me sembra di ricordare che il 22nm GF l'avrebbe fissato per la prima metà del 2012, quindi sarebbe ipotizzabile un procio basato sul 22nm a fine 2012, non vedo sinceramente la logica di offrire un Buldozer a fine 2011... Inoltre... se fosse così praticamente un X6 45nm low-k sarebbe il modello di punta per 3Q su 4? Ma su queste basi... AMD avrebbe potuto "aggiustare" un Thuban al 32nm e comunque andare più su con il clock e forse aggiungere 2 core, tanto per fargli fare il tappabuchi. Certo, non sarebbe un anti-SB, ma comunque già aumentare di 400MHz il clock stock e magari di un 33% l'IPC per 2 core in più, si sarebbe reso appetibile posizionandosi in mezzo tra un i7 X4 e un i7 X6 molto appetibile sul fatto prezzi. Poi non capisco il fatto che le nuove AM3 che a sto punto dovrebbero essere fatte unicamente per il Thuban (se si rivelasse che non supporterebbero il Buldozer) abbiano così tanti prb per riportare le esatte temp e tensioni... del Thuban. Inoltre non vedo la logica che AMD e Asus abbiano software che supporterebbero 8 core già da aprile c.a. quando Buldozer si teorizza uscirà tra 11 mesi? E' troppo discordante il tutto...
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 Ultima modifica di paolo.oliva2 : 24-08-2010 alle 16:51. |
![]() |
![]() |
#1951 |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 3076
|
Intendevo il discorso dei bit e dell'organizzazione, poi chiaro che quando si passa ad analizzare le prestazioni (in questo caso mi riferisco sempre alla sola FPU) ci sono molte altre variabili che possono fare la differenza giusto?
|
![]() |
![]() |
#1952 | |
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Quote:
Ultima modifica di Ren : 24-08-2010 alle 16:54. |
|
![]() |
![]() |
#1953 |
Senior Member
Iscritto dal: Jul 2006
Messaggi: 1071
|
Quindi nessun approccio SMT, c'è solo una unità floating point condivisa tra due core ma capace di processare due threads, quindi siamo sempre li, un thread per core, sono un pò deluso. L'aspetto che non mi piace è che considerano un modulo composto da due core, ma non sono due core veri e proprio. E' vero, non conosco i numeri di BD però secondo me AMD sta facendo un grande errore, anche perchè lo spazio in più occupato da un modulo BD rispetto ad un K10.5 non è molto e potrebbero benissimo fare un X4-X8 con 4-8 moduli capaci di processare 8-16 threads...vabbè staremo a vedere
__________________
1°Pc: AMD Athlon II X4 630@3.4GHz - Asus M4A78T-E-2*2gb Kingston ddr3 1333MHz CL9@1620MHz 7-8-8-20-1T - SAPPHIRE HD4850 512mb - hd Segate sata2 400gb-hd maxtor ide 80gb-Ali modulare Perdoon 500W - IIYAMA ProLite B2403WS 2°Pc: AMD Opteron 1210- MSI K9AGM3-2*1Gb ddr2 800mhz Corsair xms2 DHX-hd WD 160gb-X850XT PE |
![]() |
![]() |
#1954 | |
Senior Member
Iscritto dal: Nov 2002
Messaggi: 3076
|
Quote:
cioè son tre anni che siamo qui con la Star (K10) che a sua volta era arrivata in ritardo dopo praticamente 4 anni di sonno profondo ok, il Phenom II che è stato migliorato, il 45nm, poi quest'anno i Thuban con il low-k tutto quello che volete ma trovarsi qui adesso a parlare di BD con le enormi aspettative che si porta dietro e pensare che potrebbe arrivare sugli scaffali tra un anno mi viene da piangere veramente un po' come il Phenom II, il fatto che arrivò con un anno di ritardo lo declassò subito da ottimo a buon processore, visto che nel frattempo gli altri si erano riportati avanti aggiungiamo poi che Intel ha avuto dei ritardi, Westemere arrivato dopo, lo stesso SB posticipato di circa 4-6 mesi e AMD non riesce a trarne vantaggio per ridurre il ritardo che si porta dietro? |
|
![]() |
![]() |
#1955 | |
Senior Member
Iscritto dal: Aug 2009
Città: san giovanni la punta (CT)
Messaggi: 1994
|
Quote:
__________________
Phenom II X6 1055T @4 cooled by EK Supreme HF 240 ![]() ![]() ![]() |
|
![]() |
![]() |
#1956 | |
Bannato
Iscritto dal: Oct 2005
Città: In giro per il mondo
Messaggi: 5824
|
Quote:
Amd invece ha intrapreso la strada di un modulo 2 thread, che anche se può sembrare la stessa cosa di fatto non lo è: Dove prima si occupava una superfice con 12 core adesso lo si fa con 16 (per via della fpu condivisa) con una potenza effettiva che va da una parità assoluta (in casi estremi di calcoli prettamente il fp) fino al 33% in più nei casi migliori. Tutto questo considerando i core con stesso ipc. Praticamente un bel salto prestazionale, in attesa di una apu da integrare in bd. |
|
![]() |
![]() |
#1957 | |
Senior Member
Iscritto dal: Oct 2001
Messaggi: 14736
|
Quote:
Siamo passati da un core FP con SMT ad un core capace di processare indipendentemente fino a 4 istruzioni a 64 bit (o due da 128, o una da 256). Questo approccio mi sembra decisamente più efficace: SMT è comunque un modo di organizzare le operazioni da dare in pasto all'unità FP, mentre l'approccio attuale consente di mandarne in esecuzione fino a 4 insieme. Tutto questo ovviamente nel dubbio di non aver capito una mazza di come dovrebbe funzionare. |
|
![]() |
![]() |
#1958 |
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24169
|
Aggiornato la prima pagina sull'architettura bulldozer...
Più tardi posto anche quella di bobcat...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
![]() |
![]() |
#1959 | |
Senior Member
Iscritto dal: Aug 2009
Città: san giovanni la punta (CT)
Messaggi: 1994
|
Quote:
![]()
__________________
Phenom II X6 1055T @4 cooled by EK Supreme HF 240 ![]() ![]() ![]() |
|
![]() |
![]() |
#1960 | |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
Quote:
![]() Però, tieni conto che Buldozer EV girano da 4-5 mesi, che GF si era dichiarata pronta per produzione in volumi del 32nm da novembre (cioè tra 2 mesi), chiunque avrebbe pensato che tra gennaio e al limite aprile Buldozer ci sarebbe stato. E poi, sinceramente, ancora non è detto che effettivamente i tempi slittino così tanto. Dipende come si interpretano le date. AMD, dalla brutta figura del Phenom I, ormai è abituata a dire "entro" e non "dal", perché con "entro" può sempre anticipare (facendo anche bella figura) mentre con "dal" in caso di ritardo ci fa sempre una figura di merda. Inoltre, a questo punto, non capisco nemmeno il senso di divulgare il funzionamento del Buldozer con 12 mesi di anticipo sulla commercializzazione? E a che mazza serve l'NDA? Secondo me la data precisa la sapremo alla conventions GF sul punto della produzione e stato del silicio.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 |
|
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 05:51.