[Thread Ufficiale] Aspettando Bulldozer *leggere prima pagina con attenzione* [Archivio] - Pagina 10

papafoxtrot

27-08-2010, 22:52

Allora, se mettiamo che il wall sia a più di 1GHz rispetto al clock max turbo (potrebbe essere anche di più, visto che il Thuban è 3,6GHz stock turbo e a 4,610 non ha minimamente nessun wall, se per te BD avesse un wall a 4,5Ghz (come hai scritto) che clock avrebbe massimo in turbo? 3,5GHz? Mo che si fa? Clock inferiore a Thuban?
Scusa.... ma ti da' tanto fastidio che AMD superi in clock l'Intel?

A dire la verità stavo appunto ipotizzando un wall sui 5GHz ed una frequenza in thurbo boost sui 4,5.
In realtà la frequenza in TB non è un grosso problema. Perché non è la frequenza reale della CPU: Se io overclocco parto sempre dagli ipotetici 3,5GHz.
Per cui è anche possibile un wall sui 4,8GHz, sempre con frequenza a 4,5 in TB e 3,5 normale.
Come vedi non sto ipotizzando un turbo boost inefficace (1GHz di guadagno è parecchio, perché bisogna che il chip sia molto buono... ogni core deve reggere una simile frequenza, e il limite deve essere solo il consumo complessivo).
Non sto neanche ipotizzando frequenze maggiori per intel rispetto ad AMD. Intel ha già dichiarato che i top di gamma dei suoi quad core arriveranno a 3,8GHz.

Si, però se permetti il tuo pensiero, almeno mi è parso sino ad ora, è che l'IPC sarà simile al K10, il clock pure... ed invece su SB prevedi clock belli superiori agli attuali, IPC che aumenta e di un tot.... mi sembra che fai discorsi di parte.

Non è vero neanche che ipotizzo un IPC uguale a thuban. Come ti ho detto ieri sono pervenuto grosso modo ai tuoi stessi range, ipotizzando un BD più veloce di thuban di una quantità che può variare dal 40% al 90%. Vedo che tu hai ipotizzato un 40-80... non credo di essere più pessimista di te!

Allora, TUTTE le riviste riportano che il turbo in BD sarà più spinto. Ora... se un Thuban arriva a + 600MHz (a parte che con il B.E. il vantaggio del turbo lo si setta come si vuole, posso assegnarhli anche +1GHz), possiamo pensare che almeno sia +800MHz?
Ammesso e concesso che BD parta a 3,5GHz, pensi che con il CTI non aumenterà mai il clock? O è solo prerogativa di Intel? Allora... se nasce a 3,5Ghz, si suppone che almeno 200MHz crescerà con il tempo... quindi a quel punto con il clock base a 3,7GHz + il turbo arriverebbe a 4,5GHz, impossibile per il wall. Ma li hai presi per deficienti i tecnici AMD? Se il wall è di 1GHz superiore rispetto al clock massimo (Turbo) + eventuali aumenti di clock per il CTI, mi sembra chiaro che il wall se ci sarà dovrebbe essere sopra i 5,5GHz.
Ma non è vero! Leggi sopra! Cil che penso è che il wall non sarà sopra i 5GHz!" Perché vorrebbe dire aver dimensionato i transistor per i 5GHz, quando in realtà il procio andrà a 3,5 per la maggior parte della sua vita!
Solo questo volevo dire!

B|4KWH|T3

27-08-2010, 23:07

Ma io parlo di desktop infatti, LGA 2011 è il socket che sostituirà LGA 1366 di ora e di sicuro all'uscita (Q3 2011) avranno processori a 6 core con cui AMD dovrà per forza confrontarsi.

Se è un programma è così pesantemente orientato al multithreading, allora sei così sicuro che i 6 reali + 6 virtuali siano così superiori agli 8 reali di AMD?

bjt2

27-08-2010, 23:19

La grandezza dei transistors determina la corrente massima che possono erogare e quindi il click massimo. Fare un transistor più grande occupa un po' più di area. Siccome Buldozer avrà tantissimi sistemi di risparmio energetico e quindi potenzialmente permetterebbe turbo stratosferici e inoltre siccome nel monothread conta il clock, io credo che sarà dimensionato almeno per clock di 5GHz (con 4.5-4.6 max in turbo). Questo perchè sarebbe assurdo non farlo visto il processo che AMD si ritrova... ;)

Athlon 64 3000+

27-08-2010, 23:25

Posso dirvi che SB avrà un aumento di IPC del 10% rispetto a Lynfield e che quindi non ci sarà un salto netto come è stato dal core 2 quad e Core i7.
Quindi AMD sia con Llano e Buldozer si puà giocare bene le carte.
Llano anche se non sarà veloce come SB avrà comunque la parte grafica nettamente superiore e quindi sarà più equilibrato come APU.

paolo.oliva2

27-08-2010, 23:29

A dire la verità stavo appunto ipotizzando un wall sui 5GHz ed una frequenza in thurbo boost sui 4,5.
In realtà la frequenza in TB non è un grosso problema. Perché non è la frequenza reale della CPU: Se io overclocco parto sempre dagli ipotetici 3,5GHz.
Per cui è anche possibile un wall sui 4,8GHz, sempre con frequenza a 4,5 in TB e 3,5 normale.
Come vedi non sto ipotizzando un turbo boost inefficace (1GHz di guadagno è parecchio, perché bisogna che il chip sia molto buono... ogni core deve reggere una simile frequenza, e il limite deve essere solo il consumo complessivo).
Non sto neanche ipotizzando frequenze maggiori per intel rispetto ad AMD. Intel ha già dichiarato che i top di gamma dei suoi quad core arriveranno a 3,8GHz.
Non è vero neanche che ipotizzo un IPC uguale a thuban. Come ti ho detto ieri sono pervenuto grosso modo ai tuoi stessi range, ipotizzando un BD più veloce di thuban di una quantità che può variare dal 40% al 90%. Vedo che tu hai ipotizzato un 40-80... non credo di essere più pessimista di te!
Ma non è vero! Leggi sopra! Cil che penso è che il wall non sarà sopra i 5GHz!" Perché vorrebbe dire aver dimensionato i transistor per i 5GHz, quando in realtà il procio andrà a 3,5 per la maggior parte della sua vita!
Solo questo volevo dire!
Scusa... magari mi spiego male. Se tu ipotizzi il massimo clock 3,5GHz... lo consideri già in turbo?
Il calcolo dello spazio tra i transistor lo devono fare rispetto la massima frequenza, che non è quella stock, ma quella turbo.
Ma tu continui a riportare che andrà a 3,5GHz... questo non lo capisco.

Esempio Thuban:
Clock stock = 3,2GHz Nessun wall almeno sino a +1,4GHz (4,6GHz)
Clock turbo = 3,6GHz +1GHz.

Il wall potrebbe essere a 4,7 o più, visto che su extremesystem sono arrivati a 4,650GHz a liquido senza trucchi, in quanto il Vcore era 1,650V. Se l'avessero raffreddato sotto lo zero, il Vcore diminuirebbe drasticamente.

Questo lascia lo spazio a modelli futuri, visto che il CTI sta facendo il suo lavoro ed il procio a mano a mano richiede meno Vcore per le stesse frequenze.
Se fosse possibile un 3,4GHz a 125W, potrebbe esserci pure il 3,6GHz a 140W (visto che ufficialmente AMD l'aveva messo in scaletta).
E questo rientra nel fatto che il wall non disturberebbe di certo, visto che se si adottasse sempre i +400MHz del Turbo, si arriverebbe a 4GHz e il wall fino a 4,650GHz non si è visto.

La stessa cosa si avrebbe per BD.

papafoxtrot

27-08-2010, 23:29

Se è un programma è così pesantemente orientato al multithreading, allora sei così sicuro che i 6 reali + 6 virtuali siano così superiori agli 8 reali di AMD?

Lui non è mica sicuro... Sta solo rispondendo a chi dice che gi bulldozer X8 si confronteranno con sandy bridge a 4 core e 8 thread.
Ciò è ovviamente un fregnaccia, perchP intel ha in programma SA a 6 e 8 core, e BD deve come minimo raggiungere i SB a 6 core. QUesto sta dicendo! Mica dice che non ce la farà!

Qualcuno qui sopra dice che confrontare per numero di core è sbagliato.
Può esserlo, si possono considerare altre variabili tra le quali i costi di produzione o i prezzi di vendita.
Ma bisogna considerare quella che è l'offerta dell'uno e dell'altro.
Dato che Intel venderà CPU a 6 e 8 core, bisogna che AMD, se vuole vendere degli 8 core, li faccia potenti.
Se vuole fare tanti core economici, nessun problema per me, ma bisogna che ne faccia tanti! Siccome AMD ne fa 8 di core, bisogna che questi 8 se la vedano coi 6 di intel.
Per questo si confronta per numero di core.
Inoltre si deve considerare il single thread. Se io ho 8 core e intel 4 e andiamo uguale in multi thread, quando passiamo al single thread io vado la metà di intel... E purtroppo sono pochi oggi i software usati dagli utenti desktop che sfruttano 8 core.
Certo ci sarò il turbo boost. Certo ce l'ha anche intel.

Insomma non diamo la cosa per scontata, e non pensiamo sempre che chi esprime dubbi su queste valutazioni sia un pessimista. La mia valutazione non è pessimista. Io confido che i sandy bridge 6c saranno a portata di mano. Ma non lo do per scontato. Intel sta migliorando un'architettura molto potente, molto versatile, e anche economica da produrre, visto che un core nehalem (4 core, HT e baracca varia) occupa poco meno silicio di un core deneb, mentre un core thuban è decisamente più grande e dunque costa di più. E il SOI + low-k non te lo regalano.

Insomma non diamo le cose per scontate... E non vendiamo Llano come il c hip del futuro... Sandy bridge sta arrivando col suo bravo chip video integrato ondie con L3 condivisa, tanto come Llano.

paolo.oliva2

27-08-2010, 23:43

La grandezza dei transistors determina la corrente massima che possono erogare e quindi il click massimo. Fare un transistor più grande occupa un po' più di area. Siccome Buldozer avrà tantissimi sistemi di risparmio energetico e quindi potenzialmente permetterebbe turbo stratosferici e inoltre siccome nel monothread conta il clock, io credo che sarà dimensionato almeno per clock di 5GHz (con 4.5-4.6 max in turbo). Questo perchè sarebbe assurdo non farlo visto il processo che AMD si ritrova... ;)

Ops, era la grandezza non la distanza... :D

Infatti...
AMD DEVE ottenere un procio potente, la potenza è ottenuta con IPC X clock.
Se il suo silicio permetterà clock alti, non vedo il perché lo si debba castrare facendo transistor più piccoli... visto che comunque la superficie del die è piccola e quindi non sorgono problemi di alti costi di die a wafer.

affiu

27-08-2010, 23:44

io capisco che non sono un ingegnere ma mi domando e mi ridomando sempre la stessa cosa:

software o non software ,ma perche su apu ontario un gioco in dx11 e di ultima generazione gira(anche se non velocemente)?siamo cmq nella fascia bassa,giusto?eppure gira...forse è stato scritto anche per apu?...non credo!

non saranno (bulldozer & bobcat ) due facce della stessa medaglia?

nel senso che come nella fascia bassa (portatili ed ultraportatili, sarà gia 1 da un punto di vista potenza/watt) sono soli ,forse nella versione piu arricchita e pompata di bulldozer sara dello stesso scenario....chi puo saperlo

dopotutto sono tranquillo ,perchè nel peggiore dei scenario ha la sempre carta interlagos,...che all'occorrenza lo potrabbero proporre per desktop(vista la similarità architetturale).... che tutto sommato altro che core inutili sarebbero...pure per il desktop sarebbero sfruttati

di una cosa solo sono sicuro ,sogno di averlo visto , che su cinebench e su questo forum ,qualcuno:D in maniera facilotta sfondera con uno zambezi x8 in overclock spinto i 20 pts

non aldisotto....potete stare tranquilli ,poi il resto avra solo poca importanza

pensate che se mister Paolo ha fatto 8 con thuban ,il doppio thuban farebbe circa (solo per questioni di matematica) 16...praticamente siamo vicino ai 20

ma (sempre di amd parlando) bulldozer x8 ,con tutto il possibile fatto ,sia come frequenza ,che memorie ,che raffreddamento + ottimizzazioni varie

sforerà i 20 pts....ma nostante questo accadra ,accentuera l'incredulita e l'inutile macchiamento su apu e ...e ... tutto sarà piu magico e disperato!

pensate a llano su cinebench, cosa farebbe .....forse i 10 pts ad occhi chiusi?...che ne pensate?

malmo

27-08-2010, 23:44

Lui non è mica sicuro... Sta solo rispondendo a chi dice che gi bulldozer X8 si confronteranno con sandy bridge a 4 core e 8 thread.
Ciò è ovviamente un fregnaccia, perchP intel ha in programma SA a 6 e 8 core, e BD deve come minimo raggiungere i SB a 6 core. QUesto sta dicendo! Mica dice che non ce la farà!

Qualcuno qui sopra dice che confrontare per numero di core è sbagliato.
Può esserlo, si possono considerare altre variabili tra le quali i costi di produzione o i prezzi di vendita.
Ma bisogna considerare quella che è l'offerta dell'uno e dell'altro.
Dato che Intel venderà CPU a 6 e 8 core, bisogna che AMD, se vuole vendere degli 8 core, li faccia potenti.
Se vuole fare tanti core economici, nessun problema per me, ma bisogna che ne faccia tanti! Siccome AMD ne fa 8 di core, bisogna che questi 8 se la vedano coi 6 di intel.
Per questo si confronta per numero di core.
Inoltre si deve considerare il single thread. Se io ho 8 core e intel 4 e andiamo uguale in multi thread, quando passiamo al single thread io vado la metà di intel... E purtroppo sono pochi oggi i software usati dagli utenti desktop che sfruttano 8 core.
Certo ci sarò il turbo boost. Certo ce l'ha anche intel.

Insomma non diamo la cosa per scontata, e non pensiamo sempre che chi esprime dubbi su queste valutazioni sia un pessimista. La mia valutazione non è pessimista. Io confido che i sandy bridge 6c saranno a portata di mano. Ma non lo do per scontato. Intel sta migliorando un'architettura molto potente, molto versatile, e anche economica da produrre, visto che un core nehalem (4 core, HT e baracca varia) occupa poco meno silicio di un core deneb, mentre un core thuban è decisamente più grande e dunque costa di più. E il SOI + low-k non te lo regalano.

Insomma non diamo le cose per scontate... E non vendiamo Llano come il c hip del futuro... Sandy bridge sta arrivando col suo bravo chip video integrato ondie con L3 condivisa, tanto come Llano.

imho sbagliato, si confronta sempre e solo per prezzo e consumo. Se una cpu amd a 18000 core va più (per la maggior parte degli utilizzi/tutti gli utilizzi)di una intel a 4 core a parità di prezzo e il tdp è quello, amd ha un prodotto più valido di intel, altrimenti no.
Non ha senso dire amd a 8 core va come l'intel a 6 core, che magari costa pure 50 euro in più, e allora amd fa cagare. Sono architetture diverse il confronto spiccio core contro core, imho non ha più senso.

ps: il confronto tra chip video intel e amd non è neanche da fare per quanto sono indietro quelli di intel.

papafoxtrot

27-08-2010, 23:45

Scusa... magari mi spiego male. Se tu ipotizzi il massimo clock 3,5GHz... lo consideri già in turbo?
Il calcolo dello spazio tra i transistor lo devono fare rispetto la massima frequenza, che non è quella stock, ma quella turbo.
Ma tu continui a riportare che andrà a 3,5GHz... questo non lo capisco.

Esempio Thuban:
Clock stock = 3,2GHz Nessun wall almeno sino a +1,4GHz (4,6GHz)
Clock turbo = 3,6GHz +1GHz.

Il wall potrebbe essere a 4,7 o più, visto che su extremesystem sono arrivati a 4,650GHz a liquido senza trucchi, in quanto il Vcore era 1,650V. Se l'avessero raffreddato sotto lo zero, il Vcore diminuirebbe drasticamente.

Questo lascia lo spazio a modelli futuri, visto che il CTI sta facendo il suo lavoro ed il procio a mano a mano richiede meno Vcore per le stesse frequenze.
Se fosse possibile un 3,4GHz a 125W, potrebbe esserci pure il 3,6GHz a 140W (visto che ufficialmente AMD l'aveva messo in scaletta).
E questo rientra nel fatto che il wall non disturberebbe di certo, visto che se si adottasse sempre i +400MHz del Turbo, si arriverebbe a 4GHz e il wall fino a 4,650GHz non si è visto.

La stessa cosa si avrebbe per BD.

Ovviamente no, forse non mi sono spiegato. Intendo: la CPU avrà un clock default di 3,5GHz e in TB potrebbe prendere i 4,5. A questo punto il wall secondo me sarà tra i 5GHz e poco sotto.
Questo perché intanto comunque quando overclocchi parti a occare da 3,5, per cui quando arrivi a 4 e mezzo, inutile contarsela... ne hai abbastanza! I migliori a liquido faranno i loro 4,8-5GHz e chi ha l'azoto liquido pompa di brutto.
E poi perché comunque la CPU ha il suo default ai 3,5GHz (sempre ipotetici), per cui inutile fare una CPU che per lo più va a 3,5, e mettergli i transistor da 5GHz. E' come prendere la panda, che in media farà 50kmh tutta la vita, e metterci l'estrattore sul ventre o l'alettone estraibile, perché ai 180 in autostrada da maggiore stabilità...
Non so se mi spiego, ovviamente la mia è un esagerazione.

La mia stima comunque è quella che ho detto ormai alcune pagine fa.
C'è qualcuno che farebbe una bella risk analysys su quelle che potrebbero essrere le prestazioni? Mettiamo in input una curva gaussiana per la densità di probabilità della bontà del processo, una curva per la densità di probabilità del TDP, basandosi sull'indicazione "raddoppiano i core con +12% di area occupata), grosso modo dovrebbe uscire una gaussiana per la frequenza con picco di probabilità sui 3,5GHz e una gaussiana per l'IPC, con picco di probabilità +15% rispetto a thuban, basandosi sull'indicazione di JF-AMD (+50% con il 33% di core in più).
Secondo me viene fuori una curva di densità di probabilità con un picco sul +50-60% rispetto a Thuban, che vuol dire superare core i7 980x e quindi arrivare li li con SB a 6 core.

paolo.oliva2

27-08-2010, 23:50

Lui non è mica sicuro... Sta solo rispondendo a chi dice che gi bulldozer X8 si confronteranno con sandy bridge a 4 core e 8 thread.
Ciò è ovviamente un fregnaccia, perchP intel ha in programma SA a 6 e 8 core, e BD deve come minimo raggiungere i SB a 6 core. QUesto sta dicendo! Mica dice che non ce la farà!

Qualcuno qui sopra dice che confrontare per numero di core è sbagliato.
Può esserlo, si possono considerare altre variabili tra le quali i costi di produzione o i prezzi di vendita.
Ma bisogna considerare quella che è l'offerta dell'uno e dell'altro.
Dato che Intel venderà CPU a 6 e 8 core, bisogna che AMD, se vuole vendere degli 8 core, li faccia potenti.
Se vuole fare tanti core economici, nessun problema per me, ma bisogna che ne faccia tanti! Siccome AMD ne fa 8 di core, bisogna che questi 8 se la vedano coi 6 di intel.
Per questo si confronta per numero di core.
Inoltre si deve considerare il single thread. Se io ho 8 core e intel 4 e andiamo uguale in multi thread, quando passiamo al single thread io vado la metà di intel... E purtroppo sono pochi oggi i software usati dagli utenti desktop che sfruttano 8 core.
Certo ci sarò il turbo boost. Certo ce l'ha anche intel.

Insomma non diamo la cosa per scontata, e non pensiamo sempre che chi esprime dubbi su queste valutazioni sia un pessimista. La mia valutazione non è pessimista. Io confido che i sandy bridge 6c saranno a portata di mano. Ma non lo do per scontato. Intel sta migliorando un'architettura molto potente, molto versatile, e anche economica da produrre, visto che un core nehalem (4 core, HT e baracca varia) occupa poco meno silicio di un core deneb, mentre un core thuban è decisamente più grande e dunque costa di più. E il SOI + low-k non te lo regalano.

Insomma non diamo le cose per scontate... E non vendiamo Llano come il c hip del futuro... Sandy bridge sta arrivando col suo bravo chip video integrato ondie con L3 condivisa, tanto come Llano.

Mah... non so per potenzialità, ma SB ha una VGA realizzata a 45nm e messa vicino ad un die realizzato a 32nm, nello stesso package... (si vede che a Intel piace continuare la filosofia di attaccare 2 pezzi, tipo Core2 quad). Llano è tutta un'altra cosa... è parte integrante del die e la potenza della VGA è di gran lunga superiore. Intel non può assolutamente avere l'esperienza di ATI/AMD.

carlottoIIx6

27-08-2010, 23:51

Io ti ho capito perfettamente...
Il nocciolo è quello.
Se uno non fa come dio Intel, non è detto che sbaglia, anzi, la storia dimostra che si può fare meglio.
L'i980X è del 30% superiore ad un 1090T? (non è detto, magari nei giochi va più il Thuban) Perfetto, io ho speso 240€ per il procio e 140€ per il top della mobo... tu tieniti il 30% in più, ma nel mio portafoglio ci sono ancora quasi 1.000€. Con quei soldi BD X8 e mobo ci scappano alla grande e forse pure l'upgrade successivo.
Se poi la potenza la si ottiene con 8 core, con 16, con un core sopra l'altro, con il clock, che importa?

Era questo che volevi dire?

pensavo che me lo dicessi tu :)
comunque
stavo pensando ad un commento che avevo letto in un forum su bulldozer
che recitava così:
"così hanno ridimensionato la parte in virgola mobile, che dovrebbe essere
aumentata...."
perchè costui dice così... lo dice perchè penza che bulldozer sono due core con una parte in comune (la fpu)
ma allo stesso modo bulldozer potrebbe essere visto come
un core evoluto capace di processare due thread alla volta
fisici, pero'!

per me quel che chiamano x8 è in realtà un x4 bulldozer
un x4 che ha quattro core bulldozer
core evoluti che sono in grado di fare due thread alla volta!
quello che chimano modulo è bulldozer!
un x4 bulldozer ( che viene venduto come x8)
va confrontato con un x4 intel!
la sfida sarà x8 fisici contro x4 fisici + x4 virtuali!

il modulo è infatti l'unità indivisibile che si ripete sempre come i vecchi core
e di fatto prende il posto dei core
è deve essere visto
(a mio avviso)
come il nuovo core bulldozer
core evoluto che riesce a fare due thread alla volta

quindi a chi dice, che così è venuto a amncare meno calcolo in virgola mobile, direi
no! quello rimane los tesso (anche se secondo me l'hanno potenziato)
solo si possono fare più thread alla volta!

quello che ci venderanno come x8 è quindi secondo me x4 buldozer = 8 thread

se intel fa x8, amd può fare x16 siamo lì!
conta l'area del processore ed infine il prezzo!

altra cosa, in single
il thread ha un fpu tutta per se :)
guadagna così??

non so il prezzo ma un x4 bulldozer (=x8) dovrebbe avere allincirca la stessa area di un x4 intel! oi poco su....
inoltre a causa dell'ottimizzazione interna del core bulzorer o detto modulo
non si sa quando va realmente
se con superficie metà, un mudulo amd va come un x2 intel???

PS amd non sbaglia secondo me, anzi...
ai posteri l'ardua sentenza

papafoxtrot

28-08-2010, 00:00

imho sbagliato, si confronta sempre e solo per prezzo e consumo. Se una cpu amd a 18000 core va più (per la maggior parte degli utilizzi/tutti gli utilizzi)di una intel a 4 core a parità di prezzo e il tdp è quello, amd ha un prodotto più valido di intel, altrimenti no.
Non ha senso dire amd a 8 core va come l'intel a 6 core, che magari costa pure 50 euro in più, e allora amd fa cagare. Sono architetture diverse il confronto spiccio core contro core, imho non ha più senso.

Non mi hai proprio capito. AMD NON FARA' un 18000 core!
Hai letto ciòl che ho scritto? Se amd facesse una CPU da 1000 core e battesse intel, no problem! MaAMD farà un 8 core! Per qui quegli 8 core devono bastare! Quegli 8 core confrontiamo! Perché quelli ci sono!

Da una parte cìè amd che fa 8 core. Dall'altra intel che ne fa 8.
Non c'p niente da fare! Confronti 8 core contro 8 core!!

Se amd avesse detto "bah... vedremo... faremo 100 core. forse 150, forse 200... non ci abbiamo ancora pensato". Non sarebbe un problema. MA AMD ha detto "faremmo un bulldozer a 8 core.
Allora io so che devo confrontare 8 core amd con i core di intel!

Da qui viene il confronto tra il numero di core!

Non dal fatto che chi ha il core con più ipc è migliore!

ATI vende GPU da 1600 core, e nvidia fa risultati più alti con 480. Non è un problema, perché il chip ati è grande metà consuma quasi metà e costa metà.

Ma il chip di AMD sarà un 8 core tanto come quello di intel.
ERGO, devo confrontare l'IPC di ogni core! Non c'è scampo!

Non mi puoi dire "AMD va bene, perchP allo stesso prezzo del quad core intel ti vende un 8 core che va uguale.
Perché sopra al quad intel ha anche i 6 e gli 8 core.
Tutto ciò funzionerebbe se AMD sopra agli 8 avrebbe i 12 e 16 core.
M a siccome AMD ha un 8 core, allora quell'8 core deve vincere coi 6 core di intel.

PUNTO!
Sennò finisce come al solito che intel piazza gli 8 core a 1000 euro, i 6 core dai 250 ai 500 euro, i 4 core a 100 euro... E AMD vende a 100 euro un'architettura nuova di palla che le ha portato via 5 anni di ricerca e sviluppo pagati miliardi di dollari all'anno.

Ora tu non mi puoi dire che il deneb va bene per il semplice fatto che costa 100 euro. Deneb ti può andare benone a te, va benone a me... a 100 euro. Ma all'amd vendere il deneb a 100 euro, è tutto fuorché una buona cosa!
Deneb gli costa in produzione almeno tanto come un core i7. Solo che il core i7 intel lo vende a 200 euro. AMD il phenom II X4 955T lo vende a 120.
Chi guadagna di più?

Non puoi valutare la bontò di un prodotto solo in base a quanto costa a te comprarlo. Questa è una valutazione dal lato del consumatore.
Ma l'azienda deve valutare quanto gli è costato svilupparlo (costo fisso), quanto gli costa produrlo (costo variabile), e da li ricavare il breaking point. Più basso lo vendi, più ne devi vendere... ma siccome la quota di mercato è quella non puoi regalare le CPU!

Risultato.
Bulldozer deve essere capace con 8 core di eguagliare un sandy bridge a 6 core. In questo modo AMD venderà bulldozer a 300 euro, batterà cassa, investirà in ricerca e sviluppo e fusion 2 sarà una bestia.
Se bulldozer a 8 core sarà pari a un SB a 4 core, AMD lo venderà a 100 euro, ci guadagnerà un cazz, non investirà, o farà debiti per farlo, e fusion arriverà in ritardo, e senza il supporto di svilupaptori, openCL e quant'altro.
Questo è il succo.

Ma qua se io parlo così sembra che sia qui a dire che bulldozer sarà un cesso. Non è vero un tubo! Sto dicendo che è sbagliato sperare in un bulldozer economico e basta, o confrontarlo col quad core, perché tanto i core sono èiù piccoli. Mi andrebbe bene se poi amd mi facesse un 16 core. Ma siccome mi fa un 8 core, quell'8 core deve essere buono!
E io spero con tutto il cuore che lo sia, e sono qui a studiare, a fare speculazioni, quanto può essere la frequenza, quanto può pesare l'HKMG, quanto può essere la cache, così una cache 8C, è possibile che l'IPC sia cresciuto di tot..

paolo.oliva2

28-08-2010, 00:02

Ovviamente no, forse non mi sono spiegato. Intendo: la CPU avrà un clock default di 3,5GHz e in TB potrebbe prendere i 4,5. A questo punto il wall secondo me sarà tra i 5GHz e poco sotto.
Questo perché intanto comunque quando overclocchi parti a occare da 3,5, per cui quando arrivi a 4 e mezzo, inutile contarsela... ne hai abbastanza! I migliori a liquido faranno i loro 4,8-5GHz e chi ha l'azoto liquido pompa di brutto.
E poi perché comunque la CPU ha il suo default ai 3,5GHz (sempre ipotetici), per cui inutile fare una CPU che per lo più va a 3,5, e mettergli i transistor da 5GHz. E' come prendere la panda, che in media farà 50kmh tutta la vita, e metterci l'estrattore sul ventre o l'alettone estraibile, perché ai 180 in autostrada da maggiore stabilità...
Non so se mi spiego, ovviamente la mia è un esagerazione.

La mia stima comunque è quella che ho detto ormai alcune pagine fa.
C'è qualcuno che farebbe una bella risk analysys su quelle che potrebbero essrere le prestazioni? Mettiamo in input una curva gaussiana per la densità di probabilità della bontà del processo, una curva per la densità di probabilità del TDP, basandosi sull'indicazione "raddoppiano i core con +12% di area occupata), grosso modo dovrebbe uscire una gaussiana per la frequenza con picco di probabilità sui 3,5GHz e una gaussiana per l'IPC, con picco di probabilità +15% rispetto a thuban, basandosi sull'indicazione di JF-AMD (+50% con il 33% di core in più).
Secondo me viene fuori una curva di densità di probabilità con un picco sul +50-60% rispetto a Thuban, che vuol dire superare core i7 980x e quindi arrivare li li con SB a 6 core.
Comunque sono contento che dal wall a 4,5GHz ti sei spostato a 5GHz scarsi :)
Per la rete si parla di un +10% per SB rispetto all'i980X, poi bisognerà vedere se in alcuni programmi o se sia una media.
Comunque si parla che l'i980X rispetto ad un i7 X4 abbia un 30% di guadagno di media (non prendiamo sempre solo quei programmi dove pompa).

Quindi se partiamo che un Thuban fosse simile all'i7, in monoth no certamente, ma comunque poi il thuban si rifà in multith, matematicamente SB sarebbe del 43% superiore ad un Thuban. Da un 43% ad un 50-60%, più che arrivare BD lì lì, direi che SB X6 arriverebbe lì lì. :) Poi spero che in SB abbiano migliorato l'SMT, perché l'i980X mostrava parecchi prb dove l'SMT non era supportato. Biosogna tenerne conto, perché BD di questi problemi non ne avrà sicuramente.

papafoxtrot

28-08-2010, 00:09

Mah... non so per potenzialità, ma SB ha una VGA realizzata a 45nm e messa vicino ad un die realizzato a 32nm, nello stesso package... (si vede che a Intel piace continuare la filosofia di attaccare 2 pezzi, tipo Core2 quad). Llano è tutta un'altra cosa... è parte integrante del die e la potenza della VGA è di gran lunga superiore. Intel non può assolutamente avere l'esperienza di ATI/AMD.

Eh no caro mio... In sandy bridge la GPU è integrata sul silicio, condivide memory controller e cache L3, attraverso la quaale comunica con la CPU. La stessa GPU ha power gating e turbo boost e può essere overcloccata se la CPU è inutilizzata, o undercloccata per occare la cpu.

E queste sono le sue prestazioni: http://www.anandtech.com/show/3871/the-sandy-bridge-preview-three-wins-in-a-row/7
Anzi, queste sono le prestazioni della versione a 1 unità Intel farà processori con una o due unità video. Questa fa meglio delle HD5450 intanto.

Certo quella di Llano sarà superiore, ma non sottovalutare l'avversario.

papafoxtrot

28-08-2010, 00:16

Questo è l'avversario gente:
http://www.anandtech.com/show/3871/the-sandy-bridge-preview-three-wins-in-a-row
Rcordiamoci che questi test si riferiscono al quad core a 3,1GHz con 6MB di L3. Ci saranno quad core a 3,4GHz con 8MB e intel annuncia finoa 3,8GHz.
E ci saranno 6 core e 8 core.
I consumi sono veramente interessanti.

Ma soprattutto si sa qualcosa dei prezzi. Nella fascia golosa dei 200 dollari c'è il quad core con HT a 3,3GHz.

Ora sappiamo qualcosa di più. Per conoscere le prestazioni del 6 core IMHOP basta aggiungere un 30-50% per i core, mentre la frequenza è ignota.

paolo.oliva2

28-08-2010, 00:16

Eh no caro mio... In sandy bridge la GPU è integrata sul silicio, condivide memory controller e cache L3, attraverso la quaale comunica con la CPU. La stessa GPU ha power gating e turbo boost e può essere overcloccata se la CPU è inutilizzata, o undercloccata per occare la cpu.

E queste sono le sue prestazioni: http://www.anandtech.com/show/3871/the-sandy-bridge-preview-three-wins-in-a-row/7
Anzi, queste sono le prestazioni della versione a 1 unità Intel farà processori con una o due unità video. Questa fa meglio delle HD5450 intanto.

Certo quella di Llano sarà superiore, ma non sottovalutare l'avversario.
Ma è una APU o una GPU?

paolo.oliva2

28-08-2010, 00:19

Questo è l'avversario gente:
http://www.anandtech.com/show/3871/the-sandy-bridge-preview-three-wins-in-a-row
Rcordiamoci che questi test si riferiscono al quad core a 3,1GHz con 6MB di L3. Ci saranno quad core a 3,4GHz con 8MB e intel annuncia finoa 3,8GHz.
E ci saranno 6 core e 8 core.
I consumi sono veramente interessanti.

Ma soprattutto si sa qualcosa dei prezzi. Nella fascia golosa dei 200 dollari c'è il quad core con HT a 3,3GHz.

Ora sappiamo qualcosa di più. Per conoscere le prestazioni del 6 core IMHOP basta aggiungere un 30-50% per i core, mentre la frequenza è ignota.

Lì c'è scritto.... MAX single core turbo. Che vuole dire? il massimo turbo per 1 core? E se sono 2 che fa? Cala? In Thuban 1090T, il turbo per def è 4 core a +400MHz.
Ma.... se fanno un SB X4 in cui il clock massimo è 3,4GHz, quando faranno l'X6 che clock avrà? Io mi sarei aspettato un X4 a 3,8GHz almeno se poi un X6 si parlava di 3,5Ghz. Ecco perché aspettano il 22nm per l'X8.

Capozz

28-08-2010, 00:29

Eh no caro mio... In sandy bridge la GPU è integrata sul silicio, condivide memory controller e cache L3, attraverso la quaale comunica con la CPU. La stessa GPU ha power gating e turbo boost e può essere overcloccata se la CPU è inutilizzata, o undercloccata per occare la cpu.

E queste sono le sue prestazioni: http://www.anandtech.com/show/3871/the-sandy-bridge-preview-three-wins-in-a-row/7
Anzi, queste sono le prestazioni della versione a 1 unità Intel farà processori con una o due unità video. Questa fa meglio delle HD5450 intanto.

Certo quella di Llano sarà superiore, ma non sottovalutare l'avversario.

La 5450 è proprio l'entry level assoluto tra le gpu ati, ha 80 sp, 4 rops e 8 tmu, mentre la gpu di Llano presumibilmente avrà prestazioni simili ad una 5670, forse anche qualcosa in più visto che ha un numero maggiore di SP, ma dipenderà dalle frequenze.
Tra 5450 e 5670 c'è un abisso, la prima è più o meno 5 o 6 volte più lenta.

stefanonweb

28-08-2010, 00:37

Stiamo parlando per Bulldozzer di piattaforme DDR3 Dual Triple o Quad Channel?
Grazie...

capitan_crasy

28-08-2010, 00:46

Questo è l'avversario gente:
http://www.anandtech.com/show/3871/the-sandy-bridge-preview-three-wins-in-a-row

io proprio non capirò mai Intel come rilevi così beatamente le prestazioni delle proprie CPU mesi prima dell'uscita ufficiale...
Bè AMD ha dei valori da cui potersi confrontare e questo è un vantaggio....

Rcordiamoci che questi test si riferiscono al quad core a 3,1GHz con 6MB di L3. Ci saranno quad core a 3,4GHz con 8MB e intel annuncia finoa 3,8GHz.
E ci saranno 6 core e 8 core.
I consumi sono veramente interessanti.

Siamo alle solite...
E il costo che determina il successo di una CPU...
I 6 core Nehalem saranno dei mostri ma costano troppo.
Inoltre l'ottimismo sui prezzi bassi di Intel è dovuto a qualcosa di concreto oppure sono sono speculazioni dovuti all'ottimismo dei prezzi bassi dei Quad core AMD che forse saranno ancora più bassi grazie al 32nm SOI?

Ma soprattutto si sa qualcosa dei prezzi. Nella fascia golosa dei 200 dollari c'è il quad core con HT a 3,3GHz.

Mi domando se una APU come Llano a 3.30Ghz costasse la metà cosa succederebbe; le prestazioni dei core X86 saranno indietro ma ad occhio e croce quelle della GPU dovrebbero essere ben superiori...

Ora sappiamo qualcosa di più. Per conoscere le prestazioni del 6 core IMHOP basta aggiungere un 30-50% per i core, mentre la frequenza è ignota.

Io prima di questa recensione sentivo parlare di 20/30% di prestazioni in più sul nehalem; sono notevolmente sorpreso delle prestazioni della IGP Intel, anche se bisogna verificare anche la qualità dell'immagine...
Più che altro il Boost di prestazioni sul 3D penalizza non poco la fascia bassa di Nvidia, dove non può proporre un alternativa valida nel settore entry level...

papafoxtrot

28-08-2010, 00:47

Ma è una APU o una GPU?
APU è il nome coniato da AMD, comunque strutturalmente l'integrazione in SB e Llano è praticamente uguale.

Lì c'è scritto.... MAX single core turbo. Che vuole dire? il massimo turbo per 1 core? E se sono 2 che fa? Cala? In Thuban 1090T, il turbo per def è 4 core a +400MHz.
Ma.... se fanno un SB X4 in cui il clock massimo è 3,4GHz, quando faranno l'X6 che clock avrà? Io mi sarei aspettato un X4 a 3,8GHz almeno se poi un X6 si parlava di 3,5Ghz. Ecco perché aspettano il 22nm per l'X8.
IL SB, come anche i nehalem, il turbo boost non si applica semplicemente in base al numero di core usati. Viene misurato il consumo della CPU e in base a quelllo viene aumentata la frequenza ai core più usati.
Il clock massimo per i quad core è di 3,8GHz, con TDP di 95W. Quando ti sposti sui 6 core devi considerare che il tdp sarà di 130W, e che no ci sarà la GPU.
In compenso ci sarà il MC quad channel a consumare di più.

La 5450 è proprio l'entry level assoluto tra le gpu ati, ha 80 sp, 4 rops e 8 tmu, mentre la gpu di Llano presumibilmente avrà prestazioni simili ad una 5670, forse anche qualcosa in più visto che ha un numero maggiore di SP, ma dipenderà dalle frequenze.
Tra 5450 e 5670 c'è un abisso, la prima è più o meno 5 o 6 volte più lenta.

Ma infatti h detto che la GPU di llano sarò superiore. Ho linkato perché si parlava della modalità di integrazione.
Ad ogni modo questa è la versione a singola unità con clock massimo di 1150MHz. CI saranno versioni a due unità, con clock fino a 1350. Per cui se già questa è ben superiore alla 5450, le versioni top saranno a tutt'altro livello.
Inoltre escludo che Llano abbia GPU superiore alle 5670, per il semplice fatto che il bus verso la memoria è estremamente inferiore e condiviso con la GPU. Inoltre c'è da vedere il clock. Già ora la 5670 ha un TDP di 61w. Per farla entrare nella CPU si dovrà circa dimezzare il consumo, forse più. A quel punto certo c'è il cambio di processo e manca il consumo della sceda. Ma le frequenze saranno probabilmente più conservative.
Le ALU saranno di più perché ancora conviene metterne di più a bassa frequenza che poche ad alta frequenza (sempre per via che il consumo va col cubo della frequenza).

capitan_crasy

28-08-2010, 00:50

La 5450 è proprio l'entry level assoluto tra le gpu ati, ha 80 sp, 4 rops e 8 tmu, mentre la gpu di Llano presumibilmente avrà prestazioni simili ad una 5670, forse anche qualcosa in più visto che ha un numero maggiore di SP, ma dipenderà dalle frequenze.
Tra 5450 e 5670 c'è un abisso, la prima è più o meno 5 o 6 volte più lenta.

In linea teorica SB visto su anandtech dovrebbe avere le prestazioni 3D di Ontario per via della similitudine con la GPU 5450; tuttavia quest'ultimo sarà sicuramente indietro per via dei core X86 inferiori sia di numero di core sia per l'architettura più lenta...

Ren

28-08-2010, 01:03

io proprio non capirò mai Intel come rilevi così beatamente le prestazioni delle proprie CPU mesi prima dell'uscita ufficiale...

Perchè rallentano di proposito per non incappare nel antitrust, oltre che per massimizzare il profitto delle generazioni già in produzione.

calabar

28-08-2010, 01:22

Non mi hai proprio capito. AMD NON FARA' un 18000 core!

[...]

Ma qua se io parlo così sembra che sia qui a dire che bulldozer sarà un cesso. Non è vero un tubo! Sto dicendo che è sbagliato sperare in un bulldozer economico e basta, o confrontarlo col quad core, perché tanto i core sono èiù piccoli. Mi andrebbe bene se poi amd mi facesse un 16 core. Ma siccome mi fa un 8 core, quell'8 core deve essere buono!
E io spero con tutto il cuore che lo sia, e sono qui a studiare, a fare speculazioni, quanto può essere la frequenza, quanto può pesare l'HKMG, quanto può essere la cache, così una cache 8C, è possibile che l'IPC sia cresciuto di tot..
Concordo perfettamente con il principio espresso alla fine, AMD non può accontentarsi della fascia bassa come fa ora.

Però ritengo che ci siano delle valutazioni sbagliate tra le argomentazioni, e in particolare.

"Da una parte cìè amd che fa 8 core. Dall'altra intel che ne fa 8.
Non c'p niente da fare! Confronti 8 core contro 8 core!!"
Per tutto il primo periodo, vedremo BD a 8 core e SB a 4 core per i desktop.
Questo mi pare il confronto da fare, ed è anche il confronto a cui AMD ha dichiarato di mirare (nella speranza di vincerlo, e magari di stravincerlo, ovviamente!)

Più avanti intel mira a far uscire 6 e 8 core per desktop, e se questo porterà a muovere il mercato verso l'alto, non vedo perchè AMD non possa decidere di far uscire le versioni 12 e 16 core di BD, già previste per i server, anche come processori per PC: il prodotto ce l'ha già ed è pronto, se avesse una sua buona vendibilità (magari sulla fascia 1000 euro come gli extreme di intel) anche in questo mercato, non vedo perchè dovrebbe rimanere indietro rispetto ad intel.

"Ma l'azienda deve valutare quanto gli è costato svilupparlo (costo fisso), quanto gli costa produrlo (costo variabile), e da li ricavare il breaking point. Più basso lo vendi, più ne devi vendere... ma siccome la quota di mercato è quella non puoi regalare le CPU!"
Si, ma tu sai bene che il 4 core BD non costerà quanto il 4 core SB, ma molto meno.
AMD intende mettere due core dove intel ne mette uno solo.
Quindi direi che la situazione è comunque molto differente da quella attuale in cui intel vende un i7 3,2 ghz ad un fantastiliardo e AMD un Phenom della stessa frequenza, con un costo di produzione probabilmente paragonabile, a 125 euro.

[...]Per cui se già questa è ben superiore alla 5450, le versioni top saranno a tutt'altro livello.
Inoltre escludo che Llano abbia GPU superiore alle 5670, per il semplice fatto che il bus verso la memoria è estremamente inferiore e condiviso con la GPU. Inoltre c'è da vedere il clock. Già ora la 5670 ha un TDP di 61w. [...]
A giudicare dal link che hai postato, le schede paiono più o meno alla pari, forse un leggero vantaggio di quella intel (ma proprio un pelino), ma se guardi i bench fino alla fine vedi che in alcuni vince una, in altri vince l'altra.

Al di la di questo, quando valuti la potenza della GPU itegrata in Llano, non tieni conti di diversi fattori:
- il numero di SP e ben superiore alla 5670
- i 61w di TDP sono per tutta la scheda, mentre qui MC e altro sono condivisi e direttamente comunicanti con la cpu
- le schede video serie 5xxx sono con processi bulk standard (oltretutto parliamo del problematico 40nm di TSMC). La GPU integrata in Llano godrà di: 32nm, processo SOI, HKMG, forse Low k. I vantaggi di queste tre o quattro cosette mi paiono da soli sufficienti a far calare drasticamente il consumo. E il soi + HKMG penso permetteranno frequenze tutt'altro che conservative.

carlottoIIx6

28-08-2010, 07:19

i vostri ragionamenti sono buoni
però non stiamo uscendo dal campo ipotetico!

io ho affermato che l'x8 amd è inrealtà un x4 bulldozer
ma non si sa niente di come questo modulo vada rispetto ad due core intel!
potrebbe benissimo andare alla pari...
ma con una superficie del 38% percento in meno! (non so intel che superfice ha... ipotizzo)
bisognerebbe fare il confronto.... almeno con le superfici!
ma se anche ammettiamo un modulo andasse l'80% in meno di un x2 intel
se l'area è il 40% in meno amd puo metterci un altro modulo and avere
il 20% di area in più di un x2 intel, ma con prestazioni il 60% in più!

non sappiamo niente di come va bulldozer!

comunque prima di paragonarlo ad inte dovremo fare il paragone in casa amd
vediamo calcolatrice alla mano...

supponiamo che magny core (MC) ha un area di 1 u^2 (dove u^2 è un unità generica al quadrato)
supponiamo che un modulo bulldozer (o core bulldozer) sia il 12% più grande di un core del MC

se riscaliamo l'area del MC a 32 nanometri diventerebbe 0,71 u^2
per riportarla a 1 u^2 devo aggiungere 4 core ed arrivo a 0,95 u^2
quindi un 16 core MC avrebbe la stessa area attuale e quindi stesso profitto per amd

facciamo il calcolo con buldozer
dobbiamo fare: (8 x "area di core MC) * 1.12 = 0,53 U^2

cioè il chip viene il 47% in meno
ma ogni core ha (da come si dice) l'11% in più rispetto MC (no???)
insomma
l'area vine la metà e le presatzioni so il 50% in più!

quindi amd potrebbe raddoppiare l'area e fornire un x32
raddoppiando le prestazioni (100% in più) mantenendo la sessa
circa la stessa area di un x16 con k10!

come va buldozer x8 ( cioè l'x4 modulo) rispetto un ipotetico phenom II x8?
dovrebbe andare l'11 in più ma esser decisamente più contenuto (la metà??)

ai tempi dell'athlon xp amd si era inventato un nome che non era la frequenza ma diceva l'equvalente della frequenza intel
tipo athlon xp 1800+ non andava a 1800 GHz ma era come un intel da 1800GHz

secondo me ora dovremmo fare lo stesso, tipo il mio processore è un x# (xnumero) rispetto quello intel. esempio: l'x4 moduli è un x7,3+ equicalente intel

bicchiere

28-08-2010, 08:38

secondo me ora dovremmo fare lo stesso, tipo il mio processore è un x# (xnumero) rispetto quello intel. esempio: l'x4 moduli è un x7,3+ equicalente intel

Beh, AMD ha gia' detto che valuterà il tutto in core, anche se in realtà un modulo non sono proprio due core fisici :(

GT82

28-08-2010, 09:03

[...]Il sito Planet 3DNow ha chiesto spiegazioni ad AMD stessa e essa ha confermato che le CPU Bulldozer desktop NON saranno compatibili con gli attuavi socket AM3.[...]

Se tutto questo significa migliori prestazioni, bene così

A sto punto un possessore di Thuban 1090T supporrei passi ad un X8 a sto punto, non essendo aggiornabile al BD X6.

Da qui all'uscita di BD (un anno circa) cos'è previsto di nuovo per il socket AM3? stanno 16 mesi con il Thuban?

, e così questo AM3+ resterà uno dei socket più corti e sfigati della storia di AMD... Mi viene in mente i primi Athlon 64... prima socket 754 e 940 per la fascia alta... Poi 939 e sempre 940 pèer la fascia alta... poi 939 per tutti (anche per gli opteron 1xxx)...

Come dicevo sopra, se 'sto processore riuscirà a ripetere i fasti della K8 ben venga il nuovo socket, anche due, tre no sarebbe troppo in effetti :D

paolo.oliva2

28-08-2010, 09:04

Concordo perfettamente con il principio espresso alla fine, AMD non può accontentarsi della fascia bassa come fa ora.

Però ritengo che ci siano delle valutazioni sbagliate tra le argomentazioni, e in particolare.

"Da una parte cìè amd che fa 8 core. Dall'altra intel che ne fa 8.
Non c'p niente da fare! Confronti 8 core contro 8 core!!"
Per tutto il primo periodo, vedremo BD a 8 core e SB a 4 core per i desktop.
Questo mi pare il confronto da fare, ed è anche il confronto a cui AMD ha dichiarato di mirare (nella speranza di vincerlo, e magari di stravincerlo, ovviamente!)

Più avanti intel mira a far uscire 6 e 8 core per desktop, e se questo porterà a muovere il mercato verso l'alto, non vedo perchè AMD non possa decidere di far uscire le versioni 12 e 16 core di BD, già previste per i server, anche come processori per PC: il prodotto ce l'ha già ed è pronto, se avesse una sua buona vendibilità (magari sulla fascia 1000 euro come gli extreme di intel) anche in questo mercato, non vedo perchè dovrebbe rimanere indietro rispetto ad intel.

"Ma l'azienda deve valutare quanto gli è costato svilupparlo (costo fisso), quanto gli costa produrlo (costo variabile), e da li ricavare il breaking point. Più basso lo vendi, più ne devi vendere... ma siccome la quota di mercato è quella non puoi regalare le CPU!"
Si, ma tu sai bene che il 4 core BD non costerà quanto il 4 core SB, ma molto meno.
AMD intende mettere due core dove intel ne mette uno solo.
Quindi direi che la situazione è comunque molto differente da quella attuale in cui intel vende un i7 3,2 ghz ad un fantastiliardo e AMD un Phenom della stessa frequenza, con un costo di produzione probabilmente paragonabile, a 125 euro.

A giudicare dal link che hai postato, le schede paiono più o meno alla pari, forse un leggero vantaggio di quella intel (ma proprio un pelino), ma se guardi i bench fino alla fine vedi che in alcuni vince una, in altri vince l'altra.

Al di la di questo, quando valuti la potenza della GPU itegrata in Llano, non tieni conti di diversi fattori:
- il numero di SP e ben superiore alla 5670
- i 61w di TDP sono per tutta la scheda, mentre qui MC e altro sono condivisi e direttamente comunicanti con la cpu
- le schede video serie 5xxx sono con processi bulk standard (oltretutto parliamo del problematico 40nm di TSMC). La GPU integrata in Llano godrà di: 32nm, processo SOI, HKMG, forse Low k. I vantaggi di queste tre o quattro cosette mi paiono da soli sufficienti a far calare drasticamente il consumo. E il soi + HKMG penso permetteranno frequenze tutt'altro che conservative.

Quoto.
Io penso che è stato il ragionamento più obiettivo letto sino ad ora, che rende bene il quadro della situazione.

carlottoIIx6

28-08-2010, 09:20

Beh, AMD ha gia' detto che valuterà il tutto in core, anche se in realtà un modulo non sono proprio due core fisici :(

si, ma bisogna vedere tuttle le scelte di amd!

una domanda per capitano
si sa la die size di un x8 bulldozer?

un x4 fisici + x4 virtuali sandy bridge sarà di 225 mm² (circa 20 mm² per core)
se l'area è la stessa amd piazzerà un x8 fisici contro un x4+x4virtuali.

paolo.oliva2

28-08-2010, 09:30

Da qui all'uscita di BD (un anno circa) cos'è previsto di nuovo per il socket AM3? stanno 16 mesi con il Thuban?
Io mi tengo all'ufficiale di AMD, cioé che i nuovi proci dovrebbero uscire nel primo semestre del 2011. Il resto per me sono voci di corridoio. Ricordati che prima dell'uscita del Thuban, molte testate avevano detto che sarebbe uscito a giugno 2010, invece è uscito il 22 aprile 2010.
Al primo semestre 2011 la finestra è da gennaio ad giugno, cioè da 4 mesi a 10 mesi, con una probabilità, visto che AMD ha promesso un nuovo chip-set ogni anno, che coincida con il BD, per aprile 2011, e sarebbero 8 mesi, al più.
Llano sicuramente uscirà prima, visto che AMD ha già le idee chiare sul socket e molte meno problematiche, visto che non è tutto ex-novo.

Inoltre basta tenere in considerazione che AMD ha rallentato considerevolmente la commercializzazione di ciò che aveva promesso con Thuban. Vi ricordate la scaletta AMD originale che a giugno doveva seguire un Thuban a 140W cioé dopo 2 mesi? Ne sono passati 4....

Il perché di questo? Forse una similitudine all'X4 C3 a 3,6GHz che non è mai uscito per non dare fastidio al Thuban?

Il 1090T nuovo che ho con Vcore def arriva sui 3,7GHz, ben 500MHz sopra il clock stock. Non permette un Thuban a 3,4GHz 125W? E per 140W? Per me pure i 3,6GHz, visto che con il dissi stock pure ora in estate è facile arrivare bene a 3,8GHz.

Se BD ci fosse tra 1 anno, AMD non può rimanere con un Thuban a 3,2GHz e per me ci sarebbero già i modelli nuovi. La cosa è completamente diversa nel caso invece ci fossero 4 mesi o poco più.

Io la penso così.

GT82

28-08-2010, 09:48

Se ora Intel ne mette 6 di core, considerando che SB l'hanno progettato e tuttora sviluppando quelli di Haifa, c'è da aspettarsi concretamente tra un anno o al max Q4 2011 un SB X8 con pure qualche miglioramento di IPC, tipo 10-15%.

ricordate cos'è successo da Conroe a Penryn?

circa +8-10% di IPC e consumi abbassati, ok lì c'era pure il passaggio da 65 a 45nm, ma comunque mi rifiuto di pensare che in oltre un anno Intel non migliori il proprio 32nm

Due giorni fa ho scritto questo

e adesso dopo aver appena finito di leggere la preview di Sandy Bridge dico CVD, aka "come volevasi dimostrare"...

quelli di Haifa come c'era da aspettarsi hanno fatto il loro sporco e dannatamente ottimo lavoro, dal Pentium M in su non finiscono di stupire

SB è senza discussione una cpu/gpu cazzutissima, c'è poco da fare

...la GPU che in versione 6 "core" va un 10% più di un 5450, e son previste versioni a 12 con power gating

...IPC medio a parità di clock e core superiore a Nehalem del 13-14% circa con picchi del 20%

...e dopo tutto questo, come se non bastasse consumi by Haifa

DICO CHE BULLDOZER SE VORRA' COMPETERE DOVRA' ESSERLO DI NOME MA SOPRATTUTTO DI FATTO!

.

paolo.oliva2

28-08-2010, 09:57

si, ma bisogna vedere tuttle le scelte di amd!

una domanda per capitano
si sa la die size di un x8 bulldozer?

un x4 fisici + x4 virtuali sandy bridge sarà di 225 mm² (circa 20 mm² per core)
se l'area è la stessa amd piazzerà un x8 fisici contro un x4+x4virtuali.

Bisogna contare una cosa:
La scalabilità di core è tutta a vantaggio di AMD, nel senso che più nei proci aumentano di numero i core, più AMD è avvantaggiata.

Basta vedere l'esempio Thuban:
Tra un Phenom II X4 4 core vs i7 X4 4+4 c'era una differenza maggiore di quella che ci ritroviamo tra un Phenom II X6 ed un i980X nonostante che questi ha aumentato considerevolmente la L3, mentre a parte le ottimizzazioni, il Thuban ha unicamente 2 core in più nella stessa L3.

A maggior ragione, per me è probabile che l'IPC superiore di SB ammortizzi il calo della minore scalabilità per l'aumento dei core nei confronti di un i980X portato a X8, ma non si può assolutamente pensare che da SB X6 a SB X8 ci sia la stessa percentuale di guadagno calcolata con il +33% di core.

In poche parole, mettendo dei numeri a caso, un SB X4 +30% rispetto a BD X4, SB X6 + 20% rispetto a BD X6, SB X8 + 10% rispetto a BD X8 e così via.

In questo incide proprio l'architettura della cache circolare di Intel, e più aumentano i core, più la probabilità che il dato sia distante, aumenta, senza contare che su 8MB di L3 di un X4 è una cosa, su 12MB di L3 di un X6 è un'altra e su 16MB di un X8?

Oltretutto se si arrivasse al punto che AMD porterà dal server un BD X12, io avrei già molti dubbi su un SB X8 a 16th visto i problemi di un i980X con l'SMT, quindi vedrei costretta Intel a disabilitare l'SMT per poter sfruttare i th fisici rinunciando a quelli logici, e a quel punto diminuirebbe pure l'IPC...

paolo.oliva2

28-08-2010, 10:06

Due giorni fa ho scritto questo

e adesso dopo aver appena finito di leggere la preview di Sandy Bridge dico CVD, aka "come volevasi dimostrare"...

quelli di Haifa come c'era da aspettarsi hanno fatto il loro sporco e dannatamente ottimo lavoro, dal Pentium M in su non finiscono di stupire

SB è senza discussione una cpu/gpu cazzutissima, c'è poco da fare

...la GPU che in versione 6 "core" va un 10% più di un 5450, e son previste versioni a 12 con power gating

...IPC medio a parità di clock e core superiore a Nehalem del 13-14% circa con picchi del 20%

...e dopo tutto questo, come se non bastasse consumi by Haifa

DICO CHE BULLDOZER SE VORRA' COMPETERE DOVRA' ESSERLO DI NOME MA SOPRATTUTTO DI FATTO!

.

Conta questo:
1 anno fa si parlava che l'i7 sarebbe stato irraggiungibile per il Phenom II.

Ora... un Phenom II X6 (con 2 core in più) ha raggiunto l'irraggiungibile i7 X4 (aumento dei core fisici rispetto all'i7 del 50%)

Ora l'irraggiungibile SB X4 sarà raggiunto da un BD X8 con 4 core in più, con il 32nm HKMG e forse il low-k? (aumento dei core fisici rispetto a SB del 100%)

Qual'è la differenza di IPC tra SB X4 e i7 X4?

carlottoIIx6

28-08-2010, 10:06

Due giorni fa ho scritto questo

e adesso dopo aver appena finito di leggere la preview di Sandy Bridge dico CVD, aka "come volevasi dimostrare"...

quelli di Haifa come c'era da aspettarsi hanno fatto il loro sporco e dannatamente ottimo lavoro, dal Pentium M in su non finiscono di stupire

SB è senza discussione una cpu/gpu cazzutissima, c'è poco da fare

...la GPU che in versione 6 "core" va un 10% più di un 5450, e son previste versioni a 12 con power gating

...IPC medio a parità di clock e core superiore a Nehalem del 13-14% circa con picchi del 20%

...e dopo tutto questo, come se non bastasse consumi by Haifa

DICO CHE BULLDOZER SE VORRA' COMPETERE DOVRA' ESSERLO DI NOME MA SOPRATTUTTO DI FATTO!

.

ma che cos'è
paura cronaca da intel???
non è vero che la gpu va il 10% in più di un 5450
sonopipù meno lì
che poi è la scheda più scarsa amd!

liano e poi ontario che costerà molto meno di sb ne avrà una molto migliore!
bulldoze non compete sulla gpu

anche amd ha aumentato non sappiamo quanto lle prestazioni per core
si pensa dell'11% ma diminuendo l'area
questo vuol dire che a parità di core di intel li può vendere di meno
anche se andassero di meno guadagnadoci di più :)

capitan_crasy

28-08-2010, 10:13

Due giorni fa ho scritto questo

e adesso dopo aver appena finito di leggere la preview di Sandy Bridge dico CVD, aka "come volevasi dimostrare"...

Ma che bravo...:rolleyes:

quelli di Haifa come c'era da aspettarsi hanno fatto il loro sporco e dannatamente ottimo lavoro, dal Pentium M in su non finiscono di stupire

Ma perchè ogni volta che leggo i tuoi post devi per forza glorificare Intel? Sinceramente stai un pò annoiando...

SB è senza discussione una cpu/gpu cazzutissima, c'è poco da fare

Molto meno cazzuta delle prime indiscrezioni...

...la GPU che in versione 6 "core" va un 10% più di un 5450, e son previste versioni a 12 con power gating

E quindi?
Andare più di una 5450 è un risultato eccezionale solo per le IGP Intel; restano comunque scarse a livello di frame.
Inoltre bisogna verificare se la qualità d'immagine non sia stata abbassata per guadagnare qualche frame...

...IPC medio a parità di clock e core superiore a Nehalem del 13-14% circa con picchi del 20%

Prima di queste recensione si parlava tranquillamente del 30% in più in media...

DICO CHE BULLDOZER SE VORRA' COMPETERE DOVRA' ESSERLO DI NOME MA SOPRATTUTTO DI FATTO!

.

Che noia...
Se vuoi dare almeno il beneficio del dubbio ad AMD va bene,ma se ogni volta devi rimarcare quanto sia brava intel allora di suggerisco di andare in altri thread...

paolo.oliva2

28-08-2010, 10:15

Sapete cosa mi viene da pensare sul caXXeggio di AMD sul socket?

Di capire la contromossa Intel sul numero dei core, e quindi dotare BD di socket idoneo a permettere upgrade futuri senza dover cambiare la mobo.

Faccio un esempio:
Oggi compro BD X8 con AM3+, domani non riuscirò a metterci assolutamente un BD > X8.

Che fa AMD? Perché tritare i neuroni per mettere BD a martellate sul socket AM3? Creiamo un socket idoneo a poter mettere nel futuro un BD X12 o X16, ma con delle castrature idonee a far si che uno non compri mobo+procio desktop ottenendo = a procio+mobo server.

Oltretutto il cambio di socket in corsa di BD creerebbe dei problemi.

bicchiere

28-08-2010, 10:16

Molto meno cazzuta delle prime indiscrezioni....

Tieni ben presente che ancora non sappiamo nulla dei processori desktop per socket 2011. Quelli di cui sai qualcosa sono i processori di fascia "media".

capitan_crasy

28-08-2010, 10:28

Tieni ben presente che ancora non sappiamo nulla dei processori desktop per socket 2011. Quelli di cui sai qualcosa sono i processori di fascia "media".

L'argomento per il momento non è pertinente alla discussione in quanto non si conoscono i numeri delle CPU Bulldozer e delle APU Llano per un qualsiasi confronto (se non a livello tecnico)...

GT82

28-08-2010, 10:29

Se ora Intel ne mette 6 di core, considerando che SB l'hanno progettato e tuttora sviluppando quelli di Haifa, c'è da aspettarsi concretamente tra un anno o al max Q4 2011 un SB X8 con pure qualche miglioramento di IPC, tipo 10-15%.

ricordate cos'è successo da Conroe a Penryn?

circa +8-10% di IPC e consumi abbassati, ok lì c'era pure il passaggio da 65 a 45nm, ma comunque mi rifiuto di pensare che in oltre un anno Intel non migliori il proprio 32nm

Conta questo:
1 anno fa si parlava che l'i7 sarebbe stato irraggiungibile per il Phenom II.

Ora... un Phenom II X6 (con 2 core in più) ha raggiunto l'irraggiungibile i7 X4.

Ora l'irraggiungibile SB X4 sarà raggiunto da un BD X8 con 4 core in più, con il 32nm HKMG e forse il low-k?

siccome l'approccio Intel conferma la presenza di core "pesanti" mi auguro che AMD nella stessa superficie-consumo riesca a piazzare almeno 4 moduli (8 core)

AMD ci ha detto che le prestazioni di un modulo sono l'80% di un "vero" dual core basato sulla stessa architettura

ora, perchè un modulo BD abbia le stesse prestazioni di un dual core Phenom II, occorre che l'IPC rispetto al Phenom II sia aumentato del 25%

perchè se l'aumento è inferiore, significa che a parità di core BD andrebbe meno di Phenom II

comunque facendo due conti

1- considerando un IPC immutato tra Phenom II e BD
2- considerando un BD 4 moduli (8 core) nella stessa fascia di superficie e consumo di SB 4X (8 threads)
3- considerando che a parità di clock un Nehalem X6 ha un +22% medio su un Nehalem X4
4- considerando che la scalabilità tra Nehalem e SB non venga migliorata (già ora Nehalem X6 va "solo" il 22% in più e non il "33%")

a parità di clock, quindi puro IPC, ne viene fuori che un BD 4 moduli (8core) andrebbe circa il 5% n più di un Sandy X4 (8 threads) come quello della preview di Anandtech

ma che cos'è
paura cronaca da intel???
non è vero che la gpu va il 10% in più di un 5450
sonopipù meno lì
che poi è la scheda più scarsa amd!

liano e poi ontario che costerà molto meno di sb ne avrà una molto migliore!
bulldoze non compete sulla gpu

anche amd ha aumentato non sappiamo quanto lle prestazioni per core
si pensa dell'11% ma diminuendo l'area
questo vuol dire che a parità di core di intel li può vendere di meno
anche se andassero di meno guadagnadoci di più :)

non è la cronopaura by Intel

è rispetto ed enorme considerazione per l'azienda leader del settore, con una forza finanziaria e infrastrutturale enorme, e che nel bene e nel male (bustarelle, compilatori) è davanti da 5 anni
difficilmente si può sperare in un altro Pentium 4

va eccome il 10% in più, guarda bene i grafici, e magari con driver acerbi...

so bene che è la scheda più scarsa di AMD, ma qui quello che conterà sarà il rapporto prestazioni/watt che nel caso delle schede discrete è sicuramente un po' più in secondo piano

BD non compete sulla GPU, ma questo deve comunque far riflettere perchè Intel da un annetto buono con la GMA HD, ha fatto vedere e tutt'ora conferma un netto salto di qualità

quelli di Anandtech dicono che non hanno riscontrato alcuna inferiorità a livello di qualità di immagine

Llano e Ontario non si confronteranno con SB, target molto diversi

.

Ares17

28-08-2010, 10:50

comunque facendo due conti

1- considerando un IPC immutato tra Phenom II e BD
2- considerando un BD 4 moduli (8 core) nella stessa fascia di superficie e consumo di SB 4X (8 threads)
3- considerando che a parità di clock un Nehalem X6 ha un +22% medio su un Nehalem X4
4- considerando che la scalabilità tra Nehalem e SB non venga migliorata (già ora Nehalem X6 va "solo" il 22% in più e non il "33%")

.

1) IPC immutato tra PH2 e BD?

E dove lo hai letto?

Amd dichiara che un modulo BD ha un IPC dell'80% rispetto ad un dual core classico (presumibilmente considerando le stesse unità di calcolo e non di cpu di famiglie diverse).
Altrimenti non avrebbe senso la proporzione +33% di core = +50% di prestazioni.

2) il passaggio da 6 ad 8 core (4 moduli) di Bd avremo +50% di ipc.
con sb avremo un aumento oscillante tra +10 e +20% di prestazioni.
Quindi se un Tsix è circa equivalente ad un quad credi davvero che basti quell'aumento di ipc per pareggiare il +50% ?
3) Cosa che indica una scarsa propensione a scalare di core.

4) Sicuro che la proporzione sia quella giusta:
+50% dei core = +33% di ipc.
Allora Intel e quelli di Haifa hanno molto da imparare da Amd:
+50% di core = + 50% di ipc (questa è la giusta proporzione).

paolo.oliva2

28-08-2010, 10:53

siccome l'approccio Intel conferma la presenza di core "pesanti" mi auguro che AMD nella stessa superficie-consumo riesca a piazzare almeno 4 moduli (8 core)

AMD ci ha detto che le prestazioni di un modulo sono l'80% di un "vero" dual core basato sulla stessa architettura

ora, perchè un modulo BD abbia le stesse prestazioni di un dual core Phenom II, occorre che l'IPC rispetto al Phenom II sia aumentato del 25%

perchè se l'aumento è inferiore, significa che a parità di core BD andrebbe meno di Phenom II

comunque facendo due conti

1- considerando un IPC immutato tra Phenom II e BD
2- considerando un BD 4 moduli (8 core) nella stessa fascia di superficie e consumo di SB 4X (8 threads)
3- considerando che a parità di clock un Nehalem X6 ha un +22% medio su un Nehalem X4
4- considerando che la scalabilità tra Nehalem e SB non venga migliorata (già ora Nehalem X6 va "solo" il 22% in più e non il "33%")

a parità di clock, quindi puro IPC, ne viene fuori che un BD 4 moduli (8core) andrebbe circa il 5% n più di un Sandy X4 (8 threads) come quello della preview di Anandtech
A parità di clock, forse.
Però non continuiamo a prendere tra tutti gli articoli, quello che ha predetto BD in maniera peggiore, e prendendo gli articoli migliori su SB, che tra l'ottimistico +30% di giorni fa, si è già arrivati a +10%...
Guardando che un SB riesce a portare il clock in turbo a SOLO 3,8GHz ma SOLO per 1 core, cacchio, fa meglio un Thuban su 45nm low-k che quando si parla di turbo ne porta almeno 4 a 3,6GHz...
Ma il punto è che va ridimensionato il discorso di vedere SB X6 o più a 3,5GHz stock. Ed è per questo che gli X6 si vedranno a fine 2011, troppo devono limare per riuscire a portare il 32nm Intel a livelli "accettabili".
E' per questo che non si fa altro che pronosticare clock per AMD almeno 500MHz più bassi di quelli che vedremo... perché il discorso tira e parecchio dopo anni che si è giudicato il silicio INTEL HKMG il migliore sulla faccia della terra.
non è la cronopaura by Intel

è rispetto ed enorme considerazione per l'azienda leader del settore, con una forza finanziaria e infrastrutturale enorme, e che nel bene e nel male (bustarelle, compilatori) è davanti da 5 anni
difficilmente si può sperare in un altro Pentium 4
Magari non fa il flop sull'architettura, ma il silicio a 33nm HKMG è quello che è, e comparato a quello che uscirà da AMD, io lo giudicherei un flop paragonabile al PIV.
Aspettarsi un SB X8 agli stessi clock di un BD X16 ed allo stesso TDP è pura utopia, manco gli israeliani si mettessero a fare riti vodo e macumba.

va eccome il 10% in più, guarda bene i grafici, e magari con driver acerbi...
so bene che è la scheda più scarsa di AMD, ma qui quello che conterà sarà il rapporto prestazioni/watt che nel caso delle schede discrete è sicuramente un po' più in secondo piano
BD non compete sulla GPU, ma questo deve comunque far riflettere perchè Intel da un annetto buono con la GMA HD, ha fatto vedere e tutt'ora conferma un netto salto di qualità
quelli di Anandtech dicono che non hanno riscontrato alcuna inferiorità a livello di qualità di immagine
Llano e Ontario non si confronteranno con SB, target molto diversi
.
Aspettiamo di vedere altri articoli... perché sino ad ora personalmente io non ho mai visto osannare AMD ma, al contrario, sempre osannare Intel.

carlottoIIx6

28-08-2010, 10:59

non è la cronopaura by Intel

è rispetto ed enorme considerazione per l'azienda leader del settore, con una forza finanziaria e infrastrutturale enorme, e che nel bene e nel male (bustarelle, compilatori) è davanti da 5 anni
difficilmente si può sperare in un altro Pentium 4

va eccome il 10% in più, guarda bene i grafici, e magari con driver acerbi...

so bene che è la scheda più scarsa di AMD, ma qui quello che conterà sarà il rapporto prestazioni/watt che nel caso delle schede discrete è sicuramente un po' più in secondo piano

BD non compete sulla GPU, ma questo deve comunque far riflettere perchè Intel da un annetto buono con la GMA HD, ha fatto vedere e tutt'ora conferma un netto salto di qualità

quelli di Anandtech dicono che non hanno riscontrato alcuna inferiorità a livello di qualità di immagine

Llano e Ontario non si confronteranno con SB, target molto diversi

.

come ha fatto notare capitano (che mi risponda per piacere sul size del die bulldozer se la sa :) )
non ha senso fare paragone sulle prestazioni ma solo dal punto di vista tecnico
visto che non sappiamo nulla

da questo punto di vista amd si conferma frande innovatrice
prima a 64bit
prima a mettere un x4 so un solo die + cache l3
prima a fare un core=modulo complesso capace di fare da solo multithread
prima fare fusion = intesa non come semplice affiancamento cpu gpu

sicuramente le sorprese che possiamo aspettarci è le performace per watt
che potrebbe essere "moltissimo" migliori di quell intel

dici ontario non competera' con sb??
non lo so... secondo me la cosa è tutta da verificare
sicuramente costera molto meno e consumerà molto meno
ma se surclassera' sb nei giochii? :D:D

paolo.oliva2

28-08-2010, 11:04

1) IPC immutato tra PH2 e BD?

E dove lo hai letto?

Amd dichiara che un modulo BD ha un IPC dell'80% rispetto ad un dual core classico (presumibilmente considerando le stesse unità di calcolo e non di cpu di famiglie diverse).
Altrimenti non avrebbe senso la proporzione +33% di core = +50% di prestazioni.

2) il passaggio da 6 ad 8 core (4 moduli) di Bd avremo +50% di ipc.
con sb avremo un aumento oscillante tra +10 e +20% di prestazioni.
Quindi se un Tsix è circa equivalente ad un quad credi davvero che basti quell'aumento di ipc per pareggiare il +50% ?
3) Cosa che indica una scarsa propensione a scalare di core.

4) Sicuro che la proporzione sia quella giusta:
+50% dei core = +33% di ipc.
Allora Intel e quelli di Haifa hanno molto da imparare da Amd:
+50% di core = + 50% di ipc (questa è la giusta proporzione).

Quoto.

Nella migliore delle ipotesi, un SB X8 avrebbe un IPC similare a quello che avrebbe dovuto avere un SB X6 se avesse rispettato il reale incremento di IPC come AMD.

Questa è la realtà. Osannare un SB X8 come il doppio più potente di un SB X4 e fantasticare clock di 3,5GHz + il turbo, è fantascienza.

GT82

28-08-2010, 11:21

Ti rispondo con ironia va..

Ma che bravo...:rolleyes:

bravo io? era difficilissima come previsione in effetti...

d'altra parte dopo quasi 2 anni era difficile prevedere che non migliorassero Nehalem

in tutti i settori economici di solito l'azienda che ha maturato un certo vantaggio su gli altri competitors, si stanca di essere davanti facendosi raggiungere...
ma per piacere

c'è un detto che dice "non è sempre domenica", io dico "non è sempre Netburst"...

Ma perchè ogni volta che leggo i tuoi post devi per forza glorificare Intel? Sinceramente stai un pò annoiando...

Annoiato? e lo dici a me? son 5 anni che sono annoiato e aspetto, aspetto che il divario si riduca (e in parte è già avvenuto)

però questi qui i processori li sanno fare, e pure bene, non solo quelli di Sunnyvale...

e colpa mia? è colpa di Anandtech? e colpa dei benchmark? dei compilatori? del KGB?

Molto meno cazzuta delle prime indiscrezioni...

Stiamo ai numeri che come tali non soffrono di influenze campanilistiche o di tifoseria per non dire fanboysmo...

oltre il 50% di IPC rispetto a Phenom II

questo intanto è un numero, di BD non sappiamo ancora nulla, ma intanto questo ripeto è un numero, e non un numeretto qualunque

altro numero, vista la tabella consumi? si vede chiaramente un -10-15% anche lì

E quindi?
Andare più di una 5450 è un risultato eccezionale solo per le IGP Intel; restano comunque scarse a livello di frame.
Inoltre bisogna verificare se la qualità d'immagine non sia stata abbassata per guadagnare qualche frame...

Non fa più notizia visto che già un anno fa la HD Graphics dei Core i3/i5 nel confronto con i 785/790 di AMD dimostrò che il divario delle precedenti generazioni era solo un ricordo

sulla qualità dell'immagine Anandtech ne ha parlato nella preview, forse ti è sfuggito

come probabilmente ti sono sfuggiti i confronti che da un anno vengono fatti in ambito AV/HTPC con benchmark appositi e valutazioni visive

e con l'incognita dei driver non certo sviluppati, quindi le cose potrebbero pure migliorare

io ricordo solo che il 780g uscì la bellezza di 2 anni e mezzo fa, 55nm con una certa potenza e un certo consumo

passa un anno e i 785g/790g non innovano e migliorano praticamente nulla a parte qualcosa di secondario

ora vengono fuori gli 880/890 e troviamo sempre quel RV620 dell'anno scorso

non mi stupisce per nulla quindi vedere Intel che si porta alla pari, AMD dorme da due anni praticamente...

Prima di queste recensione si parlava tranquillamente del 30% in più in media...

Io al massimo massimo mi aspettavo un +20%, del resto si sa già da tempo che SB era un evoluzione di una già ottima architettura, non era uno stravolgimento (come deve fare AMD) ma un affinamento

Che noia...
Se vuoi dare almeno il beneficio del dubbio ad AMD va bene,ma se ogni volta devi rimarcare quanto sia brava intel allora di suggerisco di andare in altri thread...

Ascolta, ho ordinato ieri il terzo processore K10 in un anno e mezzo, io le cpu Intel non le compro, capisci? ;)
quindi non frequento molto i loro threads

la mia vuole essere pura e semplice scaramanzia, un non lasciarsi a facili entusiasmi

AMD sta lavorando a BD da quanti anni? --> aspettative loro e nostre enormi

solo che gli altri partivano da un livello più alto, e nel frattempo cercano giustamente di mantenersi sulla vetta migliorandosi, tu o AMD non fareste altrettanto?

GT82

28-08-2010, 11:39

1) IPC immutato tra PH2 e BD?

E dove lo hai letto?

Amd dichiara che un modulo BD ha un IPC dell'80% rispetto ad un dual core classico (presumibilmente considerando le stesse unità di calcolo e non di cpu di famiglie diverse).
Altrimenti non avrebbe senso la proporzione +33% di core = +50% di prestazioni.

2) il passaggio da 6 ad 8 core (4 moduli) di Bd avremo +50% di ipc.
con sb avremo un aumento oscillante tra +10 e +20% di prestazioni.
Quindi se un Tsix è circa equivalente ad un quad credi davvero che basti quell'aumento di ipc per pareggiare il +50% ?
3) Cosa che indica una scarsa propensione a scalare di core.

4) Sicuro che la proporzione sia quella giusta:
+50% dei core = +33% di ipc.
Allora Intel e quelli di Haifa hanno molto da imparare da Amd:
+50% di core = + 50% di ipc (questa è la giusta proporzione).

Se oggi un Phenom dual core ha prestazioni 1, ipotizzando un aumento di IPC del 25% con BD, un dual core classico Bulldozer avrebbe prestazioni pari a 1.25 appunto

ma AMD dice che un modulo ha l'80% delle prestazioni di un dual core classico, quindi 1.25x0.8= 1

quindi stesso IPC del Phenom II, ma con un area e un consumo molto molto molto più piccoli, più piccoli di un ipotetico Phenom II anch'esso a 32nm
è questa la ratio del progetto BD

il +50% di AMD è riferito da un Thuban a un BD X8, non da BD X6 a BD X8!

Se AMD rispettasse la proporzione +33%/+50% significa che l'aumento di IPC è ancora più alto del 25%, ma del 40%

se i numeri fossero questi allora a parità di clock, un BD 4 moduli (8core) andrebbe il 18% in più di un Sandy X4 con HT

punto 4:

ma questo chi lo nega? sappiamo da mesi quanto ottima è la linearità prestazionale già adesso dei Phenom II sia in frequenza sia in core rispetto alla controparte

AMD può anche mettere 1000 core per quello che mi riguarda, basta che poi le prestazioni e i consumi in sigle e in multi siano competitive col Sandy...

paolo.oliva2

28-08-2010, 11:53

AMD può anche mettere 1000 core per quello che mi riguarda, basta che poi le prestazioni e i consumi in sigle e in multi siano competitive col Sandy...

Però, vedi... razionalizza.

Il silicio AMD permetterà frequenze ben più alte di quelle Intel, e il TDP sarà sempre più basso a parità di core.

Basta che guardi un MC a 12 core e lo Xeon basato sull'i7 X6.

Siamo o non siamo a livelli simili di potenza? Ma cacchio, stiamo confrontando un 45nm liscio senza nemmeno il low-k (nemmeno l'ultima evoluzione del 45nm AMD) con il 32nm HKMG fior fiore all'occhiello di Intel, con l'architettura superiore e tanti bla bla bla dietro. Come si farebbe ad avere dubbio in proposito quando AMD avrà il 32nm HKMG con pure il low-k aggiuntivo?

Tu dai indiscutibile che Intel in 2 anni per forza migliora l'i7, e metti in discussione AMD che dopo 5 anni non migliorerebbe?

Ci vuole poco per vedere che AMD passerà avanti sia di silicio che di efficienza su Intel, perché la corsa sul numero dei core a procio Intel non la può assolutamente fare con AMD, perché non scala quanto AMD e sarebbe inutile e perché il suo silicio non lo permette. O vogliamo mettere in discussione pure questo? AMD, dal canto suo, ha implementato il Turbo per sopperire proprio all'IPC monocore, sfruttando il notevole clock, quindi rendendo idoneo un procio per server (cioé + numero di core), tra l'altro eliminando i problemi Intel sull'SMT che non volete ammettere.

Il quadro a me sembra questo... la mia idea è che tirare fuori continui prb per sminuire BD è unicamente arrampicarsi sui muri.

Tra l'altro, basta guardare che intel ha si la sua scaletta a tick tock, ma dai tempi "rilassati" del Core2 sta diventando un po' frenetica... chissà perché?

GT82

28-08-2010, 12:01

@ Paolo

guarda che nei miei post io non ho masi parlato di Sandy Bridge X6 o X8

sappiamo che non scalano bene come prestazioni e che al crescere dei core il vantaggio diminuisce

ma penso che lo sappiano da tempo pure gli ingegneri Intel, dai calcoli di prima ora l'IPC di Sandy sarà circa il 50-55% più alto di quello di Phenom I a parità di core e clock

Bulldozer deve ridurre questo gap, non c'è niente da fare

rimetto il grafico di HWU

http://www.hwupgrade.it/articoli/cpu/2432/moneybench_1.png

dando per buona la prev di Anandtech sai dove si posiziona quel Sandy X4 (8 Threads) 3.1Ghz?

249 punti

mettendolo a 3333 come il 975 sale a 267

ma poi spiegami 'na cosa che ho notato ora...

si dice che Phenom II scala meglio, ma quel grafico delle prestazioni medie (quindi sia single che multi threads) dice che da Nehalem X4 a X6 c'è un +21,7% di prestazioni ma altrettanto chiaramente che da un Phenom X4 955 al Thuban 1090T il guadagno è del 24,3%
quindi la scalabilità non è ottima nemmeno per AMD

anche prendendo in considerazione i test multithreaded, il K10 fa sempre meglio nel passaggio X4-->X6, ma un po' meglio, non una differenza eclatante

Ares17

28-08-2010, 12:07

Se oggi un Phenom dual core ha prestazioni 1, ipotizzando un aumento di IPC del 25% con BD, un dual core classico Bulldozer avrebbe prestazioni pari a 1.25 appunto

ma AMD dice che un modulo ha l'80% delle prestazioni di un dual core classico, quindi 1.25x0.8= 1

quindi stesso IPC del Phenom II, ma con un area e un consumo molto molto molto più piccoli, più piccoli di un ipotetico Phenom II anch'esso a 32nm
è questa la ratio del progetto BD

il +50% di AMD è riferito da un Thuban a un BD X8, non da BD X6 a BD X8!

Se AMD rispettasse la proporzione +33%/+50% significa che l'aumento di IPC è ancora più alto del 25%, ma del 40%

se i numeri fossero questi allora a parità di clock, un BD 4 moduli (8core) andrebbe il 18% in più di un Sandy X4 con HT

punto 4:

ma questo chi lo nega? sappiamo da mesi quanto ottima è la linearità prestazionale già adesso dei Phenom II sia in frequenza sia in core rispetto alla controparte

AMD può anche mettere 1000 core per quello che mi riguarda, basta che poi le prestazioni e i consumi in sigle e in multi siano competitive col Sandy...

ipotiziamo per un six opteron un ipc =100
Sappiamo da Amd che con BD un aumento dei core del 33% apporta un incremento del 50% di ipc passando da opteron a db.
Quindi:
8 core = 150 IPC /8 = 18,75 ipc *2 (un dual core) = 37.5 ipc.
un dual con architettura opteron avrebbe un ipc di 33%.
Di conseguenza un modulo Bd ha un IPC del 12.5% maggiore rispetto all'odierna architettura.
Guarda caso all'incirca l'incremento che si ha tra Nh e Sb.
Ne consegue che un six Bd dovrebbe avere all'incirca le stesse prestazioni di un Sb quad.

Se l'architettura a moduli di bd fosse classica invece avremmo un ipc di 37,5/8*10= 46.87.
Ma dove con architettura classica avremmo un quad con ipc di 93.75 (-6.25 rispetto a tuban six) con la stessa superfice avremo un six (3 moduli) con un ipc di 112 (ancora quel 12.5% in più rispetto tuban).
Non vedo quindi da dove ricavi che un dual phenom abbia lo stesso ipc di un modulo Bd?

GT82

28-08-2010, 12:09

Però, vedi... razionalizza.

Il silicio AMD permetterà frequenze ben più alte di quelle Intel, e il TDP sarà sempre più basso a parità di core.

Basta che guardi un MC a 12 core e lo Xeon basato sull'i7 X6.

Siamo o non siamo a livelli simili di potenza? Ma cacchio, stiamo confrontando un 45nm liscio senza nemmeno il low-k (nemmeno l'ultima evoluzione del 45nm AMD) con il 32nm HKMG fior fiore all'occhiello di Intel. Come si farebbe ad avere dubbio in proposito quando AMD avrà il 32nm HKMG con pure il low-k aggiuntivo?

Tu dai indiscutibile che Intel in 2 anni per forza migliora l'i7, e metti in discussione AMD che dopo 5 anni non migliorerebbe?

Ci vuole poco per vedere che AMD passerà avanti sia di silicio che di efficienza su Intel, perché la corsa sul numero dei core a procio Intel non la può assolutamente fare con AMD, perché non scala quanto AMD e sarebbe inutile e perché il suo silicio non lo permette. O vogliamo mettere in discussione pure questo? AMD, dal canto suo, ha implementato il Turbo per sopperire proprio all'IPC monocore, sfruttando il notevole clock, quindi rendendo idoneo un procio per server (cioé + numero di core), tra l'altro eliminando i problemi Intel sull'SMT che non volete ammettere.

Il quadro a me sembra questo... la mia idea è che tirare fuori continui prb per sminuire BD è unicamente arrampicarsi sui muri.

Ma chi sminuisce cosa scusa?

ho appena scritto che se sarà rispettato ciò che dice JF (50/33) sarà un gran processore!

significherà che BD X8 andrà circa il 15% più forte di SB X4 (8 threads)

se poi BD potrà salire di più di frequenza ben venga alla grande, e chi non se lo augura?

IO HO DETTO CHE PER ADESSO SB SEMBRA UN BUON PROGETTO, CHE PARTIVA DA UN GIA' BUON PROGETTO, PER QUESTO DICO CHE BULLDOZER DOVRA' PER FORZA ESSERE UN OTTIMO PROCESSORE, E SECONDO ME LO SARA'

DIRE CHE LA REDBULL DEL 2011 DALLE PRIME PROVE SEMBRA UNA GRAN MACCHINA NON MI SEMBRA EQUIVALGA A DIRE CHE LA FERRARI 2011 DI CUI SI CONOSCE MENO NON CE LA FARA' SICURAMENTE A COMPETERE ALLA PARI

.

Dre@mwe@ver

28-08-2010, 12:10

Di conseguenza un modulo Bd ha un IPC del 12.5% maggiore rispetto all'odierna architettura.
Guarda caso all'incirca l'incremento che si ha tra Nh e Sb.
Ne consegue che un six Bd dovrebbe avere all'incirca le stesse prestazioni di un Sb quad.

Oh, perfetto, questo era lo scenario che avevo in mente:

i5 senza HT <------> Bulldozer X4

i7 con HT <--------> BD X6

esacore SB <--------> BD X8

Mentre un eventuale octa-core sarebbe afrrontabile con una CPU BD con 5 moduli/6 moduli.

Dre@mwe@ver

28-08-2010, 12:13

Ragazzi comunque credo che sia inutile attaccare GT82 o papafoxtor per quello che dicono, le loro supposizioni sono logiche e condivisibili, e hanno ragione a temere Sandy Bridge: ragazzi, parliamo di quad ed esa con IPC incredibile e frequenze elevate! Non diamo per scontato che AMD riesca a primeggiare, i calcoli vanno fatti. Che poi Bulldozer sarà una grandissima CPU, e soprattutto rivoluzionaria date le premesse, è molto probabile, ma non bisogna credere ciecamente che AMD si troverà di colpo ai vertici assoluti (anche se io lo spero :)).

gianni1879

28-08-2010, 12:19

Mi sono comprato la scheda madre AM3,se non c'è il supporto vi..

sei sospeso 10gg per il tuo comportamento, alla prossima uscita come questa sarai bannato.

Per cui hai tempo per riflettere

paolo.oliva2

28-08-2010, 12:20

@ Paolo

guarda che nei miei post io non ho masi parlato di Sandy Bridge X6 o X8

sappiamo che non scalano bene come prestazioni e che al crescere dei core il vantaggio diminuisce

ma penso che lo sappiano da tempo pure gli ingegneri Intel, dai calcoli di prima ora l'IPC di Sandy sarà circa il 50-55% più alto di quello di Phenom I a parità di core e clock

Bulldozer deve ridurre questo gap, non c'è niente da fare

rimetto il grafico di HWU

http://www.hwupgrade.it/articoli/cpu/2432/moneybench_1.png

dando per buona la prev di Anandtech sai dove si posiziona quel Sandy X4 (8 Threads) 3.1Ghz?

249 punti

mettendolo a 3333 come il 975 sale a 267

ma poi spiegami 'na cosa che ho notato ora...

si dice che Phenom II scala meglio, ma quel grafico delle prestazioni medie (quindi sia single che multi threads) dice che da Nehalem X4 a X6 c'è un +21,7% di prestazioni ma altrettanto chiaramente che da un Phenom X4 955 al Thuban 1090T il guadagno è del 24,3%
quindi la scalabilità non è ottima nemmeno per AMD

anche prendendo in considerazione i test multithreaded, il K10 fa sempre meglio nel passaggio X4-->X6, ma un po' meglio, non una differenza eclatante

Io non so come abbiano valutato i test, ma per quello che ho provato io, dal 965C3 al 1090T non c'è assolutamente nulla in cui il 1090T non riveli più potenza.

Forse io non uso né l'X4 né l'X6 a parametri def, e forse, ipotizzo, i proci AMD a def riguardo l'NB non sfruttano a dovere il procio.
Tra l'altro, oltre al fatto che l'Intel scala peggio al numero di core, scala peggio pure all'aumento di frequenza.
Infatti, se un Thuban a def forse è un po' sotto all'i7 a uguale frequenza, più si sale in clock e più la differenza sparisce per poi essere avvantaggiato il Thuban.
Non a caso in Cinebench, da un guadagno iniale, l'i7 X4 deve aumentare la frequenza sempre più per uguagliare il Thuban.
E' anche per questo che AMD ha tutto vantaggio, sia sulla scalabilità dei core, sia sulla risposta all'aumentare della frequenza.
A me la strada sembra molto più in salita per Intel che per AMD.
Nel caso AMD riesca a realizzare un BD con un incremento di IPC ottimo, Intel (X6 in su) non può aumentare in frequenza per il TDP e non può aumentare il numero dei core, mentre, viceversa, AMD nel caso BD abbia un IPC non esaltante, può giocare entrambe le carte in assoluta libertà.

carlottoIIx6

28-08-2010, 12:22

Ragazzi comunque credo che sia inutile attaccare GT82 o papafoxtor per quello che dicono, le loro supposizioni sono logiche e condivisibili, e hanno ragione a temere Sandy Bridge: ragazzi, parliamo di quad ed esa con IPC incredibile e frequenze elevate! Non diamo per scontato che AMD riesca a primeggiare, i calcoli vanno fatti. Che poi Bulldozer sarà una grandissima CPU, e soprattutto rivoluzionaria date le premesse, è molto probabile, ma non bisogna credere ciecamente che AMD si troverà di colpo ai vertici assoluti (anche se io lo spero :)).

e chi li attacca
per me è solo questione di ragionamento e chiarimento!

per me è solo questione di razionalizzare senza par passare
emozionalismi!

non c'è motivo logico di pessimismo!
ce ne sono di un moderato ottimismo!

GT82

28-08-2010, 12:25

Non vedo quindi da dove ricavi che un dual phenom abbia lo stesso ipc di un modulo Bd?

All'inizio ho detto che per essere uguale allora occorre che l'IPC aumenti del 25%, se invece deve essere maggiore del 12.5%, allora occorre che l'aumento di IPC tra K10 e BD a parità di core sia del 40.625%

Questo è il calcolo che ho fatto

mettiamo che 1 core K10 ha prestazioni 1

2 core K10 hanno prestazioni 2 (non è proprio così ma tralasciamo tanto non cambia di una virgola la logica)

ora mettiamo che l'aumento dell'IPC tra le due gen. con architettura classica (2 core int distinti, 2 fpu, ecc.) sia del 40.625%

allora questo ipotetico BD avrebbe prestazioni pari a 2.8125

ma AMD dice che il design a modulo, se da un parte riduce (spero tantissimo!) superficie e consumo, dall'altra comporta un -20% di prestazioni (da 1 a 0.8)

quindi 2.8125 x 0.8 = 2.25

2.25 / 2 = 1.125

l'aumento di IPC tra K10 dual core classico e modulo BD (2 core) è del 12.5%

.

Ares17

28-08-2010, 12:27

Ragazzi comunque credo che sia inutile attaccare GT82 o papafoxtor per quello che dicono, le loro supposizioni sono logiche e condivisibili, e hanno ragione a temere Sandy Bridge: ragazzi, parliamo di quad ed esa con IPC incredibile e frequenze elevate! Non diamo per scontato che AMD riesca a primeggiare, i calcoli vanno fatti. Che poi Bulldozer sarà una grandissima CPU, e soprattutto rivoluzionaria date le premesse, è molto probabile, ma non bisogna credere ciecamente che AMD si troverà di colpo ai vertici assoluti (anche se io lo spero :)).
Tra un quad intel ed un six Amd ad oggi c'è una differenza di ipc a favore del primo che oscilla tra il 7 ed il 15%.
Da tutti i dati divulgati (sia da amd che da intel) non vedo proprio come si possa però asserire che un octa amd possa essere inferiore ad un quad intel (sb)
Facendo due calcoli spicci ipotizziamo un quad con ipc 100 ed un six con ipc 85.
Da quello che dice amd un octa avra un ipc di 42.5 che fa 127,5.
Ne consegue che Sb quad per essere alla pari di Bd octa dovrà avere un aumento di ipc di oltre il 25% (ma sembra che il suo incremento sia molto inferiore).
Indubbiamente un six Sb (con le attuali premesse) è inarrivabile da un octa (e solo avvicinato da un deca) amd, ma certamente superato da un dodeca.
Che Sb sia una ottima cpu non ci sono dubbi (nemmeno in assenza di innalzamenti di ipc), ma ipotizzare che un quad Db abbia lo stesso ipc di un Phenom quad mi sembra alquanto impossibile.

Dre@mwe@ver

28-08-2010, 12:34

e chi li attacca
per me è solo questione di ragionamento e chiarimento!

per me è solo questione di razionalizzare senza par passare
emozionalismi!

non c'è motivo logico di pessimismo!
ce ne sono di un moderato ottimismo!

"Attaccare" per modo di dire, intendo dal punto di vista delle idee riguardo Bulldozer :D

papafoxtrot

28-08-2010, 12:56

si, ma bisogna vedere tuttle le scelte di amd!

una domanda per capitano
si sa la die size di un x8 bulldozer?

un x4 fisici + x4 virtuali sandy bridge sarà di 225 mm² (circa 20 mm² per core)
se l'area è la stessa amd piazzerà un x8 fisici contro un x4+x4virtuali.

Non si conosce il die sie di bulldozer, ma considerando anche che la L2 di AMD è tipicamente più grossa (512kb) è difficile che il core AMD occupi meno di quello di SB. E il modulo ha il suo 12% in più.
225mm^2 sono un die size abbastanza piccolo, e soprattutto a differenza di AMD è inclusivo di GPU e controller PCI-express. Il che vuol dire che il core size è molto piccolo.

i vostri ragionamenti sono buoni
però non stiamo uscendo dal campo ipotetico!

io ho affermato che l'x8 amd è inrealtà un x4 bulldozer
ma non si sa niente di come questo modulo vada rispetto ad due core intel!
potrebbe benissimo andare alla pari...
ma con una superficie del 38% percento in meno! (non so intel che superfice ha... ipotizzo)
bisognerebbe fare il confronto.... almeno con le superfici!

No, il modulo bulldozer sono DUE core. Questo lo ha detto l'AMD stessa. Finiamola di fare considerazioni sbagliate. Il modulo non è un grosso core alla intel.
Sono due piccoli core messi insieme cercando di occupare meno spazio possibile.
Il principio AMD è mettiamo tanti core semplici in poco posto, come per le GPU. Il principio intel è "facciamo 4 core che pestano come deficenti".
Il bulldozer E' un 8 core, è un top di gamma e coi top di gamma deve confrontarsi.

Concordo perfettamente con il principio espresso alla fine, AMD non può accontentarsi della fascia bassa come fa ora.

Però ritengo che ci siano delle valutazioni sbagliate tra le argomentazioni, e in particolare.

"
Da una parte cìè amd che fa 8 core. Dall'altra intel che ne fa 8.
Non c'è niente da fare! Confronti 8 core contro 8 core!!"
Per tutto il primo periodo, vedremo BD a 8 core e SB a 4 core per i desktop.
Questo mi pare il confronto da fare, ed è anche il confronto a cui AMD ha dichiarato di mirare (nella speranza di vincerlo, e magari di stravincerlo, ovviamente!)

Più avanti intel mira a far uscire 6 e 8 core per desktop, e se questo porterà a muovere il mercato verso l'alto, non vedo perchè AMD non possa decidere di far uscire le versioni 12 e 16 core di BD, già previste per i server, anche come processori per PC: il prodotto ce l'ha già ed è pronto, se avesse una sua buona vendibilità (magari sulla fascia 1000 euro come gli extreme di intel) anche in questo mercato, non vedo perchè dovrebbe rimanere indietro rispetto ad intel.

Per tutto il primo periodo vedremo sandy bridge a 4 core e Llano. Bulldozer è atteso per la metà circa del 2011, e AMD è solita, e ha detto lo farà anche stavolta, far uscire prima le versioni Opteron, e poi i desktop. Ad esempio con shanghai l'opteron uscì a dicembre, il phenom II a gennaio-febbraio. Con Thuban, l'Istambul era uscito a giugno 2009.
Probabilmente nell'estate del 2011 arriveranno i bulldozer fino a 8 core. E nell'autunno i sandy bridge a 6 e 8 core.
Per cui BD dovrà confrontarsi quasi da subito coi top di gamma intel, e in attesa di quelli ci saranno sempre e comunque i Core i7 970, 980 e 990x, che saranno comunque buoni avversari, sebbene un IPC corca il 10% inferiore. Dopotutto questi sono già dei mezzi sandy bridge, visto il PP.
Quindi BD dfa subito avrà come avversario core i7 990x (6 core 3,46GHz) ed è bene che vinca, subito.
AMD ha fatto sucire thuban per confrontarsi coi core i7 quad core (e comunque ci riesce solo in multicore, che non è l'uso più tipico che ne fa l'utente desktop). Ma Thuban era già in roadmap, il che vuol dire che era già in progetto da tempo.
Un bulldozer a 12/16 core non è in roadmap! Non se lo inventano mica dall'oggi al domani! Non basta prendere il'opteron interlagos e cambiargli il nome!
Questo ad esempio ha controller quad channel, a causa dell'unione di due chip! Per farlo entrare sulla scheda madre AM3+ devono cambiargli mezzo uncore, MC compreso, che deve diventare single channel per tutti e due i chip...
Inoltre devono migliorare le prestazioni single core, perché gli utenti desktop faranno fatica a usare i 6/8 core, figurarsi 16...
Un phenom a 16 core rischia di essere una cosa talmente di nicchia da costituire una vera vittoria di pirro.Se ritenessero interlagos adatto a vendere nel settore desktop lo venderebbero al volo! Se non lo fanno è perché ritengono che non ci guadagnerebbero! Nessuno, soprattutto se in posizione disagiata rispetto al concorrente, si tiene in casa i pezzi migliori!

"Ma l'azienda deve valutare quanto gli è costato svilupparlo (costo fisso), quanto gli costa produrlo (costo variabile), e da li ricavare il breaking point. Più basso lo vendi, più ne devi vendere... ma siccome la quota di mercato è quella non puoi regalare le CPU!"
Si, ma tu sai bene che il 4 core BD non costerà quanto il 4 core SB, ma molto meno.
AMD intende mettere due core dove intel ne mette uno solo.
Quindi direi che la situazione è comunque molto differente da quella attuale in cui intel vende un i7 3,2 ghz ad un fantastiliardo e AMD un Phenom della stessa frequenza, con un costo di produzione probabilmente paragonabile, a 125 euro.

Questo non lo possiamo sapere. Di che costo parli? Costo di produzione? Costo per te che lo compri?
Che AMD tenga prezzi competitivi non c'è dubbio! Ma non c'è dubbio che un modulo (2 core) bulldozer) occupi più di un core sandy bridge (che come dicevo prima è piccolissimo). Dunque produrre un bulldozer X8 costa di più che produrre un SB x4. Ergo, Se AMD fa competere gli X8 con gli X4 Intel ha già vinto, perché compete spendendo meno per produrre.

A giudicare dal link che hai postato, le schede paiono più o meno alla pari, forse un leggero vantaggio di quella intel (ma proprio un pelino), ma se guardi i bench fino alla fine vedi che in alcuni vince una, in altri vince l'altra.

Al di la di questo, quando valuti la potenza della GPU itegrata in Llano, non tieni conti di diversi fattori:
- il numero di SP e ben superiore alla 5670
- i 61w di TDP sono per tutta la scheda, mentre qui MC e altro sono condivisi e direttamente comunicanti con la cpu
- le schede video serie 5xxx sono con processi bulk standard (oltretutto parliamo del problematico 40nm di TSMC). La GPU integrata in Llano godrà di: 32nm, processo SOI, HKMG, forse Low k. I vantaggi di queste tre o quattro cosette mi paiono da soli sufficienti a far calare drasticamente il consumo. E il soi + HKMG penso permetteranno frequenze tutt'altro che conservative.
Si, ma quella è una GPU che esce tra 5 mesi, chissà che driver ha... E comunque gli da un 10% ad una scheda dedicata, che scusa se è poco, ma ha un suo MC, un suo bus, una RAM molto più veloce.
E questa GPU uscirà a frequenze più alte, anche e anche con hardware raddoppiato.
Io credo che la GPU di Llano sarà più potente, ma non sottovalutate quella di intel. Anche perché intel avrà una GPU del genere su uan CPU molto migliore di Llano.

Due giorni fa ho scritto questo

e adesso dopo aver appena finito di leggere la preview di Sandy Bridge dico CVD, aka "come volevasi dimostrare"...

quelli di Haifa come c'era da aspettarsi hanno fatto il loro sporco e dannatamente ottimo lavoro, dal Pentium M in su non finiscono di stupire

SB è senza discussione una cpu/gpu cazzutissima, c'è poco da fare

...la GPU che in versione 6 "core" va un 10% più di un 5450, e son previste versioni a 12 con power gating

...IPC medio a parità di clock e core superiore a Nehalem del 13-14% circa con picchi del 20%

...e dopo tutto questo, come se non bastasse consumi by Haifa

DICO CHE BULLDOZER SE VORRA' COMPETERE DOVRA' ESSERLO DI NOME MA SOPRATTUTTO DI FATTO!

.

Quotone.
E ripeto, non voglio certo dire che BD sarà un cesso, ma che bisogna che sia davvero buono. Il sorpasso non è scontato come molti credono.

Conta questo:
1 anno fa si parlava che l'i7 sarebbe stato irraggiungibile per il Phenom II.

Ora... un Phenom II X6 (con 2 core in più) ha raggiunto l'irraggiungibile i7 X4 (aumento dei core fisici rispetto all'i7 del 50%)

Ora l'irraggiungibile SB X4 sarà raggiunto da un BD X8 con 4 core in più, con il 32nm HKMG e forse il low-k? (aumento dei core fisici rispetto a SB del 100%)

Qual'è la differenza di IPC tra SB X4 e i7 X4?
Ma certo! Ma il problema non è se il SB X4 sarà raggiunto. BD non deve raggiungere il SB X4. DEVE SUPERARE SB X6.

Sapete cosa mi viene da pensare sul caXXeggio di AMD sul socket?

Di capire la contromossa Intel sul numero dei core, e quindi dotare BD di socket idoneo a permettere upgrade futuri senza dover cambiare la mobo.

Faccio un esempio:
Oggi compro BD X8 con AM3+, domani non riuscirò a metterci assolutamente un BD > X8.

Che fa AMD? Perché tritare i neuroni per mettere BD a martellate sul socket AM3? Creiamo un socket idoneo a poter mettere nel futuro un BD X12 o X16, ma con delle castrature idonee a far si che uno non compri mobo+procio desktop ottenendo = a procio+mobo server.

Oltretutto il cambio di socket in corsa di BD creerebbe dei problemi.
No, perché la seconda generazione di BD (da roadmap AMD) avrà grafica integrata e dunque necessiterà di un socket diverso che potrebbe essere lo stesso di llano, o la versione evoluta con possibile retrocompatibilità.
Piuttosto pensavo se non abbiano pensato, col nuovo socket, di introdurre un MC triple channel.
Magari gli era venuta la balzana idea che chi usava l'AM3 liscio aveva solo due canali, e chi aveva la mobo nuova li usava tutti... :D So, sto fantasticando...
Il triple channel mi anbdrebbe bene per i 6 slot sulla mobo.

Ma chi sminuisce cosa scusa?

ho appena scritto che se sarà rispettato ciò che dice JF (50/33) sarà un gran processore!

significherà che BD X8 andrà circa il 15% più forte di SB X4 (8 threads)

se poi BD potrà salire di più di frequenza ben venga alla grande, e chi non se lo augura?

IO HO DETTO CHE PER ADESSO SB SEMBRA UN BUON PROGETTO, CHE PARTIVA DA UN GIA' BUON PROGETTO, PER QUESTO DICO CHE BULLDOZER DOVRA' PER FORZA ESSERE UN OTTIMO PROCESSORE, E SECONDO ME LO SARA'

DIRE CHE LA REDBULL DEL 2011 DALLE PRIME PROVE SEMBRA UNA GRAN MACCHINA NON MI SEMBRA EQUIVALGA A DIRE CHE LA FERRARI 2011 DI CUI SI CONOSCE MENO NON CE LA FARA' SICURAMENTE A COMPETERE ALLA PARI

.

Purtroppo qui se dici che Intel ha mandato fuori un buon SB (e non c'erano dubbi visto da dove partiva), anche senza aver fatto la rivoluzione... Passi per fanboy e denigratore di bulldozer...

Gigamez

28-08-2010, 13:07

siccome l'approccio Intel conferma la presenza di core "pesanti" mi auguro che AMD nella stessa superficie-consumo riesca a piazzare almeno 4 moduli (8 core)

AMD ci ha detto che le prestazioni di un modulo sono l'80% di un "vero" dual core basato sulla stessa architettura

ora, perchè un modulo BD abbia le stesse prestazioni di un dual core Phenom II, occorre che l'IPC rispetto al Phenom II sia aumentato del 25%

perchè se l'aumento è inferiore, significa che a parità di core BD andrebbe meno di Phenom II

comunque facendo due conti

1- considerando un IPC immutato tra Phenom II e BD
2- considerando un BD 4 moduli (8 core) nella stessa fascia di superficie e consumo di SB 4X (8 threads)
3- considerando che a parità di clock un Nehalem X6 ha un +22% medio su un Nehalem X4
4- considerando che la scalabilità tra Nehalem e SB non venga migliorata (già ora Nehalem X6 va "solo" il 22% in più e non il "33%")

a parità di clock, quindi puro IPC, ne viene fuori che un BD 4 moduli (8core) andrebbe circa il 5% n più di un Sandy X4 (8 threads) come quello della preview di Anandtech

non è la cronopaura by Intel

è rispetto ed enorme considerazione per l'azienda leader del settore, con una forza finanziaria e infrastrutturale enorme, e che nel bene e nel male (bustarelle, compilatori) è davanti da 5 anni
difficilmente si può sperare in un altro Pentium 4

va eccome il 10% in più, guarda bene i grafici, e magari con driver acerbi...

so bene che è la scheda più scarsa di AMD, ma qui quello che conterà sarà il rapporto prestazioni/watt che nel caso delle schede discrete è sicuramente un po' più in secondo piano

BD non compete sulla GPU, ma questo deve comunque far riflettere perchè Intel da un annetto buono con la GMA HD, ha fatto vedere e tutt'ora conferma un netto salto di qualità

quelli di Anandtech dicono che non hanno riscontrato alcuna inferiorità a livello di qualità di immagine

Llano e Ontario non si confronteranno con SB, target molto diversi

.

uhm.. mi dispiace doverlo ammettere, ma io sono d'accordo con te: Intel sembra abbia fatto un eccellente lavoro e sincerametne dalle indiscrezioni uscite qualche giorno fa (speravo qualcosa di piu' specifico, a dire il vero), pur continuando ad essere dalla parte di AMD, bisogna secondo me ammettere che SB sara' un avversario piu' duro del previsto.

Senza contare che i dati rilasciati relativi all'architettura BD sinceramente mi sembrano alquanto controversi.. talmente nebulosi che viene anche un po' da pensar male, soprattutto in relazione al fatto che da parte di Intel si abbiano in mano gia' i primi dati e bench certi:

-Prima di tutto mi pare impossibile che AMD potra' schierare BD x4 vs SB x4. Da quello detto da AMD stessa e dal semplice calcolo relativo all'area del silicio utilizzata, mi sembra chiaro come AMD voglia competere "core-HT vs Module-2Th". Se cosi' non fosse BD sara' una sicura disfatta gia' prima di essere presentato, ma come detto reputo impossibile uno scenario di questo tipo. Bull avra' piu' core di SB, e sinceramente non penso proprio che si fermerà ad avere 8cores (4moduli): Dai ragazzi, basta fare due calcoli.. ogni modulo occupa il 12% di un core k10. Metteteci il nuovo processo produttivo ed un avversario come SB.. volete dirmi che AMD presentera' un top di gamma con un chip grosso 2/3 il suo vecchio TOP che avra' prestazioni quasi la meta' del top Intel? Per me e' impossibile e basta. Mi aspetto con certezza un desktop 6 moduli come top, e mi sbilancio senza problemi in questa ottimistica previsione :)

-Il fatto di cambiare socket dopo mille annunci (pur non completamente ufficiali) relativi alla futura compatibilità delle attuali schede madri mi lascia perplesso da una parte, ma anche abbastanza fiducioso dall'altra. In realta' potrebbe voler dire tutto o niente: potrebbe essere che si siano resi conto che SB rullando di brutto, sarebbe stato piu' temibile del previsto (ma un 10% in piu' di Nehalem mi sembra potesse essre piu' che auspicabile, anzi.. forse ci si aspettava pure molto di piu'), e quindi con un socket nuovo avrebbero potuto spremere fin da subito Bull, oppure semplicemente si rendono conto che hanno tra le mani un vero mostro, e quindi vogliono semplicemente spremere di piu' i futuri acquirenti XD.. vedremo! Non dimenticate pero' che se fosse vera la mia ipotesi di un 6moduli desktop il fatto di avere un socket nuovo verrebbe da se', nel senso che penso sarebbe una cosa inevitabile, e tutto potrebbe quadrare in una speculazione di questo tipo..

-La storia relativa al progetto fusion (bobcat e llano) e' un tasto un po' dolente, ed e' inutile far finta di non ammetterlo. AMD ha avuto l'idea rivoluzionaria, ma non si puo' certo dire che in questo settore ora come ora sia davanti ad intel, che aihme' con SB presentera' una architettura sostanzialmente similare, ovvero senza integrare due chip nello stesso package ma avendo cpu+gpu nello stesso pezzo di silicio e con parti condivise (l3 ad esempio). Mi sembra un dato di fatto, indipendentemente dalle potenze grafiche in gioco! Purtroppo AMD ha un po' perso il "treno della novità", e si e' fatta raggiungere anche in questo :( Il fero fusion sara' "fusion2", che a mio parere doveva uscire prima, molto prima di quando uscirà..

In generale comunque penso che Amd adottera' una tattica basata sulla scalabilità dei cores e sulla quantità degli stessi, semplificando i circuiti e tirando i Ghz. Intel puntera' sulla complessita' architetturale dei cores e sulla potenza single-thread. mi sembra di vedere la battaglia ATI vs Nvidia nel settore GPU. In quel settore AMD l'ha spuntata, ma contro un avversario con capacita' economiche e "persuasive" del calibro di Intel penso che questa volta sara' piu' dura.

Mi aspetto commendi del tipo "ad amd servono il doppio dei cores per battere Intel", ma mi aspetto sinceramente anche che in Multi-Th AMD la spuntera' senza troppi grossi problemi. Vedremo! :)

papafoxtrot

28-08-2010, 13:23

Tra un quad intel ed un six Amd ad oggi c'è una differenza di ipc a favore del primo che oscilla tra il 7 ed il 15%.
Da tutti i dati divulgati (sia da amd che da intel) non vedo proprio come si possa però asserire che un octa amd possa essere inferiore ad un quad intel (sb)
Facendo due calcoli spicci ipotizziamo un quad con ipc 100 ed un six con ipc 85.
Da quello che dice amd un octa avra un ipc di 42.5 che fa 127,5.
Ne consegue che Sb quad per essere alla pari di Bd octa dovrà avere un aumento di ipc di oltre il 25% (ma sembra che il suo incremento sia molto inferiore).
Indubbiamente un six Sb (con le attuali premesse) è inarrivabile da un octa (e solo avvicinato da un deca) amd, ma certamente superato da un dodeca.
Che Sb sia una ottima cpu non ci sono dubbi (nemmeno in assenza di innalzamenti di ipc), ma ipotizzare che un quad Db abbia lo stesso ipc di un Phenom quad mi sembra alquanto impossibile.

O porca miseria, ma allora non ci capiamo proprio!
Nessuno di noi ha mai ipotizzato che BD X8 sia inferiore a SB X4!! Ciò che stiamo dicendo è che ciò non sarà per nulla sufficiente, e che se BD X8 fosse analogo ad un SB X4 sarebbe la rovina di AMD!
BD (x8) DEVE prendere core i7 990x e SB X6.

E con questo, ripeto per l'ultima volta, non sto dicendo che ciò non sia possibile; sto dicendo che la cosa è necessaria, ma per nulla scontata.

carlottoIIx6

28-08-2010, 13:47

Non si conosce il die sie di bulldozer, ma considerando anche che la L2 di AMD è tipicamente più grossa (512kb) è difficile che il core AMD occupi meno di quello di SB. E il modulo ha il suo 12% in più.
225mm^2 sono un die size abbastanza piccolo, e soprattutto a differenza di AMD è inclusivo di GPU e controller PCI-express. Il che vuol dire che il core size è molto piccolo.

No, il modulo bulldozer sono DUE core. Questo lo ha detto l'AMD stessa. Finiamola di fare considerazioni sbagliate. Il modulo non è un grosso core alla intel.
Sono due piccoli core messi insieme cercando di occupare meno spazio possibile.
Il principio AMD è mettiamo tanti core semplici in poco posto, come per le GPU. Il principio intel è "facciamo 4 core che pestano come deficenti".
Il bulldozer E' un 8 core, è un top di gamma e coi top di gamma deve confrontarsi.

lasciami tranquillamente non pensarla come te :)

la domanda che mi pongo, ma dati alla mano e non speculazioni
sono le dimensioni del die!
senza un dato, che si potrà dire mai?
amd ha afermato di avere un desigh compatto!

GT82

28-08-2010, 13:49

@ papafoxtrot

dai calcoli che ho fatto sull'IPC, si intende quindi sempre a parità di frequenza, se un modulo BD andasse 1.125 volte un dual core K10 ne viene fuori che prendendo la tabella delle prestazioni qui su HWU (che fa un mix di single e multi threading) un BD 4 moduli (8 core) va un 18-20% di più di un Sandy X4 (8 threads)

ora, sempre prendendo quella tabella da Nehalem X4 a X6 il guadagno è del 22%, se la scalabilità di Sandy Bridge fosse la stessa significa quindi che come dici tu un BD X8 andrà come un Sandy X6
cioè sorpassare sia il 980X che il 990X

a livello di aree dovremmo esserci perchè se un modulo occupa il 12% (ma non era il 20%???) in più di un singolo core significa che in teoria nello spazio di un odierno Thuban ci possono stare 5 moduli e qualcosina avanza
mentre nello spazio di un Phenom X4 ci stanno 3 moduli (e si avanza parecchio qui, circa mezzo modulo)

altra cosa che vorrei portare nella discussione sulle aree è che l'aumento di core avvenuto tra Deneb e Thuban ha comportato un aumento dell'area utilizzata più che proporzionale a quanto occupa un singolo core dotato della sua cache da 512Kb

la causa penso sia dovuta al fatto che per motivi "geometrici" nel Thuban c'è più spazio libero, che quindi magari non consuma energia, ma però incide nei costi di produzione

Deneb

http://images.anandtech.com/reviews/cpu/amd/phenom2/810/900die.jpg

Thuban

http://techreport.com/r.x/phenom-ii-x6/thuban-die.jpg

si vede chiaramente che nel Thuban ci sono più aree "morte"

potrebbe essere uno svantaggio in termini produttivi per AMD che punta appunto ad un maggior numero di core Bruce Lee style rispetto ai minori core Schwarzenegger style di Intel? :D

.

carlottoIIx6

28-08-2010, 14:03

si vede chiaramente che nel Thuban ci sono più aree "morte"

.

aree morte?
valle a controllare il sabato sera'!
dove vanno gli esserini che attivano i transistor a divertirsi
secondo te? :)

cionci

28-08-2010, 14:07

l'aumento di IPC tra K10 dual core classico e modulo BD (2 core) è del 12.5%
L'IPC non è tutto. Contano anche le frequenze. Avendo una pipeline più lunga ed un critical path presumibilmente più corto potrebbe salire meglio in frequenza e quindi guadagnare, suppongo, un 10% di frequenza in più rispetto al K10 classico.

Quello che non mi è chiaro ancora è se la FPU avrà una specie di SMT (duplicazione del FP register file e scheduling delle istruzioni provenienti dai due thread in modo da occupare in modo ottimale l'unità FP) o sarà assegnata in ogni istante ad un singolo thread. Nel secondo caso non riesco a capire come verrà gestita l'attesa di un thread che non avrà accesso alla FPU o i meccanismi dell'eventuale revoca della FPU per evitare che questa venga assegnata per un intero time slice allo stesso thread.

GT82

28-08-2010, 14:27

aree morte?
valle a controllare il sabato sera'!
dove vanno gli esserini che attivano i transistor a divertirsi
secondo te? :)

:D :D :D

Alekz

28-08-2010, 14:50

Si sa già se usciranno versioni di bulldozer con un solo modulo, e quindi dual core?

calabar

28-08-2010, 15:03

Quindi BD dfa subito avrà come avversario core i7 990x (6 core 3,46GHz) ed è bene che vinca, subito.
Questa è una valutazione che possiamo fare solo conoscendo le precise date di uscita.
Dalla tua analisi comunque direi che BD, quando esce, si scontrerà con SB x4, e gli SB superiori arriveranno comunque mesi dopo.
Probabilmente pochi mesi, che potrebbero però sufficienti ad AMD per far uscire un prodotto competitivo senza troppo ritardo rispetto agli SB di fascia alta.

Oltretutto non capisco l'ostinazione a voler paragonare BD e SB per core quando AMD stessa ha chiaramente detto con quale mira sia stato concepito BD, ossia il confronto a parità di thread.
Sperare che un 4x BD sia competitivo con un x4 SB secondo me non solo è irrealistico, è proprio fantasioso.

Ma Thuban era già in roadmap, il che vuol dire che era già in progetto da tempo.
Un bulldozer a 12/16 core non è in roadmap! Non se lo inventano mica dall'oggi al domani! Non basta prendere il'opteron interlagos e cambiargli il nome!
E chi ti dice che AMD non abbia invece previsto un eventuale passaggio al settore Desktop dei 12-16 core se necessario?
E soprattutto... chi ti dice che sia tanto complicato il passaggio? La situazione è ben diversa da quella di Thuban, dove per renderlo competitivo nel settore desktop hanno dovuto inserire notevoli innovazioni e un processo produttivo migliorato, qui si tratterebbe semplicemente di portare il processore su Desktop.

Oltretutto continui a sostenere che thuban è uscito in quanto in roadmap. Ma seguendone l'uscita io ricordo invece che c'era totale incertezza sull'inserimento di questa cpu in roadmap e sulla sua uscita.
Thuban è stato inserito perchè è servito come sperimentazione del PP con low-k, e per contrastare gli i7 4x.

Questo ad esempio ha controller quad channel, a causa dell'unione di due chip! Per farlo entrare sulla scheda madre AM3+ devono cambiargli mezzo uncore, MC compreso, che deve diventare single channel per tutti e due i chip...
Oppure potrebbero far lavorare semplicemente ogni controller in single channel (così da ottenere un dual channel per AM3). Se anche lavorando in dual sarà competitivo, perchè non fare il passaggio facendo lavorare ognuno dei due controller in single channel?
Del resto abbiamo visto come in ambito desktop il tri channel degli i7 porti ben pochi miglioramenti.

Inoltre devono migliorare le prestazioni single core, perché gli utenti desktop faranno fatica a usare i 6/8 core, figurarsi 16...
MA questo vale anche per intel.I six core Intel scalano peggio perchè con SMT il numero di thread gestibili diventa sovrabbondante, tanto che non li sfrutta il vantaggio di questa tecnologia.
Stesso quindi per AMD, se il numero di core fosse eccessivo, il problema sarebbe simile.

Questo non lo possiamo sapere. Di che costo parli? Costo di produzione? Costo per te che lo compri?
Che AMD tenga prezzi competitivi non c'è dubbio! [...] Ergo, Se AMD fa competere gli X8 con gli X4 Intel ha già vinto, perché compete spendendo meno per produrre.
Io mi baso sulla dichiarazione di AMD di poter inserire due core dove intel ne inserisce uno. E tutti ben sappiamo che il modulo AMD è fatto per essere piccolo.
Poniamo pure che sia un po' più grande del modulo da un core di SB. Ma di quanto? Non certo il doppio, tanto da poter dire che ad Intel produrre un x4 costa quanto ad un AMD produrre un x4.
Quindi il vantaggio di costi di produzione a parità di core per AMD presumibilmente c'è, quindi ripeto la situazione odierna, ossia di vendere a prezzi ben differenti CPU con costo di produzione simile, comunque non dovrebbe ripetersi anche qualora l'x4 AMD non fosse competitivo con l'x4 intel (come presumo, del resto).

Si, ma quella è una GPU che esce tra 5 mesi, chissà che driver ha... E comunque gli da un 10% ad una scheda dedicata, che scusa se è poco, ma ha un suo MC, un suo bus, una RAM molto più veloce.
E questa GPU uscirà a frequenze più alte, anche e anche con hardware raddoppiato.
Io credo che la GPU di Llano sarà più potente, ma non sottovalutate quella di intel. Anche perché intel avrà una GPU del genere su uan CPU molto migliore di Llano.
Non importa cosa abbia o non abbia una 5450: è una scheda di fascia bassa e quelle sono le sue prestazioni.
Anche il 10% di vantaggio che affermi per la GPU di SB mi sembrano ottimistici (ma dovrei fare calcoli per verificare), in alcune prove è la 5450 ad essere superiore di quel tanto, non è sempre l'intel ad essere sopra.

Oltretutto per quanto Llano sia sicuramente inferiore a SB, non vedo come con una parte GPU tanto superiore possa andar meno di SB in quelle situazioni come i giochi in cui è la GPU (integrata) che fa le prestazioni.

JDM70

28-08-2010, 15:31

Io voglio dire la mia so già che prenderò tirate di orecchie a dritta e a manca,
secondo me e dico secondo me, AMD contrapporrà Un Modulo AMD contro un Core-Ht Intel, dico questo perchè a pensarci bene parlare di Smt non avrebbe senso, e poi quella parte in più "chiamamolo Int" che mi dà da pensare è un Int reale contro un Int virtuale?...

marchigiano

28-08-2010, 15:35

AMD può anche mettere 1000 core per quello che mi riguarda, basta che poi le prestazioni e i consumi in sigle e in multi siano competitive col Sandy...

mi pare che cinebench (software adatto al multicore) supporti max 64 cpu... è plausibile che tutti i programmi x86 abbiano un limite massimo di core utilizzabili, se la maggior parte si ferma a 4-6 core per amd potrebbe essere un problema

tanto si sa che i programmatori si basano su intel e windows, ai tempi dell'athlon 64 win xp-64 non è uscito finchè intel non ha fatto le prime cpu a 64 bit...

GT82

28-08-2010, 15:47

Anche il 10% di vantaggio che affermi per la GPU di SB mi sembrano ottimistici...

In effetti a prima lettura negli ultimi giochi non m'ero accorto che la 5450 sta sempre davanti

ciò non toglie il fatto che:

1) dopo oltre due anni in tema di IGP che passi avanti ci sono stati da 780g a 880G in termini di prestazioni/watt?

2) questa nuova SB Graphics va più del doppio della precedente (di un anno) HD Graphics

http://www.anandtech.com/show/3871/the-sandy-bridge-preview-three-wins-in-a-row/7

Batman= +10%

Dragon Age Origins= +27%

Dawn Of War II= -4.3%

Call of Duty Modern Warfare 2= +9.5%

BioShock 2= +8.9%

World Of Warcraft= -10.3%

HAWX= -12.3%

la 5450 è data per un TDP di 19.1 watt

ma non voglio proprio credere che AMD/ATI si fa raggiungere da Intel pure nella grafica, impossibile

LLano avrà per forza una APU cazzutissima, della serie altro che 5450...

GT82

28-08-2010, 15:51

Io voglio dire la mia so già che prenderò tirate di orecchie a dritta e a manca,
secondo me e dico secondo me, AMD contrapporrà Un Modulo AMD contro un Core-Ht Intel, dico questo perchè a pensarci bene parlare di Smt non avrebbe senso, e poi quella parte in più "chiamamolo Int" che mi dà da pensare è un Int reale contro un Int virtuale?...

Mi auguro per AMD che ciò non avvenga, perchè se un BD 4 moduli (8 core) andrà come un Sandy X4 è meglio che smettano di fare processori, questa volta sul serio...

un Sandy X4 non deve andare più di un BD 6 core, assolutamente

tutto questo ipotizzando frequenze simili, perchè come ha già detto papafoxtrot mi sembra, il consumo varia con il cubo della frequenza quindi non è per nulla conveniente salire

carlottoIIx6

28-08-2010, 16:10

Io voglio dire la mia so già che prenderò tirate di orecchie a dritta e a manca,
secondo me e dico secondo me, AMD contrapporrà Un Modulo AMD contro un Core-Ht Intel, dico questo perchè a pensarci bene parlare di Smt non avrebbe senso, e poi quella parte in più "chiamamolo Int" che mi dà da pensare è un Int reale contro un Int virtuale?...

esatto

Ares17

28-08-2010, 16:11

Mi auguro per AMD che ciò non avvenga, perchè se un BD 4 moduli (8 core) andrà come un Sandy X4 è meglio che smettano di fare processori, questa volta sul serio...

un Sandy X4 non deve andare più di un BD 6 core, assolutamente

tutto questo ipotizzando frequenze simili, perchè come ha già detto papafoxtrot mi sembra, il consumo varia con il cubo della frequenza quindi non è per nulla conveniente salire
Se un 4 moduli amd consumasse 45w a 3,4 ghz (ipotesi) cosa gli impedirebbe di salire di frequenza?
o pensi che i ppc di IBM a 4 ghz consumino 300w?
Ogni cpu ha la sua frequenza proporzianata al consumo e gia il fatto che i transistor amd (a causa del processo produttivo diverso) usino meno amperé dovrebbe farci riflettere sulle possibili differenze di frequenza.

JDM70

28-08-2010, 16:17

Mi auguro per AMD che ciò non avvenga, perchè se un BD 4 moduli (8 core) andrà come un Sandy X4 è meglio che smettano di fare processori, questa volta sul serio...

un Sandy X4 non deve andare più di un BD 6 core, assolutamente

tutto questo ipotizzando frequenze simili, perchè come ha già detto papafoxtrot mi sembra, il consumo varia con il cubo della frequenza quindi non è per nulla conveniente salire

No, intendo dire 4 moduli AMD"4+4" contro 4 core Intel "4+4", poi nulla vieta che 4 muduli AMD vadano più di 4 core intel, visto appunto che c'è una parte reale di core, non virtuale

Edit: e da questo mi vien anche da pensare alla frase che hanno detto "con questo approccio a Modulo viene rivoluzionato il modo di pensare al core come lo intendiamo adesso"

paolo.oliva2

28-08-2010, 16:23

Io non capisco perché se AMD fa prezzi "convenienti" si debba arrivare sempre al punto che "deve per forza aumentare i prezzi", "non può vendere in negativo" e menate varie.

Il 1090T all'uscita era sui 290€, oggi lo si compra a 240€, e stiamo parlando del modello top, perché addirittura i Thuban di fascia bassa costano anche meno di un X4 top, visto che cominciano ad essere sotto i 140€.

BD X8 ha una superficie di die inferiore al Thuban, di qui un costo produzione inferiore.
Se AMD continuasse a vendere allo stesso listino del Thuban X6, chiaramente avrebbe maggior profitto.
Ora... contando che l'ammortamento della realizzazione dell'architettura conterebbe sull'intera produzione AMD destinata sia per server che desktop, obiettivamente rinunciando a quella percentuale di guadagno data dal maggiore numero di die a wafer, potrebbe a tutti gli effetti conservare lo stesso prezzo di listino del Thuban.

Con un BD X8 B.E. proposto a 250€, ma anche a 300€, non ci sarebbe alcuna alternativa per rapporto prezzo/prestazioni.

Aggiungo.
Dando per scontato per SB X4 sarà meno potente, lo scalino successivo dell'offerta Intel sarà o l'i7 X6 o SB X6.
Contando che l'entry-level X6 Intel parte da 800€ e che SB costerà certamente di più, AMD che problemi avrebbe a proporre 2 BD X6 (sufficienti a prevalere su SB X6) o addirittura 2 BD X8 per contrastare un SB X8 e guadagnarci un totale?

Poi non è detto che AMD debba per forza ricorrere a 2 die... progettare un BD X10 nativo o anche X12 a me non sembrerebbe per nulla difficile, perché il TDP certamente lo permetterà, e se AMD ha realizzato bene la parte turbo, i clock per la parte 2-4-6 core sarebbe la medesiva anche con un 24 core, dove ciò che cambierebbe sarà solo il clock massimo con l'uso di tutti i core.

Insomma, sia commercialmente che potenzialmente, io non vedo assolutamente che quando sul finire del 2011 Intel proporrà gli SB X6 e X8 nel desktop, troverebbe AMD impreparata con nulla per controbattere... anzi, tutt'altro.

paolo.oliva2

28-08-2010, 16:27

Se un 4 moduli amd consumasse 45w a 3,4 ghz (ipotesi) cosa gli impedirebbe di salire di frequenza?
o pensi che i ppc di IBM a 4 ghz consumino 300w?
Ogni cpu ha la sua frequenza proporzianata al consumo e gia il fatto che i transistor amd (a causa del processo produttivo diverso) usino meno amperé dovrebbe farci riflettere sulle possibili differenze di frequenza.

La risposta è sia sulla frequenza che sul numero di core.

L'affermazione di AMD "noi doteremo i proci con 2 core fisici al posto di 1 fisico e 1 logico" dice tutto.

Se tra IPC e clock un BD X8 non contrasterà un SB X6, che problema c'è? BD X12. SB X8, BD X16. Voglio proprio vedere il clock e TDP di un SB X8 a 32nm, Haifa e non Haifa.

dark.halo

28-08-2010, 16:32

Se un 4 moduli amd consumasse 45w a 3,4 ghz (ipotesi) cosa gli impedirebbe di salire di frequenza?
o pensi che i ppc di IBM a 4 ghz consumino 300w?
Ogni cpu ha la sua frequenza proporzianata al consumo e gia il fatto che i transistor amd (a causa del processo produttivo diverso) usino meno amperé dovrebbe farci riflettere sulle possibili differenze di frequenza.

QUOTO...
AMD dice che ogni modulo dissipa 25W max (presumibilmente col turbo inserito) quindi 4 moduli 8 thread consumano (contando anche la cache e MC)
poco meno di 125W
25W col turbo/ facciamo c.a 20W senza * 4 moduli + 25W di l3/M.C. = 125W TDP
Alla fine SB va come ho ipotizzato io c.a +10% di IPC con -20% di consumi,insomma una bella bestiolina.

calabar

28-08-2010, 17:06

LLano avrà per forza una APU cazzutissima, della serie altro che 5450...
Beh credo oramai che la GPU di Llano sia superiore alla 5450 sia ormai una fatto assodato.

Dovrebbe avere 400/480 SP, quindi almeno quanto la 5670, con la pecca della banda passante ma l'incognita delle frequenze.

Dre@mwe@ver

28-08-2010, 17:17

Io non capisco perché se AMD fa prezzi "convenienti" si debba arrivare sempre al punto che "deve per forza aumentare i prezzi", "non può vendere in negativo" e menate varie.

Il 1090T all'uscita era sui 290€, oggi lo si compra a 240€, e stiamo parlando del modello top, perché addirittura i Thuban di fascia bassa costano anche meno di un X4 top, visto che cominciano ad essere sotto i 140€.

Per AMD non è affatto un bene vendere le proprie CPU a quei prezzi. Soprattutto per quanto riguardo l'X6, che ha un die size maggiore degli i7 e viene venduto a meno. In proporzione, AMD guadagna meno di Intel con le sue CPU.

Ad AMD non interessa affatto vendere a prezzi convenienti, quello che interessa ad AMD è incamerare la maggior quantità possibile di denaro. E tiene i prezzi bassi in relazione alle prestazioni soltanto perché deve conquistare maggiori quote di mercato per guadagnare di più.

AMD deve vendere BD a prezzi alti, altrimenti i soldi da investire in ricerca e sviluppo saranno sempre pochi, mentre Intel avrà quantità colossali di soldi da investire, portando sul mercato CPU sempre migliori mentre AMD sarà costretta ad arrancare, per poi fallire. Adesso però AMD ha dalla sua un CPU validissima come Bulldozer, che (a mio parere) sarà ben in grado di reggere contro la concorrenza, e quindi i prezzi dovranno essere più alti rispetto agli attuali. Esempio: BD X8 va come SB X6. Allora, l'esacore Sandy Bridge costa, per ipotesi, 700€. Allora AMD cosa deve fare? Di certo non può vendere il suo Bulldozer che ha le stesse prestazioni dell'X6 a 300€, ma deve venderlo a 700 come l'Intel. Magari lo venderà a 600€ per eliminare la concorrenza, e i guadagni saranno comunque alti dato che il die size di BD è molto basso.

In ogni caso quello che voglio dire è che Bulldozer è la CPU che può segnare la ribalta o il fallimento di AMD sul versante CPU, perché se con questa generazioni di processori AMD non riuscirà a colmare, o almeno a ridurre di molto il gap tecnologico che ha con Intel, la vedo molto brutta per questa azienda. Ma io sono convinto che le rivoluzioni apportate da questa architettura saranno premiate, AMD ci ha messo 5 anni per realizzarla, e di certo i suoi ingegneri non sono degli sprovveduti (soprattutto dopo il flop Phenom I 65nm). I miglioramenti saranno parecchi e le prestazioni alte: già il fatto che si sia cambiato socket è indicativo del fatto che AMD ha delle CPU che sono vincenti anche se non rappresentano l'ideale per gli upgrade :)

matt92tau

28-08-2010, 17:48

Per AMD non è affatto un bene vendere le proprie CPU a quei prezzi. Soprattutto per quanto riguardo l'X6, che ha un die size maggiore degli i7 e viene venduto a meno. In proporzione, AMD guadagna meno di Intel con le sue CPU.

...cut...

Guarda che ha die size maggiore non corrisponde sempre costo di produzione maggiore, a parità di die size ad AMD costa meno produrre una cpu rispetto ad Intel perché hanno diversi metodi di produzione.

Megakirops

28-08-2010, 17:54

vedo che gli animi si stanno scaldando....:D

cmq tutte belle speculazioni, complimenti :D

quoto tutti quelli che iniziano a parlare di moduli e non più di core....secondo me all'uscita di BD troveremo la sorpresa dei BDx4 a 4 moduli e 8 thread e BDx8 a 8 moduli e 16 thread, tanto il die size lo permette

B|4KWH|T3

28-08-2010, 17:56

Lui non è mica sicuro... Sta solo rispondendo a chi dice che gi bulldozer X8 si confronteranno con sandy bridge a 4 core e 8 thread.
Ciò è ovviamente un fregnaccia, perchP intel ha in programma SA a 6 e 8 core, e BD deve come minimo raggiungere i SB a 6 core. QUesto sta dicendo! Mica dice che non ce la farà!

Qualcuno qui sopra dice che confrontare per numero di core è sbagliato.
Può esserlo, si possono considerare altre variabili tra le quali i costi di produzione o i prezzi di vendita.
Ma bisogna considerare quella che è l'offerta dell'uno e dell'altro.
Dato che Intel venderà CPU a 6 e 8 core, bisogna che AMD, se vuole vendere degli 8 core, li faccia potenti.
Se vuole fare tanti core economici, nessun problema per me, ma bisogna che ne faccia tanti! Siccome AMD ne fa 8 di core, bisogna che questi 8 se la vedano coi 6 di intel.
Per questo si confronta per numero di core.
Inoltre si deve considerare il single thread. Se io ho 8 core e intel 4 e andiamo uguale in multi thread, quando passiamo al single thread io vado la metà di intel... E purtroppo sono pochi oggi i software usati dagli utenti desktop che sfruttano 8 core.
Certo ci sarò il turbo boost. Certo ce l'ha anche intel.

Insomma non diamo la cosa per scontata, e non pensiamo sempre che chi esprime dubbi su queste valutazioni sia un pessimista. La mia valutazione non è pessimista. Io confido che i sandy bridge 6c saranno a portata di mano. Ma non lo do per scontato. Intel sta migliorando un'architettura molto potente, molto versatile, e anche economica da produrre, visto che un core nehalem (4 core, HT e baracca varia) occupa poco meno silicio di un core deneb, mentre un core thuban è decisamente più grande e dunque costa di più. E il SOI + low-k non te lo regalano.

Insomma non diamo le cose per scontate... E non vendiamo Llano come il c hip del futuro... Sandy bridge sta arrivando col suo bravo chip video integrato ondie con L3 condivisa, tanto come Llano.

AMD ha già detto che (giustamente) NON ha interesse a vendere cpu DESKTOP (quelli che lei definisce "client") con un numero di core/thread così elevato.

Dico giustamente perchè NON esiste NESSUN utente desktop per cui quei core facciano la differenza.

NON ha senso parlare di processori senza tenere presente il tipo di codice che deve girarci sopra.

PS: Forse non vi ricordate il drastico abbassamento dei prezzi che c'è stato sugli Opteron con socket c32 e g34. Soprattutto i primi. E gli Opteron/Bulldozer andrano sul c32 e sul g34. Chi fa pesante uso di software multithread (professionisti/ricercatori più che altro) deve rivolgersi in quella fascia.

Heimdallr

28-08-2010, 17:58

Lui non è mica sicuro... Sta solo rispondendo a chi dice che gi bulldozer X8 si confronteranno con sandy bridge a 4 core e 8 thread.
Ciò è ovviamente un fregnaccia, perchP intel ha in programma SA a 6 e 8 core, e BD deve come minimo raggiungere i SB a 6 core. QUesto sta dicendo! Mica dice che non ce la farà!

Esattamente, confrontare il bulldozer X8 con i sandy bridge a 4 core secondo me è inutile, io mi aspetto che gli X8 seli mangino ai quad SB, semplicemente perchè quelli sono processori per la fascia mainstream che secondo me andrebbero confrontati con Llano, il vero confronto sarà tra bulldozer X6/X8 e gli intel 6/8 core (probabilmente gli 8 core Intel costeranno un rene :eek: ).

paolo.oliva2

28-08-2010, 18:02

Per AMD non è affatto un bene vendere le proprie CPU a quei prezzi. Soprattutto per quanto riguardo l'X6, che ha un die size maggiore degli i7 e viene venduto a meno. In proporzione, AMD guadagna meno di Intel con le sue CPU.
Beh, scusa, questo ormai si sa. Però un 1090T non costa di più di un 1035T, chiaramente è giustificato un prezzo più alto per diciamo una selezione e prodotto migliore. Però certamente è meno giustificato che la situazione che lo stesso modello di procio per ogni 100MHz in più di clock stock, costa il doppio del precedente.

Ad AMD non interessa affatto vendere a prezzi convenienti, quello che interessa ad AMD è incamerare la maggior quantità possibile di denaro. E tiene i prezzi bassi in relazione alle prestazioni soltanto perché deve conquistare maggiori quote di mercato per guadagnare di più.
Ma questo è normale logica di mercato, che se si sposa con la logica del mio portafoglio, si va bene a braccetto.

AMD deve vendere BD a prezzi alti, altrimenti i soldi da investire in ricerca e sviluppo saranno sempre pochi, mentre Intel avrà quantità colossali di soldi da investire, portando sul mercato CPU sempre migliori mentre AMD sarà costretta ad arrancare, per poi fallire.
Questo non è vero.
Dipende da come è strutturato il bilancio. Intel può destinare l'1% dei profitti alla ricerca come AMD può destinare il 20% di profitti. Non ha alcuna importanza (o almeno relativa) quanto si guadagna a procio e quanto si guadagna in totale.
Se fai mente locale, AMD sino a 2 anni fa, faceva 1 investimento per architettura superiore (principalmente per server) e poi lo riciclava anche nel desktop.
Se invece guardi ultimamente quello che ha portato avanti (guarda a caso quando la maggior parte della gente pensava che AMD fallisse), noteresti che l'impegno si può dire perfino superiore a quello Intel.
Da D0 a D1 per l'X6 server per permettere Magny-C 8 e 12 core.
E0 per il Thuban descktop
Fusion con Llano e Bobcat
Buldozer.

Secondo il tuo discorso, facendo il conteggio di quello che ha incassato in questi anni vendendo i proci a prezzo basso, lo avrebbe potuto fare? NO, ed invece SI.
Intel con quello che ha incassato dovrebbe avere almeno 100 volte di più di progetti ed essere al 12nm di silicio... invece? Cosa vuole dire ciò?
Che una ditta destina 1 miliardo di $ (a caso) per la ricerca ed il resto lo mette in tasca. Sicuramente Intel le tasche le ha piene ed AMD meno, non lo metto in dubbio, ma comunque io sono felice se BD X8 a 3,8GHz con turbo a 4,5GHz, B.E., lo potrei comprare a 300€.

Adesso però AMD ha dalla sua un CPU validissima come Bulldozer, che (a mio parere) sarà ben in grado di reggere contro la concorrenza, e quindi i prezzi dovranno essere più alti rispetto agli attuali. Esempio: BD X8 va come SB X6. Allora, l'esacore Sandy Bridge costa, per ipotesi, 700€. Allora AMD cosa deve fare? Di certo non può vendere il suo Bulldozer che ha le stesse prestazioni dell'X6 a 300€, ma deve venderlo a 700 come l'Intel. Magari lo venderà a 600€ per eliminare la concorrenza, e i guadagni saranno comunque alti dato che il die size di BD è molto basso.
Il tuo discorso è più che giusto, però io la vedo in modo diverso.
Per me il guadagno è nella quantità e non nel prezzo singolo. Inoltre la gente non la schiodi da Intel se hai un prodotto equivalente ed anche migliore allo stesso prezzo... la schiodi se vendi un procio a 250€ con l'equivalente potenza di quello che a listino Intel vende a 1000€.
Non mi fraintendete, non sto parlando di guerra all'Intel, ma solo unicamente di strategia commerciale. Del resto, se Intel all'epoca dei Core2 avesse venduto un Q9650 a 150€, oggi AMD non esisterebbe e potrebbe tranquillamente vendere un i920 a 800€ senza preoccuparsi di investire nel silicio e nelle architetture..

In ogni caso quello che voglio dire è che Bulldozer è la CPU che può segnare la ribalta o il fallimento di AMD sul versante CPU, perché se con questa generazioni di processori AMD non riuscirà a colmare, o almeno a ridurre di molto il gap tecnologico che ha con Intel, la vedo molto brutta per questa azienda. Ma io sono convinto che le rivoluzioni apportate da questa architettura saranno premiate, AMD ci ha messo 5 anni per realizzarla, e di certo i suoi ingegneri non sono degli sprovveduti (soprattutto dopo il flop Phenom I 65nm). I miglioramenti saranno parecchi e le prestazioni alte: già il fatto che si sia cambiato socket è indicativo del fatto che AMD ha delle CPU che sono vincenti anche se non rappresentano l'ideale per gli upgrade :)
Io non la vedo in questo modo. Che BD vada o non vada, AMD ha un alleato in Intel: il suo prezzo di listino. Finché Intel avrà listini esponenziali, AMD potrebbe ancora vendere un 940 C2 a 3GHz rimanendo concorrenziale come prestazioni-prezzo, perché immancabilmente Intel aumenterà il suo listino.

B|4KWH|T3

28-08-2010, 18:04

...

Ora tu non mi puoi dire che il deneb va bene per il semplice fatto che costa 100 euro. Deneb ti può andare benone a te, va benone a me... a 100 euro. Ma all'amd vendere il deneb a 100 euro, è tutto fuorché una buona cosa!
Deneb gli costa in produzione almeno tanto come un core i7. Solo che il core i7 intel lo vende a 200 euro. AMD il phenom II X4 955T lo vende a 120.
Chi guadagna di più?[...]

Ma chi l'ha detto?
Dipende tutto dai volumi di vendita e dai costi di produzione!
E, aggiungo, anche dalle capacità di produzione

[quote]
[...]
Risultato.
Bulldozer deve essere capace con 8 core di eguagliare un sandy bridge a 6 core. In questo modo AMD venderà bulldozer a 300 euro, batterà cassa, investirà in ricerca e sviluppo e fusion 2 sarà una bestia.

SB 6 core a 300 euro non esisterà mai

gianni1879

28-08-2010, 18:08

Datevi una sonora calmata un pò tutti, sennò le sospensioni fioccheranno come nulla fosse.

Per chi segue la discussione invito ad usare toni pacati, ed a smetterla di fasciarsi la testa prima ancora di un debutto ufficiale.

B|4KWH|T3

28-08-2010, 18:20

1- considerando un IPC immutato tra Phenom II e BD

:mbe:
Ma l'hai vista la preview dell'architettura?.
Questo è il più grosso cambiamento dai tempi del K7 e ti aspetti un IPC immutato?

Jean240

28-08-2010, 18:28

:mbe:
Ma l'hai vista la preview dell'architettura?.
Questo è il più grosso cambiamento dai tempi del K7 e ti aspetti un IPC immutato?

Quello che vorrei fargli capire..non può essere immutato per niente..anche se piccolo ma ci sarà per forza di cose!!

GT82

28-08-2010, 18:30

:mbe:
Ma l'hai vista la preview dell'architettura?.
Questo è il più grosso cambiamento dai tempi del K7 e ti aspetti un IPC immutato?

Bhe considerato che un modulo occupa solo il 12% in più di un dual core "vero", visto che hanno tolto parecchia roba, secondo me sarebbe già discreto come lavoro

magari proprio uguale no, io ipotizzavo l'uguaglianza in modo da stare con i piedi per terra, poi tutto quello che arriva in più, ben venga!
potrebbe starci il +12.5% di cui abbiamo parlato parecchio

AMD non ha scelto la strada presa da Intel di fare core muscolosi, ma al contrario fare core più semplici, magari meno prestanti ma allo stesso tempo più piccoli e meno assetati di energia, in modo da mettercene di più a parità di spazio

B|4KWH|T3

28-08-2010, 18:34

Bhe considerato che un modulo occupa solo il 12% in più di un dual core "vero", visto che hanno tolto parecchia roba, secondo me sarebbe già discreto come lavoro

magari proprio uguale no, io ipotizzavo l'uguaglianza in modo da stare con i piedi per terra, poi tutto quello che arriva in più, ben venga!
potrebbe starci il +12.5% di cui abbiamo parlato parecchio

AMD non ha scelto la strada presa da Intel di fare core muscolosi, ma al contrario fare core più semplici, magari meno prestanti ma allo stesso tempo più piccoli e meno assetati di energia, in modo da mettercene di più a parità di spazio

AMD ha detto che è riuscita a raggiungere in quel modo l'80% di prestazioni rispetto a due core completi. Ma non intendeva due core Phenom II, intendeva 2 core completi con la nuova architettura.
Quindi non ci sono (ancora) elementi per comparare direttamente le due architetture.

B|4KWH|T3

28-08-2010, 18:35

E comunque se occupa solo il 12% in più penso che non ci metta niente a fare un 6 moduli qualora ne avesse la necessità

BodyKnight

28-08-2010, 19:06

Ma il bulldozer in che fonderie si fa? GF o TSMC?

Mi auguro per amd che li faccia uscire senza problemi prima dell'archiviazione dei gulftown da parte della intel.

Jean240

28-08-2010, 19:14

Ma il bulldozer in che fonderie si fa? GF o TSMC?

Mi auguro per amd che li faccia uscire senza problemi prima dell'archiviazione dei gulftown da parte della intel.

GF..

bjt2

28-08-2010, 19:26

Il caro Dresdenboy si prende una settimana di "riposo", ma prima ci lascia un post sul suo blog MOOOOOOLTO interessante:

http://citavia.blog.de/2010/08/27/a-quick-round-of-links-9265110/

La cosa più interessante è la seguente:

Thuban e company hanno una pipeline di 22 FO4 (non 24, sorry). Mentre Bulldozer ha una pipeline di 17 FO4. Quindi una pipeline del 30% più veloce. Questo vuol dire che a parità di processo (quindi anche se buldozer fosse fatto con il 45nm low-k liscio di adesso), potrebbe andare fino al 30% più veloce in clock. Considerando il nuovo processo, questo significa frequenze MOLTO alte. Ricordo che il FO4 del Pentium 4 è stimato in 16. Quindi possiamo aspettarci anche frequenze dell'ordine del 5GHz (almeno in turbo mode)...

Facciamo 2 conti per un ipotetico bulldozer X6. Un X6 Phenom II attuale va a 3.2GHz. +30% per la pipeline più lunga, +40% per il processo più parco, sono 5.8 GHz. Ora non credo che arriveremo a tanto perchè penso che AMD faccia i transistors più piccoli (e quindi più lenti) per occupare meno area e comunque con una pipeline del 30% più veloce non si va il 30% più su di clock perchè i tempi di ritardo tra i vari stadi non migliorano e quindi una pipeline così corta garantisce un 15, massimo 20% in più. Questo per dire che un clock stock di oltre 4GHz come X6 e forse anche come X8 lo si può sperare...

cionci

28-08-2010, 19:33

Che si intende per FO4 ?

cionci

28-08-2010, 19:40

Che si intende per FO4 ?
Ok, mi sono risposto da solo: è una metrica per misurare delay massimo in modo indipendente dalla tecnologia di produzione. In questo caso 17 FO4 è il delay del critical path (cioè in questo caso lo stage con delay più alto della pipeline).

bjt2: sinceramente il 40% di guadagno in frequenza per il cambio di processo produttivo mi sembra esagerato. Ultimamente non mi sembra che l'aumento in frequenza sia andato oltre il 25%. Solitamente poi il 25% si ottiene verso la fine del ciclo di vita del processo produttivo.

papafoxtrot

28-08-2010, 19:59

Ok, mi sono risposto da solo: è una metrica per misurare delay massimo in modo indipendente dalla tecnologia di produzione. In questo caso 17 FO4 è il delay del critical path (cioè in questo caso lo stage con delay più alto della pipeline).

bjt2: sinceramente il 40% di guadagno in frequenza per il cambio di processo produttivo mi sembra esagerato. Ultimamente non mi sembra che l'aumento in frequenza sia andato oltre il 25%. Solitamente poi il 25% si ottiene verso la fine del ciclo di vita del processo produttivo.

Ti ringrazio per il chiarimento. Sono invece d'accordo sul miglioramento delle frequenze. Il passo in avanti più grande mai fatto con le frequenze di una architettura passando da un processo all'altro è stato indubbiamente quello di phenom. Era arrivato a 2,6GHz a 65nm, ed è saltato a 3,4GHz a 45nm, dunque un aumento di 800MHz pari al 30% della frequenza originale.
E appunto ciò si è verificato dopo quasi un anno dall'attivazione della produzione a 45nm.
Consideriamo che il 32nm avrà anche HKMG, possiamo aspettarci forse un +30% al lancio, ma solo se oltre ad HKMG ci sarà anche il ow-k. Qualche informazione precisa in merit? Fonti?

Per quanto riguarda le cache vorrei ancora chiedere a bjt2: si è certi dell'uso di celle 8C anziché 6C? In cosa consiste la differenza?
C'è qualche possibilità che AMD usi memoria Z-RAM per la L3?

marchigiano

28-08-2010, 20:23

c'è da dire che dai test di anand l'HT di SB serve quasi a niente a parte un paio di test dove da significativi guadagni... quindi magari queste unità BD potrebbero ridurre il gap, specie se come dice cionci possono servire le due alu contemporaneamente e senza dover fare o moltiplicazioni o somme insieme come nel phenom (almeno spero di non aver detto una cassata :D )

bicchiere

28-08-2010, 20:46

Tornando a Fusion, è chiaro che ci vorranno driver particolari per sfruttare cpu e gpu, o perfino integrare le due cose.

E a questo punto mi domando, che ne sarà di Linux?
Avrà driver open, closed o CICCIA?
Si sa già quali saranno i sistemi operativi supportati da Fusion?

bjt2

28-08-2010, 20:54

Ok, mi sono risposto da solo: è una metrica per misurare delay massimo in modo indipendente dalla tecnologia di produzione. In questo caso 17 FO4 è il delay del critical path (cioè in questo caso lo stage con delay più alto della pipeline).

bjt2: sinceramente il 40% di guadagno in frequenza per il cambio di processo produttivo mi sembra esagerato. Ultimamente non mi sembra che l'aumento in frequenza sia andato oltre il 25%. Solitamente poi il 25% si ottiene verso la fine del ciclo di vita del processo produttivo.

Il 40% di clock in più o il 50% di tdp in meno sono i proclami di GF... Poi è possibile che non ci si riesca... :)
Ora qui c'è l'HKMG che consente di scendere del 20% le tensioni, portando anche alla diminuzione del già basso leakage... 20% in meno di tensione significa almeno 40% in meno di potenza statica in meno, considerando il leakage costante (cosa non vera)... Passando dal 65nm al 45nm AMD non aveva ottenuto un grande scaling anche perchè non c'erano grosse novità... Il processo di incisione a lenti liquide serve solo per avere una buona risoluzione senza cambiare il laser... Quindi il 50% non lo vedo così campato in aria... :)

Ti ringrazio per il chiarimento. Sono invece d'accordo sul miglioramento delle frequenze. Il passo in avanti più grande mai fatto con le frequenze di una architettura passando da un processo all'altro è stato indubbiamente quello di phenom. Era arrivato a 2,6GHz a 65nm, ed è saltato a 3,4GHz a 45nm, dunque un aumento di 800MHz pari al 30% della frequenza originale.
E appunto ciò si è verificato dopo quasi un anno dall'attivazione della produzione a 45nm.
Consideriamo che il 32nm avrà anche HKMG, possiamo aspettarci forse un +30% al lancio, ma solo se oltre ad HKMG ci sarà anche il ow-k. Qualche informazione precisa in merit? Fonti?

Per quanto riguarda le cache vorrei ancora chiedere a bjt2: si è certi dell'uso di celle 8C anziché 6C? In cosa consiste la differenza?
C'è qualche possibilità che AMD usi memoria Z-RAM per la L3?

Il low-k spero che ci sia... Dubito che una volta collaudato sul 45nm e sopratutto visti i risultati che da, lo si metta da parte... :)
Le celle 8C dovrebbe essere certo, persino su Llano. Se non mi sbaglio hanno maggiore figura di rumore, quindi consentono tensione minore oppure, a parità di tensione, minori latenze... Ecco perchè le caches INTEL sono sempre state più veloci...
La L3 come Z-RAM non so se sia il caso di sperarla: si è già visto che l'architettura AMD non migliora di molto le prestazioni con una grossa L3, ma che è importante la latenza della L3... Una SRAM 6C o 8C è più veloce di una Z-RAM...

paolo.oliva2

28-08-2010, 21:20

@Bjt2.

Domanda da nubbio. :)

La lunghezza delle pipeline è una costante o comunque dipendente dal silicio?
Tipo... procio X, pipeline 10 su 90nm, max 5GHz, se il silicio arriva a quella frequenza bene, altrimenti amen. Stesso procio, pipeline 10, ma silicio 45nm, l'architettura avrebbe lo stesso limite di 5GHz anche se il silicio potesse dare 6GHz? Oppure la pipeline risente comunque di latenze inferiori per la riduzione del silicio e quindi permettere di più?

Perché il PIV era fatto a 90nm o 120nm? Se Buldozer ha una pipeline simile ma 32nm è equiparabile o promette più velocità?

paolo.oliva2

28-08-2010, 21:25

Il caro Dresdenboy si prende una settimana di "riposo", ma prima ci lascia un post sul suo blog MOOOOOOLTO interessante:

http://citavia.blog.de/2010/08/27/a-quick-round-of-links-9265110/

La cosa più interessante è la seguente:

Thuban e company hanno una pipeline di 22 FO4 (non 24, sorry). Mentre Bulldozer ha una pipeline di 17 FO4. Quindi una pipeline del 30% più veloce. Questo vuol dire che a parità di processo (quindi anche se buldozer fosse fatto con il 45nm low-k liscio di adesso), potrebbe andare fino al 30% più veloce in clock. Considerando il nuovo processo, questo significa frequenze MOLTO alte. Ricordo che il FO4 del Pentium 4 è stimato in 16. Quindi possiamo aspettarci anche frequenze dell'ordine del 5GHz (almeno in turbo mode)...

Facciamo 2 conti per un ipotetico bulldozer X6. Un X6 Phenom II attuale va a 3.2GHz. +30% per la pipeline più lunga, +40% per il processo più parco, sono 5.8 GHz. Ora non credo che arriveremo a tanto perchè penso che AMD faccia i transistors più piccoli (e quindi più lenti) per occupare meno area e comunque con una pipeline del 30% più veloce non si va il 30% più su di clock perchè i tempi di ritardo tra i vari stadi non migliorano e quindi una pipeline così corta garantisce un 15, massimo 20% in più. Questo per dire che un clock stock di oltre 4GHz come X6 e forse anche come X8 lo si può sperare...
Allora... anche in caso di IPC non "spettacolare", con un aumento del 30-35% del clock rispetto ad adesso, anche un Thuban andrebbe come un X6 i7 i980X (SB penso di no).

Il mio portafoglio comincia a tremare... col cavolo che un BD X8 costerà 300€ :mad:

Sto giro rimaniamo fregati tutti....

Capozz

28-08-2010, 21:58

Allora... anche in caso di IPC non "spettacolare", con un aumento del 30-35% del clock rispetto ad adesso, anche un Thuban andrebbe come un X6 i7 i980X (SB penso di no).

Il mio portafoglio comincia a tremare... col cavolo che un BD X8 costerà 300€ :mad:

Sto giro rimaniamo fregati tutti....

E a quanto lo metterebbero ?
Amd non è proprio nella posizione di poter sparare processori desktop a 400/500 euro, deve aumentare la propria quota di mercato.

bjt2

28-08-2010, 22:29

@Bjt2.

Domanda da nubbio. :)

La lunghezza delle pipeline è una costante o comunque dipendente dal silicio?
Tipo... procio X, pipeline 10 su 90nm, max 5GHz, se il silicio arriva a quella frequenza bene, altrimenti amen. Stesso procio, pipeline 10, ma silicio 45nm, l'architettura avrebbe lo stesso limite di 5GHz anche se il silicio potesse dare 6GHz? Oppure la pipeline risente comunque di latenze inferiori per la riduzione del silicio e quindi permettere di più?

Perché il PIV era fatto a 90nm o 120nm? Se Buldozer ha una pipeline simile ma 32nm è equiparabile o promette più velocità?
Non sono sicuro di aver capito la domanda. In ogni caso:
Il FO4 è una misura della complessità dello stadio della pipeline. Fissata la pipeline, la complessità è data. Poi si può implementarla a 130, 90, 65, 45, 32nm ecc... A seconda del processo, sarà maggiore la frequenza a cui potrà andare... Non esiste un limite intrinseco al clock dato un processo, o meglio, esiste un limite intrinseco dato un FO4 di una architettura. La combinazione di FO4 e processo da la velocità.

Per esempio. Il Power 7 ha un FO4 di 17 (mi pare) ed è stato implementato con il 45nm, mi pare con il Low-k. Ora quel processore ha una caterva di transisors. Il quadcore arriva a 4.14 GHz e l'octacore a 3.96 Ghz... Un ipotetico bulldozer X4 fatto a 45nm (il processo del Thuban) sarebbe arrivato a 4.2-4.3 stock, minimo, sia perchè il Power 7 ha molti più transistors e molte più unità attive (un quad core ha 16 thread, e ogni core ha mi pare 12 unità di esecuzione), sia perchè il Power 7 è una CPU server e tradizionalmente queste hanno qualche centinaia di MHz in meno delle controparti desktop...

EDIT: in ogni caso, nel caso peggiore, un buldozer X4 a 4.1 Ghz e un Bulldozer X8 a 3.9 Ghz è fattibile visto il Power 7, anche con questo 45nm Low-k. Ricordiamo che IBM usa lo stesso processo di GF/AMD...

EDIT: Su wikipedia dice che esiste una versione quadcore da 4.25 Ghz. Il Power6 che aveva un FO4 di 13 arrivava a 5GHz e IBM aveva in laboratorio un prototipo funzionante a 6GHz...

EDIT: sto leggendo su google gruppi che tra Thuban e Buldozer, c'è un progetto cancellato che aveva un FO4 di 13... Sarebbe arrivato a 5GHz con il 45nm! Dice anche che BD dovrebbe avere un IPC (A PARITA' DI FREQUENZA) del 20-25% in più. Il tizio sembra essere un ex dipendente AMD che ha lavorato al progetto... Il gruppo in guestione è http://groups.google.de/group/comp.arch/browse_thread/thread/45018bf3214f6049?hl=de# e il tipo si chiama Mitch_qualcosa...

paolo.oliva2

28-08-2010, 23:14

Non sono sicuro di aver capito la domanda. In ogni caso:
Il FO4 è una misura della complessità dello stadio della pipeline. Fissata la pipeline, la complessità è data. Poi si può implementarla a 130, 90, 65, 45, 32nm ecc... A seconda del processo, sarà maggiore la frequenza a cui potrà andare... Non esiste un limite intrinseco al clock dato un processo, o meglio, esiste un limite intrinseco dato un FO4 di una architettura. La combinazione di FO4 e processo da la velocità.

Per esempio. Il Power 7 ha un FO4 di 17 (mi pare) ed è stato implementato con il 45nm, mi pare con il Low-k. Ora quel processore ha una caterva di transisors. Il quadcore arriva a 4.14 GHz e l'octacore a 3.96 Ghz... Un ipotetico bulldozer X4 fatto a 45nm (il processo del Thuban) sarebbe arrivato a 4.2-4.3 stock, minimo, sia perchè il Power 7 ha molti più transistors e molte più unità attive (un quad core ha 16 thread, e ogni core ha mi pare 12 unità di esecuzione), sia perchè il Power 7 è una CPU server e tradizionalmente queste hanno qualche centinaia di MHz in meno delle controparti desktop...

EDIT: in ogni caso, nel caso peggiore, un buldozer X4 a 4.1 Ghz e un Bulldozer X8 a 3.9 Ghz è fattibile visto il Power 7, anche con questo 45nm Low-k. Ricordiamo che IBM usa lo stesso processo di GF/AMD...

EDIT: Su wikipedia dice che esiste una versione quadcore da 4.25 Ghz. Il Power6 che aveva un FO4 di 13 arrivava a 5GHz e IBM aveva in laboratorio un prototipo funzionante a 6GHz...

EDIT: sto leggendo su google gruppi che tra Thuban e Buldozer, c'è un progetto cancellato che aveva un FO4 di 13... Sarebbe arrivato a 5GHz con il 45nm! Dice anche che BD dovrebbe avere un IPC (A PARITA' DI FREQUENZA) del 20-25% in più. Il tizio sembra essere un ex dipendente AMD che ha lavorato al progetto...

Se BD dovesse avere un 20-25% di IPC in più con quel clock che si ritroverebbe sarebbe un mostro.
Adesso provo a fare qualche tabella con excel... :)

Capozz

28-08-2010, 23:30

Se BD dovesse avere un 20-25% di IPC in più con quel clock che si ritroverebbe sarebbe un mostro.
Adesso provo a fare qualche tabella con excel... :)

Con un 20/25% di ipc in più rispetto a K10 con delle frequenze così elevate (e magari qualche margine di overclock) verrebbe fuori una bestia non da poco.
Bah, lo spero vivamente ma non sono così ottimista, almeno sul clock.

bjt2

28-08-2010, 23:51

Se BD dovesse avere un 20-25% di IPC in più con quel clock che si ritroverebbe sarebbe un mostro.
Adesso provo a fare qualche tabella con excel... :)

Con un 20/25% di ipc in più rispetto a K10 con delle frequenze così elevate (e magari qualche margine di overclock) verrebbe fuori una bestia non da poco.
Bah, lo spero vivamente ma non sono così ottimista, almeno sul clock.

Ho messo il link a google groups apposta. Il tipo si da le arie da ex dipendente AMD che ha lavorato anche su bulldozer. Io non credo sia un mitomane perchè lo avrebbero sgamato. Da come parla sembra quantomeno competente...
A dire la verità dice anche che si perde un 5% di IPC per la microarchitettura. E poi ho capito dopo cosa intendeva: passando da 22 FO4 a 17 FO4 si è perso qualche forwarding path che accellerava qualcosina, ma lui dice che era così allo stadio a cui lui ha lasciato il progetto e che potrebbero aver risolto diversamente...

Comunque 20% in più di IPC, 30-40% di più in clock... Non oso pensare...

paolo.oliva2

29-08-2010, 00:01

fatto

Il tutto è diviso in tabelle.
Per non dare fastidio a nessuno, sono partito da un IPC inferiore del 10% sino ad arrivare ad un IPC maggiore del 25%.
Come base è un BD X8, quindi ho impostato un 33% in più rispetto al Thuban per il fatto dei 2 core in più.
Ogni tabella ha la percentuale di IPC teorica del BD nel titolo, la frequenza teorica di BD nella 1a colonna e la frequenza risultante per un Thuban per uguagliare la potenza nella seconda colonna. Nella terza colonna infine c'è il rapporto.
Per facilitare la lettura, ho messo sfondo rosso nel caso il rapporto sia inferiore di 1,5, giallo sino a 2 e verde maggiore di 2.

http://www.pctunerup.com/up/results/_201008/20100828235334_BuldozerThuban1.jpg

http://www.pctunerup.com/up/results/_201008/20100828235408_BuldozerThuban2.jpg

http://www.pctunerup.com/up/results/_201008/20100828235431_BuldozerThuban3.jpg

paolo.oliva2

29-08-2010, 00:07

E' impressionante.
Con un IPC inferiore del 10% e con un clock di solo 4GHz, un BD X8 sarebbe già del 50% più potente di un Thuban, corrispondente ad un 1090T a 4,79GHz.

Con un IPC maggiore del 15% e con clock a 4GHz... sarebbe già impressionante... praticamente quasi il doppio di un Thuban def.

Se penso che in OC io arrivo a 8, sarebbe in grado di fare 16 :eek:

paolo.oliva2

29-08-2010, 00:09

Ho messo il link a google groups apposta. Il tipo si da le arie da ex dipendente AMD che ha lavorato anche su bulldozer. Io non credo sia un mitomane perchè lo avrebbero sgamato. Da come parla sembra quantomeno competente...
A dire la verità dice anche che si perde un 5% di IPC per la microarchitettura. E poi ho capito dopo cosa intendeva: passando da 22 FO4 a 17 FO4 si è perso qualche forwarding path che accellerava qualcosina, ma lui dice che era così allo stadio a cui lui ha lasciato il progetto e che potrebbero aver risolto diversamente...

Comunque 20% in più di IPC, 30-40% di più in clock... Non oso pensare...

Corrisponderebbe ad un Thuban @6,710GHz ed esattamente 2,1 volte il Thuban def.
Cinebench sui 17 :eek:

Un BD X16 anche a solo 3GHz sarebbe sovrumano...

somethingstrangeinyourmind

29-08-2010, 00:15

Ragazzi siete dei grafomani!
Vi lascio qualche ora e mi ritrovo 5 pagine di thread da leggere!
Scherzi a parte complimenti a tutti per gli spunti ed i ragionamenti.
Mi sembra però che ci si stia concentrando molto su BD e poco su Llano.

XCRYSIS95

29-08-2010, 01:29

Ma se Bulldozer userà un nuovo socket (AM3 +) i vecchi processori Am3 saranno compatibili con il nuovo socket ,che pensate ? :)

Capozz

29-08-2010, 01:39

Ragazzi siete dei grafomani!
Vi lascio qualche ora e mi ritrovo 5 pagine di thread da leggere!
Scherzi a parte complimenti a tutti per gli spunti ed i ragionamenti.
Mi sembra però che ci si stia concentrando molto su BD e poco su Llano.

Beh alla fine Llano è praticamente noto: conosciamo l'architettura, sappiamo le prestazioni della componente cpu e possiamo immaginare quelle della gpu, il momento migliore per parlarne sarà dopo l'uscita e verificare quanto la combinazione cpu+gpu possa dare dei risultati concreti.
Bulldozer invece è qualcosa di totalmente nuovo rispetto al passato, decisamente più intrigante :D

Capozz

29-08-2010, 01:40

Ma se Bulldozer userà un nuovo socket (AM3 +) i vecchi processori Am3 saranno compatibili con il nuovo socket ,che pensate ? :)

A quanto pare no.

floydbarber

29-08-2010, 01:56

A quanto pare no.

Veramente si diceva di si. E poi, altrimenti che senso avrebbe chiamarlo AM3+?

Pihippo

29-08-2010, 02:38

Ho messo il link a google groups apposta. Il tipo si da le arie da ex dipendente AMD che ha lavorato anche su bulldozer. Io non credo sia un mitomane perchè lo avrebbero sgamato. Da come parla sembra quantomeno competente...
A dire la verità dice anche che si perde un 5% di IPC per la microarchitettura. E poi ho capito dopo cosa intendeva: passando da 22 FO4 a 17 FO4 si è perso qualche forwarding path che accellerava qualcosina, ma lui dice che era così allo stadio a cui lui ha lasciato il progetto e che potrebbero aver risolto diversamente...

Comunque 20% in più di IPC, 30-40% di più in clock... Non oso pensare...

Ciao Bjt2. Sei un grande :)
Letta la discussione linkata, Posto cosa dice Mitchaslup

The issue was that the 3rd unit was used a lot, only to run into the
dual-only ported DataCache. This caused sequencing issues.

Inoltre un tizio gli chede: The third ALU is of more concern, Intel will standardize benchmarks to
make this look bad, even though I know it was used 1% on average

E lui risponde:
So what else is new?

C'è da ridere o da piangere? Ci potresti illuminare anche sulla parte della terza unità?

paolo.oliva2

29-08-2010, 02:39

STRAIN engineering has become one of the main con-
- [ Traduci questa pagina ]
16 ago 2010 - for 32-nm SOI CMOS technology with HKMG. Performance .... technology with enhanced stress, porous low-k BEOL and immersion lithography,” in IEDM Tech. ...
ieeexplore.ieee.org/iel5/16/5491381/05467180.pdf?tp=&arnumber...

Porc zocc, ci vuole la password

http://www.pctunerup.com/up/results/_201008/20100829023856_32nm.jpg

Però li riporta pure low-k.
Se il 32nm HKMG AMD esce alla partenza con il low-k, sono caxxi... andrebbe a palla.

cionci

29-08-2010, 02:59

@Bjt2.

Domanda da nubbio. :)

La lunghezza delle pipeline è una costante o comunque dipendente dal silicio?
Tipo... procio X, pipeline 10 su 90nm, max 5GHz, se il silicio arriva a quella frequenza bene, altrimenti amen. Stesso procio, pipeline 10, ma silicio 45nm, l'architettura avrebbe lo stesso limite di 5GHz anche se il silicio potesse dare 6GHz? Oppure la pipeline risente comunque di latenze inferiori per la riduzione del silicio e quindi permettere di più?

Perché il PIV era fatto a 90nm o 120nm? Se Buldozer ha una pipeline simile ma 32nm è equiparabile o promette più velocità?
In un circuito digitale sincrono (con clock), il critical path è il percorso del circuito che provoca maggiori ritardi e di conseguenza limita la frequenza.
Solitamente c'è un registro sorgente, un circuito che elabora il contenuto del registro ed infine il registro di destinazione. Il circuito per poter funzionare ad una data frequenza deve essere in grado di presentare i risultati in modo stabile all'ingresso del registro qualche istante prima del nuovo fronte di clock (esattamente Tsetup + Thold dei flip-flop che compongono i registri).
Chiamando Tcp il tempo massimo di attraversamento del circuito, o meglio il T di attraversamento del critical path, abbiamo che:

Tsetup + Thold + Tcp < T

dove T è il periodo di clock, cioè 1 / F (F è la frequenza di clock).

Semplificando...la pipeline non è altro che una suddivisione in stadi (stage) dell'esecuzione di una istruzione. Ogni stadio esegue una piccola parte dell'istruzione fra un registro sorgente ed un registro di destinazione. Lo stage successivo, al clock successivo, prende il risultato e mette a sua volta il suo risultato in un altro registro entro la fine del ciclo di clock.
Di fatto nella pipeline abbiamo in esecuzione un massimo di una istruzione per stage della pipeline (le cose possono anche andare diversamente in caso di duplicazione delle unità di esecuzione, ma come dicevo: semplifichiamo).
Con la pipeline a regime abbiamo comunque la terminazione di una istruzione per ciclo di clock. Con la pipeline vuota dobbiamo attendere un numero di clicli di clock pari alla lunghezza della pipeline prima che l'esecuzione di una istruzione sia terminata.
Quindi possiamo applicare il discorso fatto prima: il critical path di una CPU è il critical path con ritardo più alto fra i critical path di ogni stage. Questo critical path servirà a determinare la frequenza massima raggiungibile dalla CPU con una determinata tecnologia litografica (potenza permettendo).

Aumentare il numero di stadi ha però delle contro-indicazioni: se la pipeline va in stallo (cioè deve essere svuotata) in caso di misprediction (fallimento della branch prediction, l'algoritmo che "prevede" dove andrà a finire un salto condizionale e quindi riempirà di conseguenza la pipeline) o per il cambio di contesto, prima di terminare una nuova istruzione passeranno ben 31 cicli di clock. E' chiaro che per ovviare a questi overhead bisogna avere un ottimo algoritmo di branch prediction e bisogna avere la possibilità di raggiungere frequenze nettamente maggiori dei concorrenti.

Il Prescott aveva una pipeline di 31 stadi per gli interi. Una cosa praticamente mai vista (normalmente sono intorno ai 10-12 stadi per gli interi, tranne le prime implementazioni). Aveva però gravi problemi di leakage (è uno degli elementi che vanno a determinare la potenza necessaria a far funzionare la CPU) che non gli permettevano di raggiungere le frequenze che gli ingegneri avrebbero voluto fargli raggiungere (pensate che Intel avrebbe voluto raggiungere gli 8-10 Ghz entro due generazioni litografiche). Questa fu la motivazione per cui il progetto Tejas, il successore di Prescott, non arrivò nemmeno sul mercato.

paolo.oliva2

29-08-2010, 10:08

In un circuito digitale sincrono (con clock), il critical path è il percorso del circuito che provoca maggiori ritardi e di conseguenza limita la frequenza.
Solitamente c'è un registro sorgente, un circuito che elabora il contenuto del registro ed infine il registro di destinazione. Il circuito per poter funzionare ad una data frequenza deve essere in grado di presentare i risultati in modo stabile all'ingresso del registro qualche istante prima del nuovo fronte di clock (esattamente Tsetup + Thold dei flip-flop che compongono i registri).
Chiamando Tcp il tempo massimo di attraversamento del circuito, o meglio il T di attraversamento del critical path, abbiamo che:

Tsetup + Thold + Tcp < T

dove T è il periodo di clock, cioè 1 / F (F è la frequenza di clock).

Semplificando...la pipeline non è altro che una suddivisione in stadi (stage) dell'esecuzione di una istruzione. Ogni stadio esegue una piccola parte dell'istruzione fra un registro sorgente ed un registro di destinazione. Lo stage successivo, al clock successivo, prende il risultato e mette a sua volta il suo risultato in un altro registro entro la fine del ciclo di clock.
Di fatto nella pipeline abbiamo in esecuzione un massimo di una istruzione per stage della pipeline (le cose possono anche andare diversamente in caso di duplicazione delle unità di esecuzione, ma come dicevo: semplifichiamo).
Con la pipeline a regime abbiamo comunque la terminazione di una istruzione per ciclo di clock. Con la pipeline vuota dobbiamo attendere un numero di clicli di clock pari alla lunghezza della pipeline prima che l'esecuzione di una istruzione sia terminata.
Quindi possiamo applicare il discorso fatto prima: il critical path di una CPU è il critical path con ritardo più alto fra i critical path di ogni stage. Questo critical path servirà a determinare la frequenza massima raggiungibile dalla CPU con una determinata tecnologia litografica (potenza permettendo).

Aumentare il numero di stadi ha però delle contro-indicazioni: se la pipeline va in stallo (cioè deve essere svuotata) in caso di misprediction (fallimento della branch prediction, l'algoritmo che "prevede" dove andrà a finire un salto condizionale e quindi riempirà di conseguenza la pipeline) o per il cambio di contesto, prima di terminare una nuova istruzione passeranno ben 31 cicli di clock. E' chiaro che per ovviare a questi overhead bisogna avere un ottimo algoritmo di branch prediction e bisogna avere la possibilità di raggiungere frequenze nettamente maggiori dei concorrenti.

Il Prescott aveva una pipeline di 31 stadi per gli interi. Una cosa praticamente mai vista (normalmente sono intorno ai 10-12 stadi per gli interi, tranne le prime implementazioni). Aveva però gravi problemi di leakage (è uno degli elementi che vanno a determinare la potenza necessaria a far funzionare la CPU) che non gli permettevano di raggiungere le frequenze che gli ingegneri avrebbero voluto fargli raggiungere (pensate che Intel avrebbe voluto raggiungere gli 8-10 Ghz entro due generazioni litografiche). Questa fu la motivazione per cui il progetto Tejas, il successore di Prescott, non arrivò nemmeno sul mercato.

Praticamente il nesso sarebbe.... se aumenti di un tot la frequenza, quando l'algoritmo di branch prediction fa il suo lavoro, sei nettamente superiore, se invece l'algoritmo di branch prediction sbaglia, il tempo "morto" in cui la pipeline si deve svuotare e riempire, se quegli n cicli sono ad una frequenza alta, non sarebbe avvertibile lo stallo.

Ma io penso che la "filosofia" con cui un produttore di procio realizza l'architettura è anche in base al silicio, e, ove progetta l'architettura in un modo diverso, cerca di modificare il silicio. Con Tejas Intel ci aveva provato senza risultato, quindi l'architettura pompata di Intel è la risposta per aumentare la potenza, visto che per il leakage non sarebbe possibile aumentare la frequenza del silicio.
Beh, certamente non si può dire che l'idea di AMD sia sbagliata, in quanto Intel l'aveva già intrapresa e ci aveva rinunciato non perché l'idea fosse sbagliata, ma perché gli 8-10GHz erano irraggiungibili.

Però, mi viene il dubbio che questo modulo di BD possa forse ovviare in qualche modo lo stallo della pipeline. Cioè... oltre ad essere praticamente un raddoppio di core per un SMT hardware, non potrebbe anche avere qualche nesso anche con l'algoritmo di branch prediction?

Comunque secondo me AMD nasconde ancora qualche cosa, perché non può dire una volta che darebbe 2 core fisici al posto di 1 fisico e uno logico e annunciare che BD X8 sarebbe il max, perché d'accordo che potrebbe raddoppiare i core in un unico package, però... dovrebbe comunque portare l'insieme ad una frequenza superiore ai 3GHz.
Comunque anche questo punto mi sembra che induca a pensare in clock sui 4Ghz e più per un X8.
Magny-C a 12 core è un 2,4GHz mi sembra. Un singolo Thuban X6 ha in desktop una frequenza di 3,2GHz X6 e 3,6Ghz turbo, ma che potrebbe essere anche di più se tirato al max di TDP. Ora... se BD X16 fosse sui 3GHz per contrastare un SB 8+8 a 3GHz, mi sembra chiaro che un BD X8 singolo dovrebbe avere almeno un 50% di clock superiore all'X16, quindi 3GHz + 50%, arriviamo a 4,5GHz sicuri in turbo.

Insomma, tutto concorda sempre a portare ad un innalzamento delle frequenze rilevante, sia per il tipo di architettura, sia per la lunghezza della pipeline, sia per il leakage basso del silicio e sia per tutto quello che è trapelato sul silicio, che se avesse pure il low-k, sarebbe una bestia non da ridere. Io penso sempre più a 4GHz sicuri e verso i 5GHz con il turbo.

cionci

29-08-2010, 10:39

Attenzione, AMD non sta intraprendendo la stessa strada di Intel, non ha creato un'architettura a pipeline profonde ;) O almeno non sembra da quanto attualmente fatto vedere.

Lo stallo della pipeline non si può ovviare, bisogna perfezionare gli algoritmi di branch prediction ;) E' questa è una cosa che appunto è stata fatta in Bulldozer.

La cosa che ancora mi è più oscura è come le unità floating point verranno condivise fra i due thread allocati nel singolo modulo Bulldozer.
La FPU sarà ad uso esclusivo di un solo thread ? O la FPU avrà una specie SMT che permetterà di "mescolare" le istruzioni dei due thread in modo da poter sfruttare al minimo una unità FMAC per ogni thread ? bjt2: sai niente riguardo a questo punto ?

papafoxtrot

29-08-2010, 11:19

Non sono sicuro di aver capito la domanda. In ogni caso:
Il FO4 è una misura della complessità dello stadio della pipeline. Fissata la pipeline, la complessità è data. Poi si può implementarla a 130, 90, 65, 45, 32nm ecc... A seconda del processo, sarà maggiore la frequenza a cui potrà andare... Non esiste un limite intrinseco al clock dato un processo, o meglio, esiste un limite intrinseco dato un FO4 di una architettura. La combinazione di FO4 e processo da la velocità.

Per esempio. Il Power 7 ha un FO4 di 17 (mi pare) ed è stato implementato con il 45nm, mi pare con il Low-k. Ora quel processore ha una caterva di transisors. Il quadcore arriva a 4.14 GHz e l'octacore a 3.96 Ghz... Un ipotetico bulldozer X4 fatto a 45nm (il processo del Thuban) sarebbe arrivato a 4.2-4.3 stock, minimo, sia perchè il Power 7 ha molti più transistors e molte più unità attive (un quad core ha 16 thread, e ogni core ha mi pare 12 unità di esecuzione), sia perchè il Power 7 è una CPU server e tradizionalmente queste hanno qualche centinaia di MHz in meno delle controparti desktop...

EDIT: in ogni caso, nel caso peggiore, un buldozer X4 a 4.1 Ghz e un Bulldozer X8 a 3.9 Ghz è fattibile visto il Power 7, anche con questo 45nm Low-k. Ricordiamo che IBM usa lo stesso processo di GF/AMD...

EDIT: Su wikipedia dice che esiste una versione quadcore da 4.25 Ghz. Il Power6 che aveva un FO4 di 13 arrivava a 5GHz e IBM aveva in laboratorio un prototipo funzionante a 6GHz...

EDIT: sto leggendo su google gruppi che tra Thuban e Buldozer, c'è un progetto cancellato che aveva un FO4 di 13... Sarebbe arrivato a 5GHz con il 45nm! Dice anche che BD dovrebbe avere un IPC (A PARITA' DI FREQUENZA) del 20-25% in più. Il tizio sembra essere un ex dipendente AMD che ha lavorato al progetto... Il gruppo in guestione è http://groups.google.de/group/comp.arch/browse_thread/thread/45018bf3214f6049?hl=de# e il tipo si chiama Mitch_qualcosa...

Dunque F04 mi par di capire che voglia dire una pipeline con latenze molto basse, giusto? Il che comporterebbe frequenze alte?
La pipeline del P4 aveva F04=13.
Posso dire che se aumentano gli stadi l'Fo4 diminuisce, o le due cose sono solo blandamente collegate?
Un F04 di 13, com'era quello del Power 6 e di questo fumoso progetto AMD poi abbandonato, può significare pipeline molto lunghe? Direi di si, a vedere dalle frequenze a cui lavorava il power6...
Ma come sappiamo se la pipeline si allunga è difficile che l'IPC si mantenga così alto, considerato anche che si deve togliere un 20% per via del modulo (che rende l'80% di un dual core vero).

Processo produttivo: IBM sforna i power7 a 3,9GHz 8 coree. Si deve però considerare che il TDP di queste CPU è parecchio superiore a quello delle CPU desktop a cui siamo abituati. Credo che l'8 core faccia 576mm^2 e 200W di TDP. E a quanto ne so IBM usa un processo SOI più avanzato, che però potrebbe essere adottato da GF nei 32nm.
A questi dobbiamo certo togliere i vari 32nm e HKMG. Ad ogni modo le due architetture non saranno mai comparabili.

Allora... anche in caso di IPC non "spettacolare", con un aumento del 30-35% del clock rispetto ad adesso, anche un Thuban andrebbe come un X6 i7 i980X (SB penso di no).

Il mio portafoglio comincia a tremare... col cavolo che un BD X8 costerà 300€ :mad:

Sto giro rimaniamo fregati tutti....

Altro che tutti fregati. Rimaniamo tutti fregati se BD va poco e AMD lo svend, perché al giro dopo va a ramengo.
Se BD sarà prezzato a 200 euro suonerà come una campana da morto.

DIN

DIN

DIN

Voglio un Bulldozer a 1000 eurooooooo!!

STRAIN engineering has become one of the main con-
- [ Traduci questa pagina ]
16 ago 2010 - for 32-nm SOI CMOS technology with HKMG. Performance .... technology with enhanced stress, porous low-k BEOL and immersion lithography,” in IEDM Tech. ...
ieeexplore.ieee.org/iel5/16/5491381/05467180.pdf?tp=&arnumber...

Porc zocc, ci vuole la password

http://www.pctunerup.com/up/results/_201008/20100829023856_32nm.jpg

Però li riporta pure low-k.
Se il 32nm HKMG AMD esce alla partenza con il low-k, sono caxxi... andrebbe a palla.

Magari ci fosse! E' vero che se lo hanno adottato sul 45nm difficilmente lo elimineranno dal nodo successivo. E forse gli costa meno sviluppare solo il 32 con low-k che un 32 con ed uno senza, per cui è probabile che tutti i processori a 32nm abbiano low-k.

papafoxtrot

29-08-2010, 11:25

Ho messo il link a google groups apposta. Il tipo si da le arie da ex dipendente AMD che ha lavorato anche su bulldozer. Io non credo sia un mitomane perchè lo avrebbero sgamato. Da come parla sembra quantomeno competente...
A dire la verità dice anche che si perde un 5% di IPC per la microarchitettura. E poi ho capito dopo cosa intendeva: passando da 22 FO4 a 17 FO4 si è perso qualche forwarding path che accellerava qualcosina, ma lui dice che era così allo stadio a cui lui ha lasciato il progetto e che potrebbero aver risolto diversamente...

Comunque 20% in più di IPC, 30-40% di più in clock... Non oso pensare...

Ma se questo ha lasciato AMD prim che avessero un sample, e ancora prima che avessero finito l'architettura, come diavolo può parlare di IPC +20%?

Io tendo a credere più al +12,5% di JF-AMD sinceramente.

Che comunque combinato con l'aumento di frequenza e con i due core in più da un risultato molto elevato, anche se meno sensazionalistico.

Un +15% di frequenza rispetto a thuban porterebbe a prestazioni del 70% superiori, che vuol dire probabilmente centrare l'obiettivo di superare i SB X6.

capitan_crasy

29-08-2010, 11:32

Per bjt2 e cionci:

Siete due grandissimi!!!:ave: :ave: :ave:

Vi sparo subito in prima pagina!!! :D

Ma se questo ha lasciato AMD prim che avessero un sample, e ancora prima che avessero finito l'architettura, come diavolo può parlare di IPC +20%?

Io tendo a credere più al +12,5% di JF-AMD sinceramente.

Che comunque combinato con l'aumento di frequenza e con i due core in più da un risultato molto elevato, anche se meno sensazionalistico.

Un +15% di frequenza rispetto a thuban porterebbe a prestazioni del 70% superiori, che vuol dire probabilmente centrare l'obiettivo di superare i SB X6.

JF dice che il 12% di IPC in più è una valutazione sbagliata!

cionci

29-08-2010, 11:40

Dunque F04 mi par di capire che voglia dire una pipeline con latenze molto basse, giusto? Il che comporterebbe frequenze alte?
La pipeline del P4 aveva F04=13.
Posso dire che se aumentano gli stadi l'Fo4 diminuisce, o le due cose sono solo blandamente collegate?
Sì, sono legati. Diciamo che si allunga la pipeline con l'obiettivo di ottenere un critical path più corto e quindi un FO4 più basso.
FO4=13 per il P4 Willamette o Prescott ? Willamette aveva la pipline degli interi a 20 stadi, mentre Prescott l'aveva a 31 stadi.

capitan_crasy

29-08-2010, 12:05

Donald Newell (Vice Presidente e Chief Technology Officer (CTO) divisione server AMD) dichiara che AMD sta valutando l'ipotesi di proporre Server con architettura X86 Bobcat la quale sarà la base delle prossime APU della serie Ontario destinate al mercato Netbook.

"We are definitely in the process of examining this as a design point. It would be foolish not to.

There's only a few papers and there's a lot more data to collect. It really depends on a number of factors to whether or not that's a good design point.

There's a certain amount of computation to be done, and a certain amount of time for it to be done. The large cores will get more work done in a single amount of time and get you a better answer."

Bobcat è del 10% inferiore, come prestazioni globali, dell'architettura K10, tuttavia il suo consumo massimo è estremamente basso con valori che possono raggiungere 1 Watt con alcune specifiche versioni.

Clicca qui... (http://www.xbitlabs.com/news/cpu/display/20100827215918_AMD_to_Examine_Bobcat_Microprocessors_in_Servers.html)

calabar

29-08-2010, 12:11

La cosa che ancora mi è più oscura è come le unità floating point verranno condivise fra i due thread allocati nel singolo modulo Bulldozer.
La FPU sarà ad uso esclusivo di un solo thread ? O la FPU avrà una specie SMT che permetterà di "mescolare" le istruzioni dei due thread in modo da poter sfruttare al minimo una unità FMAC per ogni thread ? bjt2: sai niente riguardo a questo punto ?
Che io ricordi, e da quanto avevo capito, era stato confermato che la FPU poteva lavorare su thread indipendenti se le istruzioni erano a 128 bit (2 contemporanee) o 64 bit (4 contemporanee).
Quindi il thread è uno solo esclusivamente nel caso di istruzioni AVX, negli altri casi, ossia in tutte le situazioni viste fino ad oggi, dovrebbero lavorare come due motori FP.
Qualcosa di molto differente da SMT comunque, la pipeline viene "divisa", non "condivisa".
Qualcuno conferma/smentisce?

Io tendo a credere più al +12,5% di JF-AMD sinceramente.
Concordo, anche a me pare plausibile per quanto emerso finora una percentuale intorno al 10%.
Anche se poi bisogna vedere in quali ambiti, ricordiamo che il 12,5% era riferito all'incremento tra un 12 e un 16 core in ambito server.

paolo.oliva2

29-08-2010, 12:13

Sì, sono legati. Diciamo che si allunga la pipeline con l'obiettivo di ottenere un critical path più corto e quindi un FO4 più basso.
FO4=13 per il P4 Willamette o Prescott ? Willamette aveva la pipline degli interi a 20 stadi, mentre Prescott l'aveva a 31 stadi.

Se sarà confermato che BD ha una pipeline 17 FO4, deve avere per forza un clock sopra il PIV Willamette (20) e Prescott (31).

Non si può realizzare un'architettura che va solo se il clock è alto e poi avere un clock del 10% superiore a Thuban.
Indi se il PIV ha sfiorato i 4GHz (mi sembra) ma non oltre per prb di leakage, questo prb AMD non l'ha, quindi contando la pipeline ancora più propensa a clock maggiori, ci si dovrebbe aspettare al 101% clock sopra ai 4GHz in condizione non turbo.
Sbaglio?

dark.halo

29-08-2010, 12:18

Per bjt2 e cionci:

Siete due grandissimi!!!:ave: :ave: :ave:

Vi sparo subito in prima pagina!!! :D

:ave: :ave: :ave:

JF dice che il 12% di IPC in più è una valutazione sbagliata!

Infatti JF non si è mai sbilanciato così ha detto solo che con il 33% di core aggiuntivi si ha il 50% si troughput.
Analizziamo nel dettaglio 33% di core in più, ok ma noi sappiamo che lo scaling non è perfetto; facciamo che ogni core in più scala dello 0.80%,

33%* 0.80 = 26.4 %
quindi aumentando i core del 33% otteniamo il 26,4 % di prestazioni in più all'incirca come Thuban ( paolo chiedo conferma a te che hai più esperienza sul campo).
Quindi in totale l'ipc dovrebbe essere compreso in un valore di 20/23% in più.

paolo.oliva2

29-08-2010, 12:21

Che io ricordi, e da quanto avevo capito, era stato confermato che la FPU poteva lavorare su thread indipendenti se le istruzioni erano a 128 bit (2 contemporanee) o 64 bit (4 contemporanee).
Quindi il thread è uno solo esclusivamente nel caso di istruzioni AVX, negli altri casi, ossia in tutte le situazioni viste fino ad oggi, dovrebbero lavorare come due motori FP.
Qualcosa di molto differente da SMT comunque, la pipeline viene "divisa", non "condivisa".
Qualcuno conferma/smentisce?
Anche a me sembra così.

Concordo, anche a me pare plausibile per quanto emerso finora una percentuale intorno al 10%.
Anche se poi bisogna vedere in quali ambiti, ricordiamo che il 12,5% era riferito all'incremento tra un 12 e un 16 core in ambito server.
Però non riesco a capire una cosa.
Il Phenom II andava piano nei calcoli interi e in FP praticamente non riusciva a sfruttare tutta la potenza perché era sovrabbondante rispetto alla realtà.
Ora, in BD praticamente l'INT è stato aumentato del 50% (c'è un INT in più ogni 2 core), lasciamo stare l'FP.

Non riesco a trovare una correlazione sul fatto che se anche per la condivisione di parti comuni fra i core porterebbe ad una diminuzione dell'IPC, dall'altra, il potenziamento dell'INT e dell'FP dovrebbero comunque portare vantaggi. Sarebbe teoricamente stupido aumentare l'INT del 50% per poi castare i proci per farlo diminuire del 40%, a meno che questa diminuzione non comporti come vantaggio un notevole risparmio di TDP e quindi clock alti anche con parecchi moduli.

Sbaglio?

aaadddfffgggccc

29-08-2010, 12:25

@capitan_crasy

Ciao Boss ;)

Hai info sulle caratteristiche del socket AM3+?

sarà possibile montarci le attuali CPU, es. thuban oppure si cambia tutto?

Grazie

cionci

29-08-2010, 12:27

Se sarà confermato che BD ha una pipeline 17 FO4, deve avere per forza un clock sopra il PIV Willamette (20) e Prescott (31).
Difficile fare un confronto di questo tipo.
Comunque ho trovato che il Prescott aveva un FO4 di 12.5, mentre il Willamette un FO4 pari a 16.3. Quindi molto vicini ai 17 stimati per il Bulldozer. Di fatto indicherebbe una pipeline, non certo a 20 stadi, dato che la complessità è sicuramente aumentata, ma probabilmente intorno ai 16-18 stadi.

calabar

29-08-2010, 12:32

@paolo.oliva2
Secondo me non sbagli, e infatti nonostante il calo di prestazioni per gli elementi condivisi tra i due core, si parla di un aumento di ipc.

paolo.oliva2

29-08-2010, 12:39

:ave: :ave: :ave:

Infatti JF non si è mai sbilanciato così ha detto solo che con il 33% di core aggiuntivi si ha il 50% si troughput.
Analizziamo nel dettaglio 33% di core in più, ok ma noi sappiamo che lo scaling non è perfetto; facciamo che ogni core in più scala dello 0.80%,

33%* 0.80 = 26.4 %
quindi aumentando i core del 33% otteniamo il 26,4 % di prestazioni in più all'incirca come Thuban ( paolo chiedo conferma a te che hai più esperienza sul campo).
Quindi in totale l'ipc dovrebbe essere compreso in un valore di 20/23% in più.

Io sinceramente nel Thuban vedo un guadagno del 50%, però io non tengo i proci a parametri def, cerco di ottimizzarli al massimo.
Però in Cinebench ho praticamente il 51% di guadagno rispetto ad un X4 (probabile che l'NB lavori meglio) e nelle conversioni grafiche pure.

Però, probabilmente il Thuban lavora meglio perché il low-k ha concesso migliorie pure alla parte NB, facendola lavorare meglio.

Inoltre, credo che ormai bisogna pensare ad un BD con l'ottica modulo= core+SMT hardware più che BD = core.

Se diamo peso alle parole di AMD cioè di offrire core fisici in egual numero rispetto alla concorrenza di fisici + logici, allora mi sembra chiaro che non possiamo pensare all'IPC a core ma a modulo, e certamente non saremmo nell'ordine del 10% di IPC ma ben superiore. Se a questo aggiungiamo poi il notevole incremento di clock...

dany700

29-08-2010, 12:40

premesso che sono un niubbo...per quanto riguarda gli aspetti profondamente tecnici delle architetture SB, BD o quant'altro ;)

e che mi accontento di illuminarmi solo sugli elementi fondamentali...o perlomeno quelli più evidenti e comunque che permettano un'analisi tendenzialmente plausibile della situazione, che troverà riscontro o meno, dalle opportune prove pratiche e dalle scelte del mercato.

Detto questo...in questi ultimi 30 post...ho lette parecchie "stranezze".

In primo luogo...che essendo BD esclusivamente AM3+ costerà meno. Gran stupidata! Considerando inoltre che non ingloberà il NB così come lo conosciamo oggi...Costerà parecchio di più...soprattutto al lancio. Altro che meno...parecchio in più rispetto ad una dichiarata retrocompatibilità.

un bd 8x (4 moduli) forse competerà con un SB 4x? A prescindere dalla mancanza di bench...ma che razza di tabacco vi fumate???:D :D

io mi domando...come si fa a paragonare un bd 8x con un sb 4+4??? da dove le tirate fuori queste affermazioni da politicanti??? :rolleyes:

solo per la FPU?? ricordo che Amd l'FPU l'ha sostituita con l'FMA...ovvero una tecnologia superiore in ambito virgola mobile...che SB ed Intel si possono scordare fino al 2013. E già solo questo la dice lunga.

Se a ciò aggiungiamo altre variabili sostanziali come il SOI e il dielettrico low-k di Amd...rispetto ad un penoso BULK di Intel, ancora mi domando come si faccia, se pur a priori e senza certezze...a paragonare un BD ad un semplice SB.

IPC migliore in SB e contestuale minore TDP??...forse...ma non aspettiamoci rivoluzioni, l'architettura è quella che è...più di tanto non può evolversi.

E' comunque inequivocabile...che SB non sarà appannaggio degli smanettoni, vista la scarsità delle prestazioni oltre i 4ghz. Amd permetterà almeno i 5ghz ad aria...e non si tratta solo di quantità ma anche di proporzionalità. In tal senso...nel 2011 qualsiasi SB è già perdente.

Sulla carta e solo so quella...mi sento di affermare che ad Intel probabilmente...non basterà un SB 6x per contrastare un bd8x...SMT e HT benchè siano una grande trovata architetturale, non sono sufficienti a contrastare l'efficienza superiore di BD.

Se poi vogliamo spostarci in ambito APU...ancora più facile è il discorso. Intel non possiede di certo il know-how per poter competere con Amd...ovvero è una sconfitta già persa in partenza...e per parecchi anni se non per sempre.

SB+GPU...nella migliore delle ipotesi...dico migliore...possono competere con Bobcat. Ricordiamoci che il valore di questi agglomerati tecnologici non si misura solo dai dati di targa, ma sull'implementazione del software...se a qusto aggiungiamo che non si può più utilizzare un compilatore Intel (forzatamente)...e che quest'ultima fa acqua in ambito GPU...Di fatto, è impensabile paragonarla ad Amd.

per chiudere....aspetto curioso di vedere il rapporto prestazioni/prezzo sia di SB che BD...come dire...altra sfida già ampiamente persa in partenza.

E a priori...senza il minimo dubbio.

GT82

29-08-2010, 12:46

La cosa che ancora mi è più oscura è come le unità floating point verranno condivise fra i due thread allocati nel singolo modulo Bulldozer.
La FPU sarà ad uso esclusivo di un solo thread ? O la FPU avrà una specie SMT che permetterà di "mescolare" le istruzioni dei due thread in modo da poter sfruttare al minimo una unità FMAC per ogni thread ? bjt2: sai niente riguardo a questo punto ?

Se può essere utile Anandtech ha scritto questo:

The 4-wide decode engine feeds three independent schedulers: two for the integer cores and one for the shared floating point hardware.

While there are two integer schedulers in a single Bulldozer module (one for each thread), there’s only one FP scheduler. There’s some hardware duplication at the FP scheduler to allow two threads to share the execution resources behind it. While each integer core behaves like an independent core, the FP resources work as they would in a SMT (Hyper Threading) system.

The FP scheduler has four ports to its FPUs. There are two 128-bit FMAC pipes and two 128-bit packed integer pipes. Like Sandy Bridge, AMD’s Bulldozer will support SSE all the way up to 4.2 as well as Intel’s new AVX instructions. The 256-bit AVX ops will be handled by the two 128-bit FMAC units in each Bulldozer module.

Each Bulldozer module has its own private L2 cache shared by both integer cores and the FP execution hardware.

Techreport fa pure un confronto con la FPU di Sandy Bridge

[...]Although each module has only a single floating-point unit, that FPU should be substantially more capable than past AMD FPUs. You can see the dual integer MMX and 128-bit FMAC units in the diagram above. In a sort of quasi-SMT arrangement, the FPU can track two hardware threads, one for each "parent" core on the module.

The FPU supports nearly all the alphabet-soup extensions to the x86 ISA, up to and including SSSE3, SSE 4.1, 4.2, and Intel's new Advanced Vector Extensions (AVX). AVX allows for higher-throughput processing of graphics, media, and other parallelizable, floating-point-intensive workloads by doubling the width of SIMD vectors from 128 to 256 bits. Bulldozer's 128-bit FMAC units will work together on 256-bit vectors, effectively producing a single 256-bit vector operation per cycle. Intel's Sandy Bridge, due early in 2011, will have two 256-bit vector units capable of producing a 256-bit multiply and a 256-bit add in a single cycle, double Bulldozer's AVX peak.

Bulldozer's FPU has an advantage in another area, though, as the presence of two 128-bit FMAC units indicates. FMAC is short for "fused multiply-accumulate," an operation that's sometimes known as FMA, for "fused multiply-add," instead. Whatever you call it, a single operation that joins multiplication with addition is new territory for x86 processors, and it has two main benefits.

The first, pretty straightforwardly, is higher performance. The need to multiply two numbers and then add the result turns out to be very common in graphics and media workloads, and fusing them means the processor can achieve twice the throughput for those operations. We've seen multiply-add instructions in GPUs for ages, which is why each ALU in a GPU shader can produce two ops per clock at peak. With dual 128-bit FMACs, Bulldozer's peak FLOPS throughput should be comparable to Sandy Bridge's peak with AVX and 256-bit vectors.

Second, because an FMA operation feeds the result of the multiply directly into the adder without rounding, the mathematical precision of the result is higher. For this reason, the DirectX 11 generation of GPUs adopted FMA as their new standard, as well.

Crucially, Intel's Sandy Bridge will not support an FMA operation. Instead, FMA support is slated for Haswell, the architectural refresh coming a full "tick-tock" generation beyond Sandy Bridge, likely in 2013. Earlier this year, Intel architect Ronak Singhal told us the choice to leave FMA out of Sandy Bridge was driven by the fact that it's "not a small piece of logic" since it requires more sources, or operands, than usual. Intel chose to double the vector width first with AVX and push FMA down the road.

Thus, Bulldozer will be the first x86 processor with FMA capability. That distinction won't come without controversy, though. Bulldozer supports an AMD-sanctioned four-operand form of FMA operation, whereas Haswell will use a three-operand version. Both instructions will require compiler support and freshly compiled binaries, so we may see yet another fracture in the x86 ISA until Intel and AMD can settle on a single, preferred solution.

bjt2

29-08-2010, 12:50

Ciao Bjt2. Sei un grande :)
Letta la discussione linkata, Posto cosa dice Mitchaslup

The issue was that the 3rd unit was used a lot, only to run into the
dual-only ported DataCache. This caused sequencing issues.

Inoltre un tizio gli chede: The third ALU is of more concern, Intel will standardize benchmarks to
make this look bad, even though I know it was used 1% on average

E lui risponde:
So what else is new?

C'è da ridere o da piangere? Ci potresti illuminare anche sulla parte della terza unità?

L'architettura corrente può fare 2 load e 1 store ma la cache è solo dual ported. Credo che questo intenda. Solo che non capisco. In scrittura c'è la coda...

paolo.oliva2

29-08-2010, 12:51

premesso che sono un niubbo...per quanto riguarda gli aspetti profondamente tecnici delle architetture SB, BD o quant'altro ;)

e che mi accontento di illuminarmi solo sugli elementi fondamentali...o perlomeno quelli più evidenti e comunque che permettano un'analisi tendenzialmente plausibile della situazione, che troverà riscontro o meno, dalle opportune prove pratiche e dalle scelte del mercato.

Detto questo...in questi ultimi 30 post...ho lette parecchie "stranezze".

In primo luogo...che essendo BD esclusivamente AM3+ costerà meno. Gran stupidata! Considerando inoltre che non ingloberà il NB così come lo conosciamo oggi...Costerà parecchio di più...soprattutto al lancio. Altro che meno...parecchio in più rispetto ad una dichiarata retrocompatibilità.
Sappiamo che per quello che riguarda il costo produzione, non credo vi siano differenze tra un Thuban odierno che costa dai 140€ ai 240€ al BD X8. Oltre a questo, il listino lo decide il mercato e chi vende.

un bd 8x (4 moduli) forse competerà con un SB 4x? A prescindere dalla mancanza di bench...ma che razza di tabacco vi fumate???:D :D
io mi domando...come si fa a paragonare un bd 8x con un sb 4+4??? da dove le tirate fuori queste affermazioni da politicanti??? :rolleyes:
solo per la FPU?? ricordo che Amd l'FPU l'ha sostituita con l'FMA...ovvero una tecnologia superiore in ambito virgola mobile...che SB ed Intel si possono scordare fino al 2013. E già solo questo la dice lunga.

Beh... confontare un BD X8 a SB 4+4 dove BD perdesse, sarebbe inimmaginabile. A quel punto un semplice Thuban portato sul 32nm, con un clock sui 4GHz basterebbe a confrontarsi con un SB X4
Se a ciò aggiungiamo altre variabili sostanziali come il SOI e il dielettrico low-k di Amd...rispetto ad un penoso BULK di Intel, ancora mi domando come si faccia, se pur a priori e senza certezze...a paragonare un BD ad un semplice SB.

IPC migliore in SB e contestuale minore TDP??...forse...ma non aspettiamoci rivoluzioni, l'architettura è quella che è...più di tanto non può evolversi.

E' comunque inequivocabile...che SB non sarà appannaggio degli smanettoni, vista la scarsità delle prestazioni oltre i 4ghz. Amd permetterà almeno i 5ghz ad aria...e non si tratta solo di quantità ma anche di proporzionalità. In tal senso...nel 2011 qualsiasi SB è già perdente.

Sulla carta e solo so quella...mi sento di affermare che ad Intel probabilmente...non basterà un SB 6x per contrastare un bd8x...SMT e HT benchè siano una grande trovata architetturale, non sono sufficienti a contrastare l'efficienza superiore di BD.

Se poi vogliamo spostarci in ambito APU...ancora più facile è il discorso. Intel non possiede di certo il know-how per poter competere con Amd...ovvero è una sconfitta già persa in partenza...e per parecchi anni se non per sempre.

SB+GPU...nella migliore delle ipotesi...dico migliore...possono competere con Bobcat. Ricordiamoci che il valore di questi agglomerati tecnologici non si misura solo dai dati di targa, ma sull'implementazione del software...se a qusto aggiungiamo che non si può più utilizzare un compilatore Intel (forzatamente)...e che quest'ultima fa acqua in ambito GPU...Di fatto, è impensabile paragonarla ad Amd.

per chiudere....aspetto curioso di vedere il rapporto prestazioni/prezzo sia di SB che BD...come dire...altra sfida già ampiamente persa in partenza.

E a priori...senza il minimo dubbio.

Azzo, non ho più editato, questo mi sorpassa nell'ottimismo... con me sfonderebbe una porta aperta :D .

papafoxtrot

29-08-2010, 12:52

:ave: :ave: :ave:
Infatti JF non si è mai sbilanciato così ha detto solo che con il 33% di core aggiuntivi si ha il 50% si troughput.
Analizziamo nel dettaglio 33% di core in più, ok ma noi sappiamo che lo scaling non è perfetto; facciamo che ogni core in più scala dello 0.80%,

33%* 0.80 = 26.4 %
quindi aumentando i core del 33% otteniamo il 26,4 % di prestazioni in più all'incirca come Thuban ( paolo chiedo conferma a te che hai più esperienza sul campo).
Quindi in totale l'ipc dovrebbe essere compreso in un valore di 20/23% in più.

Questa è un'ipotesi interessante. Magari non +0,8 a core, dato anche che si parla di settore server, dove i core vengono irrimediabilmente usati tutti, ma 0,85 - 0,9.

0,33*0,9=0,297
0,297+1=1,297
1,5/1,297=1,15

0,33*0,85=0,2805
1,5/1,2805=1,17

Poi si può tener conto del fatto che probabilmente lew prestazioni negli interi sono cresciute più delle prestazioni in virgola mobile. Dunque nel settore desktop l'IPC potrebbe apparire cresciuto più che nel settore server.
Ad ogni modo io sono propenso a credere ad un IPC cresciuto di una quantità massima del 20%. Già questo, tenendo conto della resa del modulo (80% di un dual core), comporterebbe un IPC della singola pipeline itnera, senza considerare il modulo, cresciuto del
1,2/0,8=1,5.
Cioè un 50% di IPC in più per la pipeline intera, moltiplicato per la resa del modulo (0,8) da un IPC complessivo per i due core del 20% superiore a K10.
Secondo me è già tantissimo, non credete? Fare +50% di pc in un colpo solo è tanto, soprattutto considerando che la pipeline si è allungata e dunque è tendenzialmente meno efficiente.

Sì, sono legati. Diciamo che si allunga la pipeline con l'obiettivo di ottenere un critical path più corto e quindi un FO4 più basso.
FO4=13 per il P4 Willamette o Prescott ? Willamette aveva la pipline degli interi a 20 stadi, mentre Prescott l'aveva a 31 stadi.

Grazie Cionci. Si 13 per Prescott.

Se sarà confermato che BD ha una pipeline 17 FO4, deve avere per forza un clock sopra il PIV Willamette (20) e Prescott (31).

Non si può realizzare un'architettura che va solo se il clock è alto e poi avere un clock del 10% superiore a Thuban.
Indi se il PIV ha sfiorato i 4GHz (mi sembra) ma non oltre per prb di leakage, questo prb AMD non l'ha, quindi contando la pipeline ancora più propensa a clock maggiori, ci si dovrebbe aspettare al 101% clock sopra ai 4GHz in condizione non turbo.
Sbaglio?

La lunghezza della pipeline influisce sul F04, ma devi sempre considerare che la pipeline del P4 prescott, quello che è arrivato a 3,8GHz, era di 31 stadi, contro i 20 circa di bulldozer.
Williamett aveva F04 di 17 e una pipeline di 20 stadi, quindi i conti tornano.
Però williamette è arrivato a 1,8GHz se non sbaglio... Certo era ancora a 180nm :D :D

@capitan_crasy

Ciao Boss ;)

Hai info sulle caratteristiche del socket AM3+?

sarà possibile montarci le attuali CPU, es. thuban oppure si cambia tutto?

Grazie

Si, sull'AM3+ entreranno i K10. Di qui la mia idea che AMD potrebbe continuare a vendere, almeno nel primo periodo, i thuban e forse i deneb, come CPU di fascia bassa per AM3+. Bulldozer, a quanto è stato dichiarato all'Hotchip, sarà prodotto solo a 6 e 8 core. Niente quad core bulldozer.

Difficile fare un confronto di questo tipo.
Comunque ho trovato che il Prescott aveva un FO4 di 12.5, mentre il Willamette un FO4 pari a 16.3. Quindi molto vicini ai 17 stimati per il Bulldozer. Di fatto indicherebbe una pipeline, non certo a 20 stadi, dato che la complessità è sicuramente aumentata, ma probabilmente intorno ai 16-18 stadi.

Credo invece che la pipeline di Bulldozer sia proprio attorno ai 20 stadi, ma forse mi ricordo un 18. E' possibile? Se ne era parlato mesi fa! Credo sia 2-3 stadi più lungha di quella di k10.

Insomma il conto torna perfettamente con il williamette. Magari sono riuscitia d ottenere FP04=17 (come williamette) con una pipeline più corta (18?). Ciò è possibile?

Scusate una domanda: Intel chiederebbe ad AMD una roiality per l'uso del suo Hyper Threading. AMD quindi preferisce di certo farne a meno.
Ma AMD non può fare uso della tecnologia sviluppata da IBM, che ha un SMT a 4 vie? Senza quindi pagare roiality a Intel?
Perché alla fine SMT non costa quasi nulla in silicio (duplicazione dei soli registri) e alla fine della fiera tutto fa brodo!
Ma l'SMT di IBM (vedi power 7) è analogo a quello di intel? Cioè, i task vengono processati alternativamente nella stessa pipeline per recuperare i vuoti dati dagli stalli, o vengono processati contemporaneamente? Perché se fosse così la cosa avrebbe molto più a che fare con i moduli di AMD (più pipeline in parallelo) che non con l'Hyper threading di intel.

Ringrazio BJT2 per il chiarimento sulle cache 8C (non sapevo che intel le usasse) e sulla ZRAM.

bjt2

29-08-2010, 12:53

STRAIN engineering has become one of the main con-
- [ Traduci questa pagina ]
16 ago 2010 - for 32-nm SOI CMOS technology with HKMG. Performance .... technology with enhanced stress, porous low-k BEOL and immersion lithography,” in IEDM Tech. ...
ieeexplore.ieee.org/iel5/16/5491381/05467180.pdf?tp=&arnumber...

Porc zocc, ci vuole la password

http://www.pctunerup.com/up/results/_201008/20100829023856_32nm.jpg

Però li riporta pure low-k.
Se il 32nm HKMG AMD esce alla partenza con il low-k, sono caxxi... andrebbe a palla.

Porous low-k è quello che è stato applicato per il Thuban... Però BEOL potrebbe voler dire Before End Of Life (del processo)... Quindi forse non ci sarà all'inizio... :(

cionci

29-08-2010, 12:55

solo per la FPU?? ricordo che Amd l'FPU l'ha sostituita con l'FMA...ovvero una tecnologia superiore in ambito virgola mobile...che SB ed Intel si possono scordare fino al 2013. E già solo questo la dice lunga.
FMAC: Fused Multiply-Accumulate

Questa alla fine è una delle cose che cambia meno rispetto all'architettura K10. Significa che ogni unità di calcolo è capace di eseguire una istruzione floating point quasliasi, sia essa basata su moltiplicazione che su somma.
Prima invece le due unità di calcolo erano suddivise per compiti, una per la moltiplicazione ed un per la somma.
Alla fine questa cosa può comportare un leggerissimo aumento di performance sul singolo thread (nel caso non fosse possibile schedulare in modo alternato istruzioni basate su somma e su moltiplicazione), ma può anche essere il tallone di achille di Buldozer: nel caso si abbiano entrami i thread che usano l'unità floating point le prestazioni rispetto ad un dual core sarebbero di fatto quasi dimezzate.
Amd permetterà almeno i 5ghz ad aria...e non si tratta solo di quantità ma anche di proporzionalità. In tal senso...nel 2011 qualsiasi SB è già perdente.
Io credo che la prima incarnazione di Bulldozer si attesterà intorno ai 3.8 Ghz con 4 moduli e 8 CPU logiche, 4.2 Ghz con 3 moduli e 6 CPU logiche. 4.6 Ghz con 2 moduli e 4 CPU logiche.

aaadddfffgggccc

29-08-2010, 12:58

Si, sull'AM3+ entreranno i K10. Di qui la mia idea che AMD potrebbe continuare a vendere, almeno nel primo periodo, i thuban e forse i deneb, come CPU di fascia bassa per AM3+. Bulldozer, a quanto è stato dichiarato all'Hotchip, sarà prodotto solo a 6 e 8 core. Niente quad core bulldozer.

Quindi, volendo è possibile vedere mobo AM3+ prima dell'uscita di BD? oppure no?

dany700

29-08-2010, 13:01

Azzo, non ho più editato, questo mi sorpassa nell'ottimismo... con me sfonderebbe una porta aperta :D .

:D :D :D

Sono solo speculazioni...sulla carta.

Si sà...generalmente...la realtà è sempre ben diversa, dalla carta ;)

bjt2

29-08-2010, 13:01

Attenzione, AMD non sta intraprendendo la stessa strada di Intel, non ha creato un'architettura a pipeline profonde ;) O almeno non sembra da quanto attualmente fatto vedere.

Lo stallo della pipeline non si può ovviare, bisogna perfezionare gli algoritmi di branch prediction ;) E' questa è una cosa che appunto è stata fatta in Bulldozer.

La cosa che ancora mi è più oscura è come le unità floating point verranno condivise fra i due thread allocati nel singolo modulo Bulldozer.
La FPU sarà ad uso esclusivo di un solo thread ? O la FPU avrà una specie SMT che permetterà di "mescolare" le istruzioni dei due thread in modo da poter sfruttare al minimo una unità FMAC per ogni thread ? bjt2: sai niente riguardo a questo punto ?

A quanto sembra lo scheduler è uno e unificato. Il decoder unico ci versa le istruzioni con un tag per dire a che thread appartiene (il tag serve per sapere a quale dei due core rivolgersi per le operazioni di load, a quale dei due banchi di registri rivolgersi, o forse è unificato e per il retire). Le micro op sono da 128 bit e una eventuale istruzione AVX è spezzata in 2 da 128 bit. Io penso che l'esecuzione delle micro op sia completamente OOO e quindi ad esempio una istruzione AVX può essere comunque eseguita se l'altra CPU ha mandato del codice FP: semplicemente l'istruzione è eseguita in due cicli successivi.

bjt2

29-08-2010, 13:07

Sì, sono legati. Diciamo che si allunga la pipeline con l'obiettivo di ottenere un critical path più corto e quindi un FO4 più basso.
FO4=13 per il P4 Willamette o Prescott ? Willamette aveva la pipline degli interi a 20 stadi, mentre Prescott l'aveva a 31 stadi.

Io avevo letto 16FO4 per la parte non dual pumped e 8 FO4 per la parte dual pumped... Presumo si parli del Willamette. 13 FO4 a questo punto il Prescott... E la parte dual pumped 6 FO4 (!).
Siccome il Power 6 con un FO4 di 13 è arrivato a 6 GHz anche con il magnifico processo AMD, INTEL ha fatto benissimi a cestinare Netburst...

dany700

29-08-2010, 13:08

FMAC: Fused Multiply-Accumulate

Questa alla fine è una delle cose che cambia meno rispetto all'architettura K10. Significa che ogni unità di calcolo è capace di eseguire una istruzione floating point quasliasi, sia essa basata su moltiplicazione che su somma.
Prima invece le due unità di calcolo erano suddivise per compiti, una per la moltiplicazione ed un per la somma.
Alla fine questa cosa può comportare un leggerissimo aumento di performance sul singolo thread (nel caso non fosse possibile schedulare in modo alternato istruzioni basate su somma e su moltiplicazione), ma può anche essere il tallone di achille di Buldozer: nel caso si abbiano entrami i thread che usano l'unità floating point le prestazioni rispetto ad un dual core sarebbero di fatto quasi dimezzate.

da neofita...non sò in quante e quali situazioni, dal lato pratico, possa diminuire le prestazioni del modulo rispetto ad un dualcore classico...Quel poco che ho letto su FMA...ripeto da niubbo...poneva l'enfasi sia in ambito multi-thread (superando un dualcore) che in singola operazione (garantendo prestazioni simili ma inferiori)...

Di fatto...finchè non vedo con i miei occhi...non credo a nulla...le variabili da considerare sono molteplici. Le mie sono sono considerazioni in funzione del "potenziale"...non certo su una scontata certezza.

Io credo che la prima incarnazione di Bulldozer si attesterà intorno ai 3.8 Ghz con 4 moduli e 8 CPU logiche, 4.2 Ghz con 3 moduli e 6 CPU logiche. 4.6 Ghz con 2 moduli e 4 CPU logiche.

concordo...infatti con i 5ghz, mi riferivo all'overclock.

carlottoIIx6

29-08-2010, 13:12

Attenzione, AMD non sta intraprendendo la stessa strada di Intel, non ha creato un'architettura a pipeline profonde ;) O almeno non sembra da quanto attualmente fatto vedere.

Lo stallo della pipeline non si può ovviare, bisogna perfezionare gli algoritmi di branch prediction ;) E' questa è una cosa che appunto è stata fatta in Bulldozer.

La cosa che ancora mi è più oscura è come le unità floating point verranno condivise fra i due thread allocati nel singolo modulo Bulldozer.
La FPU sarà ad uso esclusivo di un solo thread ? O la FPU avrà una specie SMT che permetterà di "mescolare" le istruzioni dei due thread in modo da poter sfruttare al minimo una unità FMAC per ogni thread ? bjt2: sai niente riguardo a questo punto ?
a forze deve essere disponibile per tutte e due i thread!
seno il vantaggio crolla...
per forza di logica deve lavorare in maniera da evitare l'ingorgo
che si quando due thread vengono processati sullo stesso core integer.
bulldozer è ciò che chiamiamo modulo (l'unità indivisibile che si può replicare)
quando hanno avuto l'idea, devono aver pensato come ovviare il problema.
@bj2 se fosse eseguita in due cicli, dov'è il vantaggio?

bjt2

29-08-2010, 13:17

Questa è un'ipotesi interessante. Magari non +0,8 a core, dato anche che si parla di settore server, dove i core vengono irrimediabilmente usati tutti, ma 0,85 - 0,9.

0,33*0,9=0,297
0,297+1=1,297
1,5/1,297=1,15

0,33*0,85=0,2805
1,5/1,2805=1,17

Poi si può tener conto del fatto che probabilmente lew prestazioni negli interi sono cresciute più delle prestazioni in virgola mobile. Dunque nel settore desktop l'IPC potrebbe apparire cresciuto più che nel settore server.
Ad ogni modo io sono propenso a credere ad un IPC cresciuto di una quantità massima del 20%. Già questo, tenendo conto della resa del modulo (80% di un dual core), comporterebbe un IPC della singola pipeline itnera, senza considerare il modulo, cresciuto del
1,2/0,8=1,5.
Cioè un 50% di IPC in più per la pipeline intera, moltiplicato per la resa del modulo (0,8) da un IPC complessivo per i due core del 20% superiore a K10.
Secondo me è già tantissimo, non credete? Fare +50% di pc in un colpo solo è tanto, soprattutto considerando che la pipeline si è allungata e dunque è tendenzialmente meno efficiente.

Grazie Cionci. Si 13 per Prescott.

La lunghezza della pipeline influisce sul F04, ma devi sempre considerare che la pipeline del P4 prescott, quello che è arrivato a 3,8GHz, era di 31 stadi, contro i 20 circa di bulldozer.
Williamett aveva F04 di 17 e una pipeline di 20 stadi, quindi i conti tornano.
Però williamette è arrivato a 1,8GHz se non sbaglio... Certo era ancora a 180nm :D :D

Si, sull'AM3+ entreranno i K10. Di qui la mia idea che AMD potrebbe continuare a vendere, almeno nel primo periodo, i thuban e forse i deneb, come CPU di fascia bassa per AM3+. Bulldozer, a quanto è stato dichiarato all'Hotchip, sarà prodotto solo a 6 e 8 core. Niente quad core bulldozer.

Credo invece che la pipeline di Bulldozer sia proprio attorno ai 20 stadi, ma forse mi ricordo un 18. E' possibile? Se ne era parlato mesi fa! Credo sia 2-3 stadi più lungha di quella di k10.

Insomma il conto torna perfettamente con il williamette. Magari sono riuscitia d ottenere FP04=17 (come williamette) con una pipeline più corta (18?). Ciò è possibile?

Scusate una domanda: Intel chiederebbe ad AMD una roiality per l'uso del suo Hyper Threading. AMD quindi preferisce di certo farne a meno.
Ma AMD non può fare uso della tecnologia sviluppata da IBM, che ha un SMT a 4 vie? Senza quindi pagare roiality a Intel?
Perché alla fine SMT non costa quasi nulla in silicio (duplicazione dei soli registri) e alla fine della fiera tutto fa brodo!
Ma l'SMT di IBM (vedi power 7) è analogo a quello di intel? Cioè, i task vengono processati alternativamente nella stessa pipeline per recuperare i vuoti dati dagli stalli, o vengono processati contemporaneamente? Perché se fosse così la cosa avrebbe molto più a che fare con i moduli di AMD (più pipeline in parallelo) che non con l'Hyper threading di intel.

Ringrazio BJT2 per il chiarimento sulle cache 8C (non sapevo che intel le usasse) e sulla ZRAM.

SMT del Power 7 è simile a quello INTEL. Per la precisione è simile a quello dell'Atom, perchè il Power 7 ha pipeline in order. Solo che invece di avere 2 pipeline come atom, ne ha 12... :D

bjt2

29-08-2010, 13:20

FMAC: Fused Multiply-Accumulate

Questa alla fine è una delle cose che cambia meno rispetto all'architettura K10. Significa che ogni unità di calcolo è capace di eseguire una istruzione floating point quasliasi, sia essa basata su moltiplicazione che su somma.
Prima invece le due unità di calcolo erano suddivise per compiti, una per la moltiplicazione ed un per la somma.
Alla fine questa cosa può comportare un leggerissimo aumento di performance sul singolo thread (nel caso non fosse possibile schedulare in modo alternato istruzioni basate su somma e su moltiplicazione), ma può anche essere il tallone di achille di Buldozer: nel caso si abbiano entrami i thread che usano l'unità floating point le prestazioni rispetto ad un dual core sarebbero di fatto quasi dimezzate.

Io credo che la prima incarnazione di Bulldozer si attesterà intorno ai 3.8 Ghz con 4 moduli e 8 CPU logiche, 4.2 Ghz con 3 moduli e 6 CPU logiche. 4.6 Ghz con 2 moduli e 4 CPU logiche.

Potrebbero esserci delle sorprese... :D Dresdenboy, sulla base di un brevetto AMD di qualche anno fa, ha speculato che l'unità FMAC possa fare per ogni ciclo di clock o una FMAC o una MUL + una ADD anche di thread diversi... :D Daltronde se ci pensi una FMAC adesso non sarebbe mai usata, specialmente con il codice legacy...

cionci

29-08-2010, 13:28

Potrebbero esserci delle sorprese... :D Dresdenboy, sulla base di un brevetto AMD di qualche anno fa, ha speculato che l'unità FMAC possa fare per ogni ciclo di clock o una FMAC o una MUL + una ADD anche di thread diversi... :D Daltronde se ci pensi una FMAC adesso non sarebbe mai usata, specialmente con il codice legacy...
Le motivazioni alla base dell'uso di FMAC al posto di unità specifiche potrebbero anche essere altre:
- nell'uso con due thread, un thread non dovrebbe aspettare che si liberi una unità specifica
- magari una istruzione AVX, invece che essere suddivisa in due istruzioni a 128 bit, occupa entrambe le unità di calcolo contemporaneamente

Capozz

29-08-2010, 13:42

Veramente si diceva di si. E poi, altrimenti che senso avrebbe chiamarlo AM3+?

E che c'entra il nome ? Anche oggi è la stessa cosa...sulle mobo am3 per esempio non ci vanno i processori AM2 e AM2+, compresi tutti gli agena e derivati ed anche i primi Deneb (Phenom II 920 e 940)
Il discorso compatibilità di cui parlava amd è l'esatto contrario, ovvero la possibilità che bulldozer possa andare sulle mobo AM3 attuali, ma mettere un procio AM3 su mobo AM3+ è assolutamente escluso.

floydbarber

29-08-2010, 13:56

E che c'entra il nome ? Anche oggi è la stessa cosa...sulle mobo am3 per esempio non ci vanno i processori AM2 e AM2+

Appunto, proprio per questo. Se i k10 non andranno sul nuovo socket avrebbero già iniziato a chiamarlo AM4 :D

Il discorso compatibilità di cui parlava amd è l'esatto contrario, ovvero la possibilità che bulldozer possa andare sulle mobo AM3 attuali

Questo E' il problema :cry:

papafoxtrot

29-08-2010, 13:56

SMT del Power 7 è simile a quello INTEL. Per la precisione è simile a quello dell'Atom, perchè il Power 7 ha pipeline in order. Solo che invece di avere 2 pipeline come atom, ne ha 12... :D
Interessante :) Non sapevo che Power7 potesse essere In order...
Comunque, a questo punto: non è possibile che AMD possa "comprare" l'SMT da IBM?

Comunque credo che in esecuzioni in order l'SMT sia più efficace, perché è più facile che la pipeline stalli, non potendo riordinare le operazioni da eseguire.

Potrebbero esserci delle sorprese... :D Dresdenboy, sulla base di un brevetto AMD di qualche anno fa, ha speculato che l'unità FMAC possa fare per ogni ciclo di clock o una FMAC o una MUL + una ADD anche di thread diversi... :D Daltronde se ci pensi una FMAC adesso non sarebbe mai usata, specialmente con il codice legacy...

Interessante :)
Così non si rischiad i perdere cicli a eseguire solo la moltiplicazione o solo la somma :)

Le motivazioni alla base dell'uso di FMAC al posto di unità specifiche potrebbero anche essere altre:
- nell'uso con due thread, un thread non dovrebbe aspettare che si liberi una unità specifica
- magari una istruzione AVX, invece che essere suddivisa in due istruzioni a 128 bit, occupa entrambe le unità di calcolo contemporaneamente

Credo sia così: le due pipeline 128bit vengono usate assieme per eseguire l'istruzione a 256 bit, senza spezzare quest'ultima.

cionci

29-08-2010, 14:06

Interessante :) Non sapevo che Power7 potesse essere In order...
Comunque, a questo punto: non è possibile che AMD possa "comprare" l'SMT da IBM?
AMD, se non sbaglio, è libera di usare tutte le tecnologie di Intel.

floydbarber

29-08-2010, 14:15

AMD, se non sbaglio, è libera di usare tutte le tecnologie di Intel.

Si, non ricordo i termini ma c'è stato un accordo quando hanno chiuso le controversie sulle politiche commerciaili scorrette di Intel

Defragg

29-08-2010, 14:18

AMD, se non sbaglio, è libera di usare tutte le tecnologie di Intel.

Si, non ricordo i termini ma c'è stato un accordo quando hanno chiuso le controversie sulle politiche commerciaili scorrette di Intel

Mi incuriosisce! Dove posso reperire altre informazioni al riguardo? :)

papafoxtrot

29-08-2010, 14:28

Non credo sia proprio così semplice, anceh se può essere. Non ricordo bene.
E' stata la soluzione extragiudiziale della controversia tra AMD e Intel presso la corte di new york.
Intel ci metteva le licenze X86 e non so se e quali altri brevetti e un miliardo di dollari. AMD non impiantava altre cause legali legate alla vicenda.
Se fosse così secondo me al prossimo giro AMD aggiungerà anche SMT. Male non farà, e può essere tranquillamente aggiunto ad ogni pipeline intera.
Una cosa ancora sulla FMAC che può eseguire una mul ed una add di due processi diversi. Ciò richiede in effetti i quattro operandi in input di cui si è parlato, contro i tre operandi canonici di una FMA.

Probabilmente quando anche intel passerà alel FMA allora si eseguiranno veramente (nel senso che il compilatore le manderà in esecuzione) operazioni FMA; e allora sostituiranno l'input con i tre operandi canonici e toglieranno questo riarrangiamento.

Una domanda: Il passaggio alle oeprazioni FMA è un passo in direzione di fusion? Voglio dire, per sostiture una FPU x86 con uno shader core (GPU) immagino che si debbano dare in input oeprazioni in forma di FMA. Per cui questo passaggio potrebbe essere obbligato per arrivare ad usare lo shader core delle GPU come FPU.
Sbaglio?

floydbarber

29-08-2010, 14:34

Questo era il comunicato di AMD:

http://www.amd.com/us/press-releases/Pages/amd-press-release-2009nov12.aspx

C'era di mezzo la condivisione di alcuni brevetti per 5 anni

capitan_crasy

29-08-2010, 15:08

@capitan_crasy

Ciao Boss ;)

Hai info sulle caratteristiche del socket AM3+?

sarà possibile montarci le attuali CPU, es. thuban oppure si cambia tutto?

Grazie

Ciao:

Guarda, le informazioni che ho raccolto sui socket in questi ultimi tempi si sono rilevati del tutto inaffidabili, comprese le compatibilità.
Appurato che le CPU Bulldozer NON andranno sull'attuale socket AM3, le voci parlano di compatibilità (anche se presunta) delle CPU socket AM3 sul socket AM3+, dato che il nuovo socket nasce dalla base di quello vecchio e che Bulldozer aggiunge alcune caratteristiche e non toglie quelle che ci sono già.
Credo che avremo notizie ufficiali a novembre; non escludo che nelle prossime settimane ci siano nuove indiscrezioni sui nuovi socket e nuovi chipset...

calabar

29-08-2010, 15:16

Se fosse così secondo me al prossimo giro AMD aggiungerà anche SMT. Male non farà, e può essere tranquillamente aggiunto ad ogni pipeline intera.
Però riflettici:
- SMT risulta meno efficace negli attuali i7 6x, perchè il numero di thread gestiti comincia ad essere eccessivo per un uso desktop.
- BD è improntato per avere core più piccoli e in maggior numero. Questo ha fatto dire ad alcuni (anche tu se non erro) che proprio a causa di questo BD rischia di non essere competitivo sul mercato desktop nelle sue versioni con più di 4moduli/8core, perchè l'eccessivo numero di core difficilmente sarà gestito da applicazioni reali, mentre i core più potenti di SB gestiranno meglio la situazione.

Con questo scenario, aggiungere SMT ad un progetto già fortemente improntato al multicore, sarebbe davvero così vantaggioso?
O potrebbe rivelarsi uno spreco di silicio e tempo (la tecnologia va comunque studiata, adattata e implementata... e potrebbe non essere efficace come quella intel che su questa ha molta più esperienza), senza contare che AMD ha proprio dichiarato di voler evitare che i propri processori possano avere dei cali prestazionali in quelle situazioni in cui SMT crea problemi.

Ren

29-08-2010, 15:24

SMT del Power 7 è simile a quello INTEL. Per la precisione è simile a quello dell'Atom, perchè il Power 7 ha pipeline in order. Solo che invece di avere 2 pipeline come atom, ne ha 12...

Il power 7 è un Out of Order con 6 dispatch unit,8 issue slot e 12 unità funzionali.

ps. ti confondi sempre...;)

capitan_crasy

29-08-2010, 15:28

AMD ha detto fino alla nausea che non crede nella tecnologia SMT; fatevene una dannata ragione e smettiamola con questa storia...

Xile

29-08-2010, 15:32

Ma di quanto dovrebbero essere più velocei questi processori rispetto ai Phenom?!

B|4KWH|T3

29-08-2010, 15:34

Attenzione, AMD non sta intraprendendo la stessa strada di Intel, non ha creato un'architettura a pipeline profonde ;) O almeno non sembra da quanto attualmente fatto vedere.

Lo stallo della pipeline non si può ovviare, bisogna perfezionare gli algoritmi di branch prediction ;) E' questa è una cosa che appunto è stata fatta in Bulldozer.

La cosa che ancora mi è più oscura è come le unità floating point verranno condivise fra i due thread allocati nel singolo modulo Bulldozer.
La FPU sarà ad uso esclusivo di un solo thread ? O la FPU avrà una specie SMT che permetterà di "mescolare" le istruzioni dei due thread in modo da poter sfruttare al minimo una unità FMAC per ogni thread ? bjt2: sai niente riguardo a questo punto ?

Per quel che ho capito io è la seconda

bjt2

29-08-2010, 15:35

Le motivazioni alla base dell'uso di FMAC al posto di unità specifiche potrebbero anche essere altre:
- nell'uso con due thread, un thread non dovrebbe aspettare che si liberi una unità specifica
- magari una istruzione AVX, invece che essere suddivisa in due istruzioni a 128 bit, occupa entrambe le unità di calcolo contemporaneamente

Ma comunque una istruzione AVX deve essere divisa in 2 da 128 bit, perchè le unità sono a 128 bit. Solo che se sono libere tutte e due, sono eseguite in parallelo, altrimento no...

cionci

29-08-2010, 15:39

Se fosse così secondo me al prossimo giro AMD aggiungerà anche SMT. Male non farà, e può essere tranquillamente aggiunto ad ogni pipeline intera.
Di fatto già lo userà sulla FPU a quanto sembra.

paolo.oliva2

29-08-2010, 15:40

...e un miliardo di dollari...
Credo sia un milione di $...

capitan_crasy

29-08-2010, 15:41

Ma di quanto dovrebbero essere più velocei questi processori rispetto ai Phenom?!

Troppo presto...
Non ci sono ancora dati ufficiali...

bjt2

29-08-2010, 15:43

Interessante :) Non sapevo che Power7 potesse essere In order...
Comunque, a questo punto: non è possibile che AMD possa "comprare" l'SMT da IBM?

Non credi ci sia un brevetto. Il concetto di SMT è quasi banale.

Comunque credo che in esecuzioni in order l'SMT sia più efficace, perché è più facile che la pipeline stalli, non potendo riordinare le operazioni da eseguire.

Esatto. :)

Interessante :)
Così non si rischiad i perdere cicli a eseguire solo la moltiplicazione o solo la somma :)

Se ci pensi, comunque per far eseguire alla unità FMAC una moltiplicazione o una somma il MUL e l'ADD devono essere poter divisi e l'unico modo è quello del brevetto AMD. Poi arrivati a questo, non ci vuole nulla ad aggiungere un data path per poter fare MUL e ADD in parallelo... :) Il bello è che essendo un brevetto AMD, INTEL deve pagarne le royalty, sempre se AMD glielo concede... :) Può essere un altra arma in mano ad AMD. Anche per questo IMHO INTEL non ha implementato FMAC: senza il brevetto AMD avrebbe dovuto mettere un MUL, un ADD e una FMAC SEPARATE... :)

Credo sia così: le due pipeline 128bit vengono usate assieme per eseguire l'istruzione a 256 bit, senza spezzare quest'ultima.
L'istruzione è comunque spezzata ma se la seconda FPU è libera è eseguita in un solo clock.
Io penso che le due unità MMX facciano le operazioni x87 legacy e quelle MMX e forse anche le operazioni SIMD intere (MMX, SSEx)...

cionci

29-08-2010, 15:43

Ma comunque una istruzione AVX deve essere divisa in 2 da 128 bit, perchè le unità sono a 128 bit. Solo che se sono libere tutte e due, sono eseguite in parallelo, altrimento no...
Questo non lo so sinceramente. Aggiungerebbe un ritardo non facilmente prevedibile per la terminazione dell'istruzione AVX. A rigor di logica dovrebbero essere portate avanti contemporaneamente.

mtk

29-08-2010, 15:43

Credo sia un milione di $...

no no,era un miliardo abbondante di dollari....se la memoria non mi inganna 1,5....ci facevo il pieno al razzo :asd:

edit.
1.25 miliardi

bjt2

29-08-2010, 15:46

Non credo sia proprio così semplice, anceh se può essere. Non ricordo bene.
E' stata la soluzione extragiudiziale della controversia tra AMD e Intel presso la corte di new york.
Intel ci metteva le licenze X86 e non so se e quali altri brevetti e un miliardo di dollari. AMD non impiantava altre cause legali legate alla vicenda.
Se fosse così secondo me al prossimo giro AMD aggiungerà anche SMT. Male non farà, e può essere tranquillamente aggiunto ad ogni pipeline intera.
Una cosa ancora sulla FMAC che può eseguire una mul ed una add di due processi diversi. Ciò richiede in effetti i quattro operandi in input di cui si è parlato, contro i tre operandi canonici di una FMA.

Probabilmente quando anche intel passerà alel FMA allora si eseguiranno veramente (nel senso che il compilatore le manderà in esecuzione) operazioni FMA; e allora sostituiranno l'input con i tre operandi canonici e toglieranno questo riarrangiamento.

Una domanda: Il passaggio alle oeprazioni FMA è un passo in direzione di fusion? Voglio dire, per sostiture una FPU x86 con uno shader core (GPU) immagino che si debbano dare in input oeprazioni in forma di FMA. Per cui questo passaggio potrebbe essere obbligato per arrivare ad usare lo shader core delle GPU come FPU.
Sbaglio?

Il brevetto AMD predeve una FMAC a 3 bus, che poi può essere comunque a 4 operandi. Dresdenboy ha ipotizzato un quarto bus per sfruttare MUL e ADD contemporaneamente con istruzioni diverse. Quando INTEL introdurrà le FMA a 3 operandi, la FMAC dovrà comunque avere 3 bus minimo, ma non vedo il motivo per AMD di tornare a 3 bus... :)
L'FMAC è un passo verso l'uso delle SP delle GPU. E AMD è in vantaggio...

bjt2

29-08-2010, 15:48

Il power 7 è un Out of Order con 6 dispatch unit,8 issue slot e 12 unità funzionali.

ps. ti confondi sempre...;)

Hai ragione... Mi confondo sempre con il SUN Niagara e il SUN Rock... ;)

F1R3BL4D3

29-08-2010, 15:48

no no,era un miliardo abbondante di dollari....se la memoria non mi inganna 1,5....ci facevo il pieno al razzo :asd:

edit.
1.25 miliardi

Si, 1,25 miliardi di $.

B|4KWH|T3

29-08-2010, 15:49

Credo sia un milione di $...

Un milione sarebbero noccioline :Prrr:

Era proprio un miliardo di dollari (anzi 1,2 se non erro)

bjt2

29-08-2010, 15:51

Questo non lo so sinceramente. Aggiungerebbe un ritardo non facilmente prevedibile per la terminazione dell'istruzione AVX. A rigor di logica dovrebbero essere portate avanti contemporaneamente.

Se sono tutte e due libere certamente... :) Ma se ci sono altre istruzioni in coda, molte istruzioni in coda, è meglio stallare tutte e 2 le parti a 128 bit per farle assieme oppure farle tutte e due in sequenza su una sola pipeline? ;)
Il motivo di avere pipeline a 128 bit è per la granularità. INTEL deve per forza fare l'istruzione a 256 bit tutta assieme, AMD no... :)

Immagina un thread che spara istruzioni AVX e un thread legacy che spara istruzioni a 128 bit... INTEL deve fare una istruzione a 256 e una a 128 bit in due cicli. AMD può fare 1 da 256 e DUE a 128 bit in 2 cicli... :)

Megakirops

29-08-2010, 15:52

Credo sia un milione di $...

no no era proprio un miliardo o poco più

paolo.oliva2

29-08-2010, 15:54

Però riflettici:
- SMT risulta meno efficace negli attuali i7 6x, perchè il numero di thread gestiti comincia ad essere eccessivo per un uso desktop.
- BD è improntato per avere core più piccoli e in maggior numero. Questo ha fatto dire ad alcuni (anche tu se non erro) che proprio a causa di questo BD rischia di non essere competitivo sul mercato desktop nelle sue versioni con più di 4moduli/8core, perchè l'eccessivo numero di core difficilmente sarà gestito da applicazioni reali, mentre i core più potenti di SB gestiranno meglio la situazione.

Con questo scenario, aggiungere SMT ad un progetto già fortemente improntato al multicore, sarebbe davvero così vantaggioso?
O potrebbe rivelarsi uno spreco di silicio e tempo (la tecnologia va comunque studiata, adattata e implementata... e potrebbe non essere efficace come quella intel che su questa ha molta più esperienza), senza contare che AMD ha proprio dichiarato di voler evitare che i propri processori possano avere dei cali prestazionali in quelle situazioni in cui SMT crea problemi.

Io aggiungerei che come detto da AMD, l'intenzione sia quella di fornire un procio a parità di TH di quello Intel, con la differenza che quello Intel ha 2 TH su 1 core fisico, mentre quello AMD avrebbe i TH uguale ai core fisici.
L'SMT ulteriore creerebbe unicamente problemi e nessun vantaggio, visto che comunque l'SMT non supera mai in alcuna condizione il rendimento di 1/2 core fisico.
Al limite dei casi, come hai detto pure tu, quando SB X6 e X8 lo avremo nel desktop (dopo BD X8) e vagliato l'effettiva prestazione di BD, AMD potrebbe sempre vagliare l'opportunità di portare BD X12 e X16 (già pronti da tempo) pure nel desktop.

aaadddfffgggccc

29-08-2010, 15:55

Ciao:

Guarda, le informazioni che ho raccolto sui socket in questi ultimi tempi si sono rilevati del tutto inaffidabili, comprese le compatibilità.
Appurato che le CPU Bulldozer NON andranno sull'attuale socket AM3, le voci parlano di compatibilità (anche se presunta) delle CPU socket AM3 sul socket AM3+, dato che il nuovo socket nasce dalla base di quello vecchio e che Bulldozer aggiunge alcune caratteristiche e non toglie quelle che ci sono già.
Credo che avremo notizie ufficiali a novembre; non escludo che nelle prossime settimane ci siano nuove indiscrezioni sui nuovi socket e nuovi chipset...

Allora non mi resta che attendere...
Te l'ho chiesto perchè nei lab di Asus bolle qualche cosa in pentola ma nessuno si sbilancia. :mad:

paolo.oliva2

29-08-2010, 15:55

no no era proprio un miliardo o poco più

Ops. mi scuso, non era ironia.

mtk

29-08-2010, 15:55

Si, 1,25 miliardi di $.

Un milione sarebbero noccioline :Prrr:

Era proprio un miliardo di dollari (anzi 1,2 se non erro)

no no era proprio un miliardo o poco più

esatto...e oltre ai soldi intel ha fatto cadere le accuse di violazione di brevetti per lo spin off di globalfoundries e ha prolungato di 5 anni l utilizzo dei brevetti condivisi tra intel e amd.
e c e' ancora pendente la multa europea dell anti trust(intel ha fatto ricorso) e forse quella della fcc statunitense

cionci

29-08-2010, 16:00

Se sono tutte e due libere certamente... :) Ma se ci sono altre istruzioni in coda, molte istruzioni in coda, è meglio stallare tutte e 2 le parti a 128 bit per farle assieme oppure farle tutte e due in sequenza su una sola pipeline? ;)
Il motivo di avere pipeline a 128 bit è per la granularità. INTEL deve per forza fare l'istruzione a 256 bit tutta assieme, AMD no... :)

Immagina un thread che spara istruzioni AVX e un thread legacy che spara istruzioni a 128 bit... INTEL deve fare una istruzione a 256 e una a 128 bit in due cicli. AMD può fare 1 da 256 e DUE a 128 bit in 2 cicli... :)
Non necessariamente bisogna stallarla, ma si possono anche cercare di schedulare insieme ;)

Immagina invece lo scenario in cui metà istruzione venga eseguita e metà no e poi ci sia una dipendenza sui dati di questa. Non si complicherebbe un po' troppo ?

F1R3BL4D3

29-08-2010, 16:00

esatto...e oltre ai soldi intel ha fatto cadere le accuse di violazione di brevetti per lo spin off di globalfoundries e ha prolungato di 5 anni l utilizzo dei brevetti condivisi tra intel e amd.
e c e' ancora pendente la multa europea dell anti trust(intel ha fatto ricorso) e forse quella della fcc statunitense

Con la FTC (penso sia quella che intendessi) si è arrivati all'accordo già da inizio Agosto.

mtk

29-08-2010, 16:08

Con la FTC (penso sia quella che intendessi) si è arrivati all'accordo già da inizio Agosto.

si,scusa ho sbagliato a scrivere,allora ok mi sono perso l accordo :D ....comunque anche la multa europea se venisse confermata sarebbe una bella botta per intel,si parlava di 1 miliardo e qualcosa,non ricordo se dollari o euro pero'..

bjt2

29-08-2010, 16:12

Non necessariamente bisogna stallarla, ma si possono anche cercare di schedulare insieme ;)

Immagina invece lo scenario in cui metà istruzione venga eseguita e metà no e poi ci sia una dipendenza sui dati di questa. Non si complicherebbe un po' troppo ?

In termini di schedulazione e presenza in coda, per come sono fatti gli algoritmi di schedulazione, le due metà dell'istruzione a 256 o sono eseguite assieme nelle due pipeline o una dopo l'altra nella stessa pipeline, o comunque si può fare in modo che sia SEMPRE così. AMD può permettersi questa flessibilità, INTEL no... ;) Perchè limitare le possibilità alla pipeline AMD? Non credo che sia così complicato, anzi credo cre non debba proprio farsi nulla... Pensa alle SSE quando il K8 era a 64 bit... ;) Le istruzioni a 128 bit erano spezzate in 2 a 64 bit che andavano una dietro l'altra... Qui invece POSSONO (non debbono) andare in parallelo... E' l'unica differenza... :)

cionci

29-08-2010, 16:20

In termini di schedulazione e presenza in coda, per come sono fatti gli algoritmi di schedulazione, le due metà dell'istruzione a 256 o sono eseguite assieme nelle due pipeline o una dopo l'altra nella stessa pipeline, o comunque si può fare in modo che sia SEMPRE così. AMD può permettersi questa flessibilità, INTEL no... ;) Perchè limitare le possibilità alla pipeline AMD? Non credo che sia così complicato, anzi credo cre non debba proprio farsi nulla... Pensa alle SSE quando il K8 era a 64 bit... ;) Le istruzioni a 128 bit erano spezzate in 2 a 64 bit che andavano una dietro l'altra... Qui invece POSSONO (non debbono) andare in parallelo... E' l'unica differenza... :)
La differenza c'è nelle dipendenze dei dati. L'istruzione OP1 è una istruzione AVX che lavora anche sull'indirizzo X (una locazione di memoria generica).
Mettiamo che l'operazione OP2 sia a 128 bit, appartenga allo stesso thread di OP1 e sia successiva, ma necessiti di leggere da X.
Come faccio a schedulare OP1 ? Quale garanzia ho che OP1 venga eseguita dopo la seconda parte di OP2 ?

affiu

29-08-2010, 16:42

quindi ,per quanto abbia senso o sia utile ,aprendo piu applicazioni contemporaneamente , bulldozer dovrebbe all'umenatre di esse ,far vedere la sua potenza

cioe ,nel mio immaginario, se uno aprisse 2 bluray con 2 player diversi, fare 2 conversioni video, aprire un gioco e giocarci,+ tutti i social network e quantaltro......

lui macinerebbe come aprire un solo bluray su phenom?

Pihippo

29-08-2010, 16:50

La differenza c'è nelle dipendenze dei dati. L'istruzione OP1 è una istruzione AVX che lavora anche sull'indirizzo X (una locazione di memoria generica).
Mettiamo che l'operazione OP2 sia a 128 bit, appartenga allo stesso thread di OP1 e sia successiva, ma necessiti di leggere da X.
Come faccio a schedulare OP1 ? Quale garanzia ho che OP1 venga eseguita dopo la seconda parte di OP2 ?

Ciao
In questo caso mi sa che ha fatto un gran casino l'icu della cpu. Perchè, almeno nel k10 gli indirizzi vengono sempre precalcolati dalle agu. Dunque la logica OoO dovrebbe sapere che OP1 è dipendente da OP2. Non capisco comunque cosa c'è di strano sono casi molto comuni e non solo per istruzioni Avx o fp ma anche per istruzioni int, anzi sopratutto per queste.
Sempre sperando di non aver detto minchiate.

paolo.oliva2

29-08-2010, 16:50

..sto leggendo su google gruppi che tra Thuban e Buldozer, c'è un progetto cancellato che aveva un FO4 di 13... Sarebbe arrivato a 5GHz con il 45nm! Dice anche che BD dovrebbe avere un IPC (A PARITA' DI FREQUENZA) del 20-25% in più. Il tizio sembra essere un ex dipendente AMD che ha lavorato al progetto... Il gruppo in guestione è http://groups.google.de/group/comp.arch/browse_thread/thread/45018bf3214f6049?hl=de# e il tipo si chiama Mitch_qualcosa...

Sarebbe quasi fattibile. Ho analizzato un articolo postato dal @Capitano sul 1055T 95W e ho notato nei test di consumo, che il Thuban X6@4,03GHz consumerebbe quasi un 20% in meno di un i7 920 130W a def, e meno del 20% in più, confrontato ad un i870 dato per 95W.
Oltretutto, nonostante un aumento delle prestazioni del 20%, consumerebbe comunque un 20% in meno circa di un i980X, e se facciamo i conti tra consumo e potenza, avrebbe perfino un'efficienza migliore del 32nm HKMG Intel.

Fonte (http://www.hexus.net/content/item.php?item=26122&page=1)

Sintetizzato (http://www.hwupgrade.it/forum/showpost.php?p=32943879&postcount=27142)

bjt2

29-08-2010, 21:21

La differenza c'è nelle dipendenze dei dati. L'istruzione OP1 è una istruzione AVX che lavora anche sull'indirizzo X (una locazione di memoria generica).
Mettiamo che l'operazione OP2 sia a 128 bit, appartenga allo stesso thread di OP1 e sia successiva, ma necessiti di leggere da X.
Come faccio a schedulare OP1 ? Quale garanzia ho che OP1 venga eseguita dopo la seconda parte di OP2 ?

Se entrambe leggono dalla locazione X, non c'è nessun problema. Se OP1 scrive su X e OP2 legge da X (il caso che sarebbe il più problematico) si schedulano entrambe le microoperazioni della OP1 come scriventi sulla locazione X e l'OP2 stallerà fino a quando ENTRAMBE avranno finito. L'unità di load/store è OOO ma nel caso di una lettura DOPO scrittura, è l'unico caso in cui le operazioni di memoria non possono essere riordinate. Quindi OP2 asperrterà ENTRAMBE le microoperazioni che risultano come se fossero due istruzioni separate che scrivono in X (e seguenti) e che vengono PRIMA di OP2 e che quindi DEVONO essere eseguite prima. Quindi in quel caso non ci sarebbe nessuna esecuzione fuori ordine. Però mentre in SB non potrebbe essere schedulata nessuna altra operazione, in Bulldozer potrebbe essere schedulata nello stesso ciclo della OP2 un'altra istruzione a 128 bit indipendente dello stesso thread o dell'altro thread... :)

paolo.oliva2

29-08-2010, 23:40

Spero non sia vecchia:
Qui (http://hothardware.com/News/AMD-May-Use-Bobcat-Core-To-Expand-Server-Products/) e Qui (http://www.dancewithshadows.com/tech/amd-announces-bulldozer-and-bobcat-microprocessor-architecture-announced/) uno schema per l'annuncio, già postato da altri di Bobcat per server.
http://www.pctunerup.com/up/results/_201008/20100829233829_bob.jpg

Buldozer con Turbo pure nei server. (qui (http://www.xbitlabs.com/news/cpu/display/20100825234144_AMD_s_Next_Gen_Server_Platforms_to_Feature_TurboCore_Technology.html))

Questa è molto importante, non tanto per l'aumento di potenza con TH inferiori, ma proprio per la trasportabilità di proci maggiori di X8 pure nel desktop nel caso AMD lo reitehga opportuno. Inoltre, ciò dovrebbe abbattere in parte i prezzi, perche pre-figurerebbe un'unica catena sia per desktop che per server, dove probabilmente l'aggressività del turbo sarebbe solo un'impostazione via bios.

somethingstrangeinyourmind

30-08-2010, 09:54

Quindi i dubbi sulla potenza dell'unita FP del singolo modulo di BD dovrebbero essere stati dissipati. Alla luce di quanto postato sembrerebbe decisamente in grado di supportare adeguatamente le due linee INT.
Inoltre mi sembra che un pò tutti siate concordi sul fatto che BD dovrebbe lavorare su frequenze piuttosto alte: intorno ai 4 Ghz.
Altri punti "fermi"?

Pihippo

30-08-2010, 10:55

Quindi i dubbi sulla potenza dell'unita FP del singolo modulo di BD dovrebbero essere stati dissipati. Alla luce di quanto postato sembrerebbe decisamente in grado di supportare adeguatamente le due linee INT.
Inoltre mi sembra che un pò tutti siate concordi sul fatto che BD dovrebbe lavorare su frequenze piuttosto alte: intorno ai 4 Ghz.
Altri punti "fermi"?

Ciao
Che se probabilmente è vero che va un 20-25% in più a parità di clock rispetto al PhII e ha una frequenza stock del 20% probabilmente ci si potrà scordare di BD sotto i 200 euro :(

calabar

30-08-2010, 11:18

Ciao
Che se probabilmente è vero che va un 20-25% in più a parità di clock rispetto al PhII e ha una frequenza stock del 20% probabilmente ci si potrà scordare di BD sotto i 200 euro :(
Non mi pare una brutta cosa: se si troverà sotto i 200 euro significherà semplicemente che andrà meno che se ne costasse di più.

Se invece sarà competitivo potrebbe far iniziare una guerra dei prezzi con intel che potrà portare solo vantaggi a noi compratori.
Quindi auguratevi che vada forte, dato che SB sappiamo già come andrà!

somethingstrangeinyourmind

30-08-2010, 11:28

Non mi pare una brutta cosa: se si troverà sotto i 200 euro significherà semplicemente che andrà meno che se ne costasse di più.

Se invece sarà competitivo potrebbe far iniziare una guerra dei prezzi con intel che potrà portare solo vantaggi a noi compratori.
Quindi auguratevi che vada forte, dato che SB sappiamo già come andrà!
Quoto. Sotto i duecento euri non credo che avrebbe neanche motivo di esistere.
Vorrebbe dire essere sotto Thuban e non credo che sia possibile.

carlottoIIx6

30-08-2010, 11:31

secondo me
la situazione che si presenda è così:
il cuore di bulldozer è lo FP scheduler
che lavora in questo modo
quando è in multi divide il lavoro in due e ci ritroviamo
un core integer ed un 128 bit fmac a lavorare come se fossero un core
(in tal senso la cpu diventa un x8 reale con 8 core uguali)
quando lavora in single l'fp scheduler unisce i due fmac e ci ritroviamo un core
più grande (se non fa questo bulldozer non ha senso... quindi lo fa)

quindi in definitiva
più core in multi (dove serve avere più thread)
un core più grosso in single (dove serve avere un core più grosso)

una incognità, potrebbe essere se l'fp scheduler fa di più di questo...

Dre@mwe@ver

30-08-2010, 11:40

secondo me
la situazione che si presenda è così:
il cuore di bulldozer è lo FP scheduler
che lavora in questo modo
quando è in multi divide il lavoro in due e ci ritroviamo
un core integer ed un 128 bit fmac a lavorare come se fossero un core
(in tal senso la cpu diventa un x8 reale con 8 core uguali)
quando lavora in single l'fp scheduler unisce i due fmac e ci ritroviamo un core
più grande (se non fa questo bulldozer non ha senso... quindi lo fa)

quindi in definitiva
più core in multi (dove serve avere più thread)
un core più grosso in single (dove serve avere un core più grosso)

una incognità, potrebbe essere se l'fp scheduler fa di più di questo...

Praticamente un Reverse Hyperthreading? AMD aveva annunciato che non ci sarà se non sbaglio...ma se ci fosse sarebbe una trovata eccezionale.

calabar

30-08-2010, 11:52

quindi in definitiva
più core in multi (dove serve avere più thread)
un core più grosso in single (dove serve avere un core più grosso).
Per non fare confusione, ricordiamo che quando si parla di "core" si intendono le unità int, mentre qui stiamo parlando di FP.

carlottoIIx6

30-08-2010, 12:16

Per non fare confusione, ricordiamo che quando si parla di "core" si intendono le unità int, mentre qui stiamo parlando di FP.

per core intendo il core integer più fp scheduler
per core bulldozer intendo i due core integer più scheduler
chiamiamolo modulo

Ren

30-08-2010, 12:45

Io sono per l'esecuzione di una AVX in due passate, come del resto si è sempre fatto con le cpu precedenti. Le performance alla fine sarebbero le stesse, dato che le AVX gestibili sarebbero due.

paolo.oliva2

30-08-2010, 13:16

Non mi pare una brutta cosa: se si troverà sotto i 200 euro significherà semplicemente che andrà meno che se ne costasse di più.

Se invece sarà competitivo potrebbe far iniziare una guerra dei prezzi con intel che potrà portare solo vantaggi a noi compratori.
Quindi auguratevi che vada forte, dato che SB sappiamo già come andrà!

Quoto.

Però la vedrei un attimo complessa la cosa.

I prezzi del Thuban sono in discesa... un 1090T ormai lo si trova anche sotto i 240€, i 1035/1045 dovrebbero essere proposti sotto i 140€.

Bisogna contare che un BD X6 costa molto meno produrlo di un Thuban X6, perché ha una superficie die nettamente inferiore.

Ora... come può AMD spostare l'interesse della clientela verso BD? Semplicemente con un prezzo/prestazioni più conveniente. Ma dobbiamo ricordarci che BD richiede il cambio mobo, mentre Thuban no.

Quindi, secondo me, lo scenario ipotizzabile sarebbe che la fascia bassa e medio/bassa del Thuban (almeno sino al 95W TDP 1055T) risulterebbe ancora competitiva per prezzo (così da continuare a smaltire le scorte di magazzino e/o continuare la catena 45nm low-k fino ad esaurimento), permettendo così l'upgrade a chi volesse passare da AM2+/AM3, e nello stesso tempo proporre un BD che per prezzo/prestazioni tale, da renderlo appetibile.

Quindi un BD X6 entry-level dovrebbe partire da un prezzo tale da avere un rapporto/prestazioni migliore di un 1090T a 3,2GHz e comunque non sotto i 240€ del 1090T attuale.

Guardando che la fascia Thuban è compressa in un range di 800MHz (3,2GHz-2,4GHz), contando per BD clock di almeno 4GHz, 800MHz in meno lo porterebbe a 3,2GHz, il resto lo farebbe l'IPC, che in qualche modo compenserebbe sia sul fatto che il 1090T è B.E., sia sul clock del Turbo a def più aggressivo, e nell'insieme offrirebbe un OC almeno uguale a quello fattibile con il 1090T.

BD X8 sarebbe a parte..., se l'IPC sarà di circa il 17% maggiore, beh... unito a 2 core in più (+33%), al clock maggiore (+20%), purtroppo ad AMD potrebbe passare per la testa di reintrodurre gli FX... perché comunque con una potenza almeno dell'80% superiore ad un 1090T, sarebbe nettamente comparabile a ciò che Intel sta vendendo come E.E.
L'unica cosa che ci salverebbe, sarebbe che per rivaleggiare con SB X6-X8 AMD dovesse ricorrere a BD X12-X16, nel qual caso gli FX sarebbero quelli, ma noi ci salveremmeno... BD X8 a prezzi B.E..

bjt2

30-08-2010, 13:29

Ciao
Che se probabilmente è vero che va un 20-25% in più a parità di clock rispetto al PhII e ha una frequenza stock del 20% probabilmente ci si potrà scordare di BD sotto i 200 euro :(

Degli attuali Phenom esistono versioni anche a "basso" clock (mi pare a partire da 2.4GHz) e anche triple, dual core derivanti da X4 fallati. Gli X3 e gli X2 vanno a scomparire perchè il processo a 45nm è molto maturo, ma anche se non lo fosse, ci sarà sempre spazio per la segmentazione di mercato... Il processo a 32nm è nuovo e dubito che da Bulldozer a 4 moduli si riesca a ottenere subito una grossa percentuale di CPU funzionanti. Vedremo Bulldozer X8, X6 e forse anche X4 (anche se è stato negato) con più o meno cache L3 e con frequenze più o meno alte. E' possibile che avremmo Bulldozer anche sotto i 3GHz e/o con poca o nessuna cache L3 e/o con moduli disabilitati anche attorno a 100 euro... :)
Un Bulldozer X4 senza L3 a 3GHz potrebbe andare anche come un 965 e costare sotto i 100 euro...

GT82

30-08-2010, 14:03

Un BD X4 anche a me sembra improbabile, in quella fascia di potenza ci sarà LLano...

Pihippo

30-08-2010, 14:25

Degli attuali Phenom esistono versioni anche a "basso" clock (mi pare a partire da 2.4GHz) e anche triple, dual core derivanti da X4 fallati. Gli X3 e gli X2 vanno a scomparire perchè il processo a 45nm è molto maturo, ma anche se non lo fosse, ci sarà sempre spazio per la segmentazione di mercato... Il processo a 32nm è nuovo e dubito che da Bulldozer a 4 moduli si riesca a ottenere subito una grossa percentuale di CPU funzionanti. Vedremo Bulldozer X8, X6 e forse anche X4 (anche se è stato negato) con più o meno cache L3 e con frequenze più o meno alte. E' possibile che avremmo Bulldozer anche sotto i 3GHz e/o con poca o nessuna cache L3 e/o con moduli disabilitati anche attorno a 100 euro... :)
Un Bulldozer X4 senza L3 a 3GHz potrebbe andare anche come un 965 e costare sotto i 100 euro...

Ciao
E' vero, però comunque se un bd x4 3ghz senza l3 andasse come un 965 alla fine il cambio non mi converrebbe, almeno che i bd pigliano a def i 4ghz.

somethingstrangeinyourmind

30-08-2010, 14:43

Degli attuali Phenom esistono versioni anche a "basso" clock (mi pare a partire da 2.4GHz) e anche triple, dual core derivanti da X4 fallati. Gli X3 e gli X2 vanno a scomparire perchè il processo a 45nm è molto maturo, ma anche se non lo fosse, ci sarà sempre spazio per la segmentazione di mercato... Il processo a 32nm è nuovo e dubito che da Bulldozer a 4 moduli si riesca a ottenere subito una grossa percentuale di CPU funzionanti. Vedremo Bulldozer X8, X6 e forse anche X4 (anche se è stato negato) con più o meno cache L3 e con frequenze più o meno alte. E' possibile che avremmo Bulldozer anche sotto i 3GHz e/o con poca o nessuna cache L3 e/o con moduli disabilitati anche attorno a 100 euro... :)
Un Bulldozer X4 senza L3 a 3GHz potrebbe andare anche come un 965 e costare sotto i 100 euro...
Tecnicamente sarà di sicuro possibile, ma che interesse avrebbe AMD a commercializzare processori con architettura BD in quella fascia di prezzo?
Lì potrebbe già essere ampiamente coperta con Phenom2.
Un pò più su Llano e poi BD.
E non dimentichiamoci Bobcat.

Athlon 64 3000+

30-08-2010, 14:58

Non vorrei dire una cavolata,ma nel 2011 tutta la linea basata sul K10 andrà EOL e verrà totalmente sotuituita a Llano e Buldozer.
Più precisamente Llano dovrebbe sostituire in blocco la fascia di mercato occupata dagli Athlon II e Buldozer la fascia dei Phenom II x4 e x6.
Magari Llano arriverà fino a 150-160 euro(contro i 120-130 max degli Athlon II attuali) e dai 200 euro in su ci sarà Buldozer.

affiu

30-08-2010, 15:10

Tecnicamente sarà di sicuro possibile, ma che interesse avrebbe AMD a commercializzare processori con architettura BD in quella fascia di prezzo?
Lì potrebbe già essere ampiamente coperta con Phenom2.
Un pò più su Llano e poi BD.
E non dimentichiamoci Bobcat.

secondo me dobbiamo veder piu in alto all'orizzonte,perche per quanto i k10 siano stati buoni(in relazione alla concorrenza ) l'architettura bulldozer è un passo avanti verso il futuro e i k10 passeranno ormai nell'archiviostore

dopotutto,sempre secondo me, gia bobcat è un primo assaggio verso fusion 2,in quanto vediamo che c'e' una prima conciliazione tra apu e bulldozer(visto la semplice compartimentazione su bobcat)

altrimenti non si spiegherebbe che nonostante tutto i bobcat vadino un 10% meno dei phenom 2 su processori considerati di fascia bassa....

bulldozer nasce ,secondo me, dal fatto che essere increduli in questo mondo(nonostante non si siano visti ancora in azione queste architetture) non significhi vedere e non credere ma piuttosto ,vedere e dire che non sia quello che si aspettava

ma i numeri parleranno da soli...appena il PUZZE SARA pronto:

nuovo socket(perche?) ,nuovi chipset serie 900, nuove memorie d'acciao da parte di cors@ir appositamente studiate per bulldozer,

dobbiamo,secondo me, dimenticare che ci siano paragoni da fare con i k10,perche nonostante sia un predecessore di bulldozer ,quest'ultimo sara diversissimo su tutto

potenza ,consumi,scenari di utilizzo ,efficenza e anche portafoglio soprattutto (a sto colpo secondo me)

ma nonostante tutto LO STUPORE che ci aspettiamo dovrò venire...

e non tarderà ...cosicche la gioia ,l'entusiasmo e la fantasia si fonderanno e ci accompagneranno su questo forum verso il futuro

verso l'era del processore UNICO...in tutti i sensi!!!!:Prrr:

mi aspetto solo bastoni d'acciao durante questo lungo cammino ....ma la vetta è vicina...la sorte ha deciso(permettetelo) e non si ci puo fare nulla

dalle mie parti si dice:''ogni nato è destinato''....appunto

somethingstrangeinyourmind

30-08-2010, 15:44

Non vorrei dire una cavolata,ma nel 2011 tutta la linea basata sul K10 andrà EOL e verrà totalmente sotuituita a Llano e Buldozer.
Più precisamente Llano dovrebbe sostituire in blocco la fascia di mercato occupata dagli Athlon II e Buldozer la fascia dei Phenom II x4 e x6.
Magari Llano arriverà fino a 150-160 euro(contro i 120-130 max degli Athlon II attuali) e dai 200 euro in su ci sarà Buldozer.
Un pò di post fa avevo chiesto che fine avrebbero fatto i PH2 all'uscita di BD ma non ho avuto risposte.
In effetti il punto è proprio quello.
In ogni caso un BD a 200 euri secondo me è una stima un pò ottimistica. Stiamo parlando di processori x6 e x8, con un'architettura nuova e prestazioni top di gamma.
Io immagino che partirà dai 250, sopratutto se ci sarà un refresh di Thuban con il pieno supporto ad AM3+.

secondo me dobbiamo veder piu in alto all'orizzonte,perche per quanto i k10 siano stati buoni(in relazione alla concorrenza ) l'architettura bulldozer è un passo avanti verso il futuro e i k10 passeranno ormai nell'archiviostore
...
dalle mie parti si dice:''ogni nato è destinato''....appunto
Anche per questi motivi immagino che non avrà proprio prezzi entry level.

cionci

30-08-2010, 15:55

Il prezzo non lo fa l'architettura, lo fanno le prestazioni. Come al solito AMD si posizionerà sul mercato ad un prezzo di poco più basso della corrispondente CPU Intel di prestazioni simili.
Non avendo dettagli sulle prestazioni dell'architettura, sulle frequenze di debutto (soprattutto su quanto sarà il range di frequenze alla presentazione) e sui prezzi e le prestazioni delle CPU Intel concorrenti al momento del debutto, è impossibile non solo determinare il prezzo effettivo, ma persino provare ad immaginarselo.

somethingstrangeinyourmind

30-08-2010, 16:07

Il prezzo non lo fa l'architettura, lo fanno le prestazioni.
Ma immagino che un architettura nuova abbia dei costi di progettazione/realizzazione che sicuramente incideranno sul prezzo finale.

Come al solito AMD si posizionerà sul mercato ad un prezzo di poco più basso della corrispondente CPU Intel di prestazioni simili.
Non avendo dettagli sulle prestazioni dell'architettura, sulle frequenze di debutto (soprattutto su quanto sarà il range di frequenze alla presentazione) e sui prezzi e le prestazioni delle CPU Intel concorrenti al momento del debutto, è impossibile non solo determinare il prezzo effettivo, ma persino provare ad immaginarselo.
Semplice speculazione: ma se immaginiamo che AMD abbia per le mani un "SB killer", credi che comunque si accontenterebbe di uscire con prezzi un gradino sotto Intel oppure punterebbe più in alto? se non altro con le top di gamma.

dark.halo

30-08-2010, 16:09

Mi son perso qualcosa...
AMD ha confermato che non ci saranno BD x4 :confused:
Quindi AMD schiererà..
BD x6 vs SB x4/8t
BD x8 vs SB x6/12t
beh SB 8 core starà a mille euro, e IMHO è inutile, uno che col pc ci gioca/office andrà di llano,uno che ci lavora seriamente troverà più conveniente e più performante andare sul g34 per un opteron 6200 X12 che forse gli costerà pure di meno a parità di prestazioni,per il power user un BD X8 basta ed avanza pure.
Llano X4 vs SB x4/4t
Llano X3 vs SB x2/4t
Llano X2 vs SB x2/2t

Bobcat x2/x1 vs Atom X2/x1.

Vader_10

30-08-2010, 16:10

http://www.overclock.net/amd-cpus/812892-bulldozer-20-questions-round-2-answers.html

capitan_crasy

30-08-2010, 16:28

Mi son perso qualcosa...
AMD ha confermato che non ci saranno BD x4 :confused:
Quindi AMD schiererà..
BD x6 vs SB x4/8t
BD x8 vs SB x6/12t
beh SB 8 core starà a mille euro, e IMHO è inutile, uno che col pc ci gioca/office andrà di llano,uno che ci lavora seriamente troverà più conveniente e più performante andare sul g34 per un opteron 6200 X12 che forse gli costerà pure di meno a parità di prestazioni,per il power user un BD X8 basta ed avanza pure.
Llano X4 vs SB x4/4t
Llano X3 vs SB x2/4t
Llano X2 vs SB x2/2t

Bobcat x2/x1 vs Atom X2/x1.

Non sono sicuro che AMD tagli fuori cosi il Quad core Bulldozer, soprattutto con la costruzione modulare del 32nm SOI...
Fino ad ora le versioni 4 core erano in Roadmap, quelle che mancavano e che mancano sono le versioni 6 core Bulldozer per il mercato desktop...

cionci

30-08-2010, 16:32

Ma immagino che un architettura nuova abbia dei costi di progettazione/realizzazione che sicuramente incideranno sul prezzo finale.
Sono costi che ammortizzi (o speri di ammortizzare nel tempo) nel tempo.
Semplice speculazione: ma se immaginiamo che AMD abbia per le mani un "SB killer", credi che comunque si accontenterebbe di uscire con prezzi un gradino sotto Intel oppure punterebbe più in alto? se non altro con le top di gamma.
Se avranno per le mani la CPU più prestante sul mercato, sono sicuro che la metteranno al massimo allo stesso prezzo della CPU top di gamma Intel. Non ha senso per AMD andare oltre e probabilmente non ha senso nemmeno tirare fuori subito tutte le proprie cartucce.
In questo caso entrerebbero sul mercato con una CPU che batte di poco quella Intel, in modo di rispondere uscita su uscita alla controparte. Un po' come facevano ai tempi del K7: ogni volta che Intel tirava fuori una CPU, AMD rispondeva con un altro step che riportava Intel sotto come prestazioni.

carlottoIIx6

30-08-2010, 16:39

secondo me
la situazione che si presenda è così:
il cuore di bulldozer è lo FP scheduler
che lavora in questo modo
quando è in multi divide il lavoro in due e ci ritroviamo
un core integer ed un 128 bit fmac a lavorare come se fossero un core
(in tal senso la cpu diventa un x8 reale con 8 core uguali)
quando lavora in single l'fp scheduler unisce i due fmac e ci ritroviamo un core
più grande (se non fa questo bulldozer non ha senso... quindi lo fa)

quindi in definitiva
più core in multi (dove serve avere più thread)
un core più grosso in single (dove serve avere un core più grosso)

una incognità, potrebbe essere se l'fp scheduler fa di più di questo...

forse quel che ho detto sopra [ confermato qua
http://www.overclock.net/amd-cpus/812892-bulldozer-20-questions-round-2-answers.html

affiu

30-08-2010, 16:46

thuban durera ancora un pò ,cmq assieme a bulldozer anche se con uno scalino di classe inferiore ,proprio perche rappresenta il fior fior di un processo a 45 nm ''glorioso'' .....se fosse anche cosi bulldozer(forse dovuto al low-k) ...sarà IRRUENTO dal punto di vista clock e scalerà sempre MEGLIO all'umentare del clock oltre che dei moduli

dopotutto cercandomi di allontanarmi dalla tristezza ,che sento in giro, mi tira il sollievo llano(vedo infinitamente per questa strada che per bulldozer,con tutto rispetto) perchè sono sulla via della certezza(la componente gpu) che oltretutto passa al 32 nm :eek:

poi se devo pensare(sempre sulla via della certezza) alla serie 7 e 8...solo pensando all'apporto tecnologico di una componente ,non c'è da sognare già???...sempre per via della certezza:Prrr:

già solo la gpu di llano(a parita di potenza /consumi) è simile(per non essere esagerato) a fermi,sempre secondo me!

al mio paese si esclamerebbe: ma comu cavolo fanno a farla''?allora se son di questo potenziale

potro (da sempre preso dal dubbio ,fino al midollo) sconfiggere questa paura di non immaginare una gpu potentissima(una serie 9 )...PER QUESTIONI di costruzione

il fatto di mettere una gpu su un processore ,che è anche per portatili, per forza andrà piu di quanto sentìi dire che si giocava sufficientemente...altro che...

ma ,non c'e' in questo versante da avere alcun minimo dubbio, perchè cosa pensate che su llano(anche se costava forse di piu) abbiano adottato i core k10 (dopotutto con il 32 nm piccolissimi) ,appunto per esaltare la componente su cui credono e se la sentono s...

la gpu di llano è tutto fuorchè un pezzo hardware di ALTISSIMO livello tecnologico nel xxI secolo ,che si possa immaginare all'INTERNO di un processore che ha una potenza simile (e in certi scenari PIU NATURALE visto che sono direttamente connessi) di una serie quasi 5000(già una favola per i consumi pure questa serie)

e a parte quel quasi(come prestazione in meno ) rispetto alla serie 5 ,FORSE avra consumi minori:eekk:

ma ci sarà molta piu potenza dove non osiamo nemmeno immaginare che ci sembrera talmente scontata che senza che ce ne accorgiamo SAREMO entrati nel futuro.....

fusion2 ,in parole semplici e scarne ,significhera:

tutta la potenza che non avresti mai neanche immaginato... e perche no anche sui NETBOOK ,

una CARAMELLA(all to the same die) in mano ....che magari consumera 20 watt....ed avra una potenza simile a quello che oggi viene chiamato max!:sofico:

Heimdallr

30-08-2010, 17:08

ammazza che trip :p

SuperTux

30-08-2010, 17:21

Vediamola così:

Llano ha una potenza pari circa alla HD5670, la HD5670 ha una potenza di 620Gflops.

La "vecchia" 8800gtx ha una potenza di 518 Gflops. Quindi, per proprietà transitiva, Llano avrà una potenza circa equivalente alla 8800gtx.

Un confronto così lo trovo impressionante.

paolo.oliva2

30-08-2010, 17:23

http://blogs.amd.com/work/2010/08/30/bulldozer-20-questions-%E2%80%93-part-2/

C'è un passo sul Blog AMD di JF da interpretare sul confronto di 4 socket con BD X16 e 8 socket SB X8

“Current and forthcoming Nehalem EX based servers from IBM and HP top out at 8 sockets and 64 cores. What kind of vertical scalability can we expect from Bulldozer-based servers?” – David Roff

Bulldozer will fit into the current “Maranello” and “San Marino/Adelaide” platforms. “Maranello” is our high performance platform that will support up to 4 CPUs. Combining a “Maranello” platform with the upcoming 16-core “Interlagos” processors, the total core density of a 4P system will reach as many as 64 cores.

The 8P x86 market today is pretty small. According to IDC, last year it accounted for roughly 7,915 total servers, down 26% from the year before (Source: IDC Quarterly Server Tracker, Q4 2009). If you want to say that 2009 was a bad year, from 2007 to 2008 the 8P x86 market was essentially flat as well, so that isn’t a growth engine. Part of what is impacting that market is the core and memory densities of today’s systems. People bought 8P servers to get to 48 cores (8 x 6-core) or to get to large memory footprints. Today’s 4P systems are meeting those needs at a lower price, with lower power consumption and lower latency. When we get to 2011 with “Bulldozer,” you’ll see an increase up to 64 cores, and we expect the total memory footprint will increase again.

The bottom line is, you’ll get the 64 cores that you want, you’ll just have to spend a lot less to get them; is that OK?

Non si sbilancia per il discorso potenza... però alla domanda che uno potrebbe prendere un sistema basato su 8 proci SB (64 core totali), risponde che il mercato con più di 4 socket ha mostrato un ribasso... però dice che un sistema con 4 socket basati su BD X16 è conforme a quelle esigenze (potenza?), minor consumo e minore latenza... e aggiunge che alla fine uno potrà prendere il 64 core che vuole.
Chiaro che è una risposta politica... ma non riesco a capire se paragona che un sistema 4 x BD X16 equivalga ad un sistema 8 x SB X8 come potenza oppure come numero di core.
Sarebbe importante capirlo... perché darebbe un'idea più chiara dell'IPC. Cioè... mica è una paglia :) Se 64 core BD equivarrebbero a 64 core SB, mi sembra chiaro che a sto punto un BD X8 equivarrebbe ad un SB X8, mentre al momento stiamo ragionando pressappoco che 6 core BD batterebbero 4 core SB e che un BD X8 sarebbe una via di mezzo quindi tra un SB X6 e un SB X8... ad occhio e croce.

somethingstrangeinyourmind

30-08-2010, 17:30

Non mi sembra che faccia riferimenti espliciti o impliciti alla potenza assoluta delle due piattaforme.
Credo che si riferisca esclusivamente al numero di core raggiungibili che poi mi sembra fosse anche la domanda postagli.

GT82

30-08-2010, 18:01

Speriamo che AMD o qualcuno per essa (JF ad esempio) diano presto i dati che contano per farsi idee un po' più chiare... sono ancora parecchio "abbottonati"

affiu

30-08-2010, 18:10

io penso,dato che il confronto chiaramente terra conto di tanti core(siano 4 o 6 o 8)..come si comportera con piu applicazioni attivi contemporaneamente

da due apllicazione...a 3...a quattro e vedere chi impieghera meno tempo.

è ancora presto a dirlo ,ma spererei che almeno sia superiore all'umentare di piu applicazioni funzionanti contemporaneamente.

cioe man man che le applicazione vengano aggiunte in contemporanea ,IL TEMPO TOTALE non vari in maniera consistente....:Prrr:

magari un modulo per ogni applicazione non sarebbe certamente sconvolgente:read:

Heimdallr

30-08-2010, 20:07

nessuno è un po' 'preoccupato' riguardo al potenza del singolo core?
Voglio dire, prendiamo ad esempio il 1090T con l'i7 920, nelle applicazioni che sfruttano tutti i core il Thuban riesce anche ad essere superiore (anche grazie alla frequenza più alta) ma poi in altri ambiti l'i7 risulta ancora superiore grazie ad un IPC più alto, se ci ritrovassimo con una situazione in cui il BD X8 riesce a stare dietro ad un SB a 6 core grazie ai 2 core in più ed una frequenza più spinta (e magari una scalabilità migliore all'aumentare della stessa) voi vi riterreste soddisfatti? Io sinceramente non del tutto, spero che un BD X6 abbia la capacità di stare al passo o quasi ad un SB a 6 core così da potere competere anche con gli 8 core Intel...

Pihippo

30-08-2010, 20:13

nessuno è un po' 'preoccupato' riguardo al potenza del singolo core?
Voglio dire, prendiamo ad esempio il 1090T con l'i7 920, nelle applicazioni che sfruttano tutti i core il Thuban riesce anche ad essere superiore (anche grazie alla frequenza più alta) ma poi in altri ambiti l'i7 risulta ancora superiore grazie ad un IPC più alto, se ci ritrovassimo con una situazione in cui il BD X8 riesce a stare dietro ad un SB a 6 core grazie ai 2 core in più ed una frequenza più spinta (e magari una scalabilità migliore all'aumentare della stessa) voi vi riterreste soddisfatti? Io sinceramente non del tutto, spero che un BD X6 abbia la capacità di stare al passo o quasi ad un SB a 6 core così da potere competere anche con gli 8 core Intel...

Ciao
Quell'ex ingegnere amd aveva proclamato +20% di frequenza e + 20% di ipc..
Se fosse vero, ripeto fosse vero non mi preoccuperei minimamente.

calabar

30-08-2010, 20:26

spero che un BD X6 abbia la capacità di stare al passo o quasi ad un SB a 6 core così da potere competere anche con gli 8 core Intel...
Non vorrei fare la figura del disfattista, ma secondo me un confronto a parità di core non ha senso, vincerebbe SB a mani basse per quel che sappiamo.
Quindi direi che sparare tanto significa semplicemente rimanere delusi da quello che probabilmente sarà comunque un ottimo prodotto.

Per quanto riguarda le applicazioni single thread, devo ammettere che questo dubbio è venuto anche a me. Ma magari la frequenza elevata che si suppone avranno i core di BD, unita ad un turbo mode aggressivo, risolveranno il problema.

cionci

30-08-2010, 21:19

Quell'ex ingegnere amd aveva proclamato +20% di frequenza e + 20% di ipc..
+20% di IPC rispetto a cosa ? Ad un dual core o ad un single core K10 ? A me sembra chiaro che rispetto ad un dual core l'IPC sia più basso (lo dice AMD stessa).

Pihippo

30-08-2010, 21:50

+20% di IPC rispetto a cosa ? Ad un dual core o ad un single core K10 ? A me sembra chiaro che rispetto ad un dual core l'IPC sia più basso (lo dice AMD stessa).

Ciao
Siamo sicuri che il fatto dell'80% di prestazioni per 2 core shared sia da riferirsi ad un 2 core k10? Io l'ho sempre interpretato come 80% di prestazioni rispetto ad aver 2 core BD non "shared", ovvero ognuno col suo front end e fpu. Impossibile dunque se non fosse cosi il 50% di prestazioni in più con il 33% dei core in meno, non credi?

Ren

30-08-2010, 22:10

Ciao
Siamo sicuri che il fatto dell'80% di prestazioni per 2 core shared sia da riferirsi ad un 2 core k10? Io l'ho sempre interpretato come 80% di prestazioni rispetto ad aver 2 core BD non "shared", ovvero ognuno col suo front end e fpu. Impossibile dunque se non fosse cosi il 50% di prestazioni in più con il 33% dei core in meno, non credi?

Se non conosci il metro di paragone è facile equivocare.
Potrebbero benissimo riferirsi alle prestazioni FP, come in una vecchia slide del financial day.

capitan_crasy

30-08-2010, 22:11

Signori è inutile tirare in ballo ancora le percentuali.
AMD non ha dichiarato niente sul IPC di Bulldozer, ci sono un paio di post di JF la quale dice che le prestazioni saranno superiori al K10 e niente di più.
Mancano ancora tutti i valori dei futuri modelli, mi sembra inutile cercare per forza il valore esatto del IPC di Bulldozer...

bjt2

30-08-2010, 22:13

Ciao
Siamo sicuri che il fatto dell'80% di prestazioni per 2 core shared sia da riferirsi ad un 2 core k10? Io l'ho sempre interpretato come 80% di prestazioni rispetto ad aver 2 core BD non "shared", ovvero ognuno col suo front end e fpu. Impossibile dunque se non fosse cosi il 50% di prestazioni in più con il 33% dei core in meno, non credi?

Esatto. Se avessero implementato la stessa architettura Bulldozer ma con tutto separato (quindi anche FPU pompata e sdoppiata) gli ingegneri hanno calcolato un 20% in più di prestazioni per un 50-60% in più di consumi a parità di tutto, oltre a ovviamente un'area quasi doppia. Così è vero che hanno meno prestazioni, ma a parità di clock. Essendo il consumo inferiore, a parità di TDP si può ovviamente salire di più. E' anche questo lo scopo delle pipeline 17 FO4. Inoltre se senza il processo così raffinato e il gating raffinato del bulldozer si riesce ad avere un turbocore di +400-500 Mhz... Immaginate con tutte le innovazioni architetturali e di silicio. Io prevedo almeno 800-1000 Mhz di turbo mode. Più che sufficiente a superare il SB in mono core anche se questo dovesse ancora avere un IPC più elevato, IMHO. Rendiamoci conto che INTEL ha il problema del leakage. E il power gating fatto con i P-MOS è peggio di quello fatto con gli N-MOS, come farà AMD... Il power gating riduce di 10 volte il leakage per AMD, perchè usa i N-MOS e qualcosa di meno per INTEL perchè usa i P-MOS, ma anche se fosse egualmente efficiente, il leakage di partenza di INTEL è comunque 10-20 volte superiore a quello AMD perchè manca il SOI. Poi, il gate first e il low-k... Insomma... Il silicio GF, quando arriverà a regime, straccerà la concorrenza. Speriamo che le infornate iniziali non facciano troppo schifo... Ma comunque l'architettura Bulldozer dovrebbe avere sia IPC che clock superiori... E' possibile che i primi modelli non superino i 4GHz stock, ma a regime credo che si arrivi a superare anche di molto questa soglia. Ricordiamo che IBM con un FO4 17 fa 4.25 GHz con il 45nm...

persa

30-08-2010, 22:17

Signori è inutile tirare in ballo ancora le percentuali.
AMD non ha dichiarato niente sul IPC di Bulldozer, ci sono un paio di post di JF la quale dice che le prestazioni saranno superiori al K10 e niente di più.
Mancano ancora tutti i valori dei futuri modelli, mi sembra inutile cercare per forza il valore esatto del IPC di Bulldozer...

quoto

paolo.oliva2

30-08-2010, 23:00

Non vorrei fare la figura del disfattista, ma secondo me un confronto a parità di core non ha senso, vincerebbe SB a mani basse per quel che sappiamo.
Quindi direi che sparare tanto significa semplicemente rimanere delusi da quello che probabilmente sarà comunque un ottimo prodotto.

Per quanto riguarda le applicazioni single thread, devo ammettere che questo dubbio è venuto anche a me. Ma magari la frequenza elevata che si suppone avranno i core di BD, unita ad un turbo mode aggressivo, risolveranno il problema.

+20% di IPC rispetto a cosa ? Ad un dual core o ad un single core K10 ? A me sembra chiaro che rispetto ad un dual core l'IPC sia più basso (lo dice AMD stessa).

Io sinceramente non è che ci sto capendo molto.

Le vostre conoscienze sono indubbiamente molto superiori alle mie e indubbiamente sino ad ora AMD ha parlato poco e per quello che ha parlato ha fatto 2 passi avanti, uno indietro e 5 a destra e sinistra.

Morale... se le idee chiare non le ha chi ci vive dentro ai proci, figuriamoci chi li guarda (come me) come una scatoletta da montare sulla MB :D .

Magari vorrei un attimo chiarire dei punti.

Come cacchio fa AMD a dire che i 2 core perdono rispetto a 2 core "veri" perché ci sono delle parti in comune, poi dire che c'è un INT in più e si guadagna e poi dire quella famosa frase che un BD X8 guadagnerebbe il 50% rispetto ad un K10 X6.

Se 1 modulo BD che ha 2 core perde rispetto a 2 core "veri", allora non può avere un IPC superiore.
Ma se un BD X8 va il 50% in più di un K10 X6, dove cacchio guadagna? :confused: Forse era riferito al clock? Non mi sembra plausibile... se tutto il pacchetto IPC BD + clock 32nm HKMG guadagnasse solo un 17% rispetto ad procio X6, un Thuban K10 normalissimo avrebbe guadagnato di più aggiungendogli 2 core e dimensionando i transistor per il 32nm HKMG.

Ora... onestamente... cosa può aver indotto AMD ad abbandonare il K10 che (non mi intendo, magari dico una bestialità) al limite poteva essere "modificato" per le AVX magari steccandoci qualche INT in più?

Quello che si sa per sicuro è che 1 modulo BD composto da 2 core è stato concepito per consumare meno, occupare meno spazio e avere più clock.

Allora io mi faccio questa domanda... e la faccio anche a voi. Non vi sembra strano (se l'IPC non fosse così alto) che un BD sia solo a 4 moduli/8 core?
Se AMD non è in grado di "pompare" l'IPC come fa Intel, perché non continuare sulla via del Thuban? E quella frase di AMD di proporre 2 core fisici a 1 fisico e uno logico non mi torna... come fa in ambito server a proporre al max 4 socket con massimo 64 core contro un 8 socket HP su SB a 64+64?

E' troppo nebuloso il tutto.
Per la grandezza del die di un BD X8, non penso sia extraterrestre farlo a 10 core o 12 core o addirittura di più nativo.

Cacchio... se facciamo un attimo di riflessione, un Magny-C basato su un Thuban E0 con tecnologia Turbo avrebbe i requisiti di procio da desktop, cioé alzare il clock in funzione dei core sotto carico. Basterebbe implementare la tecnologia di Llano (solo quella di spegnere i core non funzionanti e di potenziamento del Turbo) e sarebbe un super-procio.
AMD ha la carta del silicio 32nm HKMG. Esce con BD X8 con il 32nm HKMG magari in marzo ed aprile, con 6-8 mesi di tempo per fare il secondo step aggiungendo il low-k, e resterebbe con un X8?

Sinceramente, avrebbe troppo margine offerto dal silicio. Per me o realizza dei proci veramente ben sopra i 4GHz stock con turbo quasi a 5GHz (che andrebbe a braccetto tranquillamente sia con il discorso IPC basso e TDP dentro i 125W), oppure aumenterà i core.

Ho detto delle grandi fregnacce?

paolo.oliva2

30-08-2010, 23:15

Esatto. Se avessero implementato la stessa architettura Bulldozer ma con tutto separato (quindi anche FPU pompata e sdoppiata) gli ingegneri hanno calcolato un 20% in più di prestazioni per un 50-60% in più di consumi a parità di tutto, oltre a ovviamente un'area quasi doppia. Così è vero che hanno meno prestazioni, ma a parità di clock. Essendo il consumo inferiore, a parità di TDP si può ovviamente salire di più. E' anche questo lo scopo delle pipeline 17 FO4. Inoltre se senza il processo così raffinato e il gating raffinato del bulldozer si riesce ad avere un turbocore di +400-500 Mhz... Immaginate con tutte le innovazioni architetturali e di silicio. Io prevedo almeno 800-1000 Mhz di turbo mode. Più che sufficiente a superare il SB in mono core anche se questo dovesse ancora avere un IPC più elevato, IMHO. Rendiamoci conto che INTEL ha il problema del leakage. E il power gating fatto con i P-MOS è peggio di quello fatto con gli N-MOS, come farà AMD... Il power gating riduce di 10 volte il leakage per AMD, perchè usa i N-MOS e qualcosa di meno per INTEL perchè usa i P-MOS, ma anche se fosse egualmente efficiente, il leakage di partenza di INTEL è comunque 10-20 volte superiore a quello AMD perchè manca il SOI. Poi, il gate first e il low-k... Insomma... Il silicio GF, quando arriverà a regime, straccerà la concorrenza. Speriamo che le infornate iniziali non facciano troppo schifo... Ma comunque l'architettura Bulldozer dovrebbe avere sia IPC che clock superiori... E' possibile che i primi modelli non superino i 4GHz stock, ma a regime credo che si arrivi a superare anche di molto questa soglia. Ricordiamo che IBM con un FO4 17 fa 4.25 GHz con il 45nm...

Infatti per me questo sposerebbe in pieno il tutto.
Se AMD ha realizzato un BD a moduli per contrastare SB deve giostrare su 2 punti:

poniamo IPC SB 100 e IPC BD 50 (numeri a caso).

Potenza = IPC x clock

SB 8 core, 3GHz = BD 16 core 3GHz oppure = BD 8 core 6GHz

Oppure, ibrido, BD 12 core 4,5GHz.

Insomma, il silicio AMD ha un TDP inferiore e permette clock maggiori?
AMD ha realizzato un procio che occupa poco spazio (quindi rimane sempre competitivo in costo produzione anche aumentando i core), è propenso a salire di clock ed il TDP basso aiuta sia ad avere più core che avere clock più alti.
A sto punto l'IPC del core ha un'importanza relativa.

JDM70

31-08-2010, 00:12

I due core Int. del BD sono più "semplificati" rispetto al core del K10 per ipotesi un modulo BD va 5/7 a due Kore k10, visto il minor spazio occupato la sua forza starà nel fatto che ci potranno mettere + moduli rispetto al core del K10 riuscendo a guadagnare poi nel totale, processando + thread contemporaneamente, perdi un pò da una parte e guadagni di + dall'altra, e dove perdi verrà in aiuto la frequenza alta e il turbo :)

Edit: sono pienamente daccordo dove Reale è meglio di Virtuale, un Pò come il Sesso :oink: :D

Pihippo

31-08-2010, 02:33

Esatto. Se avessero implementato la stessa architettura Bulldozer ma con tutto separato (quindi anche FPU pompata e sdoppiata) gli ingegneri hanno calcolato un 20% in più di prestazioni per un 50-60% in più di consumi a parità di tutto, oltre a ovviamente un'area quasi doppia. Così è vero che hanno meno prestazioni, ma a parità di clock. Essendo il consumo inferiore, a parità di TDP si può ovviamente salire di più. E' anche questo lo scopo delle pipeline 17 FO4. Inoltre se senza il processo così raffinato e il gating raffinato del bulldozer si riesce ad avere un turbocore di +400-500 Mhz... Immaginate con tutte le innovazioni architetturali e di silicio. Io prevedo almeno 800-1000 Mhz di turbo mode. Più che sufficiente a superare il SB in mono core anche se questo dovesse ancora avere un IPC più elevato, IMHO. Rendiamoci conto che INTEL ha il problema del leakage. E il power gating fatto con i P-MOS è peggio di quello fatto con gli N-MOS, come farà AMD... Il power gating riduce di 10 volte il leakage per AMD, perchè usa i N-MOS e qualcosa di meno per INTEL perchè usa i P-MOS, ma anche se fosse egualmente efficiente, il leakage di partenza di INTEL è comunque 10-20 volte superiore a quello AMD perchè manca il SOI. Poi, il gate first e il low-k... Insomma... Il silicio GF, quando arriverà a regime, straccerà la concorrenza. Speriamo che le infornate iniziali non facciano troppo schifo... Ma comunque l'architettura Bulldozer dovrebbe avere sia IPC che clock superiori... E' possibile che i primi modelli non superino i 4GHz stock, ma a regime credo che si arrivi a superare anche di molto questa soglia. Ricordiamo che IBM con un FO4 17 fa 4.25 GHz con il 45nm...

Ciao
Sono contento che concordi, vuol dire che non ho psarato una minchiata. :D
BJt2 vorrei porti all'attenzione una cosa fondamentale sul discorso 3alu+3agu vs 2alu+2agu per quanto riguarda l'ipc k10vsBulldozer:
Fonte : http://www.agner.org/optimize/microarchitecture.pdf
Pag. 140:
The execution units have a much larger capacity than it is possible to utilize. It is alleged
that the nine execution units can execute nine micro-operations simultaneously, but it is
virtually impossible to verify this claim experimentally since the retirement is limited to three
macro-operations per clock cycle
Ovvero sebbene il core k10 possa fare 3 op aritmetico logiche+3op di memoria, il retirement buffer è limitato a solo 3 op per ciclo( in qualsiasi combinazione), quindi vorrebbe dire che se il retirement buffer di bd consentisse il ritiro di 4 op, bd avrebbe un vantaggio teorico del 33% sul k10.
Che ne pensi?

dark.halo

31-08-2010, 09:41

Per caso si sa se ci sarà una demo pubblica di Ontario/Zacate all'IFA di Berlino, oppure sono solo rumors :confused:

Sul sito della fiera AMD non appare fra gli espositori...

Megakirops

31-08-2010, 09:53

I due core Int. del BD sono più "semplificati" rispetto al core del K10 per ipotesi un modulo BD va 5/7 a due Kore k10, visto il minor spazio occupato la sua forza starà nel fatto che ci potranno mettere + moduli rispetto al core del K10 riuscendo a guadagnare poi nel totale, processando + thread contemporaneamente, perdi un pò da una parte e guadagni di + dall'altra, e dove perdi verrà in aiuto la frequenza alta e il turbo :)

Edit: sono pienamente daccordo dove Reale è meglio di Virtuale, un Pò come il Sesso :oink: :D

si ma non sai quanto sono state migliorate le unità di Bd rispetto al k10, quindi smettiamola di dire che BD sia inferiore a k10 in ipc solo perchè c'è in mente in PIV, è un'altra cosa e basta, oppure perchè l'architettura sembra essere stata semplificata. Per dare una stima dell'ipc di BD basterebbe che qualcuno, che ne capisca più di me di architetture, ''disegni'' il core BD senza unità shared, come fosse un classico core, vedere l'aumento di unità rispetto al k10 e da li risalire ad una stima, al ribasso intendiamoci, dell'ipc di un ipotetico core BD classico rispetto al K10 e togliere poi il 20%.

paolo.oliva2

31-08-2010, 10:08

Se può essere d'aiuto...

http://www.pctunerup.com/up/results/_201008/20100831100748_latencies.jpg

JDM70

31-08-2010, 10:13

si ma non sai quanto sono state migliorate le unità di Bd rispetto al k10, quindi smettiamola di dire che BD sia inferiore a k10 in ipc solo perchè c'è in mente in PIV, è un'altra cosa e basta, oppure perchè l'architettura sembra essere stata semplificata. Per dare una stima dell'ipc di BD basterebbe che qualcuno, che ne capisca più di me di architetture, ''disegni'' il core BD senza unità shared, come fosse un classico core, vedere l'aumento di unità rispetto al k10 e da li risalire ad una stima, al ribasso intendiamoci, dell'ipc di un ipotetico core BD classico rispetto al K10 e togliere poi il 20%.

Il mio intento non era sminuire il BD se mai, forse mi ero spiegato male, la trovo una Furbata, tipo come qualcuno ha già detto simile concezione alle schede video Ati :)

cionci

31-08-2010, 10:27

si ma non sai quanto sono state migliorate le unità di Bd rispetto al k10
Imho sil BD sicuramente avrà un IPC più basso rispetto ad un dual core. Singolo modulo BD contro singolo core K10 è ovvio che l'IPC sia nettamente superiore in BD.
Ma come al solito, l'IPC non è tutto. Visto che il BD è fatto per girare a frequenza nettamente più alta di un dual core K10 a parità di processo produttivo e dissipazione. Sia per il minore spazio occupato, sia per la lunghezza delle pipeline.

paolo.oliva2

31-08-2010, 10:34

si ma non sai quanto sono state migliorate le unità di Bd rispetto al k10, quindi smettiamola di dire che BD sia inferiore a k10 in ipc solo perchè c'è in mente in PIV, è un'altra cosa e basta, oppure perchè l'architettura sembra essere stata semplificata. Per dare una stima dell'ipc di BD basterebbe che qualcuno, che ne capisca più di me di architetture, ''disegni'' il core BD senza unità shared, come fosse un classico core, vedere l'aumento di unità rispetto al k10 e da li risalire ad una stima, al ribasso intendiamoci, dell'ipc di un ipotetico core BD classico rispetto al K10 e togliere poi il 20%.

Infatti il punto è tutto qui.

Comunque io sono dell'idea che se AMD non ha aumentato il numero di moduli, visto che il silicio lo permetterebbe benissimo, è che non ne ha bisogno.

Io sarei propenso a credere che si siano seduti un tecnico ed un commerciale, abbiano stimato tutte le informazioni, cioé IPC a core/modulo, superficie, frequenza, ed abbiano optato per la soluzione che determinerebbe il miglior rapporto tra prestazioni e costo produzione, anche in relazione del prezzo da posizionarsi sul mercato.

Non dimentichiamoci una cosa MOLTO importante.

AMD riporta che Buldozer sarebbe l'anti-SB (mi sembra come obiettivo).
Basta che analizziamo questo punto:
Cosa "renderebbe" di più ad AMD? Un procio del 33% più "piccolo" (esempio) con meno core, ma del 33% meno potente e magari sotto le prestazioni di un SB, con relativa perdita di faccia, prezzi più bassi e bla bla bla, oppure aumentare del 33% il die, con performances uguali o superiori a SB, e quindi averci tutto di guadagnato? Dalla faccia, e dall'aumento di prezzi.

Pensiamo solo al Thuban 1090T che con una superficie enorme viene venduto ad una frazione dei modelli di punta i7 X4, con notevoli margini di guadagno inferiori... un BD anziché X4-X6-X8 realizzato X6-X8-X10 alla fine costerebbe in proporzione molto meno di un Thuban e consentirebbe di alzare il listino percentualmente molto di più.

Controindicazioni, nessuna, né per TDP (40% in meno del 32nm, già da solo permetterebbe un Thuban a 8 core abbondanti con diminuzione del TD), né limiti per TH (con SB a 16TH, BD può arrivare tranquillamente a 16 core).

Quindi, se BD con le ottimizzazioni dell'architettura arrivasse a quel 50% in meno di TDP, avendo aumentato solo del 33% i core, mi sembra indiscusso che il rimanente 17% che non si vedrebbe sarebbe a seguito dell'IPC maggiore che chiaramente aumenta il TDP. E si collegherebbe al discorso JF +17%.

Lan_Di

31-08-2010, 10:34

Imho sil BD sicuramente avrà un IPC più basso rispetto ad un dual core. Singolo modulo BD contro singolo core K10 è ovvio che l'IPC sia nettamente superiore in BD.
Ma come al solito, l'IPC non è tutto. Visto che il BD è fatto per girare a frequenza nettamente più alta di un dual core K10 a parità di processo produttivo e dissipazione. Sia per il minore spazio occupato, sia per la lunghezza delle pipeline.

Beh il sicuramente a tutto da vedere.
Per ora si sa solo che un modulo BD va circa 80% di due core BD separati, ognuno con le proprie risorse indipendenti da altri core.
Relazioni con gli attuali K10 non sono note, ne a livello core-modulo e ne a livello core-core, a meno che non mi sia perso qualcosa per strada.

paolo.oliva2

31-08-2010, 10:44

Beh il sicuramente a tutto da vedere.
Per ora si sa solo che un modulo BD va circa 80% di due core BD separati, ognuno con le proprie risorse indipendenti da altri core.
Relazioni con gli attuali K10 non sono note, ne a livello core-modulo e ne a livello core-core, a meno che non mi sia perso qualcosa per strada.

Concettualmente rispetto a 2 core K10 il modulo BD avrebbe il 50% in più di potenza sugli INT
E poi... anche perdendo il 20% nel confronto a 2 core K10, sarebbe comunque del 20% più veloce negli INT.

E poi bisogna anche inquadrare il discorso che a parità di silicio, il TDP sarebbe inferiore e quindi aumentare il clock.
Non possiamo solo inquadrare quel -20% in sé per sé, se poi posso arginarlo con un +30% di clock, non ci sarebbe nessuna perdita (per la condivisione).

Quindi un aumento di IPC in INT, una diminuzione per le condivisioni ma che mi portano un aumento in clock uguale o maggiore, la risultante è che ho un modulo che il margine di IPC maggiore può essere "solo" del 15%, ma con un aumento di clock del 30% = 50% in più di potenza.

capitan_crasy

31-08-2010, 10:56

Notizia sulla cache L2 di Bulldozer:
Le versioni server di BD avranno 2MB di cache L2 molto probabilmente per modulo.
L'informazione è stata erroneamente pubblicata ieri sul blob di Bulldozer sulle "20 domande" alla secondo ristosta, il valore è stato rimosso poco tempo dopo (Clicca qui (http://blogs.amd.com/work/2010/08/30/bulldozer-20-questions-%E2%80%93-part-2/)).

http://www.pctunerup.com/up//results/_201008/20100831105325_l2-backup.png

Per il momento non è sicuro che AMD utilizzerà lo stesso valore anche per i Bulldozer destinati al mercato desktop...

cionci

31-08-2010, 10:56

Beh il sicuramente a tutto da vedere.
Non le ho campate per aria. Sono conclusioni che ho tratto analizzando l'architettura e ipotezzando alcuni performance hit dovuti a:
- FPU in comune fra due thread
- in teoria anche il power gating con granularità più bassa dovrebbe dare un leggero hit sul prestazioni
- pipeline più lunghe (performance hit in caso di stallo della pipeline)
- fetch/decode in comune fra i due thread (throughput più basso rispetto ad un dual core, nonostante alcuni miglioramenti)

Certo rispetto ad un K10 dual core dovrebbe avere, a parità di processo produttivo e dissipazione, frequenze nettamente più alte per:
- pipeline più lunghe -> critical path più corto -> maggiore frequenza
- migliore clock e power gating -> minore dissipazione
- quasi dual core con un aumento del die irrisorio rispetto ad un single core -> minore dissipazione rispetto al dual core K10

cionci

31-08-2010, 11:05

Concettualmente rispetto a 2 core K10 il modulo BD avrebbe il 50% in più di potenza sugli INT
E poi... anche perdendo il 20% nel confronto a 2 core K10, sarebbe comunque del 20% più veloce negli INT.
Come il 20% più veloce ? Se perdesse il 20% non può essere contemporaneamente il 20% più veloce.

Lan_Di

31-08-2010, 11:09

Come il 20% più veloce ? Se perdesse il 20% non può essere contemporaneamente il 20% più veloce.

Credo che intendesse dire che si perderà il 20% nello operazioni floating point a causa della condivisione, ma allo stesso tempo si guadagnerà il 20% sugli interi grazie al modulo int più prestante.

unnilennium

31-08-2010, 11:14

Notizia sulla cache L2 di Bulldozer:
Le versioni server di BD avranno 2MB di cache L2 molto probabilmente per modulo.
L'informazione è stata erroneamente pubblicata ieri sul blob di Bulldozer sulle "20 domande" alla secondo ristosta, il valore è stato rimosso poco tempo dopo (Clicca qui (http://blogs.amd.com/work/2010/08/30/bulldozer-20-questions-%E2%80%93-part-2/)).

http://www.pctunerup.com/up//results/_201008/20100831105325_l2-backup.png

Per il momento non è sicuro che AMD utilizzerà lo stesso valore anche per i Bulldozer destinati al mercato desktop...

il capitano usa OPERA ... evviva... un simile particolare con un altro browser si beccava molto più difficilmente.... :Prrr:

capitan_crasy

31-08-2010, 11:34

il capitano usa OPERA ... evviva... un simile particolare con un altro browser si beccava molto più difficilmente.... :Prrr:

No caro...
L'immagine non è del mio sistema... :Prrr:

cionci

31-08-2010, 11:44

Credo che intendesse dire che si perderà il 20% nello operazioni floating point a causa della condivisione, ma allo stesso tempo si guadagnerà il 20% sugli interi grazie al modulo int più prestante.
Difficilmente potrà avere un IPC maggiore del 20% sugli int rispetto ad un dual core K10...