|
|
|
![]() |
|
Strumenti |
![]() |
#9981 | |
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Quote:
Meglio non cercare motivazioni dove non ci sono. |
|
![]() |
![]() |
#9982 | |
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24169
|
Quote:
Per quanto riguarda Thuban non ci saranno ulteriori aggiornamenti all'architettura K10 sui 45nm, ne tanto meno aumenti di cache...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
|
![]() |
![]() |
#9983 | |
Senior Member
Iscritto dal: Oct 2004
Messaggi: 1603
|
Quote:
Allora bisogna solo aspettare che scenda di prezzo |
|
![]() |
![]() |
#9984 | |
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
??? JF ???
vero o fake?
http://www.xtremesystems.org/forums/...1&postcount=67 qualcuno riesce ad interpretare ? edit:riporto il post Quote:
__________________
spesso, è solo quando sai che non ti resta molto tempo che ne apprezzi il reale valore quote: "some users are a classic example of the inverse ratio between the size of the mouth and the size of the brain" * se non vi rispondo è perché siete (200+) nella mia ignore list * mi chiedo perché chi è nella ignore list è spesso sospeso e, prima o poi, viene bannato * Ultima modifica di digieffe : 22-02-2011 alle 14:34. |
|
![]() |
![]() |
#9985 |
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
|
![]() |
![]() |
#9986 |
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
novità o cose risapute?
http://blogs.amd.com/work/2011/02/21...ign-solutions/
EDIT 1: "Handling up to four 64-bit instructions per thread" cosa vorrebbe significare? http://blogs.amd.com/work/2011/02/21...hats-in-a-box/ EDIT 2: The execution units must compute results in a single cycle and forward them to dependent operations in the following cycle. All of this is required so that the module gives high architectural performance, measured in the number of instructions completed per cycle (IPC).
__________________
spesso, è solo quando sai che non ti resta molto tempo che ne apprezzi il reale valore quote: "some users are a classic example of the inverse ratio between the size of the mouth and the size of the brain" * se non vi rispondo è perché siete (200+) nella mia ignore list * mi chiedo perché chi è nella ignore list è spesso sospeso e, prima o poi, viene bannato * Ultima modifica di digieffe : 22-02-2011 alle 15:29. |
![]() |
![]() |
#9987 |
Senior Member
Iscritto dal: Sep 2005
Messaggi: 2177
|
JF sottolinea che questo è solo UNO dei fattori di performance che sta descrivendo.
Da ciò che accenna in seguito, il punto di forza dell'architettura BD sarà la possibilità di inserire molti moduli a parità di area die, e presumo che all'aumentare dei moduli ci sia pure una evidente scalabilità nelle prestazioni verso l'alto. Questo pare il succo del discorso BD. |
![]() |
![]() |
#9988 | |
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
In due parole? IPC più alto dei phenom II. Quel 64bit instruction lascia presagire che le aglu facciano qualcos'altro oltre che computare indirizzi di memoria, oppure 4 istruzioni intese come 2 op di memoria +2 di logica\aritimetica. Il secondo punto indica uno scheduler più avanzato di quello dei k10.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita Ultima modifica di Pihippo : 22-02-2011 alle 17:29. |
|
![]() |
![]() |
#9989 | |
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
Anche per il secondo punto: dovrebbe essere così anche per tutti gli scheduler di CPU moderne, ossia che il risultato di una operazione è disponibile il ciclo di clock successivo (è anche il meglio che si può fisicamente fare). La novità è che dice che tutte le istruzioni intere (penso escluse MUL e DIV) vengono eseguite in un solo ciclo di clock e l'altra novità è che tutto è stato fatto con logica standard, senza trucchetti e circuiti particolari. Se si guardano alcune slide, poi, sul blog AMD, si nota che le 4 pipelines sono denomitate EX,MUL ; EX,DIV ; AGen ; AGen . Questo cosa vuol dire? Che una pipeline può fare tutte le istruzione intere o una MUL, un'altra tutte le istruzione intere o una DIV e le altre due sono AG(L?)U... Il bello è che con il nuovo scheduler a coda unica, anche se DIV e MUL fossero bloccanti (ossia fermano tutte le istruzioni in quella pipeline), le altre istruzioni possono usare l'altra pipeline. Invece nel K10 se una pipeline era bloccata, rimanevano bloccate anche le altre istruzioni in coda. Nel K10 la DIV era microcodificata, così era spezzata in tante microistruzioni che ingolfavano le code. In LLano è stata creata una unità pipelined. Si spera che non sia bloccante, ma che richieda uno slot nella pipeline solo in fase di caricamento dati e scaricamento risultati, altrimenti una DIV a 64 bit che impiega anche 70 cicli, lascerebbe bloccata tutta una pipeline! Ricordiamo che in Llano c'è ancora il problema delle code separate. Ma già il fatto di liberare le code dalla pletora di microistruzioni necessarie per la divisione (che fa anche abbassare le istruzioni decodificate perchè è vector path) da un vantaggio in codice con molte divisioni intere... Se poi la DIV è anche non bloccate... Si spera che lo sia in Llano, pechè in BD il danno sarebbe minore, ma ovviamente speriamo che non sia bloccante anche in BD! Forse lo sapremo domani...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! ![]() ![]() ![]() |
|
![]() |
![]() |
#9990 | |
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
![]() Pure io penso che non debbano essere per forza 4 op di logica\aritmetica. Per il secondo punto. Penso che si parli solo di op che hanno già gli operandi caricati o di op r-->r altrimenti vorrebbe dire che bd ha load to use latency pari a 1 ciclo. Il che sarebbe impressionante.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita |
|
![]() |
![]() |
#9991 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
http://blogs.amd.com/work/2011/02/22...gy-efficiency/
The Bulldozer core implements numerous improvements that target super-efficient computation in all aspects of the design. These features build on and extend the foundational innovations that were discussed as part of the “Llano” disclosures made a year ago and covered in a prior blog. * Fully power gating the core to essentially zero power when not in use (questo si sapeva) * Sharing components in the dual core design (instruction fetch, decode, L2 cache, FP) to make more efficient use of them while still delivering the performance of a true dual core. This is sort of like the efficiency of a duplex home design where heat, plumbing, foundation and electrical infrastructure can all be shared, but the structure still provides independent homes for two families. * Optimizing the low level circuits for maximal efficiency at all levels. For instance low-power flip-flop design shown in paper 4.5 yesterday at ISSCC provides innovative power reductions for one of the biggest power consuming circuits in the core. The clock grid (another big power sink) builds on the power efficiencies of past designs, and adds more improvements. Perhaps most importantly, the grounds-up design opportunity enabled an unprecedented level of clock gating (see figure below from the paper) to reduce power waste as shown in the graph below. Retrofitting a design to add logic to turn clocks off when circuits aren’t used is a time consuming and error-prone process. The Bulldozer team designed these in from the beginning which enabled the inclusion of over 30,000 individual clock enables to be used. And finally, a next generation AMD Turbo CORE technology implementation that provides maximum compute speed when required, and throttles back to maximum efficiency when appropriate. Bulldozer implements a significantly more aggressive version of this capability than “Llano” with more details to be disclosed in the future.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 Ultima modifica di paolo.oliva2 : 22-02-2011 alle 23:07. |
![]() |
![]() |
#9992 |
Senior Member
Iscritto dal: Oct 2006
Città: Bologna
Messaggi: 365
|
very news
__________________
Utente dal 2006 ![]() |
![]() |
![]() |
#9993 | |
Senior Member
Iscritto dal: Dec 2002
Messaggi: 6308
|
Quote:
![]() straverissimo e a volte, i cali di prezzo sono dovuti proprio a questo...sbagliato posizionamento. |
|
![]() |
![]() |
#9994 | |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31799
|
Quote:
Il punto sarà l'intenzione di AMD, cioè massimizzare i guadagni rispetto alla potenza di BD, o aggredire il mercato offrendo prodotti con un prezzo/core diverso. In poche parole, AMD certamente non arriverà a regale i proci, ma non è da escludere che possa richiedere un prezzo/prestazioni inferiore all'attuale. Comunque se un BD X8 fosse più potente dei proci sul mercato, il fatto che probabilmente possa essere proposto allo stesso prezzo o addirittura inferiore, è innegabile che di per sé rappresenti di fatto già una riduzione di prezzo a prestazione.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 Ultima modifica di paolo.oliva2 : 23-02-2011 alle 08:16. |
|
![]() |
![]() |
#9995 | |
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
![]() ![]()
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! ![]() ![]() ![]() |
|
![]() |
![]() |
#9996 | |
Senior Member
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
|
Quote:
Infatti la L1 dovrebbe avere 3-4 cicli di latenza, e la L2 16-18. Chissa quanto sarebbero potuti salire con il clock (e die size) con una L1 cosi veloce, di sicuro meno di quanto si presume.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita |
|
![]() |
![]() |
#9997 | |
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
![]() Anche fosse realizzato con il 45nm e con FO4 di 23 consumerebbe il 25-30% in meno e quindi potrebbe andare ALMENO un 15-20% in più di clock rispetto a un K10 con lo stesso numero di transistors. Poi però abbiamo il FO4 di 17 (un altro 10-15% MINIMO) e il processo a 32nm (un altro 40%) e abbiamo nel caso peggiore (ossia prendendo i minimi e sommando brutalmente le percentuali, anche se non si fa così) un +65% di clock. Ovviamente a stock. Poichè un BD X4 dovrebbe avere un numero di transistors leggermente inferiore a un Thuban, prendiamo un 1100T come riferimento. 3.3 Ghz+65%=5.45GHz. Quindi un ipotetico BD X4 a 125W (che non faranno MAI) potrebbe raggiungere i 5.5GHz a stock. Penso che a 95W i 4.5GHz e oltre sono molto probabili... ![]() ![]() Per l'X8 possiamo supporre un TDP doppio a parità di frequenza (anche se è di meno perchè il MC e il NB sono gli stessi dell'X4). Quindi un BD X8 5.5GHz dissiperebbe 250W (e non è neanche un risultato ottimo visto che IBM in una potenza paragonabile e con processo a 45nm riesce a far andare il suo nuovo power 7 a 5.2 Ghz). Se ipotizziamo che il TDP va con il cubo della frequenza, allora possiamo calcolare la frequenza dell'X8, come 5.5GHz/radicecubica(2)=4.4GHz... Poniamoci con un adeguato coefficiente di sicurezza e possiamo ipotizzare un BD X8 4GHz stock a 125W... I 3.5GHz probabilmente sono per il 95W. E quei 3.8GHz sono un BD X8 125W di un ES che gioco forza non può essere come le CPU che usciranno tra 2 mesi, essendo stato prodotto probabilmente a novembre/dicembre...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! ![]() ![]() ![]() |
|
![]() |
![]() |
#9998 | |
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
![]() ![]()
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! ![]() ![]() ![]() |
|
![]() |
![]() |
#9999 |
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Imho ci stanno benissimo al lancio i 3.4 Ghz per il 95W ed i 3.8 Ghz per il 125W. Questo gli lascerebbe notevoli margini per il rilascio di un 3.5 Ghz a 95W e di un 4 e un 4.2 Ghz a 125W, ovviamente tutto questo per massimizzare i ricavi. Credo che tirare fuori un 4.2 Ghz subito sarebbe controproducente, anche se potessero. Dando per assodato che il 3.8 Ghz sia più veloce del 990X...
|
![]() |
![]() |
#10000 | |
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
![]() ![]() EDIT: l'X8 3.8 Ghz probabilmente sarà anche più veloce del SB X8 che uscirà, che probabilmente non andrà oltre i 3.2GHz, sopratutto a bassi carichi dove il turbocore 2.0, grazie al basso leackage del processo AMD, potrà fare la differenza: ALMENO 4.3GHz (probabilmente 4.5-4.6GHz)... Anche se l'IPC del SB fosse del 20% più elevato (a bassi carichi l'HT non serve, quindi non lo consideriamo), un core SB a 3.5GHz (supponiamo 300MHz di turbo con pochi thread) dovrebbe equivalere a un core BD a 4.2GHz...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! ![]() ![]() ![]() Ultima modifica di bjt2 : 23-02-2011 alle 11:28. |
|
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 22:37.