|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#961 |
|
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24170
|
Nuove informazioni su Bulldozer.
Hi,
We are in the process of adding a feature to GCC to take advantage of a new hardware feature in the latest AMD micro processor. This feature requires a certain mix, ordering and alignments in instruction sequences to obtain the expected hardware performance. I am asking the community to review this high level implementation design and give me direction or advice. The new hardware issues two windows of the size N bytes of instructions in every cycle. It goes into accelerate mode if the windows have the right combination of instructions or alignments. Our goal is to maximize the IPC by proper instruction scheduling and alignments. Here is a summary of the most important requirements: a) Maximum of N instructions per window. b) An instruction may cross the first window. c) Each window can have maximum of x memory loads and y memory stores . d) The total number of immediate constants in the instructions of a window should not exceed k. e) The first window must be aligned on 16 byte boundary. f) A Window set terminates when a branch exists in a window. g) The number of allowed prefixes varies for instructions. h) A window set needs to be padded by prefixes in instructions or terminated by nops to ensure adherence to the rules. We have the following implementation plan for GCC: 1) Modify the Haifa scheduler to make the desired arrangement of instructions for the two dispatch windows. The scheduler is called once before and once after register allocation as usual. In both cases it performs dispatch scheduling along with its normal job of instruction scheduling. The advantage of doing it before register allocation is avoiding extra dependencies caused by register allocation which may become an obstacle to movement of instructions.? The advantage of doing it after register allocation is a consideration for spilling code which may be generated by the register allocator. The algorithm we use is: a) Considering the current dispatch window set, choose the first instruction from ready queue that does not violate dispatch rules. b) When an instruction is selected and scheduled, inform the dispatcher code about the instruction. This step keeps track of the instruction content of windows for future evaluation. It also manages the window set by closing and opening new virtual dispatch windows. 2) Insertion of alignment code. In x86 alignment is done by inserting prefixes or by generating nops. As the object code is generated by the assembler in GCC, some information such as sizes of branches are unknown until assembly or link time. To do alignments related to dispatch correctly in GCC, we need to iteratively compute prefixes and branch sizes until its convergence. This pass currently does not exist in GCC, but it exists in the assembler. There are two possible approaches to solve alignment problem. a) ?Let the assembler performs the alignments and padding needed to adhere with the new machine dispatching rules and avoid an extra pass in GCC. b) ?Add a new pass to mimic what assembler does before generating the assembly listing in GCC and insert the required alignments. I appreciate your comments on the proposed implementation procedure and the choices a or b above. Reza Yazdani Clicca qui... La parola agli esperti...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
|
|
|
|
#962 |
|
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24170
|
AMD conferma la tecnologia Fusion sui futuri modelli Opteron!
John Fruehe (direttore AMD di produzione marketing per il mercato server/workstation) conferma che AMD proporrà la tecnologia Fusion anche per le soluzioni destinati al campo server:
"“I believe the push for an APU within servers is still to come. It is something AMD is committed to delivering in the years ahead and when the time is right, more info on Fusion APUs for servers will come” Queste soluzioni saranno proposte nelle future evoluzione dell'architettura Bulldozer. L'unione tra CPU e GPU porterà un incremento nel calcolo generale delle soluzioni AMD per il mercato server/workstation. Clicca qui...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
|
|
|
|
#963 | |
|
Senior Member
Iscritto dal: Jan 2010
Messaggi: 2858
|
Quote:
e anche i futuri desktop dopo ZAMBEZI ,secondo me ,comincieranno ad avere le gpu ,contando che ci sarà piu spazio per via del rimpicciolimento e non sarà lontano pensare che ci ''sarà'' un 4/8 core con una/due gpu dedicati per ciscun core praticamente come I CILINDRI(cpu)di un bulldozer assieme ai TURBOCOMPRESSORI(gpu) che iniettano il diesel ad alta pressione..... ...l'importante che creeranno AOD che potra permettere di overcloccare oltre che la cpu anche le gpu sia singolarmente che assieme ai core con varie combinazioni cmq dovra essere uno SPASSO per gli overclockers cosicchè i filmati HD saranno macinati proprio sotto i piedi! |
|
|
|
|
|
#964 | |
|
Senior Member
Iscritto dal: Jan 2005
Città: ichnusa
Messaggi: 17996
|
Quote:
|
|
|
|
|
|
#965 | |
|
Senior Member
Iscritto dal: Apr 2005
Messaggi: 2905
|
Quote:
Come è già stato detto molte volte qui è il software che deve seguire pesantemente questa rivoluzione dell'hardware. Altrimenti non ci sarà spazio per GPU, Tesla, firestream, video integrati, FPU unificate e quant'altro. Intel ha scelto una strada più facile: core in numero semrpe più elevato, semrpe più semplificati e piccoli, potenti bus di interconnessione e cache ampie e veloci e tecnologie di risparmio energetico. Sulle prime potranno essere in vantaggio. Qualunque software gira su x86 senza dover riscrivere, ricompilare, studiare... AMD come si dice da tempo non deve seguire Intel, ma innovare, ed è quello che sta facendo.Iniziare a devolvere i calcoli paralleli alle GPU, integrarle nelle CPU e alla fine semplificare i doppioni. Diabolico. Speriamo che vada in porto!
__________________
acquistato con soddisfazione da: SHIVA>>LuR<< Jokerpunzk,Markenforcer,vkbms, campioni del mondo,mstella. Venduto a: maxVi, gabrieletor, banaz, tdm70, raxxo, frantheman |
|
|
|
|
|
#966 | |
|
Senior Member
Iscritto dal: Jan 2006
Città: Grosseto
Messaggi: 13656
|
Quote:
Se consideriamo la potenza delle gpu odierne.. si capisce come questo passaggio potrebbe essere un progresso maggiore del passaggio che anni fa fu fatto dal single core al multicore.. speriamo
__________________
decine di trattative positive su hwupgrade! Configurazione: Gigabyte B550I AORUS PRO AX , AMD Ryzen 5950X, NVIDIA GeForce 4060Ti MSI GamingX 16GB, Silverstone strider 600W 80+ titanium, GSkill Trident 2X8@4000 MHz, Sabrent Rocket 4.0 Plus 2TB, Silverstone SG09, Samsung Gaming Monitor C49RG90 |
|
|
|
|
|
#967 | |
|
Senior Member
Iscritto dal: Apr 2005
Messaggi: 2905
|
Quote:
Non serve molto lavoro dal punto di vista software, per otteere quel risultato. E la GPU ha un peso solo quando viene effetivamente usata, come in un gioco, in assenza di altre schede. Diciamo che per far andare AVP hai integrato CPU e GPU, risparmiato un po' di silicio, consumato un po' meno, e aumentato un po' le prestazioni rispetto a quanto possibile con un chip integrato nel chipset. La vera rivoluzione è usare sistematicamente la GPU per tutte le elaborazioni FP, e arrivare a togliere completamente l'attuale FPU dai core x86. Qui ci vuole un lavoro ben più grande. Ci vuole un compilatore che sia praticamente universale, uno standard, che sia openCL o altro, usato da tutti. Il sistema stesso deve gestire i thread appoggiandosi direttamente alle unità derivanti dalla GPU. AMD deve correre! Moltissimo! Sarà una rivoluzione!
__________________
acquistato con soddisfazione da: SHIVA>>LuR<< Jokerpunzk,Markenforcer,vkbms, campioni del mondo,mstella. Venduto a: maxVi, gabrieletor, banaz, tdm70, raxxo, frantheman |
|
|
|
|
|
#968 | |
|
Senior Member
Iscritto dal: Feb 2009
Messaggi: 1402
|
Quote:
__________________
AMD Ryzen R5 2600X - nVidia GTX960 |
|
|
|
|
|
#969 |
|
Senior Member
Iscritto dal: Apr 2005
Messaggi: 2905
|
Eh nehanno di strada da fare...
Corri Forest!!!!!!!
__________________
acquistato con soddisfazione da: SHIVA>>LuR<< Jokerpunzk,Markenforcer,vkbms, campioni del mondo,mstella. Venduto a: maxVi, gabrieletor, banaz, tdm70, raxxo, frantheman |
|
|
|
|
#970 |
|
Senior Member
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
|
Il fatto che l'altro produttore di gpu utilizzi una soluzione proprietaria di certo non aiuta...
|
|
|
|
|
#971 |
|
Senior Member
Iscritto dal: Sep 2009
Messaggi: 5582
|
open CL!
l'evoluzione è invitabile! spero che il software livero si dia da fare! amd ha dimostrato di volerlo appoggiare! come spero un compilazione di parte dei programmi da parte del sistema operativo! in modo da utilizzare l'hardware al meglio! credo che chi abbia scheda vidieo a cpu distinte ne trarrà anceh beneficio l'apu è più competitiva già di se stessa, per l'ottimizzazione interna! |
|
|
|
|
#972 |
|
Senior Member
Iscritto dal: Dec 2005
Messaggi: 1113
|
a mio parere...è presto per decretare la morte delle CPU con Zambezi...
Finchè Nvidia sarà (o proverà) ad essere competitiva nelle GPU...le schede video discrete (fascia medio/alta) continueranno ad essere prodotte e di conseguenza, anche le CPU. Nel medio-lungo periodo le APU avranno sicuramente la meglio su tutto e non è da escludere a priori...un accoppiamento con discrete dalle prestazioni paurose
__________________
X79A-GD45 , 3820K , 32Gb G.SKILL 2400, Sapphire 5850 , Antec 650W, HP 27ES |
|
|
|
|
#973 | |
|
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24170
|
Quote:
Le CPU Zambesi saranno (forse) le ultime CPU AMD senza un unita GPU integrata nel DIE...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
|
|
|
|
|
#974 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31868
|
Ancora quindi nulla di preciso su Llano...
Mi sono fatto un'intrippata un po' di tutto sfogliando il th... se devo dire la verità... ancora ci ho capito poco... nel senso che Llano ed ancor più Buldozer 2a release dovrebbero essere dei mostri, ma in termini pratici... se mettiamo caso che a novembre ci sia Llano, che cosa cambierà in IPC rispetto al Thuban? Nell'OC spero tantissimo (32nm), ma fatico ad inquadrare l'IPC. Cioè... la GPU integrata sicuramente renderà meglio di una equivalente GPU su scheda. Ma quanto della GPU può essere sfruttato nell'elaborazione in connubio con la CPU? Ad esempio... i programmi di elaborazione disponibili in rete (Boinc) già sfruttano la GPU... però mi sto perdendo.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 |
|
|
|
|
#975 | |||
|
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24170
|
Quote:
Parliamo di un K10 riveduto e corretto per ospitare una GPU ed essere costruito a 32nm SOI. Inoltre alcune voci parlano delle Istruzioni AVX anche su Llano; insomma cè tanta carne sul fuoco... Quote:
L'ultimo aggiornamento sull'OpenCL porta benefici fra il calcolo unito tra GPU e le CPU ed è questo l'obbiettivo principale di AMD e della sua tecnologia Fusion ... Quote:
Una volta che le APU avranno fatto la loro comparsa sul mercato ci saranno nuove motivazioni per creare programmi in grado di fruttare la potenza delle GPU...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
|||
|
|
|
|
#976 | |
|
Senior Member
Iscritto dal: May 2009
Messaggi: 1330
|
Quote:
Ultima modifica di Dre@mwe@ver : 18-06-2010 alle 15:22. |
|
|
|
|
|
#977 |
|
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24170
|
Fusion non interferisce con le schede grafiche low-end, parola di AMD!
notizia di Hwupgrade del 18./06/2010
Fusion è il nome che sta ad indicare il progetto di AMD per l'integrazione all'interno della stessa unità di CPU e GPU: nonostante i continui passi in avanti che le architetture IGP (integrated graphics processor) hanno fatto registrare nel corso degli ultimi tempi, difficilmente l'arrivo sul mercato di Fusion andrà a creare problemi alle schede video di fascia low-end. Almeno questo è quello che dichiara AMD: "Abbiamo schede grafiche low-end che sono in grado di garantire buone prestazioni all'utente e questo rimarrà anche una volta che avremo lanciato Llano", ha affermato Shaila Bansal, senior product manager per il mainstream graphic di AMD." Ieri avevamo riportato, con questa notizia, l'intenzione della società di voler portare le memorie GDDR5 anche sulle soluzioni mainstream Radeon HD 5550 e Radeon HD 5570, rendendo ancora più interessante la propria offerta prodotto destinata al grande pubblico. Con l'inizio del prossimo anno, però AMD darà il via alla commercializzazione delle soluzioni APU (accelerating processing unit), prodotti in grado di affiancare a quattro core Phenom II x86 anche soluzioni grafiche ATI Radeon HD 5000 con 480 stream processor. Potenzialmente quindi, Llano sarebbe in grado di superare le prestazioni di Redwood, la GPU utilizzate per le soluzioni mainstream del mercato. I prodotti sviluppati si Redwood e Cedar avrebbero quindi bisogno di un importante refresh, per poter risultare ancora interessanti, ma non è dell'opinione Bansal che afferma "Non ci sono piani per abbandonare ATI Radeon HD 5450. Le GPU con bus di memoria a 64-bit continueranno ad esistere anche dopo che i prodotti Fusion saranno lanciati". Le schede grafiche destinate alla fascia più bassa del mercato, infatti, rimarrano una interessante opzione per tutti coloro che avranno la necessità di aggiornare il proprio sistema, spendendo poco. Clicca qui...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
|
|
|
|
#978 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31868
|
Grazie delle risposte... però ancora non riesco a comprendere l'intenzione di AMD con Llano.
Onestamente... anche io confido che anche se la GPU non arriva ad aiutare intensamente la CPU nei calcoli, in ogni caso delle ottimizzazioni ci saranno e sono certo che Llano avrà un IPC superiore. Ma il punto è... per quanto possa avere l'IPC superiore, è un X4 e diciamo che forse arriverà all'IPC teorico di un K10 X5, quindi il Thuban, essendo X6, dovrebbe avere un IPC ancora superiore (a parte chiaramente clock diversi per il fatto di essere 32nm). Però... magari scriverò delle stronzate, perché non ho seguito molto il tutto, ma non vedo una strategia molto precisa. Cioè mi sembra quasi che Llano adotti una tecnologia che è una via di mezzo tra un Thuban ed il Buldozer e nello stesso tempo meno prestante di entrambi. Se l'obbiettivo di AMD non è la potenza, mi viene da pensare che Llano sia più indirizzato ai portatili o comunque a configurazioni parsimoniose nei consumi e non strettamente legate al multicore intensivo... Non vorrei dire una stronzata... ma a me pare sia proprio una mossa per conquistare l'area portatili e comunque rodare il tutto per ottenere esperienza da travasare successivamente nella nuova arichitettura Buldozer ottenendo poi il max in un Buldozer 2a serie o procio con un altro nome. Questo lo dico perché se AMD avesse voluto incrementare l'IPC avrebbe dovuto fare Llano X6, perché con il 32nm è facile immaginare un ipotetico Thuban con una GPU rimanendo dentro i 125W TDP. Invece questo modo di fare mi fa credere che abbia indirizzi diversi. In fin dei conti... immagigniamoci un X4 con VGA integrata nel procio ed a 32nm... immagigniamoci la mobo di questo portatile quanto potrebbe essere piccola e soprattutto quanto consumerebbe poco. Probabile che ho detto delle stronzate, ma a intuito io la vedo più così... e poi AMD non credo si possa permettere di investire 3 progetti quasi contemporanei unicamente per il settore desktop. Thuban, Llano e Buldozer... triplicherebbe i costi con forse un raddoppio di vendite... mentre sarebbe più auspicabile Thuban che blocca gli i7 X4 e per prezzo si confronta con gli i7 X6, Llano settore portatile e Buldozer che sarà il seguito del Thuban per fronteggiare gli X6 Intel, per poi unire le esperienze di Llano e portare un Buldozer/Llano X8 in futuro... la vedrei meglio così.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CO -50 + CS -10 (NO RS) CPU-Z-18989 - CB23 48679 - CB24 2593 |
|
|
|
|
#979 |
|
Senior Member
Iscritto dal: May 2009
Messaggi: 1330
|
Paolo per il discorso IPC bisogna vedere come si intende il concetto...cioè, io ho sempre parlato di IPC riferendomi al singolo core, faccio un esempio: se un Thuban X6 pareggia con un i7 930, questo non vuol dire che l'IPC delle due CPU sia uguale, infatti l'i7, avendo un'architettura più raffinata, ha un IPC maggiore rispetto al Thuban che colma il gap con i due core aggiuntivi. Almeno riferendomi alle mie conoscenze e riferendo quindi l'IPC al singolo core, un Llano X4 avrebbe comunque un IPC maggiore degli odierni Thuban per via del raffinamento dell'architettura...sbaglio oppure ci vedo giusto? Qualcuno dia delucidazioni prego
Llano sarà per la fascia medio-bassa del mercato, offrendo comunque delle CPU più prestanti degli attuali PHII X4 e dotati di grafica integrata, e queste CPU si affiancheranno ai Bulldozer che saranno la fascia alta-enthusiast. Ma come giustamente dici il Thuban X6 dovrebbe essere, soprattutto in campo multicore, più veloce di Llano, quindi in pratica la scaletta (da un punto di vista prestazionale) sarebbe Llano-Thuban-Bulldozer. Effettivamente c'è una certa confusione Credo che Llano sia per spingere gli sviluppatori a programmare software in grado di sfruttare al meglio le APU per poi passare alla fusione definitiva fra CPU e GPU, togliendo la FPU dalle CPU e utilizzando al loro posto la GPU. Il tutto IMHO Di certo Llano sarà utilizzatissimo per i portatili, è lì che AMD deve ancora recuperare parecchio... |
|
|
|
|
#980 |
|
Member
Iscritto dal: Feb 2008
Messaggi: 269
|
da assoluto profano di questo tipo di programmazione, un kernel creato appositamente per l'architettura fusion potrebbe trarre qualche beneficio per alcune operazioni?
__________________
CPU: AMD Athlon X2 7750BE 3.15Ghz@vcore 1.3750 / NorthBridge: [email protected] RAM: Mushkin XP2 Radioactive 4GB 900Mhz@4-4-4-12-1T / HyperTransport: 2025Mhz VGA: Club3D Radeon HD4850 / HDD: Western Digital Caviar RE3 |
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 11:50.



















