Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

ASUS Expertbook PM3: il notebook robusto per le aziende
ASUS Expertbook PM3: il notebook robusto per le aziende
Pensato per le necessità del pubblico d'azienda, ASUS Expertbook PM3 abbina uno chassis particolrmente robusto ad un pannello da 16 pollici di diagonale che avantaggia la produttività personale. Sotto la scocca troviamo un processore AMD Ryzen AI 7 350, che grazie alla certificazione Copilot+ PC permette di sfruttare al meglio l'accelerazione degli ambiti di intelligenza artificiale
Test ride con Gowow Ori: elettrico e off-road vanno incredibilmente d'accordo
Test ride con Gowow Ori: elettrico e off-road vanno incredibilmente d'accordo
Abbiamo provato per diversi giorni una new entry del mercato italiano, la Gowow Ori, una moto elettrica da off-road, omologata anche per la strada, che sfrutta una pendrive USB per cambiare radicalmente le sue prestazioni
Recensione OnePlus 15: potenza da vendere e batteria enorme dentro un nuovo design
Recensione OnePlus 15: potenza da vendere e batteria enorme dentro un nuovo design
OnePlus 15 nasce per alzare l'asticella delle prestazioni e del gaming mobile. Ma non solo, visto che integra un display LTPO 1,5K a 165 Hz, OxygenOS 16 con funzioni AI integrate e un comparto foto con tre moduli da 50 MP al posteriore. La batteria da 7.300 mAh con SUPERVOOC 120 W e AIRVOOC 50 W è la ciliegina sulla torta per uno smartphone che promette di offrire un'esperienza d'uso senza alcun compromesso
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 12-11-2009, 18:03   #181
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi


Aggiornamento:


Finalmente l'architettura ufficiale!

Da queste slide si capiscono le seguenti cose:

- Buldozer potrà avere solo un numero di cores pari.
- Differenze e somiglianze tra HyperThreading INTEL e doppio core AMD:
- Fetch e decode unico per due thread per entrambi gli approcci.
- Unità FP condivisa tra i due thread per entrambi, ma essendo le due unità FP uguali, possono essere accopiate per fare una istruzione a 256 di un solo thread (il mitico reverse HyperThreading), mentre i core INTEL hanno si due unità FP, ma una fa solo addizioni e una solo moltiplicazioni.
- Unità intere SEPARATE per l'architettura AMD. E in più le pipeline sono 4. Se sono uguali a quelle del K8/9/10, ossia formate da una ALU+AGU, allora è un passo in avanti. Se sono 4 ALU come quelle INTEL, allora è un passo indietro, ma comunque rispetto a INTEL è un passo in avanti, perchè i 2 thread si contendono 4 ALU, mentre qui i 2 thread hanno il proprio set di 4 ALU dedicate.
- Cache L1 dati (e unità load store) separate: grande vantaggio AMD
- Cache L2 condivisa: siamo pari.

Quindi il pubblicizzare questo cluster di due core, come due core separati è giustificato.
Le unità FP nel K8/9/10 sono 3, ma non sono generiche. Qui abbiamo 2 unità FP a 128 bit generiche. Quindi lo scheduling dovrebbe essere semplificato.
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline  
Old 12-11-2009, 18:09   #182
F1R3BL4D3
Senior Member
 
L'Avatar di F1R3BL4D3
 
Iscritto dal: Mar 2005
Città: Castiglione Olona
Messaggi: 22637
Se interessa, questa è la roadmap 2010/2011 direttamente da AMD Italia:
Quote:
Overview per il 2010:



Riconfermandosi la sola azienda sul mercato in grado di offrire piattaforme bilanciato dall’elevata capacità elaborativa, visiva e multimediale, AMD prevede di introdurre le seguenti piattaforme:



· “Danube”: la piattaforma di nuova generazione AMD Mainstream Notebook che monta il primo processore AMD mobile quad-core e che promette di offrire più di 7 ore di autonomia della batteria;

· “Nile”: la terza piattaforma AMD Ultrathin notebook, progettata per offrire una maggiore autonomia della batteria (più di 7 ore);

· “San Marino” e “Maranello”: due nuove piattaforme in ambito server con supporto DDR3. “Maranello” si baserà sul processore “Magny-Core” a 8 e 12 core, mentre “San Marino” offrirà nuovo valore ed efficienza energetica che contribuirà alla crescita del Web e del Cloud Computing;

· “Leo”: la prossima generazione della piattaforma per PC desktop dedicata agli “enthusiast” basata sul primo processore per desktop a 6 core



Overview per il 2011:



Nel 2011 AMD darà vita a una nuova era dell’elaborazione introducendo le seguenti piattoforme (nomi in codice):



* “Bulldozer” e “Bobcat”: due nuovi core x86 studiati per specifiche piattaforme e segmenti di mercato “Bulldozer” sarà una architettura completamente nuova studiata per soluzioni server mainstream, desktop e notebook che sfrutterà un nuovo approccio multithreaded in grado di offrire sempre maggiore efficienza e prestazioni. L’architettura “Bulldozer” offre un’ esclusiva funzionalità in grado di stabilire una connessione diretta tra la CPU e unità di elaborazione grafica (GPU) per creare una soluzione a singolo chip, definita come Accelerated Processing Unit (APU), per offrire massima scalabilità.
“Bobcat” è studiato per il mercato dei PC ultra sottili a basso consumo energetico, e sarà in grado di scalare facilmente in combinazioni con altri componenti nelle configurazioni APU (Accelerated processing Unit)
* “Llano”: sarà la piattaforma dedicata ai notebook e desktop mainstream. L’APU (accelerated processing unit) sarà la prima a identificare l'unione di una CPU e una GPU in un unico die.
* “Brazos”: piattaforma per ultra portatili economici, si baserà sulla APU “Ontario”, con due core basati sulla nuova architettura “Bobcat”.
* “Zamberi”: processore per sistemi desktop dedicato al segmento “enthusiast” con 8 core basato sull’architettura indicata con il nome in codice di Bulldozer.
__________________
F1R3BL4D3 è offline  
Old 12-11-2009, 18:19   #183
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi
Secondo le informazioni rilasciate da AMD, la prima APU (accelerated processing unit) nome in codice Llano sarà basata su 4 core X86-x64 AMD derivanti dall'architettura "Stars" o più comunemente chiamata K10; il modello di riferimento è il core Propus, naturalmente riveduto e corretto.
Costruita a 32nm SOI Llano avrà una cache L2 da 512Kb per core X86 e la classica cache L3 da 4MB.
La GPU integrata nello stesso pezzo di silicio, avrà ben 480 stream processors divisi in 6 SIMD engines (80 stream processors per engine) con una capacità di calcolo massima classe "Gigaflops"; CPU e GPU condivideranno lo stesso controller di memoria DDR3 PC3-12800 (1600Mhz)
Questa APU avrà circa un 1 miliardo di transistor e sarà la prima GPU AMD costruita con tecnologia SOI.

L'uscita è attesa per il 2011...


Clicca qui...
E' possibile che questi 480 stream processor vadano a una velocità elevata, tipo 1,2-1,5GHz?
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline  
Old 12-11-2009, 18:22   #184
okorop
Senior Member
 
L'Avatar di okorop
 
Iscritto dal: Jan 2007
Messaggi: 24996
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
E' possibile che questi 480 stream processor vadano a una velocità elevata, tipo 1,2-1,5GHz?
dovrebbero essere lincati con la frequenza della gpu integrata come sulle soluzioni ati radeon, poi se si tratta della nuova architettura non si sa
__________________
[CPU]AMD Ryzen 7700X[RAM] 32Gb corsair vegance 6000Mhz CL30[Storage] 3 GB Kingstone NVe PCIE 4[mobo]Asus TUF B650 plus[vga]XFX 6750XT 12 Gb vram [PSU]Corsair RM 850i

okorop è offline  
Old 12-11-2009, 18:26   #185
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24170
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Finalmente l'architettura ufficiale!

Da queste slide si capiscono le seguenti cose:

- Buldozer potrà avere solo un numero di cores pari.
- Differenze e somiglianze tra HyperThreading INTEL e doppio core AMD:
- Fetch e decode unico per due thread per entrambi gli approcci.
- Unità FP condivisa tra i due thread per entrambi, ma essendo le due unità FP uguali, possono essere accopiate per fare una istruzione a 256 di un solo thread (il mitico reverse HyperThreading), mentre i core INTEL hanno si due unità FP, ma una fa solo addizioni e una solo moltiplicazioni.
- Unità intere SEPARATE per l'architettura AMD. E in più le pipeline sono 4. Se sono uguali a quelle del K8/9/10, ossia formate da una ALU+AGU, allora è un passo in avanti. Se sono 4 ALU come quelle INTEL, allora è un passo indietro, ma comunque rispetto a INTEL è un passo in avanti, perchè i 2 thread si contendono 4 ALU, mentre qui i 2 thread hanno il proprio set di 4 ALU dedicate.
- Cache L1 dati (e unità load store) separate: grande vantaggio AMD
- Cache L2 condivisa: siamo pari.

Quindi il pubblicizzare questo cluster di due core, come due core separati è giustificato.
Le unità FP nel K8/9/10 sono 3, ma non sono generiche. Qui abbiamo 2 unità FP a 128 bit generiche. Quindi lo scheduling dovrebbe essere semplificato.
Grande bjt2, appena ho un po di tempo ti metto in prima pagina...
una cosa volevo chiederti:
Corsini nel suo articolo dice che AMD con Bulldozer ha prediletto i calcoli interi piuttosto che quelli in virgola mobile, lasciando quest'ultimi tra i due cluster integer, oppure dedicate specificamente ad uno dei due core per ogni ciclo di clock.
Che ne pensi? mi sembra un pò troppo limitante... (premetto che la mia competenza in questi argomenti è sotto al noviziato )
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 12-11-2009, 18:27   #186
okorop
Senior Member
 
L'Avatar di okorop
 
Iscritto dal: Jan 2007
Messaggi: 24996
Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi
Grande bjt2, appena ho un po di tempo ti metto in prima pagina...
una cosa volevo chiederti:
Corsini nel suo articolo dice che AMD con Bulldozer ha prediletto i calcoli interi piuttosto che quelli in virgola mobile, lasciando quest'ultimi tra i due cluster integer, oppure dedicate specificamente ad uno dei due core per ogni ciclo di clock.
Che ne pensi? mi sembra un pò troppo limitante... (premetto che la mia competenza in questi è vicino è sotto al noviziato )
i calcoli in virgola mobile a mio avviso li lascia alla gpu che è molto piu' veloce in questo tipo di calcolo ottimizzando la cpu per tutto il resto
__________________
[CPU]AMD Ryzen 7700X[RAM] 32Gb corsair vegance 6000Mhz CL30[Storage] 3 GB Kingstone NVe PCIE 4[mobo]Asus TUF B650 plus[vga]XFX 6750XT 12 Gb vram [PSU]Corsair RM 850i

okorop è offline  
Old 12-11-2009, 18:32   #187
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24170
Quote:
Originariamente inviato da okorop Guarda i messaggi
i calcoli in virgola mobile a mio avviso li lascia alla gpu che è molto piu' veloce in questo tipo di calcolo ottimizzando la cpu per tutto il resto
Ok , però i primi esemplari di Bulldozer non avranno le GPU integrate...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 12-11-2009, 18:36   #188
okorop
Senior Member
 
L'Avatar di okorop
 
Iscritto dal: Jan 2007
Messaggi: 24996
Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi
Ok , però i primi esemplari di Bulldozer non avranno le GPU integrate...
amd vuole venderti tutto completo cpu e gpu e scheda madre ergo se le proprie gpu riescono a fare calcoli in virgola mobile con un vantaggio comparato rispetto alle cpu specializzano le gpu in quel settore e le cpu nei rimanenti.

ti faccio un banale esempio attuale: un intel core i7 per convertire un file video ci impega x (in unità di tempo), una scheda ati ne impiega x-1 (son dati appurati) allora perchè utilizzare il processore in questi ambiti? non avrebbe senso giusto ergo amd non specializza la cpu manco nel farlo e passano attraverso la gpu. Io mi aspetto dei software ottimizzati fusion che permettano un giusto carico delle varie componenti del sistema e le utilizzi quando han vantaggi. Probabilmente soluzioni buldozzer accoppiate a soluzioni nvida non daranno le stesse prestazioni in ambito 2d come buldozzer + ati.
__________________
[CPU]AMD Ryzen 7700X[RAM] 32Gb corsair vegance 6000Mhz CL30[Storage] 3 GB Kingstone NVe PCIE 4[mobo]Asus TUF B650 plus[vga]XFX 6750XT 12 Gb vram [PSU]Corsair RM 850i


Ultima modifica di okorop : 12-11-2009 alle 18:44.
okorop è offline  
Old 12-11-2009, 18:57   #189
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi
Grande bjt2, appena ho un po di tempo ti metto in prima pagina...
una cosa volevo chiederti:
Corsini nel suo articolo dice che AMD con Bulldozer ha prediletto i calcoli interi piuttosto che quelli in virgola mobile, lasciando quest'ultimi tra i due cluster integer, oppure dedicate specificamente ad uno dei due core per ogni ciclo di clock.
Che ne pensi? mi sembra un pò troppo limitante... (premetto che la mia competenza in questi argomenti è sotto al noviziato )
Ciao
Se posso permettermi, potrei parlarne io. Premetto che possono essere solo castronerie:
Dunque quello che ha detto corsini non è proprio vero. Infatti la unità Fp è composta due parti speculari con ampiezza a 128bit. Se nel thread che sta eseguendo la cpu sono presenti vettori a 256bit allora il thread che richiede il vettore monopolizzerà la Fp per un ciclo di clock per eseguire l'operazione, da come si evince nella slide, l'unità amd è un FMAC, ovvero in grado di eseguire oltre a moltiplicazioni, addizioni, ed altre operazioni aritmetiche anche operazioni con la memoria (MOV) conversioni ed altro. Questo implica che le unità da 128bit siano dual ported ognuna verso la cache, dunque ognuna di essa può eseguire 2 operazioni per ciclo di clock. Questo approccio nasce dal fatto che le unità FP nel software corrente sono sottoutilizzate, essendo la maggioranza di istruzioni di tipo integer e sopratutto istruzioni che lavorano con la memoria( e speriamo che vi siano 4 agu). Quindi per farti un esempio un k10 può eseguire nella stragrande maggioranza dei casi possibili, NB non avviene quasi mai per il motivo detto sopra sulla natura del codice, 2 operazioni aritmetiche FP + un operazione non aritmetica. Buldozzer essendo strutturato cosi portebbe eseguire, essendo lo scheduler FP dedicato tra 2 core, 4 operazioni FP, 2 aritmetiche e due non, con conseguenza miglior sfruttamento delle risorse.
Come detto primase ho detto cassate correggetemi.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita

Ultima modifica di Pihippo : 12-11-2009 alle 18:59.
Pihippo è offline  
Old 12-11-2009, 18:59   #190
capitan_crasy
Senior Member
 
L'Avatar di capitan_crasy
 
Iscritto dal: Nov 2003
Messaggi: 24170
Quote:
Originariamente inviato da okorop Guarda i messaggi
amd vuole venderti tutto completo cpu e gpu e scheda madre ergo se le proprie gpu riescono a fare calcoli in virgola mobile con un vantaggio comparato rispetto alle cpu specializzano le gpu in quel settore e le cpu nei rimanenti.

ti faccio un banale esempio attuale: un intel core i7 per convertire un file video ci impega x (in unità di tempo), una scheda ati ne impiega x-1 (son dati appurati) allora perchè utilizzare il processore in questi ambiti? non avrebbe senso giusto ergo amd non specializza la cpu manco nel farlo e passano attraverso la gpu. Io mi aspetto dei software ottimizzati fusion che permettano un giusto carico delle varie componenti del sistema e le utilizzi quando han vantaggi. Probabilmente soluzioni buldozzer accoppiate a soluzioni nvida non daranno le stesse prestazioni in ambito 2d come buldozzer + ati.
E' questo il punto...
Inoltre si rischia di avere, in alcuni casi, un Llano per il mercato mainstream più veloce di un Bullodozer per il mercato enthusiast...
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright
capitan_crasy è offline  
Old 12-11-2009, 19:19   #191
okorop
Senior Member
 
L'Avatar di okorop
 
Iscritto dal: Jan 2007
Messaggi: 24996
Quote:
Originariamente inviato da capitan_crasy Guarda i messaggi
E' questo il punto...
Inoltre si rischia di avere, in alcuni casi, un Llano per il mercato mainstream più veloce di un Bullodozer per il mercato enthusiast...
non escludo la possibilità di una scheda video integrata nel chipset anche per soluzioni enthusiast, magari senza uscita video, ma dedicata a fare proprio i calcoli in cui il processore e carente, con inoltre la possibilità di adottare soluzioni hybrid crossfire con lo spegnimento delle vga dedicate per un risparmio energetico
__________________
[CPU]AMD Ryzen 7700X[RAM] 32Gb corsair vegance 6000Mhz CL30[Storage] 3 GB Kingstone NVe PCIE 4[mobo]Asus TUF B650 plus[vga]XFX 6750XT 12 Gb vram [PSU]Corsair RM 850i


Ultima modifica di okorop : 12-11-2009 alle 19:32.
okorop è offline  
Old 12-11-2009, 19:43   #192
carlottoIIx6
Senior Member
 
L'Avatar di carlottoIIx6
 
Iscritto dal: Sep 2009
Messaggi: 5582
http://www.hwupgrade.it/articoli/cpu...-fusion_5.html
carlottoIIx6 è offline  
Old 12-11-2009, 20:03   #193
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Ciao
Se posso permettermi, potrei parlarne io. Premetto che possono essere solo castronerie:
Dunque quello che ha detto corsini non è proprio vero. Infatti la unità Fp è composta due parti speculari con ampiezza a 128bit. Se nel thread che sta eseguendo la cpu sono presenti vettori a 256bit allora il thread che richiede il vettore monopolizzerà la Fp per un ciclo di clock per eseguire l'operazione, da come si evince nella slide, l'unità amd è un FMAC, ovvero in grado di eseguire oltre a moltiplicazioni, addizioni, ed altre operazioni aritmetiche anche operazioni con la memoria (MOV) conversioni ed altro. Questo implica che le unità da 128bit siano dual ported ognuna verso la cache, dunque ognuna di essa può eseguire 2 operazioni per ciclo di clock. Questo approccio nasce dal fatto che le unità FP nel software corrente sono sottoutilizzate, essendo la maggioranza di istruzioni di tipo integer e sopratutto istruzioni che lavorano con la memoria( e speriamo che vi siano 4 agu). Quindi per farti un esempio un k10 può eseguire nella stragrande maggioranza dei casi possibili, NB non avviene quasi mai per il motivo detto sopra sulla natura del codice, 2 operazioni aritmetiche FP + un operazione non aritmetica. Buldozzer essendo strutturato cosi portebbe eseguire, essendo lo scheduler FP dedicato tra 2 core, 4 operazioni FP, 2 aritmetiche e due non, con conseguenza miglior sfruttamento delle risorse.
Come detto primase ho detto cassate correggetemi.
Sono dubbioso sul load & store address e sulla LSU.

Quali saranno le unità che calcoleranno l'indirizzo delle cache ?

Vedendo 4 pipeline intere, mi viene da pensare ad una composizione 4alu + 4 agu 64bit indipendenti o concorrenti (stile P6), che al occorrenza calcolano insieme un indirizzo a 256bit.
Sparo sta boiata, perchè lo schema del bobcat specifica espressamente le unità alu e L&S, invece nel bulldozer c'è un generico integer pipe.

Queste unità dovranno manipolare 256 bit di dati verso ogni singola cache, quindi non si potranno condividere le unità address dei due cluster,perchè ogni indirizzo fa capo ad una cache L1 data, tranne che le due cache siano in mirroring, cioè condividano gli stessi dati.

La LSU di ogni cluster dovrà avere almeno due porte a 128bit in lettura o scrittura.

Ovviamente, sempre se le AVX 256 saranno eseguite in un ciclo.

Scusate se ho sparato delle amenità...

Ultima modifica di Ren : 12-11-2009 alle 20:23.
Ren è offline  
Old 12-11-2009, 20:22   #194
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da Ren Guarda i messaggi
Sono dubbioso sul load & store address e sulla LSU.

Quali saranno le unità che calcoleranno l'indirizzo delle cache ?

Vedendo 4 pipeline intere, mi viene da pensare ad una composizione 4alu + 4 agu 64bit, che al occorrenza calcolano insieme un indirizzo a 256bit.

Queste unità dovranno manipolare 256 bit di dati verso ogni singola cache, quindi non si potranno condividere perchè ogni indirizzo fa capo ad una cache L1 data, tranne che le due cache siano in mirroring, cioè condividano gli stessi dati.
La LSU di ogni cluster dovrà avere almeno due porte a 128bit se la cache rimane a due vie 256bit.

Ovviamente, sempre se le AVX 256 saranno eseguite in un ciclo.

Scusate se ho sparato delle amenità...
Ciao
Le agu del k10 calcolano tuttora gli addresses in un singolo ciclo di clock. . Gli indirizzi delle cache\ram verranno sempre calcolati dalle agu, inoltre le L1 data sono reserved per ogni cluster di integer mentre vi sarà una singola grossa L1 instructions. Ogni cluster dispone di 4 integer pipe(dalla slide ho capito questo) e considerando la tendenza di Amd nella progettazione delle sue cpu di accorpare operazioni logiche\aritmetiche ad operazioni di memoria(i decoder amd mandano ognuno 3 mop agli scheduler, costituite da 2 op matematiche\logiche più op di memoria) si può pensare che ogni cluster avrà un proprio set di agu. Inoltre la agu calcolano l'indirizzo di memoria, ma è la L\S unit che dovrà avere un datapath verso la cache di 256bit per poter caricare\salvare in un singolo ciclo di clock gli operandi nella memoria(oppure 2 cicli se saranno a 128bit) Dunque l'ampiezza da valutare non è quella delle agu(almeno cosi ho capito che funzionano le address generator uniti) ma delle unità di load e store.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 12-11-2009, 20:31   #195
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Ciao
Le agu del k10 calcolano tuttora gli addresses in un singolo ciclo di clock. . Gli indirizzi delle cache\ram verranno sempre calcolati dalle agu, inoltre le L1 data sono reserved per ogni cluster di integer mentre vi sarà una singola grossa L1 instructions. Ogni cluster dispone di 4 integer pipe(dalla slide ho capito questo) e considerando la tendenza di Amd nella progettazione delle sue cpu di accorpare operazioni logiche\aritmetiche ad operazioni di memoria(i decoder amd mandano ognuno 3 mop agli scheduler, costituite da 2 op matematiche\logiche più op di memoria) si può pensare che ogni cluster avrà un proprio set di agu. Inoltre la agu calcolano l'indirizzo di memoria, ma è la L\S unit che dovrà avere un datapath verso la cache di 256bit per poter caricare\salvare in un singolo ciclo di clock gli operandi nella memoria(oppure 2 cicli se saranno a 128bit) Dunque l'ampiezza da valutare non è quella delle agu(almeno cosi ho capito che funzionano le address generator uniti) ma delle unità di load e store.
Quindi le AGU non dovranno essere a 256bit (o in alternativa più unità a 64bit) come nel Sandy bridge ?
Sulla LSU mi sono spiegato male, ho ipotizzato l'obbligatorietà di almeno due porte load a 128bit o due porte store sempre a 128 bit.

Attualmente il k10 dispone di due unit LSU, una effettua due store a 64bit ed un altra che effettua due load a 128bit.
Il datapath verso la L1 Data è 256bit(2vie).

Ultima modifica di Ren : 12-11-2009 alle 20:34.
Ren è offline  
Old 12-11-2009, 20:34   #196
MonsterMash
Senior Member
 
Iscritto dal: Sep 2005
Messaggi: 4337
Sono molto di fretta, quindi scrivo giusto due righe: riguardo all'utilizzo della gpu per le operazioni floating point, non è una cosa fattibile, perchè la gpu non esegue le classiche istruzioni che eseguono le cpu (x86, mmx, sse, x64, etc, etc). Non accadrà presto (e non certo entro l'uscita di buldozer) di vedere la totalità del software in grado di sfruttare la potenza elaborativa di una gpu. Saranno ancora a lungo (relativamente) pochi software a farlo, e solo quelli che usano le istruzioni DirectCompute, o OpenCL (o al più cuda per nvidia, e CAL per ati).

Non avrebbe senso quindi che amd rinunciasse ai calcoli fpu nella cpu.
__________________
I7 3930K: @ 4400 @ 1.32V, su ASUS P9X79 Deluxe - RAM: 16GB Geil 4x4GB @ 2133Mhz - Video: ATI HD6970 @ 1000 / 6000 - HD: SSD OCZ Vertex2 120gb + RAID0: 2XHitachi Deskstar T7K250 250gb SATA2 - P.S.U. Corsair TX850M - Monitor Iiyama B2712HDS LCD 27'' - Cooled by: Ybris Eclipse + Ybris ACS-G + SILENTstar HD-Quad Rev2.0 + WaterStation HomeMade: Doppio Rad triventola + Pompa Sanso PDH054
MonsterMash è offline  
Old 12-11-2009, 21:29   #197
Pihippo
Senior Member
 
Iscritto dal: Sep 2008
Città: Provincia di reggio, costa dei gelsomini :D
Messaggi: 1691
Quote:
Originariamente inviato da Ren Guarda i messaggi
Quindi le AGU non dovranno essere a 256bit (o in alternativa più unità a 64bit) come nel Sandy bridge ?
Sulla LSU mi sono spiegato male, ho ipotizzato l'obbligatorietà di almeno due porte load a 128bit o due porte store sempre a 128 bit.

Attualmente il k10 dispone di due unit LSU, una effettua due store a 64bit ed un altra che effettua due load a 128bit.
Il datapath verso la L1 Data è 256bit(2vie).
Ciao
Per quello che ne capisco io, no.
Comunque il k10 ha solo 1 L\S unit. Però questa Load\Store unit ha 2 code. LS1 accetta le operazioni di Load a 128bit e ne può eseguire 2 per ciclo(contro 1 di penryn), mentre LS2 accetta le operazioni di store a 128bit ma è capace di scrivere solo 64bit alla volta, quindi c'è ne vogliono 2 di cicli, infatti i k10 hanno un'elevata velocità di lettura della memoria ed una modesta di scrittura.
__________________
Amore mio, forza ed onore, io sono nel cuore tuo. Insieme ce la possiamo fare, a vincere questa battaglia per la vita
Pihippo è offline  
Old 14-11-2009, 00:14   #198
papafoxtrot
Senior Member
 
Iscritto dal: Apr 2005
Messaggi: 2905
iscritto
__________________
acquistato con soddisfazione da: SHIVA>>LuR<< Jokerpunzk,Markenforcer,vkbms, campioni del mondo,mstella.
Venduto a: maxVi, gabrieletor, banaz, tdm70, raxxo, frantheman
papafoxtrot è offline  
Old 14-11-2009, 10:17   #199
genesi86
Senior Member
 
Iscritto dal: Jan 2006
Messaggi: 1516
scusatemi potreste dirmi se i bulldozer saranno compatibili col socket AM3?
genesi86 è offline  
Old 14-11-2009, 10:28   #200
sniperspa
Senior Member
 
L'Avatar di sniperspa
 
Iscritto dal: Aug 2006
Messaggi: 11127
Quote:
Originariamente inviato da genesi86 Guarda i messaggi
scusatemi potreste dirmi se i bulldozer saranno compatibili col socket AM3?
Sembra proprio di si.
__________________
PC1: LG 34UC79G - Ryzen 5600@4,65ghz CO-30 - MasterLiquid 240 - 32GB 2400 Corsair@3000 - Gigabyte GA-AB350M Gaming 3 - RX 6700XT - NZXT S340 Elite
PC2: FX6300 - AC Freezer 64 pro - Gigabyte 990XA-UD3 - Sapphire HD7850 2gb - 8gb DDR3 Corsair 1333 - - Antec Two Hundred
PC3: AMD A10 7700k - 8gb DDR3 2400mhz - SanDisk Plus SSD 240gb - CoolerMaster NSE-200-KKN1
sniperspa è offline  
 Discussione Chiusa


ASUS Expertbook PM3: il notebook robusto per le aziende ASUS Expertbook PM3: il notebook robusto per le ...
Test ride con Gowow Ori: elettrico e off-road vanno incredibilmente d'accordo Test ride con Gowow Ori: elettrico e off-road va...
Recensione OnePlus 15: potenza da vendere e batteria enorme dentro un nuovo design   Recensione OnePlus 15: potenza da vendere e batt...
AMD Ryzen 5 7500X3D: la nuova CPU da gaming con 3D V-Cache per la fascia media AMD Ryzen 5 7500X3D: la nuova CPU da gaming con ...
SONY BRAVIA 8 II e BRAVIA Theatre System 6: il cinema a casa in formato compatto SONY BRAVIA 8 II e BRAVIA Theatre System 6: il c...
Bonus Elettrodomestici 2025, si parte: c...
Jeff Bezos torna al comando, stavolta di...
Anthesi sceglie OVHcloud per digitalizza...
Cube presenta Trike Flatbed Hybrid 750, ...
Call of Duty Black Ops 7 peggio di Infin...
L'Italia è il secondo mercato per...
Wi-Fi superveloce anche in giardino? FRI...
La Ford Focus va ufficialmente in pensio...
Booking.com integra Revolut Pay: nasce i...
DGX Spark a 175 fps con ray tracing su C...
Red Dead Redemption 2 Enhanced è ...
3Dfx Voodoo 2, una GPU nata con la scade...
Apple Watch: la Mela dovrà versar...
TIM e Nokia insieme per potenziare il 5G...
Musk lancia la nuova era dei DM su X con...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 23:07.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v