|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#4541 | ||||
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
Quote:
![]() ma in generale questa pagina dell'articolo è una manna, perché spiega anche le differenze con AMD. Si tratta di roba vecchia (i confronti sono fra processori di 10 anni fa), ma su queste cose le informazioni ancora attuali. Tornando alla modernità, per quanto riguarda Skylake, pare che il decoder riesca a eseguire (col supporto delle 4 unità, ovviamente) 2 macro-op (che nel gergo di Intel sono due istruzioni) fusion per ciclo di clock. Inoltre ogni unità è in grado di eseguire una uop fusion, e dunque al massimo si possono avere 4 fused-uop per ciclo di clock (dunque sarebbero 8 uop non-fused per ciclo di clock). E' un po' incasinato, ma penso che renda bene quel che riesce a gestire Skylake con soli 4 decoder (di cui 3 semplici, ma questo non è affatto un problema, come viene riportato anche su AnandTech). Quote:
Quote:
![]() P.S. Non ho tempo per rispondere agli altri commenti. Lo farò quando potrò.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
||||
|
|
|
|
#4542 | ||
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
Quote:
Si, mi pare istruzioni di sistema, di gestione dei task gate, task switching, salvataggio stato CPU e menate varie...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
||
|
|
|
|
#4543 | ||||||
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31988
|
Quote:
Se vuoi fare il confronto, lo devi fare tra Phenom II 45nm e Phenom II 32nm, cioè Llano. Phenom II 45nm 3,7GHz 125W X4, Llano 32nm 3GHz max e mi sembra che in OC non superava i 3,5GHz.Trinity, architettura BD, stesso silicio, frequenze ben superiori. Quote:
Quote:
Quote:
Nell'8370, dai 4GHz def c'è solamente +100MHz di turbo su tutti i core e +400MHz turbo su 4 core, Quote:
Quote:
Se il silicio 32nm non va, che cosa puoi modificare? 1,2 milioni di transistor sul 32nm SOI consumano 125W a 4GHz con FO4 17. Se per te il prb è il CMT, benissimo, ragiogniamo in SMT. Zen ha il doppio di transistor a core rispetto a BD, quindi se BD con 1,2 milioni di transistor per 125W, allo stesso FO4, Zen sul 32nm SOI con 1,2 milioni di transistor risulterebbe essere X4 al massimo.... vs Intel che allo stesso TDP praticamente ci mette un X8. E' da qui che parte il discorso efficienza, consumo/prestazioni e prestazioni a die, ma non è un discorso di architettura ma di limiti silicio, perchè tra 45nm low-k e 32nm HKMG ULK il Vcore non è diminuito di una mazza (il Vcore è diminuito di più dal 45nm SOI liscio al 45nm SOI low-K), mentre il passaggio dal 45nm al 32nm, l'introduzione dell'HKMG e il potenziamento ULK dal low-k NULLA. Tra l'altro il massimo Vcore concesso dal 45nm è 1,6V mentre il 32nm SOI arriva a 1,625V, inconcepibile con una miniaturizzazione più spinta e con l'aggiunta dell'HKMG. P.S. se confronti la perdita di frequenza tra Phenom II 45nm e Phenom II 32nm, da 3,7GHz a 3GHz, rappresenta più del 20%. Se applichi questo 20% alle frequenze di BD, 4GHz + 20% = 4,8GHz, si otterrebbe il valore della aspettativa AMD sulle frequenze. Una coincidenza?
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 Ultima modifica di paolo.oliva2 : 28-07-2016 alle 08:12. |
||||||
|
|
|
|
#4544 |
|
Senior Member
Iscritto dal: Jan 2003
Messaggi: 10395
|
Il raggiungimento o meno di determinate frequenze comunque dipende non solo da FO e processo base, ma anche dal layout degli strati di metallizzazione del chip (che però costano), anche a parità di architettura/processo. Chi ricorda Thunderbird?
|
|
|
|
|
#4545 | |
|
Senior Member
Iscritto dal: Nov 2003
Messaggi: 24171
|
Quote:
__________________
AMD Ryzen 9600x|Thermalright Peerless Assassin 120 Mini W|MSI MAG B850M MORTAR WIFI|2x16GB ORICO Raceline Champion 6000MHz CL30|1 M.2 NVMe SK hynix Platinum P41 1TB (OS Win11)|1 M.2 NVMe Lexar EQ790 2TB (Games)|1 M.2 NVMe Silicon Power A60 2TB (Varie)|PowerColor【RX 9060 XT Hellhound Spectral White】16GB|MSI Optix MAG241C [144Hz] + AOC G2260VWQ6 [Freesync Ready]|Enermax Revolution D.F. 650W 80+ gold|Case Antec CX700|Fans By Noctua e Thermalright |
|
|
|
|
|
#4546 |
|
Senior Member
Iscritto dal: Jan 2003
Messaggi: 10395
|
E' una cosa collegata allo stepping, ma é più una questione di design. In pratica i layer metalici sono quelli che servono a realizzare le connessioni elettriche nel chip. Il numero ed il layout dei layer influenzano induttanze e capacità parassite e quindi la capacità di un chip a salire in frequenza. In genere avere più strati può essere migliorativo, ma incrementa il costo del chip in quanto per ogni strato bisogna ripetere processi di mascheratura, etching e deposizione.
Thunderbird era esemplificativo perchè con un nuovo stepping di metallizzazione, a parità di processo produttivo, fece salire la capacità degli Athlon XP di salire in frequenza di oltre il 30% |
|
|
|
|
#4547 | |
|
Senior Member
Iscritto dal: Sep 2003
Città: Roma
Messaggi: 12359
|
Quote:
__________________
Pc ITX: Intel i5 4690k@4500, MSI Z97I gaming ACK , Kingston 2400 11-13-13-31, Samsung 840EVO 250GB, Radeon Radeon RX 480 1350-2150. There are only 10 types of people in the world: those who understand binary, and those who don't. |
|
|
|
|
|
#4548 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
|
|
|
|
|
|
#4549 | |
|
Bannato
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
|
Quote:
http://www.xtremesystems.org/forums/...-told-me/page3 E cmq si vede dal comportamento. Per es Isomen tiene il suo FX8370 a 4,6 con meno di 1,4 volt (mi pare di ricordare 1,36 esattamente). |
|
|
|
|
|
#4550 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31988
|
Io penso che l'8370 abbia solamente un RCM più idoneo... infatti consuma/scalda meno a parità di frequenza, però oltre i 4,6GHz rende meno dell'8350. Credo che se fosse per le metallizzazioni, dovrebbe essere lineare tipo l'8350.
Il mio 8370 richiede 1,25V per 4GHz (+0,05V rispetto a Iso) ma a 4,5GHz ci sto a 1,29V. Sui 4,6GHz scalda un botto (relativamente) rispetto all'8350 allo stesso Vcore. Non ho fatto dei gran test perchè sono con il dissi stock, ma a 4,7GHz l'8370 scalda quanto un 8350 a 4,4GHz, con la differenza che l'8370 è a 1,35V mentre l'8350 >1,4V. @Leoneazzurro Io non è che ne capisca tanto di trattamenti silicio, e un'altra volta mi avevi fatto notare che è sbagliato confrontare silici differenti. Però io direi di considerare l'efficienza di una architettura rispetto ad un'altra sulla carta, ma non di giudicare il prodotto finito (architettura + silicio) perchè il silicio influenza e non poco. Ad esempio, il Phenom I aveva 2,7GHz ed un IPC inferiore rispetto al Phenom II, che riuscì ad ottenere ben +1GHz con un IPC del 15% (o 17%) superiore. Giudichiamo l'efficienza architetturale Phenom dalla versione I alla II. Non metto in dubbio che la variante II sia più ottimizzata della I ma certamente molto meno di quanto è incrementato per efficienza il 45nm sul 65nm (è pure da considerare che il Phenom I non abbia potuto inserire features e/o timing più spinti proprio per carenze silicio), tra l'altro il primo e unico modello 140W di AMD .Sono in parecchi (in rete) a considerare il PP del 32nm uno dei peggiori di AMD, addirittura al livello, se non peggiore, del 65nm sempre AMD. Viceversa, il 45nm è stato uno dei migliori PP di AMD. Ora... come si fa a giudicare l'efficienza di una architettura se poi confrontiamo Phenom II + miglior PP silicio AMD vs architettura BD con se non il peggiore tra i peggiori PP di AMD e di qui imputare l'efficienza ESCLUSIVAMENTE all'architettura? Perchè se il SOI è migliore al Bulk, AMD ci ha speso soldi per portare BD sul 28nm Bulk? Perchè Llano (Phenom II) sul 32nm ha perso oltre il 20% rispetto al 45nm? Perchè invece BD sullo stesso silicio ha oltre 1GHz con il doppio dei core vs Llano? Io dico solo che se una architettura non è efficiente, non lo è e punto. Ma allora come fa BR BD, per giunta sul 28nm, ad essere così efficiente? Un calcolo approssimativo, secondo me, sarebbe questo: Phenom II 45nm --> 32nm = -20% (prestazioni a parità di TDP, con Llano) 8350 32nm vs Thuban 45nm = +20% per BD. Allora architettura BD vs architettura Phenom II = +40% (semplicemente sommando la perdita efficienza architettura + passaggio 45nm --> 32nm all'incremento BD 32nm vs Phenom II 45nm. Diversamente si applica tutta la perdita efficienza silicio esclusivamente all'architettura.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 Ultima modifica di paolo.oliva2 : 28-07-2016 alle 16:38. |
|
|
|
|
#4551 | |
|
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
BD si può in qualche modo paragonare ad uno dei Pentium IV, FO4 basso pipeline lunghe ovvero orientati al clock, mentre Phenom a intel core o a PIII, FO4 alto pipeline più corte. non ne sono sicuro ma non credo ci siano stati PIII o Core che a parità di PP avessero freq. superiori ai PIV. il PII 980 (4 core) aveva il clock di 3.8ghz sui 45mn (NON ULK), il PII 1100 (6 core) 3.7ghz sui 45nm ULK, entrambi superavano i 4ghz in OC, mentre lliano* (4 core+igp) 3.0ghz sul 32mn e max 3.5ghz in OC. Ergo il 32nm era peggiore del 45. *c'era anche la versione con igp disabiilitata? BD 3.6ghz (8150 - OC > 5ghz) era atteso ad una freq base di almeno 4.3ghz, cosa non possibile per via dei consumi. 8350 è salito a 4.0ghz per via di un meccanismo di recupero dell'energia (RCM?) sulla stessa microarchitettura -800mhz di freq. base e -700/-900 di overclock. EDIT: trinity (BD) apu 3.8ghz freq. base 4.2 turbo gpu 800mhz (llano 600mhz) Ultima modifica di digieffe : 28-07-2016 alle 18:01. |
|
|
|
|
|
#4552 | |
|
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
Quote:
quindi è un fatto che hanno rilevato utenti con entrambe le piattaforme ma non attestato da professionisti, IMHO ci sarà un fondo di verità. mi scuso per i commenti stringati ma questo è ciò che posso fare |
|
|
|
|
|
#4553 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
Questa vecchia recensione di BD, citata sul thread di Zen di anand (ma non linkata... Ho dovuto cercarla con google) mette in risalto che BD è una buona CPU server: un trattore in grado di far girare molti thread a basso IPC, che va in crisi solo in ST o con pochi thread ad alto IPC...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#4554 | |
|
Senior Member
Iscritto dal: Dec 2004
Città: Ravenna
Messaggi: 2788
|
Quote:
http://www.bitsandchips.it/9-hardwar...quenze?start=5 |
|
|
|
|
|
#4555 | |
|
Senior Member
Iscritto dal: Dec 2004
Città: IV Reich
Messaggi: 18608
|
Quote:
se vai a cercare indietro in questo forum c'è un mio thread in cui, insieme ad altri utenti, vedevamo i risultati globali delle varie cpu utilizzando 2 test contemporaneamente
__________________
Wind3 4G CA |
|
|
|
|
|
#4556 | |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31988
|
Quote:
A mio avviso, visto che oramai sono 7 anni che girano e rigirano confronti BD vs Intel, la cosa è stata volutamente ignorata. "Uno scenario del genere difficilmente è realizzabile nell’utilizzo domestico, ma chi si diletta, in contemporanea, a fare montaggi video, navigare su internet, ascoltare musica e chissà cos’altro potrebbe trovare molto interessante il sapere che la propria CPU è più reattiva di altre." Onestamente per me la cosa va chiarita per bene. L'SMT di Intel è un SMT "semplice", ha come caratteristica di sfruttare un 2° TH negli "spazi" lasciati liberi dal 1° TH, con un incremento max del 30% (tutto dipende dal software, cioè dallo spazio lasciato libero dal 1° TH). Il 3° TH non ha spazio e di conseguenza fa pure rallentare gli altri 2. A parità di core il CMT regge almeno +50% di carico rispetto all'SMT e fino al +100% nel caso i software non utilizzino le stesse unità logiche contemporaneamente. In poche parole, core + SMT = 2TH, modulo CMT da 3 a 4TH. Che tutti utilizzino un PC al massimo per chattare e stare sui forum, io non lo credo, come del resto nemmeno tutti fanno continuamente conversioni video, scaricano film con torrent, antivirus attivo e contemporaneamente giocano, però mi sembra palese che una via di mezzo sia reale. Un X2+2 Intel ha un carico ridotto a 4TH intensivi, quindi già fare solamente una conversione video significa avere il PC carico al 100% (qualsiasi software di conversione video utilizza al minimo 4TH) e non avere il sistema fluido per fare altro. Al contrario, un X4 CMT ha almeno altri 2TH liberi se non 4TH (BD X4 non ha la L3, se il sistema ha 2 banchi di memoria >1600, dual-channel, allora la mancanza di L3 non si sente, diverso come i portatili equipaggiati con 1 banco di RAM, in single channel e magari 1333). Un X4+4 Intel ha 8TH, di certo sufficienti nella maggior parte dei casi, ma di certo inferiori ai 12/16 di un 8350. Un X6+6 e >X6 è palese che non tema il confronto, in primis perchè già un X6+6 ha 12TH e quindi uguale a quanti ne può caricare un 8350, ma avrà anche i core al 100% di potenza vs un 8350 che comunque, anche senza sedersi, dovrà partizionare l'elaborazione su n TH.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 |
|
|
|
|
|
#4557 | |
|
Senior Member
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
|
Quote:
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX |
|
|
|
|
|
#4558 | |
|
Senior Member
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
|
Quote:
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX |
|
|
|
|
|
#4559 | ||||||||||||||
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
Quote:
Quote:
Quote:
- ha avuto problemi col passaggio al nuovo processo produttivo (130 -> 90nm); - ha cambiato il FO4 abbassandolo molto (P3 -> P4). Ma tu guarda un po': "casualmente" mi riguarda quello che è successo ad AMD con Bulldozer. E pensare che c'è gente che continua a voler negare differenze (che riguardano anche IPC basso. E scarse prestazioni in ST, mentre in MT va meglio). Quote:
A me è pure capitato che nello stesso arco di tempo sia cambiata l'implementazione di una tecnologia. Scarico il nuovo SDK dei colleghi cinesi, lo provo e non funziona niente. Gli mando una mail e mi risponde il responsabile: no, guarda, che è cambiata l'implementazione e adesso ti serve almeno questo stepping per far funzionare tutto. "Butto" la mia scheda, e me ne faccio prestare un'altra più nuova da un collega, e "magicamente" il mio codice torna a funzionare. Quote:
Quote:
Quote:
P4 e Core2 Duo implementano entrambi l'Hyperthreading (SMT), ma hanno FO4 molto diversi, e frequenze molto diverse (tenendo conto delle differenze di processo produttivo). Tanto per fare un esempio. Vedremo quando arriverà finalmente qualche informazione in merito. Quote:
![]() Quote:
Quote:
Quote:
Quote:
Quote:
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys Ultima modifica di cdimauro : 29-07-2016 alle 06:54. |
||||||||||||||
|
|
|
|
#4560 | |||||||||
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
Vedi il test di B&C, in cui marchigiano ha ragione: mancano i dati di SuperPi. Che fine hanno fatto? Giusto per essere chiari, se vuoi fare un test serio, devi lanciare contemporaneamente le applicazioni da un tempo x a uno y, e vedere quanto riescano a macinare all'esatto scadere del tempo y. Quote:
Quote:
* Quote:
AnandTech ne ha realizzati in ambito server, dove ci sono parecchi thread in esecuzione, per cui di carico ce n'è anche troppo. E le cose non vanno così bene con BD, come puoi vedere dal link. Quote:
Con CMT devi soltanto sperare che ci siano 2 thread hardware che riescano a impegnare equamente le due macrounità intere. I test, anche MT, di cui ho postato i link parlano chiarissimo. Quote:
Quote:
Per il resto, vedi sopra. Quote:
Inoltre in queste condizioni può riuscire a finire prima un lavoro, e liberare le porte a disposizione dell'altro thread. Quote:
1 modulo = 1 core = 2 TH.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|||||||||
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 01:03.













.








