|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#10561 | |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 32025
|
Quote:
In primis io non sono AMD, quindi se il prodotto che vende AMD non soddisfa il 100% delle persone, questo è un problema AMD e non mio. Io parlo di proci con architettura BD che ho avuto, i quali hanno soddisfatto me e chi li ha comprati in base a prezzo/prestazioni. Punto. Chi voleva più potenza ed è passato ad Intel, qual'è il problema per me? Che Intel offra più potenza, lo sappiamo tutti, ma sappiamo anche che chiede un costo/prestazioni ben superiore e quindi anche le aspettative di chi acquista sono superiori. ----- Se vuoi parlare di architettura, dimentichi tutto il contorno che è mancato a BD, e te lo dimostro senza mettere in causa Intel, altrimenti diventa un discorso di bandiera. Mettiamo il confronto su BD CMT e Zen SMT. Se Buldozer in veste XV fosse portato in toto sul 14nm, si avrebbe un XV X16, a parità di TDP rispetto a Zen e pure a frequenze superiori rispetto a quelle ottenute sul 28nm. Per facilità, lasciamo XV a 4GHz. Come è stato postato più volte, a +40% di IPC, Zen pareggerebbe in ST con BD XV a 3,2GHz, e pareggerebbe in MT sui 3,9GHz, il tutto su un BD XV a 4GHz. Guarda le performances di Zen a 3,4GHz, sarebbero di un buon 15% inferiori rispetto a quelle di XV X16 a 4GHz... Ti basta questo per farti capire che confrontare un 8350 ad un 6900K non è un confronto architetturale, in quanto lo si dovrebbe fare a parità di silicio?
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 Ultima modifica di paolo.oliva2 : 21-12-2016 alle 16:47. |
|
|
|
|
|
#10562 | |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 32025
|
Quote:
Edit OMG Ho riletto i post... mi sembrava... Chiedo scusa a Wolfhang per la mia frase e grazie a Folgore 101 che mi ha ripreso.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 Ultima modifica di paolo.oliva2 : 21-12-2016 alle 16:45. |
|
|
|
|
|
#10563 | |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 32025
|
Quote:
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 |
|
|
|
|
|
#10564 | |
|
Senior Member
Iscritto dal: Feb 2016
Città: Parma
Messaggi: 13030
|
Quote:
Tante soddisfazzzzzioni... Ovviamente con una mobo decente.
__________________
AMD Ryzen 5 5600X - 2x16 GB G.Skill Trident Z Neo Series 3600 MHz CL16 - MSI B550 Gaming Plus - AMD RX6600 8GB - AOC FHD G-Sync Compatibile |
|
|
|
|
|
#10565 |
|
Senior Member
Iscritto dal: Sep 2005
Messaggi: 2177
|
Certo che intervenire qui diventa una scusa per attaccare a prescindere.
Comunque Paolo, Zen da ciò che si è sempre letto tra articoli di siti seri e interviste agli autori/ingegneri dell'architettura, prende il meglio di tutto quello che ha amd nei suoi cassetti. Ovvio che prenda molte tecnologie che hanno inserito anche su XV come banco di prova e dal 2012, con l'arrivo di Keller AMD ha pure licenziato una ventina e più di nuovi brevetti, che da qualche parte in Zen doveva usare.
__________________
__________ Configurazione: Mainboard Gigabyte G1.Sniper A88X (rev. 3.0) ; APU A10 7850K ; HDD Western Digital SATA III WD Blue 1 TB ; Ram Corsair 1866 mhz 16 gb ; OS Seven premium 64 bit |
|
|
|
|
#10566 |
|
Senior Member
Iscritto dal: Jul 2015
Messaggi: 5595
|
Paolo vai tranquillo che AMD tutto quello che ha potuto usare di BD lo ha fatto, e ci puoi scommettere che lo si capirà meglio con ZEN+.
Se guardiamo la cpu in se gia il ccx si richiama a BD, di sicuro zen non è un'evoluzione di BD, ne tantomeno affonda le sue radici sulla struttura cmt, ma sicuramente quando esce una nuova fuoriserie anche se un nuovo modello inedito, qualcosa mutuato dalla vecchia produzione c'è sempre (e mica si reinventa la ruota ad ogni nuova uscita). |
|
|
|
|
#10567 |
|
Bannato
Iscritto dal: Jul 2008
Messaggi: 1998
|
|
|
|
|
|
#10568 | |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 32025
|
Quote:
Che riciclino delle cose è normale... ma credo che anche sto giro il silicio, o meglio la mancanza di un PP decente silicio, farà la sua parte. Però, non credo che tutto il mondo sia sfigato tranne Intel... mi sa che giudicare il PP non fortunato sia la scusa perfetta per non affermare che Intel lo ha fatto meglio, 32nm, 22nm, 14nm.
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 Ultima modifica di paolo.oliva2 : 21-12-2016 alle 20:11. |
|
|
|
|
|
#10569 | |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 32025
|
Quote:
Buona fede sempre...
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 |
|
|
|
|
|
#10570 | |
|
Senior Member
Iscritto dal: Feb 2005
Messaggi: 4992
|
Quote:
quanto alla seconda parte...apprezzo il tuo impegno per analizzare cose così complesse, però se di base non si ha chiaro il funzionamento del componente elementare(e quindi suppongo anche dei vari blocchi logici) poi conseguono supposizioni che non hanno senso di esistere. parleresti di progettare, che ne so, un motore a permanganato di potassio partendo dal presupposto che è un motore quindi basterà che girino delle cose? perché quel tuo discorso è quasi su questo livello. |
|
|
|
|
|
#10571 | |
|
Senior Member
Iscritto dal: Jul 2015
Messaggi: 5595
|
Quote:
Tutto il resto è escluso. L'uso dell'smt obbliga però ad avere core belli prestati. Un core capace di rendere 100 su 4 software diversi porterà l'ht a rendere però in modo diverso. Se il primo software sfrutta le caratteristiche del core al 50% delle proprie funzionalità ( magari perché usa solo 2 delle 4 alu) smt sulla stessa tipologia di software porterà un ipc del + 100% ( non vero per via delle risorse contese dai due th ed ipotizzando alu identiche e sufficiente spazio per i registri ed i puntatori). Allo stesso modo un software che sfrutta già tutte le potenzialità del core lascerà zero risorse al secondo th ed invece che apportare vantaggio rallentano il primo th. Un test su svariati software di diverso tempo fa portava un aumento del 2 th da un minimo del -2% (meno 2%) ad un massimo del +68%. I software ed i core si sono evoluti e credo che si passi dal 18% di media ad un 22% ( smt a 2 vie intel). Ma non dobbiamo credere che un +20 % di transistor portano ad un +30% di ipc, altrimenti sarebbe molto più conveniente l'approccio cmt di AMD che consente di avere core più piccoli ( stimato in circa l'85% di quello smt ) e porterebbe un aumento del +100% in mt ( considera che un core meno cicciottello avrà un ipc sul singolo th che va nel caso migliore uguale e nel caso peggiore a -20%) |
|
|
|
|
|
#10572 | ||||||||||||||||||||||
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
Quote:
Quote:
Quote:
Quote:
Ma la cosa più fastidiosa è vedere il comportamento (incoerente, tra l'altro) di quelli che si sono sollevati in protesta soltanto DOPO che ho risposto, mentre di fronte alle cose di cui sopra sono rimasti bellamente in silenzio, perché evidentemente a questi diversamente onesti sta benissimo così. Se ci fosse una moderazione funzionante non avrei alcun problema a rimanere in riga: mi limiterei ai meri contenuti tecnici, e a usare il testo Segnala, attendendo l'intervento del moderatore. Quando si rifarà vivo e metterà uno stop agli OT et similia, non avrò nessunissimo problema a ritornare nei miei ranghi. E adesso spero che si possa continuare tranquillamente senza finire come l'altro ieri. Quote:
Te ne accorgi per le istruzioni che hanno V come prefisso. Mentre le equivalenti SSE non hanno questo prefisso. Quote:
Quote:
Quote:
Quote:
Ovviamente le FMA4 sono più flessibili perché consentono di specificare 3 sorgenti diverse per i dati da usare per le (due) operazioni concatenate. Ma è una flessibilità relativa, perché comporta una complicazione a livello di implementazione della microarchitettura, visto che in genere prevede un massimo di 2 sorgenti e una destinazione. Inoltre l'FMAC è, per definizione, un'operazione di accumulazione, per cui è ovvio nonché sensato che lo stesso registro sia usato come una delle sorgenti e infine come destinazione; cioé esattamente come funzionano le FMA3. Questo per le FMA, che sono operazioni un po' particolari, ma devo dire che ce ne sono anche altre operazioni ternarie (con 4 operandi), sebbene siano una sparuta minoranza. Tutte le altre sono operazioni binarie (e non distruttive: hanno 3 operandi), o unarie (e non distruttive: 2 operandi). Ovviamente le SSE non possono godere di questi vantaggi, visto che sono quasi sempre con un operando in meno, e dunque spesso distruttive. Il che obbliga in diversi casi a far uso di operazioni extra di "move" (vettoriali), con aumento della densità del codice nonché decadimento prestazionale (mitigato dalla move elimination, per chi la implementa). Quote:
Quote:
Quote:
Quote:
![]() Quote:
Quote:
Quote:
Quote:
Quote:
Quote:
Nel caso di AMD, finora (non sappiamo se Zen cambierà, ma non credo, visto che è un progetto consolidato) si tratta di istruzioni che richiedono più di 2 MOP, che non sono comuni, e anzi a livello di esecuzione sono abbastanza rare. Se ricordi, tuttodigitale aveva postato una bella immagine di Intel con delle statistiche sulla tipologia di istruzioni eseguite, e il 99% (se non ricordo male) non erano microcodificate. Dunque il risparmio con questo nuovo meccanismo c'è sicuramente, ma nel mondo reale non incide, visto che è per lo più per roba legacy (e pochissimo utilizzata). Quote:
Successivamente ha detto che lo potevano fare indipendentemente i due blocchi intero e FPU. Quindi parrebbe un 8+8. Solo che mi pare un po' esagerato, visto che non sono certo scenari comuni quelli in cui si possano superare gli 8 retire. Quote:
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
||||||||||||||||||||||
|
|
|
|
#10573 | ||||||||||||||||
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
I work-around si usano per i bug. Quote:
Quote:
Quote:
Ricorda pure che il limite del decoder di Zen è di 4 istruzioni per ciclo di clock, ma per un solo thread alla volta. E che la micro-op queue invia al massimo 6 uop per ciclo di clock ai due dispatcher. Per cui una retire 8-wide mi sembra ben dimensionata alla scopo. Mentre il doppio è sicuramente molto esagerata. Quote:
Poi la domanda l'ha fatta (reiterata) sulla cache L3, che non mi pare offra prestazioni migliori di quella Intel. Dunque non aveva motivo d'esser nervoso. Sarà che lavora proprio in quell'ambito, e voleva chiarire quel dettaglio. Quote:
E finché non avremo altri, tanti, test diversi, non sapremo come si comporterà Zen e quale sarà di conseguenza la sua efficienza. Quote:
Detto in altri termini, su un processo produttivo nuovo la stessa micro-architettura consente di raggiungere prestazioni migliori, senza essere stata pensata appositamente per quel nuovo processo. Quote:
Quote:
Quote:
Quote:
Quote:
Adesso se uno a lavoro si fa una gran panzata di sonno e poi si risveglia e si sbraccia per recuperare il da fare, gli danno pure il premio produttività? Non mi pare... Quote:
Quote:
Mica è la prima volta... Se non sei sicuro di una cosa, è meglio che eviti di riportarla. Oppure, meglio ancora, cerca qualche fonte a sostegno, così ti levi il dubbio. Ed elimini alla radice i problemi. Quote:
Quote:
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
||||||||||||||||
|
|
|
|
#10574 | |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Quote:
fermo restando che BD con il silicio di Intel avrebbe probabilmente fatto meglio di SB....di questo ne sono certo. |
|
|
|
|
|
#10575 | |
|
Senior Member
Iscritto dal: Sep 2011
Messaggi: 6094
|
Quote:
venendo a noi, avrei una curiosità che nessuno fino adesso a cui l'ho chiesto mi ha saputo rispondere con esattezza e precisione. E quindi chi meglio di te in questo caso. Ne approfitto allora per chiederti delle delucidazioni in merito al seguente quesito: Parto col fatto che so che in linea teorica un affinamento al pp a parità della stessa architettura come ad esempio nel caso di sky e kaby non apporta un miglioramento dell'ipc. La mia domanda e curiosità (e come dicevo a cui non ho avuto mai una risposta concreta), è: prendendo come riferimento ad esempio il socket 775 (non voglio prendere come esempio architetture troppo vecchie) e più precisamente le cpu Core 2 Quad Q9x50 (Yorkfield) se ipoteticamente senza modificare nulla, fosse possibile portare questa architettura all'attuale pp (14nm) credo che ci siano miglioramenti in molti aspetti, in primis nei consumi etc... ma quello che m'interessa sapere, è: anche all'ipc? Per dire un Q9650 a 14nm in questo aspetto (ipc) andrebbe uguale al modello nativo a 45nm o migliorerebbe? E se si, facendo un rapido calcolo a spanne, di quanto? Ti ringrazio anticipatamente per tutto Ultima modifica di Pozhar : 22-12-2016 alle 00:33. |
|
|
|
|
|
#10576 | |
|
Senior Member
Iscritto dal: Sep 2005
Messaggi: 2177
|
Quote:
Aggiungerei a sfavore i pochissimi soldi di AMD in quest'ultimo quasi quinquennio e alla crisi del mercato pc, elementi tutti che all'epoca di BD rappresentavano invece un vantaggio per l'azienda (più soldi da investire e un mercato pc desktop decisamente molto più florido rispetto all'ultimo triennio).
__________________
__________ Configurazione: Mainboard Gigabyte G1.Sniper A88X (rev. 3.0) ; APU A10 7850K ; HDD Western Digital SATA III WD Blue 1 TB ; Ram Corsair 1866 mhz 16 gb ; OS Seven premium 64 bit |
|
|
|
|
|
#10577 | |
|
Senior Member
Iscritto dal: Feb 2005
Messaggi: 4992
|
Quote:
|
|
|
|
|
|
#10578 | |
|
Senior Member
Iscritto dal: Sep 2011
Messaggi: 6094
|
Quote:
E' che m'intessa sapere in modo più approfondito/esaustivo con qualche calcolo/ formula etc.. del perché. sia in caso affermativo che in caso contrario. cioè se è spiegabile e fosse possibile in qualche modo differente... Ultima modifica di Pozhar : 22-12-2016 alle 00:44. |
|
|
|
|
|
#10579 | |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Quote:
Infatti nonostante il fatto che sia presente una sola FP, 4 decoder vs 6 decoder, un modulo BD è grande esattamente quanto 2 core k10 (che sono straordinariamente piccoli paragonati a quelli di SB), segno che i core sono stati riempiti di logica. d'altra parte il fatto che secondo una slide il consumo di ZEN è equiparabile a quella di XV, che però è su un processo planare, la dice lunga su quanto il connubio finfet-ZEN sia imprescindibile....probabilmente, il primo con XV non mostrerebbe il suo massimo, il secondo farebbe addirittura peggio di XV su un processo planare. Ultima modifica di tuttodigitale : 22-12-2016 alle 00:53. |
|
|
|
|
|
#10580 | |
|
Senior Member
Iscritto dal: Feb 2005
Messaggi: 4992
|
Quote:
poi la sua realizzazione fisica può avere dei limiti, e quindi non necessariamente essere superiore ad un'altra o avere vantaggi tali da risultare necessariamente preferibile. |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 18:00.











, e spero che non sei di nuovo in delirio da malaria
Load-store forwarding?

Questo vuol dire che può ritirare 8+8=16 istruzioni per ciclo, contro le 8 di skylake... 







