|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#10821 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
https://translate.google.com/transla...-text=&act=url
Maggiori dettagli sul branch prediciton di Zen. Anche qui sembra essere confermato la possibilità di predirre 2 salti per ciclo anche per lo stesso thread...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
#10822 | |
|
Bannato
Iscritto dal: Sep 2006
Messaggi: 6414
|
Quote:
Come fa ad essere OLD, se il link è stato postato adesso per la prima volta e si riferisce ad un articolo di una fonte esterna che lo ha pubblicato appena qualche ora fa?!?!??
|
|
|
|
|
|
#10823 | |||||||||||||||||
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Quote:
Il grafico di AnandTech mostra uno scenario diverso. Infatti anche le versioni di SandyBridge con le GPU mostrano una densità diversa, segno che il tutto dipenda dal tipo di circuiti implementato. Quote:
Quote:
Quote:
"The article cited below indicates a misprediction penalty of 13 clock cycles. In my tests, however, the misprediction penalty ranged from 8 to 19 clock cycles depending on the subsequent instructions. There was no consistent difference between integer and floating point code in this respect." Riporto nuovamente i dati per BD & compagnia (non c'è XV): "The misprediction penalty is specified as minimum 20 clock cycles for conditional and indirect branches and 15 clock cycles for unconditional jumps and returns. My measurements indicated up to 19 clock cycles for conditional branches and 22 clock cycles for returns." Facendo un confronto, nel caso migliore abbiamo 15 - 8 = 7 stadi, e in quello peggiore 22 - 19 = 3 stadi. Certamente le pipeline sono più lunghe, ma non mi sembra che si possa affermare "a dismisura". Quote:
Quote:
Quote:
Una volta che hai il tuo chip funzionante, puoi farci girare del codice, fare dei test, e avere dei dati. Lo Skylake A0 che ho avuto a disposizione aveva parecchi bug e alcune parti non funzionanti, ma potevo comunque far girare Windows, le applicazioni, e... i miei test. E stiamo parlando di un A0 Intel: il PRIMISSIMO tape-out! Non ho fatto test prestazionali, e non ero al corrente se ci fossero dei bug che limitassero le prestazioni, ma avrei potuto documentarmi o chiedere, e far girare dei benchmark, se avessi voluto. Cosa che non ho fatto, perché mi pagavano per fare il mio lavoro. Quote:
Quote:
Evidentemente coi 32nm si aspettavano di più. Ma è stata una questione di fede. Disattesa. E non per questo si può imputare la causa al processo produttivo di per sé. IBM, inoltre, ha saputo fare di meglio, ma aveva anche altri target sia prestazionali sia di consumi. Difatti i suoi chip hanno raggiunto frequenze elevate, ma con 220W di consumi. Inoltre con la serie Z, sono aumentate enormemente le prestazioni sia sul ST sia sul MT, perché ha saputo sfruttare al meglio il maggior numero di transistor a disposizione. E in questo caso il silicio non c'entra: se decidi di utilizzare i transistor in un modo o in un altro, è una questione puramente progettale. Vedi, in proposito, la differenza col POWER7+, per cui IBM ha preferito sfruttare i nuovi transistor per aumentare soltanto la cache L3, lasciando tutto il resto invariato. Questo a dimostrazione che i transistor sono, invece, molto importanti. Quote:
Quote:
Poi è chiaro che, essendo rimasta al palo dei successivi 28nm, non abbia potuto sfruttare un silicio migliore. Ma ciò non toglie che invece di ritoccare BD, che era oggettivamente scarsa (vedi i benchmark che ho postato prima), avrebbe potuto puntare a una micro-architettura diversa e più simile alle precedenti, che erano più efficienti. Invece ha preferito far evolvere BD in tutte le salse, e soltanto con Zen ha dato un taglio netto col passato. Quote:
Quote:
![]() Quote:
Quote:
Inoltre non è dato sapere se questi bug affliggono le prestazioni, e in questo caso in che modo. Quote:
Quote:
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|||||||||||||||||
|
|
|
|
#10824 | |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Quote:
Il power7+ non è stato cosi fortunato: il 10% scarso sul p7 mi pare troppo poco per un die shrink Ultima modifica di tuttodigitale : 27-12-2016 alle 09:23. |
|
|
|
|
|
#10825 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Germania
Messaggi: 26110
|
Ho già riportato i dati in passato, per ben due volte: rispetto a POWER7, il POWER7+ ha aumentato il clock, soprattutto col turbo, e consumando di meno.
zNext, in ogni caso, ha portato ENORMI miglioramenti prestazionali a prescindere dal clock (che peraltro è aumentato di poco): perché ha saputo sfruttare MOLTO MEGLIO i tanti transistor in più.
__________________
Per iniziare a programmare c'è solo Python con questo o quest'altro (più avanzato) libro @LinkedIn Non parlo in alcun modo a nome dell'azienda per la quale lavoro Ho poco tempo per frequentare il forum; eventualmente, contattatemi in PVT o nel mio sito. Fanboys |
|
|
|
|
#10826 | ||
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
Quote:
Comunque lo schema del sito giapponese mi da un altro vantaggio per la microcode rom in quella posizione: può sparare 6 uops ciclo, anzichè 4...
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
||
|
|
|
|
#10827 | ||||||||||
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Quote:
Quote:
se 2 cpu ad una frequenza X lavorano a 1V e l'altra a 1,4V, ti pare che sia così decisivo la grandezza del core? i core Jaguar, che hanno 15 stadi (dato ufficiale), murano in OC con i 28nm HDL a 2,8GHz@1,475V.... valori molto diversi da quelli di XV. Quote:
Quote:
e acnhe il die è occupata da molti collegamenti HT, necessari anche per la configurazione dual die, oltre ad essere progettati per essere installati in piattaforme 4P. Quote:
Quote:
Quote:
poi se proprio vogliamo dirla tutta, c'è uno studio IBM in cui si consiglia un FO4 molto ridotto.. Quote:
Quote:
Quote:
Ultima modifica di tuttodigitale : 27-12-2016 alle 10:53. |
||||||||||
|
|
|
|
#10828 |
|
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 32018
|
Io non mi intendo di software, ma si continua a dire che nei giochi conti IPC*Frequena (visto come potenza massima a core) e che un numero di core >4 sia perfettamente inutile perchè il software non sarebbe in grado di sfruttare.
Ma allora perchè le console game sono l'esatto contrario? IPC*frequenza bassi e 8 core? Perchè AMD ha vinto tutte le commesse? Stando al discorso sopra, un i3 3GHz dovrebbe dare di più e non credo che AMD abbia venduto un Jaguar X8 perchè minor prezzo di un i3 magari perfino senza iGPU. Le console possono avere uno sviluppo software proprietario, nel senso studiato appositamente per gli 8 core? Ma allora... se ci fosse un'invasione di software game progettato per 8 core e non 8TH, come risulterebbe il mercato?
__________________
9950X PBO 1X CO -33 Override +100 CPU-Z RS/DU 930/18.563 - CB23-2339 - 47682 47728 -CB24 144 2508 - OCCT - V-RAY 53.994 - GeekBench 6.3 3563/22664 - TEST RS Y-Cruncher BKT - core 0-15 NPbench - CPU-Z 19207 - CB23 49265 - CB24 2593 |
|
|
|
|
#10829 | |
|
Senior Member
Iscritto dal: Feb 2005
Messaggi: 4992
|
Quote:
tu hai un Hw chiuso con degli sdk e la possibilità di monitorare effettivamente quanto saturi delle risorse a disposizione. su pc devi gestire la cosa in maniera impersonale per renderlo fruibile a vari livelli con architetture e capacità di calcolo diverse. spesso su pc fanno porting fatti male proprio perché per girare su tutto le risorse vengono gestite in maniera poco ottimizzata. |
|
|
|
|
|
#10830 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#10831 |
|
Senior Member
Iscritto dal: Feb 2005
Messaggi: 4992
|
mi sono accorto di aver saltato questo punto.
la ragione può riguardare esclusivamente il prezzo e le potenzialità del connubio cpu/gpu offerta. la ps3 ad esempio, o la prima xbox, avevano gpu nvidia ma abbinate ad altri processori(il cell ed un celeron 700 - mi pare - per fare un esempio). ora andando in direzione simil pc con architettura di tipo x86 (probabilmente per facilità di programmazione, e nel caso di M$ in particolare per la derivazione dell'o.s. e delle librerie da quelle dell'o.s. pc) non esiste un'alternativa paragonabile ad amd perché: -intel lato gpu è comunque ad un livello prestazionale inferiore ed è l'aspetto più rilevante nei giochi, che non può essere compensato da cpu più performante (per intenderci una gtx 1080 su un fx 4300 ti offre di più di una gtx 750 su un i7 6700K); -rimane il pressoché certo abbattimento dei costi prendendo una fornitura unica di apu da amd anziché ad esempio una gpu da nvidia o ati ed una cpu da terzi (ad esempio la xbox 360 vedeva abbinato un ppc ed una gpu ati - che sarà probabilmente costata meno di una nvidia). |
|
|
|
|
#10832 |
|
Senior Member
Iscritto dal: Feb 2005
Messaggi: 4992
|
|
|
|
|
|
#10833 | |
|
Bannato
Iscritto dal: Sep 2006
Messaggi: 6414
|
Quote:
|
|
|
|
|
|
#10834 |
|
Senior Member
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
|
|
|
|
|
|
#10835 | |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Quote:
Ultima modifica di tuttodigitale : 27-12-2016 alle 14:29. |
|
|
|
|
|
#10836 | |
|
Senior Member
Iscritto dal: Sep 2010
Messaggi: 4387
|
Quote:
Senza considerare il fatto che un prodotto monolitico permette di riutilizzare transistor, come il MC di PS4.... dall'altra è inutile girarci attorno, se non sarebbero in grado di sfruttare i core non avrebbero valutato una soluzione del genere, dotata di prestazioni molto basse nel ST, ma avrebbero semplicemente continuato ad utilizzare soluzione gpu e cpu distinte. Ultima modifica di tuttodigitale : 27-12-2016 alle 14:54. |
|
|
|
|
|
#10837 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
|
#10838 |
|
Senior Member
Iscritto dal: Apr 2015
Messaggi: 10200
|
Non so se già postato ma quella preview non finiva lì, c'era anche altro in merito a ryzen http://imgur.com/a/qo9pH
|
|
|
|
|
#10839 |
|
Senior Member
Iscritto dal: Dec 2005
Città: Ibiza - Malta - Udine
Messaggi: 6420
|
Chiedo agli esperti: Una Apu Zen 4c/8t a che cpu sky/kaby lake potrebbe essere paragonata come prestazioni lato x86 secondo i calcoli fino a qui stimati? E teoricamente quando potrebbero verosimilmente essere commercializzate? Grazie.
__________________
PC: "Che te lo dico a fare" |
|
|
|
|
#10840 | |
|
Senior Member
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
|
Quote:
IBQ: coda dei bytes dalla L1I. 20x16Bytes. Nelle vecchie CPU era 2 o 4 (non ricordo, comunque poco) x16B. 10 per thread in modalità SMT. Interessante. uop cache: 2k istruzioni. Per INTEL se non sbaglio è 1.5K e in Zen comunque non ci vanno le istruzioni microcodificate perchè c'è solo il puntatore. Inoltre in genere le MOP AMD sono più dense delle uop INTEL, ossia in media un programma è tradotto in meno uops in AMD. Interessantissimo se vero. uop cache throughput: 8uops ciclo. Questo non è specificato nelle slide di hot chips (ho verificato: 6uop ciclo è il dispatch, come detto anche dai francesi, ma l'output dalla uop cache non era specificato), inoltre mancano microcode rom e stack memfile dal diagramma. Confronta con INTEL che ha 1.5K entry e 6 uop ciclo. Interessantissimo se vero.
__________________
0 A.D. React OS La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani... IL MIO PROFILO SOUNDCLOUD! |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 00:46.





















