Torna indietro   Hardware Upgrade Forum > Componenti Hardware > Processori

Le soluzioni FSP per il 2026: potenza e IA al centro
Le soluzioni FSP per il 2026: potenza e IA al centro
In occasione del Tech Tour 2025 della European Hardware Association abbiamo incontrato a Taiwan FSP, azienda impegnata nella produzione di alimentatori, chassis e soluzioni di raffreddamento tanto per clienti OEM come a proprio marchio. Potenze sempre più elevate negli alimentatori per far fronte alle necessità delle elaborazioni di intelligenza artificiale.
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa
AWS è il principale operatore di servizi cloud al mondo e da tempo parla delle misure che mette in atto per garantire una maggiore sovranità alle organizzazioni europee. L'azienda ha ora lanciato AWS European Sovereign Cloud, una soluzione specificamente progettata per essere separata e distinta dal cloud "normale" e offrire maggiori tutele e garanzie di sovranità
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto
Xiaomi ha portato sul mercato internazionale la nuova serie Redmi Note, che rappresenta spesso una delle migliori scelte per chi non vuole spendere molto. Il modello 15 Pro+ punta tutto su una batteria capiente e su un ampio display luminoso, sacrificando qualcosa in termini di potenza bruta e velocità di ricarica
Tutti gli articoli Tutte le news

Vai al Forum
Discussione Chiusa
 
Strumenti
Old 06-04-2016, 13:21   #1261
digieffe
Senior Member
 
L'Avatar di digieffe
 
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
Quote:
Originariamente inviato da gridracedriver Guarda i messaggi

SB sarebbe sandy bridge?

Carrizo è XV ovvero 845, mentre Bristol Ridge sarà sia su mobile che su desktop ed è un Carrizo con steroidi

in ST l'IPC grosso modo è così:

PD 100 ----- +5~7%
SR 105~107 +12~15%
XV 120 ----- +40%
Zn 168
SB = refuso : BD

quindi BristolR è il successore di carizzo prima della apu zen?
digieffe è offline  
Old 06-04-2016, 13:24   #1262
digieffe
Senior Member
 
L'Avatar di digieffe
 
Iscritto dal: Oct 2003
Città: Milano
Messaggi: 4080
Quote:
Originariamente inviato da gridracedriver Guarda i messaggi

Fixed


anche a 3ghz rullerebbe abbastanza, ma non stai considerando che L'ES di bulldozer FX-8150 nel giugno 2011 con step B0/B1 girava a 2.8ghz def e 3.2ghz turbo poi portato a 3.6/4ghz come step B2g ad ottobre 2011

ci sono tutte le carte per girare a frequenza def 4ghz e turbo 4.4ghz

e non consideri che salire di frequenza con un fo4 basso è molto più facile e meno dispendioso in termini di watt rispetto ad un fo4 medio come appunto fo4 15~17 vs 22~24

ps. alta frequenza non vuol dire basso IPC per forza
sono d'accordo con il fatto che ci sono tutte le carte per girare a frequenza def 4ghz e turbo 4.4ghz, ma non a 95w... probabilmente 140w
digieffe è offline  
Old 06-04-2016, 13:35   #1263
george_p
Senior Member
 
L'Avatar di george_p
 
Iscritto dal: Sep 2005
Messaggi: 2177
Bisogna poi capire cosa significhi allora "e sfrutta alcune nuove tweak" dove tweak dovrebbe essere "miglioria".
Sono sempre dell'idea che far uscire un excavator per desktop con le stesse prestazioni del carrizo mobile... bah, scelta da polli.

Staremo a vedere quando esce.
__________________
__________
Configurazione:
Mainboard Gigabyte G1.Sniper A88X (rev. 3.0) ; APU A10 7850K ; HDD Western Digital SATA III  WD Blue 1 TB ; Ram Corsair 1866 mhz 16 gb ; OS Seven premium 64 bit
george_p è offline  
Old 06-04-2016, 14:31   #1264
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Non ricordo dove l'ho letto, comunque mi sembra plausibile l'IPC ST, perchè non si può confrontare mele (SMT) con pere (CMT) e se intentevano throughput, scrivevano throughput e non IPC...
questa dove salta fuori
throughput e ipc sono concetti diversi seppur collegati tra loro. Da quanto IPC è diventato sinonimo di ILP?
uno studio del 2005 dell'University of Rhode Island, è intitolato ILP is Dead, Long Live IPC! , sotto intendendo che è possibile migliorare l'ipc sacrificando le prestazioni nel ST.:

Non voglio che qualcuno ci rimanga male...le latenze sono molto alte, AMD non ha mai parlato di ILP, ma si è fermata ad un generico IPC. E poi che senso ha fare confronti disabilitando il SMT, è pur sempre una caratteristica importante del core ZEN.

Quote:
Originariamente inviato da davo30 Guarda i messaggi
E poi arriva Cioccofoundry con i 14nm che reggono al massimo 3ghz e siamo punto è a capo.

Inviato dal mio XT1092 utilizzando Tapatalk
se reggono massimo 3 GHzcon un fo4 17, sulla carta sono solo 2,1GHz per un FO4 24....
se il silicio è pessimo lo sarà anche per l'architettura ad alto IPC

Quote:
Originariamente inviato da davo30 Guarda i messaggi
Si ma da 3 a 5ghz è come passare da una panda a un Ferrari..... Mi pare improbabile che abbiano scelto di rifare un'architettura basata sulle alte frequenze. Per me sarebbe una scelta totalmente folle, più che altro vista la fonderia partner che si ritrova
invito a riflettero di quanto sia andato bene k10 sui 32nm , con ben 6 mesi di sviluppo non programmato.
il silicio non guarda in faccia a nessuno. Se fa schifo, fa schifo, c'è poco da fare.
tuttodigitale è offline  
Old 06-04-2016, 14:38   #1265
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da digieffe Guarda i messaggi
sono d'accordo con il fatto che ci sono tutte le carte per girare a frequenza def 4ghz e turbo 4.4ghz, ma non a 95w... probabilmente 140w
manca un elemento fondamentale la complessità di ZEN.
Come ha detto bjt2, al momento non c'è motivo per pensare ad un decadimento delle prestazioni per transistor rispetto a XV..
un +40% di ipc potrebbe tradursi in appena +40% (pure meno) rispetto ad XV.
Questo significherebbe che un core Skylake sarebbe comunque più grande del 50% circa...un octa core potrebbe essere più piccolo a di un 6 core..
considerando che il FO4, a 4 GHz potrebbe voler dire 1-1,1V....probabilmente saremmo abbondantemente sotto al TDP...
tuttodigitale è offline  
Old 06-04-2016, 14:48   #1266
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Guardando le latenze delle istruzioni direi di NO: Jaguar ci mette 43 cicli per fare una divisione intera a 128/64 bit. Ed è una architettura low cost e low power. Zen ci mette circa il doppio e un po' di più di BD. Perchè l'architettura di punta dovrebbe metterci di più di una a basso consumo? L'unica spiegazione è che il FO4 di Zen è al massimo pari a quello di BD...

Quindi non ho capito na fava

Se ha lo stesso FO4 di BD, non dovrebbe avere una pipe con molti stadi e vocazione per le alte frequenze? Quindi, in teoria, un IPC molto più basso di un Haswell/Broadwell?
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 06-04-2016, 14:51   #1267
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da paolo.oliva2 Guarda i messaggi
@Bjt2

A prescindere da quale frequenza def potrà arrivare Zen X8, credo che comunque il 14nm FinFet abbia una impennata di TDP oltre una certa frequenza.
questa frequenza è 4,1GHz HDL
4,7GHz HPL
su uno sconosciuto core ARM (visto che è Samsung credo sia l'a72). C'è da stare tranquilli

Stasera cerco quel bel grafico (giuro).. c'è anche l'andamento del consumo (per adesso ti accenno che mi è sembrato straordinariamente buono) a variare della frequenze, con le varie combinazioni di transistor e librerie

Ultima modifica di tuttodigitale : 06-04-2016 alle 14:54.
tuttodigitale è offline  
Old 06-04-2016, 14:56   #1268
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
http://forums.anandtech.com/showpost...&postcount=187
Ancora sulle AVX: Carrizo è più lenta su AVX di Skylake, mentre Jaguar, nonostante il clock più basso, rivaleggia con Skylake e lo batte anche in un test. Il team di jaguar è confluito in quello di Zen e si aspetta che Zen sia una sorta di doppio Jaguar che esegue 2 thread in SMT, ottimizzato per le alte frequenze (leggi: con un FO4 minore di Jaguar)...
EDIT: Jaguar straccia Skylake nella latenza, anche assoluta, tenendo conto del clock, ma ovviamente skylake lo straccia nel throughput perchè ha 2 unità a 256bit contro le una a 128b di jaguar... Ma se accoppi la latenza di jaguar, con le 4 pipeline FP128...
Quindi sarebbero partiti dall'architettura jaguar...
Sinceramente ci speravo, dall'alto della mia ignoranza, a occhio mi è sempre parsa la cosa più sensata..
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 06-04-2016, 15:04   #1269
Free Gordon
Senior Member
 
L'Avatar di Free Gordon
 
Iscritto dal: Mar 2004
Città: Eporedia
Messaggi: 13454
Quote:
Originariamente inviato da gridracedriver Guarda i messaggi
le hanno fuse
hanno preso il meglio di XV, il meglio di Jaguar e aggiunto il talento di Keller
Speriamo sia un minestrone piccante e afrodisiaco!

Forza AMD!!!!
__________________
AMD Ryzen 1700 - Asrock B450 GAMING-ITX/AC - G-Skill RipjawsV 2X8GB 2660mhz - Sapphire Pulse RX 570 ITX - Crucial MX500 m.2 - Corsair Vengeance 500W - Sharkoon Shark Zone C10 Mini ITX
Free Gordon è offline  
Old 06-04-2016, 15:25   #1270
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da tuttodigitale Guarda i messaggi
questa dove salta fuori
throughput e ipc sono concetti diversi seppur collegati tra loro. Da quanto IPC è diventato sinonimo di ILP?
uno studio del 2005 dell'University of Rhode Island, è intitolato ILP is Dead, Long Live IPC! , sotto intendendo che è possibile migliorare l'ipc sacrificando le prestazioni nel ST.:
Questa non l'ho capita. IPC sta per istruzioni per clock. Migliorare l'IPC sacrificando le prestazioni nell'ST può solo significare che per avere un IPC più alto, si è dovuti sacrificare il clock massimo... Per IPC in ST intendo dire proprio quello che ho detto: istruzioni per clock con un core Zen caricato con un solo thread... Indipendentemente dal fatto che per salire in IPC hanno dovuto sacrificare il clock massimo oppure no (come noi speriamo). Cos'altro può significare?

Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Quindi non ho capito na fava

Se ha lo stesso FO4 di BD, non dovrebbe avere una pipe con molti stadi e vocazione per le alte frequenze? Quindi, in teoria, un IPC molto più basso di un Haswell/Broadwell?
Si può fare una architettura a basso FO4 e alto IPC...

Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Quindi sarebbero partiti dall'architettura jaguar...
Sinceramente ci speravo, dall'alto della mia ignoranza, a occhio mi è sempre parsa la cosa più sensata..
Guardando le prestazioni AVX si, ma il divisore intero è più lento di quello di Jaguar...
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline  
Old 06-04-2016, 15:31   #1271
Mister D
Bannato
 
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
Quote:
Originariamente inviato da tuttodigitale Guarda i messaggi
Voglio solo ricordare che è solo la nostra interpretazione, magari viziata dagli ottimi risultati dell'architettura Intel, ci ha portato a credere fin da subito ad un aumento di tale entità nel ST.. Ma chi l'ha detto? AMD? Certo che no!

+40% di ipc core to core, da che mondo è mondo, significa che un core esegue complessivamente +40% di istruzioni per ciclo di clock. E, guarda caso, il SMT è una tecnica utile ad aumentare l'ipc attraverso il parallelismo a livello di thread (TLP).
Siamo noi, che abbiamo interpretato questo fatto come Single Threaded IPC, quello ottenuto mediante il parallelismo a livello di istruzione (ILP).

occhio. che 4GHz +40% di ipc complessivo, siamo già a livello di un esacore, e in 95W non è male. A 5GHz, cosa tutt'altro che remota (viste le latenze sembrerebbe raggiungibile in piena efficienza addirittura con le HDL ) , siamo a livelli superiori dell'octa-core (prestazioni core to core più alte )

Ho qualche perplessità sull'ipc, ma le prestazioni, con un clock di SOLI 4GHz, saranno estremamente positive, soprattutto considerando i 95W, in tutti i casi, anche quello di ipc basso...
Tuttodigitale e lo dici come me??
Sono sempre stato un sostenitore dell'architettura BD e un fortemente critico sulla prima implementazione causa sia sfiga atavica sui pp soi sia su alcune scelte sbagliate dettate chissà da quali ragionamenti (poco tempo per arrivare in tempo sul mercato quando si era già in ritardo, aspettative altissime sul silicio, ingegneri che avevano alzato il gomito, boh) ergo a me fa piacere vedere che hanno mantenuto lo stesso FO4 a patto che la cpu vada indipendentemente dal silicio e questo vuol dire che sebbene la tua teoria possa essere valida c'è un ma. Ok il SMT aiuta il parallelismo ma se loro intendono quello non puoi scrivere, per me, +40% IPC rispetto core XV.
Se era quello avrebbero messo +40 rispetto modulo XV (perché il CMT è un altro metodo di aumento del parallelismo, a livello di thread e non di istruzione). Io rimango dell'idea che visto quanto amd abbia preso m*** in faccia sulle prestazioni in ST dei propri core, penso invece che quel +40% sia da intendersi esattamente sul core singolo e in ST. E poi aggiungi il SMT come aumento in MT a contrasto di una vera seconda unità integer di un mudulo.
In definitiva credo che sia più valido il calcolo mio modo1 che il modo2 (+40% modulo XV SMT compreso) e se ti ricordi il calcolo modo1 veniva minore del modo2.
La tua obbiezione è che si potrebbe pensare: ma come cavolo si fa ad aumentare in ST del 40% le prestazioni di un core di solo IPC senza considerare il SMT e senza aumentare il FO4? Risposta: Keller
Mister D è offline  
Old 06-04-2016, 15:52   #1272
tuttodigitale
Senior Member
 
Iscritto dal: Sep 2010
Messaggi: 4387
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Questa non l'ho capita. IPC sta per istruzioni per clock. Migliorare l'IPC sacrificando le prestazioni nell'ST può solo significare che per avere un IPC più alto, si è dovuti sacrificare il clock massimo... Per IPC in ST intendo dire proprio quello che ho detto: istruzioni per clock con un core Zen caricato con un solo thread... Indipendentemente dal fatto che per salire in IPC hanno dovuto sacrificare il clock massimo oppure no (come noi speriamo). Cos'altro può significare?
IPC significa semplicemente istruzioni per clock: un supercomputer elabora certamente più istruzioni per ciclo di clock grazie alle migliaia di unità di calcolo presenti...
un aumento dell'ipc si può ottenere anche aumentando semplicemente le unità di calcolo, mediante il parallelismo a livello di thread

Quote:
Originariamente inviato da gridracedriver Guarda i messaggi
mi focalizzerei su questo punto

è stato apertamente detto che è una architettura orientata a 360°, per tanto fatta anche per viaggiare a medio-basse frequenze senza sacrificare troppo le prestazioni a vantaggio del TDP (mobile?).
il fo4 17, è secondo il famoso studio IBM, adatto anche al mobile.Ed XV ha confermato ampiamente questo fatto..

PS quella famosa (a furia di ripeterlo) ignota architettura Arm, gira a 3,3 GHz (3 GHz con buona efficienza) con transistor RVT, quelli usati dai SoC da pochi watt, seppur appesantiti dalle HDL. Penso di avere detto tutto ,

Ultima modifica di tuttodigitale : 06-04-2016 alle 16:00.
tuttodigitale è offline  
Old 06-04-2016, 16:01   #1273
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da tuttodigitale Guarda i messaggi
IPC significa semplicemente istruzioni per clock: un supercomputer elabora certamente più istruzioni per ciclo di clock grazie alle migliaia di unità di calcolo presenti...
un aumento dell'ipc si può ottenere anche aumentando semplicemente le unità di calcolo, mediante il parallelismo a livello di thread
Infatti Zen ha più porte di INTEL e anche di BD e potenzialmente potrebbe avere un IPC in ST anche più alto dei vari INTEL... Ma ovviamente poi ci sono le dipendenze tra le varie istruzioni e l'esecuzione speculativa e out of order ecc...

Attenzione: io mi riferisco all'IPC di una singola unità (CPU core) e con un solo thread... L'IPC che tu citi di un supercomputer è appunto il numero di istruzioni TOTALI (medio, massimo, a seconda di cosa si vuole dire) che un sistema può processare per clock, se caricato con un numero adeguato di thread, ad esempio PEAK FLOPS per una GPU, oppure nell'era delle battaglie RISC vs CISC si confrontavano le MIPS medie o su un dato carico di riferimento, ma qui era già più difficile perchè la I sta per istruzioni, mentre in FLOPS la O sta per operazioni ed è più definita: ad esempio una FMAC è una istruzione ma due operazioni... Per risolvere sono stati inventati i benchmark come lo SPEC (int, fp, totale), in modo da definire una prestazione più o meno assoluta... Insomma un casino...
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline  
Old 06-04-2016, 16:28   #1274
Mister D
Bannato
 
Iscritto dal: Jun 2011
Città: Forlì
Messaggi: 8199
Quote:
Originariamente inviato da tuttodigitale Guarda i messaggi
questa dove salta fuori
throughput e ipc sono concetti diversi seppur collegati tra loro. Da quanto IPC è diventato sinonimo di ILP?
uno studio del 2005 dell'University of Rhode Island, è intitolato ILP is Dead, Long Live IPC! , sotto intendendo che è possibile migliorare l'ipc sacrificando le prestazioni nel ST.:

Non voglio che qualcuno ci rimanga male...le latenze sono molto alte, AMD non ha mai parlato di ILP, ma si è fermata ad un generico IPC. E poi che senso ha fare confronti disabilitando il SMT, è pur sempre una caratteristica importante del core ZEN.

cut...
Quello studio appunto (e intuisco dal titolo molto espressivo) sembrerebbe dire che se aumentare ancora la complessità di un core a livello di pipeline (ergo >FO4 o aumento n.ro pipeline -> modi di incremento dell'ILP) è poco fattibile per aumento die size (perché si aumentano i transistor con quei 2 metodi di incremento dell'ILP) che a suo volta fa diminuire la resa produttiva e le frequenze gestibili da quell'architettura, si può aumentare l'IPC in altro modo. Ora io non me la sono letto l'articolo (e se riesci a trovarlo e postarlo, gliela do volentieri una letta) suppongo che quando dice IPC non intenda anche troughput ma proprio l'aumento delle istruzioni processate in un ciclo di clock. Probabilmente suggerisce che è arrivato il momento di ripensare le istruzioni, le varie operazioni su queste e su tutti gli altri possibili colli di bottiglia che stanno intorno al core, soprattutto se il core è già complesso. E questo lo ricollego allo studio di IBM, ricordato ancora da bjt2 e che anche tu conosci, in cui il FO4 17 è idealmente il miglior compromesso per massimizzare IPC*freq/consumo. IPC*freq che ricordo essere le IPS istruzioni per secondo.
Detto questo se il livello di parallelismo delle istruzioni può essere aumentato attraverso aumento del numero delle pipe o della complessità delle stesse, il SMT non ha questo scopo. Il SMT aumenta il thruoghput (la tradurrei come capacità di elaborazione) attraverso lo sfruttamento dei tempi morti delle stesse pipe simulando all'OS la presenza di uno o più core. E infatti in un SMT a 2 vie ogni core processa simultaneamente 2 thread e l'OS pensa che ci siano 2 core. Ma quando processa 2 thread? Quando questi 2 benedetti thread non sono in relazione di dipendenza e quando le pipeline sono in attesa per uno dei due. Quando la pipe è in attesa? Dipende dal software. Se il software ha codice che può essere parallelizzato questo viene gestito in tanti piccoli thread e non essendo in relazioni di dipendenza vengono messi in pasto ai core che però rimangono singoli e solo per il raddoppio dei registri possono processare 2 thread, ma se il software è composto da codice seriale il SMT potrà far poco o nulla. E poi si aggiunge l'ottimizzazione del codice di un software. Se un codice, anche seriale, è scritto per ottimizzare i tempi di elaborazione farà stallare poco le pipe (ergo pochi tempi morti) ergo ancora entrerà poco in gioco il SMT. Viceversa un software scritto ad cacchium sai quanti tempi morti può introdurre? Ergo il SMT ti aiuta, altrimenti puoi avere la tua potentissima architettura a IPC stellare (chi ha detto intel?) e poi girarsi i pollici
Dove voglio arrivare? Semplicemente che sarebbe stato poco furbo per amd fare una previsione sul loro SMT perché nonostante in fase di progettazione e sviluppo prototipico abbiano degli strumenti di simulazione, come fai a sapere quando realmente uscirà la tua cpu come sarà scritto il software??? E' da pazzi pensare di tirare fuori un numero medio da sbattere sul tavolo degli azionisti (e poi sui nostri monitor). Pensaci ma è più facile che con tutto quello che hanno progettato su carta abbiano fatto simulazioni su quante istruzioni il singolo core possa processare in un ciclo di clock. Ma non avete notato che se per llano si erano sbilanciati sulla frequenza sulle slide qua su zen hanno scritto solo cose sicure:
- architettura fortemente rivista con "disegno completamente nuovo del core" basata su IPC alto (e qua si sono sbilanciati su un numero);
- adozione del SMT per aumentare il thruoghput;
- Alta banda passante e sistema di cache a bassa latenza (ma quanto bassa? e con riferimento a che frequenza?????);
- cpu ad alta efficienza grazie ai Finfet.

Questo si legge dalle slide oltre quella famosa del +40%. Non hanno specificato nulla su cui non potevano dare numeri (e meno male dico io, perché forse con l'altra dirigenza avremmo avuto slide piene zeppe di numeri su previsioni fatte dall'Ing. Cane cit. "Mille") e cioè quando basse le latenze perché dipende dal silicio, quanto efficiente perché dipende dal silicio e quanta frequenza perché dipende dal silicio.
L'unico numero è sull'IPC che è difficile da considerare in MT perché quello sarebbe ancora il thruoghput. Anzi hanno proprio evidenziato "Zen core" "Excavatore core". Non so mica, ma cosa dovevano scrivere? Quel +40% per me si riferisce all'ipc in st e non vedo altra strada.

PS: ho fatto il mio mappazzone ah ah

Ultima modifica di Mister D : 06-04-2016 alle 16:35.
Mister D è offline  
Old 06-04-2016, 17:15   #1275
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Originariamente inviato da tuttodigitale Guarda i messaggi
questa frequenza è 4,1GHz HDL
4,7GHz HPL
su uno sconosciuto core ARM (visto che è Samsung credo sia l'a72). C'è da stare tranquilli

Stasera cerco quel bel grafico (giuro).. c'è anche l'andamento del consumo (per adesso ti accenno che mi è sembrato straordinariamente buono) a variare della frequenze, con le varie combinazioni di transistor e librerie
Dai che siamo curiosi...

Cerca anche le condizioni del test, magari è stato fatto su Marte, dove i TDP sono bassi ad alta frequenza...
Ren è offline  
Old 06-04-2016, 17:23   #1276
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31994
Quote:
Originariamente inviato da Free Gordon Guarda i messaggi
Quindi sarebbero partiti dall'architettura jaguar...
Sinceramente ci speravo, dall'alto della mia ignoranza, a occhio mi è sempre parsa la cosa più sensata..
Veramente quando era uscito Jaguar che non aveva il CMT, io avevo detto che se il problema fosse il CMT, perchè non sviluppare Jaguar? Mi hanno mangiato la faccia icendo che era un procio per gioco.....
paolo.oliva2 è offline  
Old 06-04-2016, 17:31   #1277
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Una cosa che non sapevo: 4 cicli di latenza ipotizzati per la L1... Una tale alta latenza vuol dire o che AMD fa schifo nel fare caches, oppure che Zen è una CPU ad alto clock... Scegliete pure...
Anche intel usa 4 cicli di latenza, forse dettati dalla complessità del BP.
Ren è offline  
Old 06-04-2016, 17:36   #1278
bjt2
Senior Member
 
L'Avatar di bjt2
 
Iscritto dal: Apr 2005
Città: Napoli
Messaggi: 6817
Quote:
Originariamente inviato da Ren Guarda i messaggi
Anche intel usa 4 cicli di latenza, forse dettati dalla complessità del BP.
Magari ha molte vie...
__________________
0 A.D. React OS
La vita è troppo bella per rovinarsela per i piccoli problemi quotidiani...
IL MIO PROFILO SOUNDCLOUD! IL MIO CANALE YOUTUBE! IL MIO PLUGIN VST PROGRAMMABILE!
bjt2 è offline  
Old 06-04-2016, 17:43   #1279
paolo.oliva2
Senior Member
 
L'Avatar di paolo.oliva2
 
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 31994
Quote:
Originariamente inviato da Mister D Guarda i messaggi
Quello studio appunto (e intuisco dal titolo molto espressivo) sembrerebbe dire che se aumentare ancora la complessità di un core a livello di pipeline (ergo >FO4 o aumento n.ro pipeline -> modi di incremento dell'ILP) è poco fattibile per aumento die size (perché si aumentano i transistor con quei 2 metodi di incremento dell'ILP) che a suo volta fa diminuire la resa produttiva e le frequenze gestibili da quell'architettura, si può aumentare l'IPC in altro modo. Ora io non me la sono letto l'articolo (e se riesci a trovarlo e postarlo, gliela do volentieri una letta) suppongo che quando dice IPC non intenda anche troughput ma proprio l'aumento delle istruzioni processate in un ciclo di clock. Probabilmente suggerisce che è arrivato il momento di ripensare le istruzioni, le varie operazioni su queste e su tutti gli altri possibili colli di bottiglia che stanno intorno al core, soprattutto se il core è già complesso. E questo lo ricollego allo studio di IBM, ricordato ancora da bjt2 e che anche tu conosci, in cui il FO4 17 è idealmente il miglior compromesso per massimizzare IPC*freq/consumo. IPC*freq che ricordo essere le IPS istruzioni per secondo.
Detto questo se il livello di parallelismo delle istruzioni può essere aumentato attraverso aumento del numero delle pipe o della complessità delle stesse, il SMT non ha questo scopo. Il SMT aumenta il thruoghput (la tradurrei come capacità di elaborazione) attraverso lo sfruttamento dei tempi morti delle stesse pipe simulando all'OS la presenza di uno o più core. E infatti in un SMT a 2 vie ogni core processa simultaneamente 2 thread e l'OS pensa che ci siano 2 core. Ma quando processa 2 thread? Quando questi 2 benedetti thread non sono in relazione di dipendenza e quando le pipeline sono in attesa per uno dei due. Quando la pipe è in attesa? Dipende dal software. Se il software ha codice che può essere parallelizzato questo viene gestito in tanti piccoli thread e non essendo in relazioni di dipendenza vengono messi in pasto ai core che però rimangono singoli e solo per il raddoppio dei registri possono processare 2 thread, ma se il software è composto da codice seriale il SMT potrà far poco o nulla. E poi si aggiunge l'ottimizzazione del codice di un software. Se un codice, anche seriale, è scritto per ottimizzare i tempi di elaborazione farà stallare poco le pipe (ergo pochi tempi morti) ergo ancora entrerà poco in gioco il SMT. Viceversa un software scritto ad cacchium sai quanti tempi morti può introdurre? Ergo il SMT ti aiuta, altrimenti puoi avere la tua potentissima architettura a IPC stellare (chi ha detto intel?) e poi girarsi i pollici
Dove voglio arrivare? Semplicemente che sarebbe stato poco furbo per amd fare una previsione sul loro SMT perché nonostante in fase di progettazione e sviluppo prototipico abbiano degli strumenti di simulazione, come fai a sapere quando realmente uscirà la tua cpu come sarà scritto il software??? E' da pazzi pensare di tirare fuori un numero medio da sbattere sul tavolo degli azionisti (e poi sui nostri monitor). Pensaci ma è più facile che con tutto quello che hanno progettato su carta abbiano fatto simulazioni su quante istruzioni il singolo core possa processare in un ciclo di clock. Ma non avete notato che se per llano si erano sbilanciati sulla frequenza sulle slide qua su zen hanno scritto solo cose sicure:
- architettura fortemente rivista con "disegno completamente nuovo del core" basata su IPC alto (e qua si sono sbilanciati su un numero);
- adozione del SMT per aumentare il thruoghput;
- Alta banda passante e sistema di cache a bassa latenza (ma quanto bassa? e con riferimento a che frequenza?????);
- cpu ad alta efficienza grazie ai Finfet.

Questo si legge dalle slide oltre quella famosa del +40%. Non hanno specificato nulla su cui non potevano dare numeri (e meno male dico io, perché forse con l'altra dirigenza avremmo avuto slide piene zeppe di numeri su previsioni fatte dall'Ing. Cane cit. "Mille") e cioè quando basse le latenze perché dipende dal silicio, quanto efficiente perché dipende dal silicio e quanta frequenza perché dipende dal silicio.
L'unico numero è sull'IPC che è difficile da considerare in MT perché quello sarebbe ancora il thruoghput. Anzi hanno proprio evidenziato "Zen core" "Excavatore core". Non so mica, ma cosa dovevano scrivere? Quel +40% per me si riferisce all'ipc in st e non vedo altra strada.

PS: ho fatto il mio mappazzone ah ah
Onestamente trovo tutto a rigor di logica, anche perchè

- architettura fortemente rivista con "disegno completamente nuovo del core" basata su IPC alto (e qua si sono sbilanciati su un numero);

Direi che la riga sopra esclude quella sotto,

- adozione del SMT per aumentare il thruoghput;

Inoltre non avrebbe senso confrontare un core XV con un core Zen con SMT... al limite sarebbe stato logico il confronto tra il modulo XV (2 TH) ed il core Zen con SMT (2TH).

Poi vorrei aggiungere... io di tutti i cicli delle operazioni e qualsivoglia, mi perdo... però credo che il Capitano abbia dato la spiegazione più semplice... cioè BD con CMT e pipe lunghe e relativo FO4 non è che non andava bene, ma BD era troppo "snello" e AMD non ci aveva speso una tozza per potenziare Cache e predizione... e poi c'è stato il crack del silicio che non ha permesso nè di raggiungere le frequenze prefissate e nè di aumentare il numero di core.
XV va meglio semplicemente perchè l'adozione delle HDL + 28nm ha ridotto il TDP e raggiunto delle frequenze accettabili,, unito all'aumento di IPC. Ma perchè Steamroller/XV non sono usciti sul 32nm SOI? Semplicemente perchè aumentando l'IPC (e quindi il TDP a core), o avrebbero dovuto abbassare la frequenza finale o ridurre il numero di core per rimanere nei 125W TDP. La minchiata che si dice che AMD non ha voluto investire su BD, è una bufala, visto che anche il prox Carrizo è pur sempre BD.

Riassumendo, io posso dire (da non tecnico procio) che l'IPC di BD dipende da tutto, ma quanto influisce la cache L0? Quanto le latenze delle cache? Quanto la FP condivisa e quant'altro? Bisogna inquadrare l'insieme... se Intel fa l'architettura X e poi passa alla Y ma la Y ha le stesse cache (latenza, dimensioni, ecc) e le stesse componenti I/O,, è chiaro che l'aumento IPC è risicato, mica può fare i miracoli.
Ma non è il caso di Zen... XV è un BD, XV2 è un BD con gli estrogeni, Zen fa il mistone prendendo il meglio di XV con il contorno di quello che Intel ha nelle cache, nella condivisione, nelle latenze, e bla bla bla, è ovvio che l'aumento di IPC è senz'altro superiore a quello del 5% medio di Intel.
paolo.oliva2 è offline  
Old 06-04-2016, 17:45   #1280
Ren
Senior Member
 
L'Avatar di Ren
 
Iscritto dal: Apr 2003
Città: Roma
Messaggi: 3237
Quote:
Originariamente inviato da bjt2 Guarda i messaggi
Magari ha molte vie...
Le evoluzioni del P6 hanno spesso alternato le vie da 4 a 8, ma se non ricordo male i 4cicli sono stati implementati nel Pentium M.

Ultima modifica di Ren : 06-04-2016 alle 18:08.
Ren è offline  
 Discussione Chiusa


Le soluzioni FSP per il 2026: potenza e IA al centro Le soluzioni FSP per il 2026: potenza e IA al ce...
AWS annuncia European Sovereign Cloud, il cloud sovrano per convincere l'Europa AWS annuncia European Sovereign Cloud, il cloud ...
Redmi Note 15 Pro+ 5G: autonomia monstre e display luminoso, ma il prezzo è alto Redmi Note 15 Pro+ 5G: autonomia monstre e displ...
HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione HONOR Magic 8 Pro: ecco il primo TOP del 2026! L...
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata Insta360 Link 2 Pro e 2C Pro: le webcam 4K che t...
JMEV SC01, la supersportiva cinese da 30...
Tesla Model 3 superata per la prima volt...
AMD ha già risolto la crisi della...
La “batteria di Baghdad” funziona davver...
Pannelli solari al contrario? Non propri...
Google Gemini si espande: arrivano le es...
Mercato TV: la leadership di Samsung reg...
L'AI che lavora 100 volte più vel...
LIDAR, battaglia finale: MicroVision met...
Il 2025 è stato l'anno di BYD: +2...
L'IA enterprise entra nella fase decisiv...
Il tiktoker Khaby Lame cede la sua socie...
Apple Pencil Pro scende a 122€ su Amazon...
Ring in forte sconto su Amazon: videocit...
Blink torna a fare sul serio: Mini 2K+ c...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 05:13.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v