[Thread Ufficiale] CPU Zen 14/12/7nm: AMD Ryzen! - Pagina 3401

paolo.oliva2 · 04-09-2021, 19:04

Quote:

Originariamente inviato da leoneazzurro

No, la cache impilata non funziona come cache L4, funziona come cache L3 estesa e stop (I chip stacked si comportano praticamente come se fossero un die unico di dimensioni maggiori, con talvolta qualche piccola penalità in termini di latenza). Non c'entra nulla con l'approccio del nuovo processore di IBM che tralaltro non usa L3 ma sfrutta una L2 di capacità enorme che simula una L3 "virtuale" andando a mettere i dati nella L2 non utilizzata di altri core. Non solo, ma avendo una struttura multi die, il dato può essere messo anche nella L2 di un core che sta in un altro chip e marcato come cache L4 "virtuale". Nell'articolo facevano le comparazioni con Zen perché AMD per ora ha avuto un approccio molto tradizionale alla gerarchia della cachee si chiedevano che cosa potrebbe succedere se la V-cache potesse essere utilizzata come estensione della L2 in una maniera simile a quella di IBM. Nel caso di IBM il vantaggio sta nel fatto che si utilizza la stessa area che sarebbe usata per una L3 condivisa di grandi dimensioni per avere invece una L2 molto grande. Lo svantaggio è che le latenze di questa L2 e delle L3-L4 "virtuali" sono più alte rispetto a quelle di una gerarchia tradizionale, per cui il bilanciamento dipende molto dall'hit rate dei dati nella cache L2 (tipo di carico di lavoro). Inoltre, la gestione di queste cache virtuali è piuttosto complessa e potrebbe richiedere un bel pezzo di area in termini di silicio, giustificabile forse in sistemi server ma non in quelli desktop (e pare potrebbero esserci problemi di sicurezza dei dati in quanto potenzialmente si hanno dati di un processo che sono disponibili nella cache di un core diverso da quello sul quale quel processo è eseguito). Senza contare che, andando verso package multidie e stacked, aggiungere cache di livello 3 e 4 (molto meno sensibili prestazionalmente a seconda del carico di lavoro) diventa molto più semplice (esempio: la prossima generazione di Xeon "Sapphire Rapids" avrà versioni che utilizzeranno della memoria HBM sul package per fungere da amplificatore di banda/riduzione latenza verso la memoria, similmente ad una L4 o ad Optane).

PS: impilare più stack costa di più, perché le aree di silicio si sommano dovendo ogni chip dello stack essere realizzato su un wafer diverso... I vantaggi dello stacking sono quelli di poter costruire un sistema modulare con costo dei vari blocchi relativamente basso (uso pochi blocchi fondamentali per costruire sistemi di diversa potenza di calcolo e capacità di cache, ogni blocco costa meno a livello di performance/area totale rispetto ad un monolitico che ha per forza di cosa rese inferiori) e di superare le barriere sulla dimensione massima dei chip (es. i processori EPYC hanno un area totale di silicio che è intorno ai 1000 mm^2, impossibile da realizzare monoliticamente, con Genoa si supereranno queste dimensioni, con le versioni stacked si andrà verso i 2000 mm^2 di silicio).

Ok
Da qualche parte avevo letto che la cache impilata aveva un costo di 24$, o 27$, non ricordo bene e non ho il link, e non era specificato se solo costo silicio o comprensivo di package

Comunque al discorso di impilazione si aggiunge anche la tecnologia di raffreddamento verticale sempre di TSMC, che in pratica farebbe impilazione, raffreddamento e package

Comunque i vantaggi della cache impilata sono enormi.
AMD ha dovuto portare il CCX a 8 core per diminuire gli stalli inter-CCX/core.
Con una cache L3 impilata, AMD potrebbe non avere bisogno di aumentare i core del CCX
Considerando che l'impilazione può collegare oltre alla L3 anche CCX ed altro, di fatto si potrebbe avere 1 CCX X8 sotto ed un CCX X8 sopra con in mezzo una L3 condivisa.

Ale55andr0 · 05-09-2021, 08:05

parlando proprio della cache, domanda per i più tecnici fra voi: in una ipotetica apu next gen AMD la infinitycache e la 3dv-cache cache potrebbero essere realizzate come unica cache di grandi dimensioni condivisa tra cpu e gpu, o resterebbero due cose distinte e separate fisicamente le une dalle altre essendo una dedicata alle istruzioni delle cpu e l'altra per fornire più banda alla gpu?

paolo.oliva2 · 05-09-2021, 11:55

"AMD Ryzen 6000 "Rembrandt" APUs are allegedly in mass producition - VideoCardz.com" https://videocardz.com/newz/amd-ryze...ss-producition

paolo.oliva2 · 05-09-2021, 12:03

Quote:

Originariamente inviato da Ale55andr0

parlando proprio della cache, domanda per i più tecnici fra voi: in una ipotetica apu next gen AMD la infinitycache e la 3dv-cache cache potrebbero essere realizzate come unica cache di grandi dimensioni condivisa tra cpu e gpu, o resterebbero due cose distinte e separate fisicamente le une dalle altre essendo una dedicata alle istruzioni delle cpu e l'altra per fornire più banda alla gpu?

Io non credo possano esserci aumenti di banda diretta... forse indirettamente, perché con una dimensione maggiore, sarà più probabile trovare il dato senza ricorrere alla ram di sistema.

paolo.oliva2 · 05-09-2021, 12:30

Una domanda tecnica sulla cache impilata.

Partiamo dal discorso che la latenza delle cache è direttamente proporzionale alla dimensione, cioè un cache da 32MB è ovvio che abbia latenze superiori vs una a 32KB.

Un chiplet Zen3 è prodotto con 32MB di memoria L3 e ha delle latenze per 32MB.

Ora, se impiliano altri 64MB di L3, la mamoria aumenterebbe a 96MB... e la logica vorrebbe che le latenze aumenterebbero perché proporzionate a 96MB e non più 32MB.

Ma ciò richiederebbe una produzione chiplet differente, cioè "normale" con latenze L3 32MB e con latenze maggiori per impilazione Cache.
Non so se la cosa possa essere risolta tramite il firmware interno.

Quindi, non sarebbe possibile, invece, una L3 divisa a blocchi? Se i blocchi fossero sempre da 32MB, la latenza sarebbe la stessa, divisa in pagine.

Magari la L3 su chiplet potrebbe cambiare il funzionamento in cache di indirizzi per la L3 impilata... o magari in futuro potrebbe essere pure una cache da Mb e non MB, con 8 cache parallele, stessa latenza di una 32MB ma con 256MB.

Ale55andr0 · 05-09-2021, 13:25

Quote:

Originariamente inviato da paolo.oliva2

Io non credo possano esserci aumenti di banda diretta... forse indirettamente, perché con una dimensione maggiore, sarà più probabile trovare il dato senza ricorrere alla ram di sistema.

non mi sono spiegato bene

...a prescindere dai benefici più o meno ampi, intendevo, è possibile unificare in una unica cache condivisa la 3dv-cache della cpu con la infinity cache della gpu? o ci sono interdipendenze per le quali devono essere fisicamente dedicate e separate in ogni caso? Cioè, una APU con CPU zen4 e gpu RDNA2 avrà le due "super cache" separate e quindi dedicate o unificate come unico pool condiviso, ecco che intendevo

floop · 05-09-2021, 15:53

Quote:

Originariamente inviato da Spitfire84

ti consiglio di installare la penultima versione dei driver del chipset (2.7 anzichè la 3.0). A me l'ultima versione ha creato diversi problemi:
- errore in fase di installazione risolto disinstallando la precedente versione e installando la nuova;
- impossibilità di disinstallazione, risolta sovrainstallando i 2.7 ai 3.0;
- spegnimenti improvvisi del pc sotto carico (devo ancora capire se erano i driver del chipset, ma è molto probabile).

per ora nulla... sgrat sgrat

leoneazzurro · 06-09-2021, 09:41

Quote:

Originariamente inviato da paolo.oliva2

Una domanda tecnica sulla cache impilata.

Partiamo dal discorso che la latenza delle cache è direttamente proporzionale alla dimensione, cioè un cache da 32MB è ovvio che abbia latenze superiori vs una a 32KB.

Un chiplet Zen3 è prodotto con 32MB di memoria L3 e ha delle latenze per 32MB.

Ora, se impiliano altri 64MB di L3, la mamoria aumenterebbe a 96MB... e la logica vorrebbe che le latenze aumenterebbero perché proporzionate a 96MB e non più 32MB.

Ma ciò richiederebbe una produzione chiplet differente, cioè "normale" con latenze L3 32MB e con latenze maggiori per impilazione Cache.
Non so se la cosa possa essere risolta tramite il firmware interno.

Quindi, non sarebbe possibile, invece, una L3 divisa a blocchi? Se i blocchi fossero sempre da 32MB, la latenza sarebbe la stessa, divisa in pagine.

Magari la L3 su chiplet potrebbe cambiare il funzionamento in cache di indirizzi per la L3 impilata... o magari in futuro potrebbe essere pure una cache da Mb e non MB, con 8 cache parallele, stessa latenza di una 32MB ma con 256MB.

Dipende da come verrà realizzato l'impilamento, se verrà modificata l'associatività, ecc. Per il momento non ci sono dettagli in merito, l'impressione avuta da quello che ho letto comunque è che si avrà "solo" un aumento della capacità totale con un modesto aumento delle latenze (che è la soluzione più semplice). Avere più cache L3 in parallelo sarebbe possibile tecnicamente ma non credo verrà mai implementata per il semplice motivo che la cache L3 viene utilizzata per l'interscambio dei dati tra i core in un CCX. Una segmentazione orizzontale significherebbe che un core che deve prendere un dato che sta in una cache di un altro core dovrebbe passare per la RAM, a meno di non avere una gestione "virtuale" come nella CPU IBM (che complica comunque le cose). Piuttosto si parla di avere una cache L3/L4 di grandi dimensioni condivisa tra tutti i core e tutti i chiplet (un'estensione di quello che AMD farà con le GPU Navi 31/32 e concettualmente similare alle HBM RAM di alcune soluzioni della famiglia Sapphire Rapids di Intel )

paolo.oliva2 · 07-09-2021, 17:51

"Does an AMD Chiplet Have a Core Count Limit?" https://www.anandtech.com/show/16930...re-count-limit

paolo.oliva2 · 07-09-2021, 18:47

Quell'articolo di Anand è scritto bene, ma io mi perdo.

Però per me l'impilazione è un aiuto non da poco, e cerco di spiegarmi.

Con Zen1 il problema era la condivisione L3 tra i CCX X4 e i CCX negli altri die
Con Zen2 tramite motherchip si riduce la latenza tra le L3 inter-die, e con Zen3 si passa al CCX X8.

Zen4 sembra avrà sempre CCX X8 e per arrivare a 96 core ci sarebbero 2 chiplet in più, ma non su potrà arrivare a 12 chiplet X8 per i 128 core di Zen5.

Ora, realizzando un CCX X12 o X16 si risolverebbe, ma oltre alla complessità, danneggerebbe il costo perché vaumenterebbe il taglio core minimo.

Ma con l'impilazione, avremmo sempre una produzione CCX X8 con X L3, ma un chiplet potrebbe essere sia X8 che X16 (impilando 2 CCX e relativa L3), una L3 condivisa e inclusiva. Cioè, sarebbe come avere un CCX X16 con R&D a costo quasi zero.

paolo.oliva2 · 08-09-2021, 07:45

Sono segnalate diminuzioni di prezzo per tutta la linea Zen3, inferiori al prezzo di listino.
Nel contempo circolano voci che Zen3+ sia già in produzione.

Io consiglierei di aspettare ad acquistare un Zen3, perché, mia opinione, difficilmente Zen3+ avrà un prezzo/prestazioni peggiore, perché se Zen3+ confermerà un +15% do performances, difficilmente troveremo una forbice del 15% nel listino.
Considerando Alder prezzato su prezzo/prestazioni simile a Zen3 e il top 12900K sopra ad un 5900X, dovrebbe costringere AMD a prezzare di conseguenza un Zen3+ 5950X. Più il 12900K sarà competitivo, meno costerà Zen3+. Sono dell'idea che Zen3+ possa essere prezzato come il listino di Zen3.. ed è ovvio che se un 5950X Zen3+ costerà 700€, difficilmente un Zen3 5950X sui 610€.

Gyammy85 · 08-09-2021, 08:03

Quote:

Originariamente inviato da paolo.oliva2

Sono segnalate diminuzioni di prezzo per tutta la linea Zen3, inferiori al prezzo di listino.
Nel contempo circolano voci che Zen3+ sia già in produzione.

Io consiglierei di aspettare ad acquistare un Zen3, perché, mia opinione, difficilmente Zen3+ avrà un prezzo/prestazioni peggiore, perché se Zen3+ confermerà un +15% do performances, difficilmente troveremo una forbice del 15% nel listino.
Considerando Alder prezzato su prezzo/prestazioni simile a Zen3 e il top 12900K sopra ad un 5900X, dovrebbe costringere AMD a prezzare di conseguenza un Zen3+ 5950X. Più il 12900K sarà competitivo, meno costerà Zen3+. Sono dell'idea che Zen3+ possa essere prezzato come il listino di Zen3.. ed è ovvio che se un 5950X Zen3+ costerà 700€, difficilmente un Zen3 5950X sui 610€.

Io dico di non aspettarsi svendite perché amd adesso si è rifatta il nome e non calerà il listino solo perché alder lake va meno ma con stile...inoltre un calo dei prezzi di zen 3 è fisiologico, è passato quasi un anno e lo shortage è finito, ad esempio l'anno scorso si trovavano i 3900x a 400 euro

leoneazzurro · 08-09-2021, 08:40

Quote:

Originariamente inviato da paolo.oliva2

Quell'articolo di Anand è scritto bene, ma io mi perdo.

Però per me l'impilazione è un aiuto non da poco, e cerco di spiegarmi.

Con Zen1 il problema era la condivisione L3 tra i CCX X4 e i CCX negli altri die
Con Zen2 tramite motherchip si riduce la latenza tra le L3 inter-die, e con Zen3 si passa al CCX X8.

Zen4 sembra avrà sempre CCX X8 e per arrivare a 96 core ci sarebbero 2 chiplet in più, ma non su potrà arrivare a 12 chiplet X8 per i 128 core di Zen5.

Ora, realizzando un CCX X12 o X16 si risolverebbe, ma oltre alla complessità, danneggerebbe il costo perché vaumenterebbe il taglio core minimo.

Ma con l'impilazione, avremmo sempre una produzione CCX X8 con X L3, ma un chiplet potrebbe essere sia X8 che X16 (impilando 2 CCX e relativa L3), una L3 condivisa e inclusiva. Cioè, sarebbe come avere un CCX X16 con R&D a costo quasi zero.

Nell'articolo vengono spiegate le diverse tecniche di interconnessione tra i core su uno stesso CCX, con relativi vantaggi e svantaggi, vengono dati chiarimenti sulla possibile interconnessione utilizzata da AMD (un ring bus, ma con qualche "secret sauce" che gli consente di avere quasi le prestazioni di un crossbar) e sulle possibilità di scalare per AMD a più di 8 core per "segmento", il che non è influenzato dall'impilamento a livello logico, in quanto si tratta di aumentare il numero di client del bus/crossbar/mesh. Cosa che ovviamente fa salire i costi in termini di area e potenza dell'interconnessione stessa. L'impilamento può fornire delle soluzioni più performanti all'interconnessione tra core e die bisogna capire come e se verrà sfruttato in questo particolare ambito (si faceva l'esempio di un interposer esterno con delle connessioni mesh sul quale "scaricare" il compito dell'interconnessione tra i core e i die).

affiu · 08-09-2021, 09:12

Quote:

Originariamente inviato da paolo.oliva2

Sono segnalate diminuzioni di prezzo per tutta la linea Zen3, inferiori al prezzo di listino.
Nel contempo circolano voci che Zen3+ sia già in produzione.

Io consiglierei di aspettare ad acquistare un Zen3, perché, mia opinione, difficilmente Zen3+ avrà un prezzo/prestazioni peggiore, perché se Zen3+ confermerà un +15% do performances, difficilmente troveremo una forbice del 15% nel listino.
Considerando Alder prezzato su prezzo/prestazioni simile a Zen3 e il top 12900K sopra ad un 5900X, dovrebbe costringere AMD a prezzare di conseguenza un Zen3+ 5950X. Più il 12900K sarà competitivo, meno costerà Zen3+. Sono dell'idea che Zen3+ possa essere prezzato come il listino di Zen3.. ed è ovvio che se un 5950X Zen3+ costerà 700€, difficilmente un Zen3 5950X sui 610€.

Per forza, non dimenticando che c'è l'effetto novità(ddr5)....quindi una certa curiosità suscita; chi arriva prima susciterrà più interesse, anche se credo che sempre verso natale (inteso come disponibilità sufficiente sul mercato) più o meno se ne discute...
A quel punto basta una slide al CES 2022 di zen4 con un bel video e svanisce nuovamente ogni sogno!

....intanto vediamo all'opera questa 3D vcache e certamente zen4 ci sembrerà sempre più una specie di reattore con un SMT2 ed un throughput che sia ''vicino'' a RDNA3 o 4 che è un chiplet, e poi finalmente si potrà dire: hybrid NATIVE G-CPU
PS. la cosa è delicata da tanti punti di vista, maggiormente l'aspetto costo/fattibilità; in teoria dovrebbe ''ritornare'' la parola HBM....i tempi dovrebbero essere maturi con 5nm.
Partendo dal loro punto di vista ROSSO:
https://www.amd.com/en/technologies/hbm
https://en.wikipedia.org/wiki/Through-silicon_via
https://en.wikipedia.org/wiki/Three-...grated_circuit

Quote:

Originariamente inviato da paolo.oliva2

...cut
Ma con l'impilazione, avremmo sempre una produzione CCX X8 con X L3, ma un chiplet potrebbe essere sia X8 che X16 (impilando 2 CCX e relativa L3), una L3 condivisa e inclusiva. Cioè, sarebbe come avere un CCX X16 con R&D a costo quasi zero.

Bravo

....ma perchè lo scopo resta sempre quello....zen4 deve essere all'altezza, intendo in termini di IGPU.
https://cdn.mos.cms.futurecdn.net/ft...Drf-480-80.jpg
E' facile immaginare un ''sandwich'' , appunto come dici un ccx da x16, che poi sono 2 ccx da 8core ma incollati uno sopra l'altro con tanti TSV.

Io mi aspetto che col 3 nm facciano una specie di chip ibrido con un pluri-''sandwich'' in cui tramite questi TSV, che poi non sono altro che collegamenti, riescono a impilare oltre la cache e cpu, pure una gpu-chiplet(che sia RDNA3 O 4 non ha importanza, quando sarà).
In altre parole e sulla carta, RDNA3 dovrebbe apportare un altro 50% di performance/watt e idem RDNA4 !!!...ragazzo.

...è un salto che non hai idea

(e neppure io

) nell'ambito gpu!....
Perchè in fondo se aumentano i transistor ed i collegamenti restano sempre i colli che non vanno di pari passo, almeno in un chip a costruzione orizzontale, ma magari in una costruzione verticale ( Cu-Cu&TSV --die-to-die, die-to-wafer, and wafer-to-wafer) si riesca a toppare questo fattore lento in termini di collegamento, rispetto ai core sempre più veloci.

paolo.oliva2 · 08-09-2021, 14:22

Quote:

Originariamente inviato da leoneazzurro

Nell'articolo vengono spiegate le diverse tecniche di interconnessione tra i core su uno stesso CCX, con relativi vantaggi e svantaggi, vengono dati chiarimenti sulla possibile interconnessione utilizzata da AMD (un ring bus, ma con qualche "secret sauce" che gli consente di avere quasi le prestazioni di un crossbar) e sulle possibilità di scalare per AMD a più di 8 core per "segmento", il che non è influenzato dall'impilamento a livello logico, in quanto si tratta di aumentare il numero di client del bus/crossbar/mesh. Cosa che ovviamente fa salire i costi in termini di area e potenza dell'interconnessione stessa. L'impilamento può fornire delle soluzioni più performanti all'interconnessione tra core e die bisogna capire come e se verrà sfruttato in questo particolare ambito (si faceva l'esempio di un interposer esterno con delle connessioni mesh sul quale "scaricare" il compito dell'interconnessione tra i core e i die).

Si, ok. Senza andare troppo in là per le mie conoscenze, un punto che non mi è chiaro.
È sbagliato assimilare i modi di collegamento dei core con le reti?

Zen 1000 aveva 2 CCX X4 a die. Se il salto dei TH a core passava dal 1 CCX al secondo, avevamo pure il passaggio dei dati dalla L3 del CCX 0 alla L3 del CCX 1, con ovvi cicli a vuoto.
La cosa era ancora più lesiva se si passava da die a die, che nel caso più negativo età il secondo CCX di un die con il secondo CCX di un altro die.

Se associo ciò ad una rete, è come se il CCX0 (di tutti i die) sia un nodo e il CCX1 una seconda postazione collegata a quel nodo.

Per me è facile così capire la latenza di Zen 1000 vs Zen2, perché Zen2, con una L3 condivisa, faceva sì che CCX0 e CCX1 fossero in parallelo e non in seriale come Zen 1000.

Però questo si scorna con Zen3, perché se Zen3 ha il core con ALU uguali a Zen2, dove cacchio arriva +19% di IPC se due CCX X4 collegati alla stessa L3 condivisa dovrebbe essere simile ad un CCX X8 con sempre la L3 condivisa?

Perché il mio ragionamento tipo 2 CCX X8 con la L3 condivisa vs CCX X16 sarebbe sulla stessa riga di Zen2...

E qui mi arrendo .. però nel computo non c'è solamente la prestazione in sé, ma anche il costo per quella prestazione... perché alla fine si valuta principalmente il costo/prestazioni.
Ipotizzare la dimensione e la resa di un CCX X16 con 384MB di L3 in un unico die "monolitico", magari APU, vs lo stesso con la base CCX X8 + L3 impilata ed idem iGPU.. mi fa ricordare l'affermazione AMD che un 3950X monolitico sarebbe costato un +40% rispetto allo stesso ma MCM.

leoneazzurro · 08-09-2021, 14:51

Se vuoi vederlo come una rete vedilo come una rete, tieni conto però che ognuno di quei collegamenti che vedi nell'articolo è in realtà un bus che ha una certa larghezza e non un collegamento seriale come nel caso delle reti, senza contare che nelle reti si tende ad avere una struttura più "gerarchica" mentre in questo caso tutti i nodi (stop) hanno pari diritti e caratteristiche.

Poi i core Zen2 e Zen3 hanno core differenti, nel senso che Zen3 ha più unità di esecuzione rispetto a Zen2, solo che molte di queste sono dedicate alle operazioni di accesso e scrittura in memoria e non tanto all'esecuzione vera a propria (fa eccezione la FPU che ha capacità nettamente migliorate, fino al 50% in più). L'aumento dell'IPC deriva dai miglioramenti di branch predictor e prefetching (meno errori sulla predizione dei salti che causano lo svuotamento delle pipeline e dati disponibili più prontamente alle unità di esecuzione), all'incremento della µ-ops cache, all'incremento della comunicazione inter-core grazie alla cache condivisa (in Zen2 la cache L3 era ancora divisa in due banchi da 16Mbytes, per cui per portare dei dati dal CCX1 al CCX2 anche se erano sullo stesso die si doveva passare per il bus esterno verso l'I/O die), alla più alta capacità efficace della L3 per core grazie all'adozione di una cache unificata da 32Mbytes anziché due da 16 Mbytes, ecc.

paolo.oliva2 · 09-09-2021, 06:36

Si, ok, ho fatto il paragone con le reti perché di simile è il senso di collegamento... La L3 di Zen2 viaggiava a circa 500GB/s con OC max (mi sembra 512GB/s il mio max).

Comunque in sti anni abbiamo avuto una impennata di prestazioni sbalorditiva... tra aumento numero core max, IPC e frequenze... si è abbassato il costo/prestazione, ma si è abbassato tantissimo pure la durata del sistema. In passato avere un sistema di 4-5 anni significava avere performances di circa il -20% sul core e in MT. Se prendiamo un Zen 1 vs un 5950X, considerando che un 1800X costava circa 500€ e oggi un 5900X si trova pure a meno...

Graphite600T · 09-09-2021, 08:35

Quote:

Originariamente inviato da paolo.oliva2

Si, ok, ho fatto il paragone con le reti perché di simile è il senso di collegamento... La L3 di Zen2 viaggiava a circa 500GB/s con OC max (mi sembra 512GB/s il mio max).

Comunque in sti anni abbiamo avuto una impennata di prestazioni sbalorditiva... tra aumento numero core max, IPC e frequenze... si è abbassato il costo/prestazione, ma si è abbassato tantissimo pure la durata del sistema. In passato avere un sistema di 4-5 anni significava avere performances di circa il -20% sul core e in MT. Se prendiamo un Zen 1 vs un 5950X, considerando che un 1800X costava circa 500€ e oggi un 5900X si trova pure a meno...

E' solo l'ottimizzazione che è pessima, se tutto sfruttase a modino il multi core basterebbe un 3600 per fare tutto degnamente senza avere necessità di frequenze oltre ai core per vincere i colli di bottiglia e la velocità di calcolo.

Io ho avuto un 5950x prima del 5900x ma l'ho dato via perchè, a meno che non virtualizzi, è veramente troppo potente: mi sentivo come un 12 enne con una Ferrari parcheggiata in garage senza poterla usare. Tempo che avrei potuto sfruttarlo sarebbe uscito qualcosa di meglio a meno. Ci sono ancora troppi applicativi e videogiochi che vogliono il single core e la frequenza a discapito di core cache e bus

paolo.oliva2 · 09-09-2021, 15:34

"Windows 11 will be faster thanks to CPU, memory and storage optimizations - VideoCardz.com" https://videocardz.com/newz/windows-...-optimizations

È un articolo su Windows ma descrive delle peculiarità che bene si adatterebbero a CPU con maggiore numero di core (ed è per questo che l'ho inserito).

C'è un punto, nel quale riporta che il carico di lavoro pesante non impatterà più nelle applicazioni in esecuzione in primo piano (il classico di un sistema che si siede), e questo mi fa supporre che, ad esempio con Alder, i core P eseguano il carico intensivo e i core E il resto, come forse con Zen, che il carico intensivo sfrutti un numero di lascicorw proporzionato e lasci libero dei TH giusto il necessario perché il sistema sia molto reattivo.

Spezzo una lancia a favore dei core non SMT... Con BD, che non era SMT, si poteva caricare fino a 3X il valore nominale di TH (ovviamente TH corposi) senza avere nessun rallentamento.Zen, che è SMT, rallenta già a 2,5X.

paolo.oliva2 · 09-09-2021, 15:57

@graphite600T.

Dipende dall'utilizzo. Per me acquistare un 5950X per gioco... non dico che sia sbagliato (nel senso che se uno vuole il max, ok, hai frequenze superiori e 8 core che si girano i pollici), però significa avere dindi da buttare. Però va anche guardato l'insieme, ovvio che se spendi già 2000-3000€ tra VGA, case, mobo e dissipazione, non sono di certo i 400€ in più tra un X8 e unX16... Anzi, se devo spendere 4000€ in una stazione, un 5950X c'è lo metto giusto per dare un senso di 360 gradi alla spesa.

Comunque i core in più servono sempre nel momento in cui fai più cose contemporaneamente. Se esegui un solo programma, i core in più servono sono a che quel software li utilizza. Io ho la sclero di utilizzare il PC al 100% e nel contempo di fare tutto quello che mi va di fare. Avendo parecchi hobby (video, foto, telescopio, ecc.) ero pure arrivato a più di 3 sistemi... (esempio 3 Zen 1000), poi ho ridotto a 2 con un Zen2 ed un 1920 X12, (3900X e 3950X erano introvabili)... oggi spendi 700€ in un 5950X e ho più prestazioni di 3 X8, spendendo un totale di meno complessivamente e senza avere problemi di lan, cavi, monitor/mouse/tastiere a iosa e un maxi tavolo.

05-09-2021, 08:05	#68002
Ale55andr0 Senior Member Iscritto dal: Nov 2008 Città: Un corridoio di schiaffoni Messaggi: 20683	parlando proprio della cache, domanda per i più tecnici fra voi: in una ipotetica apu next gen AMD la infinitycache e la 3dv-cache cache potrebbero essere realizzate come unica cache di grandi dimensioni condivisa tra cpu e gpu, o resterebbero due cose distinte e separate fisicamente le une dalle altre essendo una dedicata alle istruzioni delle cpu e l'altra per fornire più banda alla gpu? __________________ Case: CM690III PSU: Seasonic M12II Evo 750w Mobo: Asus x470 Prime Pro CPU: AMD Ryzen 5700x Dissi: Arctic Freezer 33CO Ram: 32Gb (216Gb) Corsair Vengeance LPX 3200/C16 VGA: Sapphire Pulse 7900XT ventigigaBAIT Storage: nvme M2 Sabrent 512Gb + HDD WD Black 2Tb Ultima modifica di Ale55andr0 : 05-09-2021 alle 09:35.*

05-09-2021, 11:55	#68003
paolo.oliva2 Senior Member Iscritto dal: Jan 2002 Città: Urbino (PU) Messaggi: 30231	"AMD Ryzen 6000 "Rembrandt" APUs are allegedly in mass producition - VideoCardz.com" https://videocardz.com/newz/amd-ryze...ss-producition __________________ 7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M

05-09-2021, 12:30	#68005
paolo.oliva2 Senior Member Iscritto dal: Jan 2002 Città: Urbino (PU) Messaggi: 30231	Una domanda tecnica sulla cache impilata. Partiamo dal discorso che la latenza delle cache è direttamente proporzionale alla dimensione, cioè un cache da 32MB è ovvio che abbia latenze superiori vs una a 32KB. Un chiplet Zen3 è prodotto con 32MB di memoria L3 e ha delle latenze per 32MB. Ora, se impiliano altri 64MB di L3, la mamoria aumenterebbe a 96MB... e la logica vorrebbe che le latenze aumenterebbero perché proporzionate a 96MB e non più 32MB. Ma ciò richiederebbe una produzione chiplet differente, cioè "normale" con latenze L3 32MB e con latenze maggiori per impilazione Cache. Non so se la cosa possa essere risolta tramite il firmware interno. Quindi, non sarebbe possibile, invece, una L3 divisa a blocchi? Se i blocchi fossero sempre da 32MB, la latenza sarebbe la stessa, divisa in pagine. Magari la L3 su chiplet potrebbe cambiare il funzionamento in cache di indirizzi per la L3 impilata... o magari in futuro potrebbe essere pure una cache da Mb e non MB, con 8 cache parallele, stessa latenza di una 32MB ma con 256MB. __________________ 7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M

07-09-2021, 17:51	#68009
paolo.oliva2 Senior Member Iscritto dal: Jan 2002 Città: Urbino (PU) Messaggi: 30231	"Does an AMD Chiplet Have a Core Count Limit?" https://www.anandtech.com/show/16930...re-count-limit __________________ 7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M

07-09-2021, 18:47	#68010
paolo.oliva2 Senior Member Iscritto dal: Jan 2002 Città: Urbino (PU) Messaggi: 30231	Quell'articolo di Anand è scritto bene, ma io mi perdo. Però per me l'impilazione è un aiuto non da poco, e cerco di spiegarmi. Con Zen1 il problema era la condivisione L3 tra i CCX X4 e i CCX negli altri die Con Zen2 tramite motherchip si riduce la latenza tra le L3 inter-die, e con Zen3 si passa al CCX X8. Zen4 sembra avrà sempre CCX X8 e per arrivare a 96 core ci sarebbero 2 chiplet in più, ma non su potrà arrivare a 12 chiplet X8 per i 128 core di Zen5. Ora, realizzando un CCX X12 o X16 si risolverebbe, ma oltre alla complessità, danneggerebbe il costo perché vaumenterebbe il taglio core minimo. Ma con l'impilazione, avremmo sempre una produzione CCX X8 con X L3, ma un chiplet potrebbe essere sia X8 che X16 (impilando 2 CCX e relativa L3), una L3 condivisa e inclusiva. Cioè, sarebbe come avere un CCX X16 con R&D a costo quasi zero. __________________ 7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M

08-09-2021, 07:45	#68011
paolo.oliva2 Senior Member Iscritto dal: Jan 2002 Città: Urbino (PU) Messaggi: 30231	Sono segnalate diminuzioni di prezzo per tutta la linea Zen3, inferiori al prezzo di listino. Nel contempo circolano voci che Zen3+ sia già in produzione. Io consiglierei di aspettare ad acquistare un Zen3, perché, mia opinione, difficilmente Zen3+ avrà un prezzo/prestazioni peggiore, perché se Zen3+ confermerà un +15% do performances, difficilmente troveremo una forbice del 15% nel listino. Considerando Alder prezzato su prezzo/prestazioni simile a Zen3 e il top 12900K sopra ad un 5900X, dovrebbe costringere AMD a prezzare di conseguenza un Zen3+ 5950X. Più il 12900K sarà competitivo, meno costerà Zen3+. Sono dell'idea che Zen3+ possa essere prezzato come il listino di Zen3.. ed è ovvio che se un 5950X Zen3+ costerà 700€, difficilmente un Zen3 5950X sui 610€. __________________ 7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M

08-09-2021, 14:51	#68016
leoneazzurro Senior Member Iscritto dal: Jan 2003 Messaggi: 10393	Se vuoi vederlo come una rete vedilo come una rete, tieni conto però che ognuno di quei collegamenti che vedi nell'articolo è in realtà un bus che ha una certa larghezza e non un collegamento seriale come nel caso delle reti, senza contare che nelle reti si tende ad avere una struttura più "gerarchica" mentre in questo caso tutti i nodi (stop) hanno pari diritti e caratteristiche. Poi i core Zen2 e Zen3 hanno core differenti, nel senso che Zen3 ha più unità di esecuzione rispetto a Zen2, solo che molte di queste sono dedicate alle operazioni di accesso e scrittura in memoria e non tanto all'esecuzione vera a propria (fa eccezione la FPU che ha capacità nettamente migliorate, fino al 50% in più). L'aumento dell'IPC deriva dai miglioramenti di branch predictor e prefetching (meno errori sulla predizione dei salti che causano lo svuotamento delle pipeline e dati disponibili più prontamente alle unità di esecuzione), all'incremento della µ-ops cache, all'incremento della comunicazione inter-core grazie alla cache condivisa (in Zen2 la cache L3 era ancora divisa in due banchi da 16Mbytes, per cui per portare dei dati dal CCX1 al CCX2 anche se erano sullo stesso die si doveva passare per il bus esterno verso l'I/O die), alla più alta capacità efficace della L3 per core grazie all'adozione di una cache unificata da 32Mbytes anziché due da 16 Mbytes, ecc. __________________ Clevo NH55AFW (PC Specialist Nova 15,6) - Ryzen 3700X - 32 GB HyperX Impact DDR4 HX432S20IBK2 3200MHz CL18 - Geforce RTX 2070 Mobile 8Gb 115W - 1 SSDSAMSUNG 970 EVO PLUS M.2 1 TB, NVMe - 1SSD PCS PCIe M.2 SSD 1 TB

09-09-2021, 06:36	#68017
paolo.oliva2 Senior Member Iscritto dal: Jan 2002 Città: Urbino (PU) Messaggi: 30231	Si, ok, ho fatto il paragone con le reti perché di simile è il senso di collegamento... La L3 di Zen2 viaggiava a circa 500GB/s con OC max (mi sembra 512GB/s il mio max). Comunque in sti anni abbiamo avuto una impennata di prestazioni sbalorditiva... tra aumento numero core max, IPC e frequenze... si è abbassato il costo/prestazione, ma si è abbassato tantissimo pure la durata del sistema. In passato avere un sistema di 4-5 anni significava avere performances di circa il -20% sul core e in MT. Se prendiamo un Zen 1 vs un 5950X, considerando che un 1800X costava circa 500€ e oggi un 5900X si trova pure a meno... __________________ 7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M

09-09-2021, 15:34	#68019
paolo.oliva2 Senior Member Iscritto dal: Jan 2002 Città: Urbino (PU) Messaggi: 30231	"Windows 11 will be faster thanks to CPU, memory and storage optimizations - VideoCardz.com" https://videocardz.com/newz/windows-...-optimizations È un articolo su Windows ma descrive delle peculiarità che bene si adatterebbero a CPU con maggiore numero di core (ed è per questo che l'ho inserito). C'è un punto, nel quale riporta che il carico di lavoro pesante non impatterà più nelle applicazioni in esecuzione in primo piano (il classico di un sistema che si siede), e questo mi fa supporre che, ad esempio con Alder, i core P eseguano il carico intensivo e i core E il resto, come forse con Zen, che il carico intensivo sfrutti un numero di lascicorw proporzionato e lasci libero dei TH giusto il necessario perché il sistema sia molto reattivo. Spezzo una lancia a favore dei core non SMT... Con BD, che non era SMT, si poteva caricare fino a 3X il valore nominale di TH (ovviamente TH corposi) senza avere nessun rallentamento.Zen, che è SMT, rallenta già a 2,5X. __________________ 7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M

09-09-2021, 15:57	#68020
paolo.oliva2 Senior Member Iscritto dal: Jan 2002 Città: Urbino (PU) Messaggi: 30231	@graphite600T. Dipende dall'utilizzo. Per me acquistare un 5950X per gioco... non dico che sia sbagliato (nel senso che se uno vuole il max, ok, hai frequenze superiori e 8 core che si girano i pollici), però significa avere dindi da buttare. Però va anche guardato l'insieme, ovvio che se spendi già 2000-3000€ tra VGA, case, mobo e dissipazione, non sono di certo i 400€ in più tra un X8 e unX16... Anzi, se devo spendere 4000€ in una stazione, un 5950X c'è lo metto giusto per dare un senso di 360 gradi alla spesa. Comunque i core in più servono sempre nel momento in cui fai più cose contemporaneamente. Se esegui un solo programma, i core in più servono sono a che quel software li utilizza. Io ho la sclero di utilizzare il PC al 100% e nel contempo di fare tutto quello che mi va di fare. Avendo parecchi hobby (video, foto, telescopio, ecc.) ero pure arrivato a più di 3 sistemi... (esempio 3 Zen 1000), poi ho ridotto a 2 con un Zen2 ed un 1920 X12, (3900X e 3950X erano introvabili)... oggi spendi 700€ in un 5950X e ho più prestazioni di 3 X8, spendendo un totale di meno complessivamente e senza avere problemi di lan, cavi, monitor/mouse/tastiere a iosa e un maxi tavolo. __________________ 7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M

Strumenti
Mostra una versione stampabile Invia questa pagina per email