|
|
|
|
Strumenti |
04-09-2021, 19:04 | #68001 | |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
Quote:
Da qualche parte avevo letto che la cache impilata aveva un costo di 24$, o 27$, non ricordo bene e non ho il link, e non era specificato se solo costo silicio o comprensivo di package Comunque al discorso di impilazione si aggiunge anche la tecnologia di raffreddamento verticale sempre di TSMC, che in pratica farebbe impilazione, raffreddamento e package Comunque i vantaggi della cache impilata sono enormi. AMD ha dovuto portare il CCX a 8 core per diminuire gli stalli inter-CCX/core. Con una cache L3 impilata, AMD potrebbe non avere bisogno di aumentare i core del CCX Considerando che l'impilazione può collegare oltre alla L3 anche CCX ed altro, di fatto si potrebbe avere 1 CCX X8 sotto ed un CCX X8 sopra con in mezzo una L3 condivisa.
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
|
05-09-2021, 08:05 | #68002 |
Senior Member
Iscritto dal: Nov 2008
Città: Un corridoio di schiaffoni
Messaggi: 20683
|
parlando proprio della cache, domanda per i più tecnici fra voi: in una ipotetica apu next gen AMD la infinitycache e la 3dv-cache cache potrebbero essere realizzate come unica cache di grandi dimensioni condivisa tra cpu e gpu, o resterebbero due cose distinte e separate fisicamente le une dalle altre essendo una dedicata alle istruzioni delle cpu e l'altra per fornire più banda alla gpu?
__________________
Case: CM690III PSU: Seasonic M12II Evo 750w Mobo: Asus x470 Prime Pro CPU: AMD Ryzen 5700x Dissi: Arctic Freezer 33CO Ram: 32Gb (2*16Gb) Corsair Vengeance LPX 3200/C16 VGA: Sapphire Pulse 7900XT ventigigaBAIT Storage: nvme M2 Sabrent 512Gb + HDD WD Black 2Tb Ultima modifica di Ale55andr0 : 05-09-2021 alle 09:35. |
05-09-2021, 11:55 | #68003 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
"AMD Ryzen 6000 "Rembrandt" APUs are allegedly in mass producition - VideoCardz.com" https://videocardz.com/newz/amd-ryze...ss-producition
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
05-09-2021, 12:03 | #68004 | |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
Quote:
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
|
05-09-2021, 12:30 | #68005 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
Una domanda tecnica sulla cache impilata.
Partiamo dal discorso che la latenza delle cache è direttamente proporzionale alla dimensione, cioè un cache da 32MB è ovvio che abbia latenze superiori vs una a 32KB. Un chiplet Zen3 è prodotto con 32MB di memoria L3 e ha delle latenze per 32MB. Ora, se impiliano altri 64MB di L3, la mamoria aumenterebbe a 96MB... e la logica vorrebbe che le latenze aumenterebbero perché proporzionate a 96MB e non più 32MB. Ma ciò richiederebbe una produzione chiplet differente, cioè "normale" con latenze L3 32MB e con latenze maggiori per impilazione Cache. Non so se la cosa possa essere risolta tramite il firmware interno. Quindi, non sarebbe possibile, invece, una L3 divisa a blocchi? Se i blocchi fossero sempre da 32MB, la latenza sarebbe la stessa, divisa in pagine. Magari la L3 su chiplet potrebbe cambiare il funzionamento in cache di indirizzi per la L3 impilata... o magari in futuro potrebbe essere pure una cache da Mb e non MB, con 8 cache parallele, stessa latenza di una 32MB ma con 256MB.
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
05-09-2021, 13:25 | #68006 |
Senior Member
Iscritto dal: Nov 2008
Città: Un corridoio di schiaffoni
Messaggi: 20683
|
non mi sono spiegato bene ...a prescindere dai benefici più o meno ampi, intendevo, è possibile unificare in una unica cache condivisa la 3dv-cache della cpu con la infinity cache della gpu? o ci sono interdipendenze per le quali devono essere fisicamente dedicate e separate in ogni caso? Cioè, una APU con CPU zen4 e gpu RDNA2 avrà le due "super cache" separate e quindi dedicate o unificate come unico pool condiviso, ecco che intendevo
__________________
Case: CM690III PSU: Seasonic M12II Evo 750w Mobo: Asus x470 Prime Pro CPU: AMD Ryzen 5700x Dissi: Arctic Freezer 33CO Ram: 32Gb (2*16Gb) Corsair Vengeance LPX 3200/C16 VGA: Sapphire Pulse 7900XT ventigigaBAIT Storage: nvme M2 Sabrent 512Gb + HDD WD Black 2Tb |
05-09-2021, 15:53 | #68007 | |
Senior Member
Iscritto dal: May 2006
Città: Reggio calabria
Messaggi: 3928
|
Quote:
__________________
No firma |
|
06-09-2021, 09:41 | #68008 | |
Senior Member
Iscritto dal: Jan 2003
Messaggi: 10393
|
Quote:
__________________
Clevo NH55AFW (PC Specialist Nova 15,6) - Ryzen 3700X - 32 GB HyperX Impact DDR4 HX432S20IBK2 3200MHz CL18 - Geforce RTX 2070 Mobile 8Gb 115W - 1 SSDSAMSUNG 970 EVO PLUS M.2 1 TB, NVMe - 1SSD PCS PCIe M.2 SSD 1 TB |
|
07-09-2021, 17:51 | #68009 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
"Does an AMD Chiplet Have a Core Count Limit?" https://www.anandtech.com/show/16930...re-count-limit
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
07-09-2021, 18:47 | #68010 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
Quell'articolo di Anand è scritto bene, ma io mi perdo.
Però per me l'impilazione è un aiuto non da poco, e cerco di spiegarmi. Con Zen1 il problema era la condivisione L3 tra i CCX X4 e i CCX negli altri die Con Zen2 tramite motherchip si riduce la latenza tra le L3 inter-die, e con Zen3 si passa al CCX X8. Zen4 sembra avrà sempre CCX X8 e per arrivare a 96 core ci sarebbero 2 chiplet in più, ma non su potrà arrivare a 12 chiplet X8 per i 128 core di Zen5. Ora, realizzando un CCX X12 o X16 si risolverebbe, ma oltre alla complessità, danneggerebbe il costo perché vaumenterebbe il taglio core minimo. Ma con l'impilazione, avremmo sempre una produzione CCX X8 con X L3, ma un chiplet potrebbe essere sia X8 che X16 (impilando 2 CCX e relativa L3), una L3 condivisa e inclusiva. Cioè, sarebbe come avere un CCX X16 con R&D a costo quasi zero.
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
08-09-2021, 07:45 | #68011 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
Sono segnalate diminuzioni di prezzo per tutta la linea Zen3, inferiori al prezzo di listino.
Nel contempo circolano voci che Zen3+ sia già in produzione. Io consiglierei di aspettare ad acquistare un Zen3, perché, mia opinione, difficilmente Zen3+ avrà un prezzo/prestazioni peggiore, perché se Zen3+ confermerà un +15% do performances, difficilmente troveremo una forbice del 15% nel listino. Considerando Alder prezzato su prezzo/prestazioni simile a Zen3 e il top 12900K sopra ad un 5900X, dovrebbe costringere AMD a prezzare di conseguenza un Zen3+ 5950X. Più il 12900K sarà competitivo, meno costerà Zen3+. Sono dell'idea che Zen3+ possa essere prezzato come il listino di Zen3.. ed è ovvio che se un 5950X Zen3+ costerà 700€, difficilmente un Zen3 5950X sui 610€.
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
08-09-2021, 08:03 | #68012 | |
Senior Member
Iscritto dal: Sep 2010
Città: Messina
Messaggi: 18381
|
Quote:
__________________
MSI B550 Gaming Plus - AMD Ryzen 5 5600X - HyperX Fury RGB 32GB 3200 @3600 - Kingston KC3000 1 TB/XPG SX8200 Pro 512 GB - Sapphire Radeon Pure RX 7800 XT - Corsair CX750F RGB - Cooler Master GM32-FQ |
|
08-09-2021, 08:40 | #68013 | |
Senior Member
Iscritto dal: Jan 2003
Messaggi: 10393
|
Quote:
__________________
Clevo NH55AFW (PC Specialist Nova 15,6) - Ryzen 3700X - 32 GB HyperX Impact DDR4 HX432S20IBK2 3200MHz CL18 - Geforce RTX 2070 Mobile 8Gb 115W - 1 SSDSAMSUNG 970 EVO PLUS M.2 1 TB, NVMe - 1SSD PCS PCIe M.2 SSD 1 TB |
|
08-09-2021, 09:12 | #68014 | ||
Senior Member
Iscritto dal: Jan 2010
Messaggi: 2858
|
Quote:
A quel punto basta una slide al CES 2022 di zen4 con un bel video e svanisce nuovamente ogni sogno! ....intanto vediamo all'opera questa 3D vcache e certamente zen4 ci sembrerà sempre più una specie di reattore con un SMT2 ed un throughput che sia ''vicino'' a RDNA3 o 4 che è un chiplet, e poi finalmente si potrà dire: hybrid NATIVE G-CPU PS. la cosa è delicata da tanti punti di vista, maggiormente l'aspetto costo/fattibilità; in teoria dovrebbe ''ritornare'' la parola HBM....i tempi dovrebbero essere maturi con 5nm. Partendo dal loro punto di vista ROSSO: https://www.amd.com/en/technologies/hbm https://en.wikipedia.org/wiki/Through-silicon_via https://en.wikipedia.org/wiki/Three-...grated_circuit Quote:
https://cdn.mos.cms.futurecdn.net/ft...Drf-480-80.jpg E' facile immaginare un ''sandwich'' , appunto come dici un ccx da x16, che poi sono 2 ccx da 8core ma incollati uno sopra l'altro con tanti TSV. Io mi aspetto che col 3 nm facciano una specie di chip ibrido con un pluri-''sandwich'' in cui tramite questi TSV, che poi non sono altro che collegamenti, riescono a impilare oltre la cache e cpu, pure una gpu-chiplet(che sia RDNA3 O 4 non ha importanza, quando sarà). In altre parole e sulla carta, RDNA3 dovrebbe apportare un altro 50% di performance/watt e idem RDNA4 !!!...ragazzo. ...è un salto che non hai idea (e neppure io ) nell'ambito gpu!.... Perchè in fondo se aumentano i transistor ed i collegamenti restano sempre i colli che non vanno di pari passo, almeno in un chip a costruzione orizzontale, ma magari in una costruzione verticale ( Cu-Cu&TSV --die-to-die, die-to-wafer, and wafer-to-wafer) si riesca a toppare questo fattore lento in termini di collegamento, rispetto ai core sempre più veloci. |
||
08-09-2021, 14:22 | #68015 | |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
Quote:
È sbagliato assimilare i modi di collegamento dei core con le reti? Zen 1000 aveva 2 CCX X4 a die. Se il salto dei TH a core passava dal 1 CCX al secondo, avevamo pure il passaggio dei dati dalla L3 del CCX 0 alla L3 del CCX 1, con ovvi cicli a vuoto. La cosa era ancora più lesiva se si passava da die a die, che nel caso più negativo età il secondo CCX di un die con il secondo CCX di un altro die. Se associo ciò ad una rete, è come se il CCX0 (di tutti i die) sia un nodo e il CCX1 una seconda postazione collegata a quel nodo. Per me è facile così capire la latenza di Zen 1000 vs Zen2, perché Zen2, con una L3 condivisa, faceva sì che CCX0 e CCX1 fossero in parallelo e non in seriale come Zen 1000. Però questo si scorna con Zen3, perché se Zen3 ha il core con ALU uguali a Zen2, dove cacchio arriva +19% di IPC se due CCX X4 collegati alla stessa L3 condivisa dovrebbe essere simile ad un CCX X8 con sempre la L3 condivisa? Perché il mio ragionamento tipo 2 CCX X8 con la L3 condivisa vs CCX X16 sarebbe sulla stessa riga di Zen2... E qui mi arrendo .. però nel computo non c'è solamente la prestazione in sé, ma anche il costo per quella prestazione... perché alla fine si valuta principalmente il costo/prestazioni. Ipotizzare la dimensione e la resa di un CCX X16 con 384MB di L3 in un unico die "monolitico", magari APU, vs lo stesso con la base CCX X8 + L3 impilata ed idem iGPU.. mi fa ricordare l'affermazione AMD che un 3950X monolitico sarebbe costato un +40% rispetto allo stesso ma MCM.
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
|
08-09-2021, 14:51 | #68016 |
Senior Member
Iscritto dal: Jan 2003
Messaggi: 10393
|
Se vuoi vederlo come una rete vedilo come una rete, tieni conto però che ognuno di quei collegamenti che vedi nell'articolo è in realtà un bus che ha una certa larghezza e non un collegamento seriale come nel caso delle reti, senza contare che nelle reti si tende ad avere una struttura più "gerarchica" mentre in questo caso tutti i nodi (stop) hanno pari diritti e caratteristiche.
Poi i core Zen2 e Zen3 hanno core differenti, nel senso che Zen3 ha più unità di esecuzione rispetto a Zen2, solo che molte di queste sono dedicate alle operazioni di accesso e scrittura in memoria e non tanto all'esecuzione vera a propria (fa eccezione la FPU che ha capacità nettamente migliorate, fino al 50% in più). L'aumento dell'IPC deriva dai miglioramenti di branch predictor e prefetching (meno errori sulla predizione dei salti che causano lo svuotamento delle pipeline e dati disponibili più prontamente alle unità di esecuzione), all'incremento della µ-ops cache, all'incremento della comunicazione inter-core grazie alla cache condivisa (in Zen2 la cache L3 era ancora divisa in due banchi da 16Mbytes, per cui per portare dei dati dal CCX1 al CCX2 anche se erano sullo stesso die si doveva passare per il bus esterno verso l'I/O die), alla più alta capacità efficace della L3 per core grazie all'adozione di una cache unificata da 32Mbytes anziché due da 16 Mbytes, ecc.
__________________
Clevo NH55AFW (PC Specialist Nova 15,6) - Ryzen 3700X - 32 GB HyperX Impact DDR4 HX432S20IBK2 3200MHz CL18 - Geforce RTX 2070 Mobile 8Gb 115W - 1 SSDSAMSUNG 970 EVO PLUS M.2 1 TB, NVMe - 1SSD PCS PCIe M.2 SSD 1 TB |
09-09-2021, 06:36 | #68017 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
Si, ok, ho fatto il paragone con le reti perché di simile è il senso di collegamento... La L3 di Zen2 viaggiava a circa 500GB/s con OC max (mi sembra 512GB/s il mio max).
Comunque in sti anni abbiamo avuto una impennata di prestazioni sbalorditiva... tra aumento numero core max, IPC e frequenze... si è abbassato il costo/prestazione, ma si è abbassato tantissimo pure la durata del sistema. In passato avere un sistema di 4-5 anni significava avere performances di circa il -20% sul core e in MT. Se prendiamo un Zen 1 vs un 5950X, considerando che un 1800X costava circa 500€ e oggi un 5900X si trova pure a meno...
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
09-09-2021, 08:35 | #68018 | |
Senior Member
Iscritto dal: Aug 2013
Messaggi: 603
|
Quote:
Io ho avuto un 5950x prima del 5900x ma l'ho dato via perchè, a meno che non virtualizzi, è veramente troppo potente: mi sentivo come un 12 enne con una Ferrari parcheggiata in garage senza poterla usare. Tempo che avrei potuto sfruttarlo sarebbe uscito qualcosa di meglio a meno. Ci sono ancora troppi applicativi e videogiochi che vogliono il single core e la frequenza a discapito di core cache e bus
__________________
Case: Meshify 2 Mobo: X570 Aorus Elite Cpu: Ryzen 9 5900X RAM: G.Skill Trident Z 3733 mhz CL16 Coupled FCLK 1866Mhz Gpu: RTX 3080 Gaming Pro @ 2050mhz SSD: Samsung 970 EVO Plus 2TB + Sabrent Rocket Q 1TB PSU: Corsair AX850 Dissipatore: ArcticFreezer II 420 Trattative: Troppe per nominarle tutte ma tutte senza problemi Ultima modifica di Graphite600T : 09-09-2021 alle 08:59. |
|
09-09-2021, 15:34 | #68019 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
"Windows 11 will be faster thanks to CPU, memory and storage optimizations - VideoCardz.com" https://videocardz.com/newz/windows-...-optimizations
È un articolo su Windows ma descrive delle peculiarità che bene si adatterebbero a CPU con maggiore numero di core (ed è per questo che l'ho inserito). C'è un punto, nel quale riporta che il carico di lavoro pesante non impatterà più nelle applicazioni in esecuzione in primo piano (il classico di un sistema che si siede), e questo mi fa supporre che, ad esempio con Alder, i core P eseguano il carico intensivo e i core E il resto, come forse con Zen, che il carico intensivo sfrutti un numero di lascicorw proporzionato e lasci libero dei TH giusto il necessario perché il sistema sia molto reattivo. Spezzo una lancia a favore dei core non SMT... Con BD, che non era SMT, si poteva caricare fino a 3X il valore nominale di TH (ovviamente TH corposi) senza avere nessun rallentamento.Zen, che è SMT, rallenta già a 2,5X.
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
09-09-2021, 15:57 | #68020 |
Senior Member
Iscritto dal: Jan 2002
Città: Urbino (PU)
Messaggi: 30231
|
@graphite600T.
Dipende dall'utilizzo. Per me acquistare un 5950X per gioco... non dico che sia sbagliato (nel senso che se uno vuole il max, ok, hai frequenze superiori e 8 core che si girano i pollici), però significa avere dindi da buttare. Però va anche guardato l'insieme, ovvio che se spendi già 2000-3000€ tra VGA, case, mobo e dissipazione, non sono di certo i 400€ in più tra un X8 e unX16... Anzi, se devo spendere 4000€ in una stazione, un 5950X c'è lo metto giusto per dare un senso di 360 gradi alla spesa. Comunque i core in più servono sempre nel momento in cui fai più cose contemporaneamente. Se esegui un solo programma, i core in più servono sono a che quel software li utilizza. Io ho la sclero di utilizzare il PC al 100% e nel contempo di fare tutto quello che mi va di fare. Avendo parecchi hobby (video, foto, telescopio, ecc.) ero pure arrivato a più di 3 sistemi... (esempio 3 Zen 1000), poi ho ridotto a 2 con un Zen2 ed un 1920 X12, (3900X e 3950X erano introvabili)... oggi spendi 700€ in un 5950X e ho più prestazioni di 3 X8, spendendo un totale di meno complessivamente e senza avere problemi di lan, cavi, monitor/mouse/tastiere a iosa e un maxi tavolo.
__________________
7950X - X670E Asrock PG - Aio 360 Thermaltake - RS/DU TDP max 230W - CB23 39.117 https://ibb.co/M9j2bV7 - CPU-Z 815/16427 https://valid.x86.fr/jdgu90 - No overdrive - OCBench NO RS CB23 40.697 https://ibb.co/W0qnRQB - Efficienza 7950X https://ibb.co/mGBpvgK - Codifica video https://ibb.co/Jm5Zj0M |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 07:37.