Zen 4, i segreti dell'architettura dei processori Ryzen 7000

I processori Ryzen 7000 di AMD introducono l'architettura Zen 4, un progetto evolve sul progetto Zen 3 e anticipa l'architettura Zen 5 creata da zero. Zen 4 migliora in alcune aree, amplia la cache (in particolare quella L2) e punta su frequenze di boost elevate: un miglioramento che, però, implica alcuni compromessi.
di Manolo De Agostini pubblicato il 26 Settembre 2022 nel canale ProcessoriAMDRyzenZen
L'anno scorso definimmo il progetto Zen 3 alla base dei processori Ryzen 5000 desktop come "l'architettura della maturità", perché andava a colmare il deficit che le CPU AMD avevano rispetto alle controparti Intel nelle prestazioni single-thread.
Con Zen 3, fondamentalmente, AMD chiuse un'annosa rincorsa a Intel iniziata nel 2017 con la prima architettura Zen. In questo articolo andremo ad approfondire le novità di Zen 4, il cuore dei Ryzen 7000, ma senza dubbio possiamo anticipare il giudizio finale: Zen 4 è "l'architettura della stabilità" perché cresce e si evolve su Zen 3. La stabilità è sempre un elemento positivo? Non si può dire a priori e, se avete letto il nostro test delle prime CPU Ryzen 7000, forse vi sarete fatti la vostra opinione, le nostre le trovate alla fine di questo articolo.
Prima di entrare nel merito, facciamo un breve excursus sulla roadmap di AMD per quanto concerne le architetture di calcolo x86. Dopo Zen 3, di cui abbiamo visto anche una variante con 3D V-Cache a bordo, a partire da Zen 4 la roadmap di AMD si articola su tre progetti.
Zen 4 è l'architettura dei Ryzen 7000 annunciati oggi e di cui potete vedere i test dei modelli Ryzen 7 7700X e Ryzen 9 7950X. La vedremo anche a bordo delle CPU server con gli EPYC (Genoa). In futuro, inoltre, arriveranno CPU basate su core Zen 4 con 3D V-Cache e soluzioni basate su core Zen 4C per il mondo del cloud computing. Per questa generazione, AMD ha intenzione di avvalersi dei processi produttivi a 5 e 4 nanometri di TSMC.
La strategia basata su tre varianti di Zen verrà riproposta anche in futuro con Zen 5, Zen 5 con V-cache e Zen 5C. Le informazioni sono ancora limitate, ma Zen 5 è stata declamata da AMD come un'architettura totalmente nuova, un progetto che andrà oltre il semplice miglioramento incrementale di Zen 4. Aspettiamoci quindi una maggiore scalabilità, con passi avanti per quanto riguarda le prestazioni e l'efficienza energetica.
L'azienda parla di aumento delle issue width - il numero massimo di istruzioni di cui l'architettura può iniziare l'esecuzione nello stesso ciclo - e un rinnovato front-end. Parallelamente, AMD continuerà a espandere le capacità dell'architettura sul fronte dell'IA e del machine learning, probabilmente aggiungendo il supporto a nuovi formati di dati.
Per quanto riguarda i processi produttivi, AMD punterà su 4 e 3 nanometri per realizzare il Compute Die delle CPU in arrivo (i nomi in codice per ogni segmento li vedete nelle slide).
Architettura Zen, le principali novità da Zen 1 a Zen 4
L'architettura Zen introdotta nel 2017 è stata il punto di svolta per AMD nel settore desktop e non solo. Da lì la rincorsa a Intel si è fatta sempre più efficace fino ad arrivare al punto in cui oggi, per certi versi, è Intel a dover riassestarsi e inseguire. Con Zen 1 e Zen+, prodotti a 14 e 12 nanometri, AMD portava sul mercato delle CPU desktop consumer fino a 8 core dal rapporto prezzo-prestazioni competitivo, figlio di un incremento dell'IPC del 52% rispetto all'architettura Excavator di precedente generazione.
Il passaggio a Zen 2 vide cambiamenti decisamente più marcati nel progetto dei Ryzen, perché a fronte di un progresso dell'IPC del 15%, AMD passò al progetto basato su chiplet che tutt'oggi ritroviamo nei Ryzen 7000. Zen 2 portava per la prima volta la famiglia Ryzen a toccare i 16 core, anche per effetto del salto al processo produttivo a 7 nanometri. Parallelamente saliva anche la frequenza di boost, arrivando a un massimo di 4,7 GHz.
Con Zen 3 AMD face il passo avanti che le serviva sul fronte dell'IPC (+19% su Zen 2) e, mantenendo il progetto a chiplet, passò a un core complex a 8 core con 32 MB di cache L3 condivisi. Mantenendo il processo produttivo a 7 nm, l'azienda riuscì a spingere la massima frequenza di boost a 4,9 GHz, avvicinandosi ai 5 GHz.
Arriviamo ai giorni nostri con Zen 4, i cui tratti distintivi sono ben riassunti dalla slide che vedete sopra. L'IPC compie un passo avanti del 13% di media rispetto a Zen 3, la cache L2 per core sale a 1 MB e c'è il passaggio ai 5 nanometri, processo che permette al top di gamma della serie di arrivare a 5,7 GHz come massima frequenza di boost, ben 800 MHz in più rispetto al portabandiera della serie 5000.
Da sottolineare che le CPU Zen 4 sono le prime soluzioni Ryzen progettate esclusivamente per il mondo desktop (non contiamo le APU riadattate dal segmento mobile) a prevedere una GPU integrata. Basata su architettura RDNA 2, questa GPU integrata non si trova nel Compute Die del processore bensì nell'I/O Die a 6 nanometri. Ne parleremo più avanti, ora bando alle ciance: cosa permette all'IPC di salire? Cosa ha cambiato AMD all'interno dell'architettura rispetto a Zen 3? Entriamo nei dettagli.
Zen 4: prestazioni ed efficienza in cima ai pensieri di AMD
Il team di ingegneri di AMD che ha disegnato all'architettura Zen 4 ha lavorato seguendo tre direttrici volte a garantire un rapporto prestazioni-consumi migliore rispetto a Zen 3. Incremento dell'IPC su valori "a doppia cifra", insieme all'incremento delle frequenze operative, sono stati i principali veicoli del miglioramento prestazionale. Non solo, particolare focus è andato verso la latenza, ed è per questo che AMD ha raddoppiato la cache L2 per core e lavorato per migliorare l'efficacia della stessa.
Infine, per migliorare il profilo dei consumi, AMD non si è solo affidata a processi produttivi più avanzati, ma ha anche lavorato per ridurre il consumo dinamico delle CPU. Passando all'analisi del core Zen 4, AMD è intervenuta anzitutto sul front end, migliorando la branch prediction.
L'unità di branch prediction è un po' un "indovino": si occupa infatti di prevedere l'esito di un'operazione su cui si basa l'accettazione di una istruzione di salto condizionato. Ciò significa che il processore fa "un atto di fede" sulla direzione che prenderà una diramazione prima di conoscere il percorso corretto e la calcola in modo speculativo, anticipatamente. Se ci prende, la CPU non spreca cicli di clock e quindi svolge le operazioni con efficienza; se invece l'ipotesi si rivela errata, le istruzioni eseguite vengono scartate e si "rimbocca" il ramo (branch) corretto, il che porta a un ritardo e quindi a minori prestazioni.
Il front-end della CPU ha il compito di recuperare le istruzioni dalla memoria, decodificarle e metterle a disposizione delle unità di calcolo. Il suo compito è quindi quello di fornire un numero di µOP tale da tenere impegnato il back-end. Assicurarsi che quest'ultimo sia costantemente indaffarato è cruciale per permettere all'unità di calcolo di offrire le massime prestazioni.
Nel caso di Zen 4, il miglioramento è stato ottenuto mediante l'espansione delle cache L1 e L2 legate al branch target buffer (BTB): nel primo caso del 50% (da 1K a 1,5K entry), nel secondo da 6,5K a 7K entry. AMD afferma che l'unità è ora in grado di predire due "taken branches" per ciclo di clock.
Un salto condizionato può essere infatti "taken" o "not taken". Nel caso di un salto "taken" si salta in una parte differente nella memoria del programma, mentre un salto "not taken" prosegue nell'esecuzione subito dopo il salto condizionale. Predire due taken branches rende il processo di esecuzione più rapido. AMD ha inoltre incrementato la capacità della Op cache del 68% e fatto sì che possa gestire 9 macro-ops per ciclo. Per il resto è stata mantenuta la base di Zen 3.
Per quanto concerne gli engine di calcolo (Execution Engine), ovvero la parte integer e floating point della CPU, Zen 4 presenta una coda di ritiro istruzioni più ampia del 25%, un file di registro integer / floating point maggiore e buffer più profondi lungo tutto il core. Anche questo caso molti aspetti sono del tutto identici a Zen 3.
La parte di load/store è stata migliorata con una coda del 22% più ampia per le istruzioni load, si è lavorato per eliminare conflitti nelle porte della cache dati, ed è stato implementata una cache L2 il 50% più ampia del DTLB (Data Translation-Lookaside Buffer). Il resto è identico a Zen 3.
A cambiare è senza dubbio la gerarchia della cache, con una cache L2 da 1 MB per core che raddoppia quella in aiuto dei core Zen 3. AMD ha ampliato la capacità di gestire outstanding misses (cosa utile in caso di cache miss) sia dalla cache L2 alla cache L3 per core sia dalla L3 alla memoria.
L'altra novità riguarda il supporto alle istruzioni AVX-512 che serve a implementare le istruzioni VNNI e BFloat16 e accelerare i carichi di intelligenza artificiale. AMD ha implementato le istruzioni AVX-512 su data path a 256 bit, una soluzione che elimina i compromessi termici e di frequenza di altre implementazioni, seppur impatti sulle performance di picco. A ogni modo, secondo AMD, le nuove istruzioni consentono di gestire carichi di inferenza molto più velocemente che con l'architettura Zen 3: si parla di prestazioni multi-core FP32 superiori del 30% e multi-core int8 fino a 2,5 volte più veloci.
Infine, da segnalare un aggiornamento dell'ISA per un miglior supporto della virtualizzazione (X2AVIC e TSC_AUX) e un occhio alla sicurezza con Indirect Branch Restricted Speculation (IBRS) sempre attiva per CLP0 (Current Privilege Level 0).
La GPU integrata nell'I/O die
Tutte le CPU Ryzen 7000 desktop presentate offrono per la prima volta (APU derivate dal settore mobile a parte) la grafica integrata, spesso abbreviata in iGPU. Per la precisione è una GPU RDNA 2 con 2 Compute Unit in grado di lavorare fino a 2,2 GHz. Si tratta di una mossa che non guarda al gaming, anche perché questi processori si rivolgono notoriamente a chi acquista una scheda video dedicata. E allora a cosa serve?
Lo scopo di questa GPU è principalmente quello di assicurare la prima accensione del sistema ed eventuale diagnostica in caso di problemi, ma non solo: AMD punta a soddisfare le necessità dei settori business, CAD e CAM, ambiti che prevedono una CPU potente ma necessitano di elevate prestazioni grafiche.
La iGPU RDNA 2 è interessante perché supporta la decodifica AV1 10bpc/8bpc, VP9 10bpc/8bpc, H.265 10bpc/8bpc e H.264 10bpc/8bpc. Per quanto riguarda la codifica, il chip può gestire H.264 10bpc/8bpc e H.265 10bpc/8bpc.
Quanto alle uscite video, troviamo la compatibilità con HDMI 2.1 con HFR, FRL a 48 Gbps, DSC, HDR10+ e VRR. È persino DisplayPort 2.0 ready con Adaptive Sync, DSC, UHBR10 ed estensioni HDR. Completano il quadro il supporto a USB Type C con DisplayPort Alt Mode, a display fino al 4K a 60 Hz e persino alla grafica ibrida, ovvero al funzionamento insieme alla GPU dedicata.
I/O die a 6 nanometri, fondamentale per DDR5 e PCIe 5.0
Non solo la GPU integrata, che pur è l'aspetto più importante, l'architettura Zen 4 prevede un I/O Die totalmente rinnovato in cui il controller di memoria DDR5 supporta fino a 5200 MT/s con ECC, anche se tramite EXPO le memorie possono funzionare con data transfer ben superiori.
Il processore supporta un totale di 28 linee PCI Express 5.0 (24 accessibili, di cui 16 per la grafica e 8 per gli SSD NVMe), offre la tecnologia di BIOS Flashback via USB per il ripristino del firmware in caso di problemi e integra un'interconnessione Infinity Fabric ottimizzata, che serve per parlare con i Compute Die in modo efficiente e veloce. Al fine di consumare meno, l'I/O Die si affida a metodologie di gestione energetica che AMD ha applicato per la prima volta a bordo dei processori Ryzen 6000 mobile.
Una forte evoluzione in attesa della rivoluzione
Tirando le somme, Zen 4 rappresenta un'importante evoluzione rispetto a quanto offerta da Zen 3, ma allo stesso tempo non ci troviamo davanti a una rivoluzione drastica: questo ci porta a parlare "architettura della stabilità" proprio perché AMD ha cercato di preservare quanto conquistato e migliorarlo ulteriormente.
L'evoluzione è degna di nota perché Zen 4 fa da apripista a una nuova piattaforma (AM5), supporta i nuovi standard PCI Express 5.0 e DDR5, integra una GPU nell'I/O die e le istruzioni AVX-512. Inoltre, riesce a migliorare prestazioni single e multi-core in modo marcato, incrementando l'efficienza.
Le CPU Zen 4 portano quindi sul mercato molta carne al fuoco, e se prestazionalmente parlando evidenziano indubbie qualità, allo stesso tempo mostrano un aumento di consumi e temperature, frutto anche della dell'impennata dei clock decisa da AMD, che sicuramente non fa gioire nessuno.
Certo, le cose vanno sempre messe in prospettiva con la concorrenza, quindi con le soluzioni di Intel. In tal senso possiamo pronunciarci solo rispetto ai Core di 12a generazione, che di certo non brillano per consumi e temperature.
Non c'è uno strapotere di un'architettura sull'altra, e non va dimenticato che a breve Intel introdurrà i Core di 13a generazione. La battaglia è quindi serrata, e si può certo dire che AMD, a fronte di un cambiamento totale di piattaforma totale, ha creato una base solida su cui dovrà provare necessariamente a migliorare nei prossimi anni, risolvendo i problemi indicati.
4 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoAlla fine dell'articolo si parla di aumento di consumi. Vorrei capire se c'è un aumento concreto o se si parla di aumento solo perchè ci sono alcuni modelli dal TDP più elevato.
Escludendoli si sarebbe ancora parlato di aumento di consumi? Patto che, naturalmente, escluderli non significhi impoverire la gamma.
L'incremento IPC ~+13%, è buono ma AMD ci aveva abituato troppo bene.
In ogni caso, unendo l'incremento IPC all'aumento delle frequenze, si arriva ad un risultato complessivo egregio.
Superlativo il max boost, sia come frequenza 5,7GHz (ma si può arrivare a 5,850GHz), come come numero di core (da 4 a 6 al posto di 1 come con Zen3).
Per me comunque l'avrebbero dovuto commercializzare max a 125W TDP.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".