Intel Meteor Lake: arriva l'architettura di nuova generazione
Le prime CPU Intel costruite con la tecnologia produttiva Intel 4 implementano molte novità architetturali, a partire dal design a 4 tile indipendenti. La risultante è quella di offrire processori molto potenti ma capaci di adattarsi alle rinnovate necessità di elaborazioni dei client, offrendo potenza bilanciata a un consumo che deve essere sempre più contenuto.
di Paolo Corsini pubblicato il 19 Settembre 2023 nel canale ProcessoriIntelCoreMeteor Lakenotebook consumer
In occasione del proprio evento Innovation 2023, che si sta tenendo in questi giorni a San Jose, Intel ha annunciato ufficialmente i primi processori della famiglia Meteor Lake, nome in codice che identifica le CPU di nuova generazione dell'azienda americana. Il debutto di questi processori è fissato per il 14 dicembre e rappresenta un passaggio molto importante per Intel: si tratta dei primi costruiti con il nuovo processo Intel 4 che segue quello Intel 7 usato per le precedenti generazioni di CPU Core, oltre che soluzioni che implementano importanti novità che vedremo poi portate avanti anche nelle CPU dei prossimi anni.
Per introdurre le soluzioni Meteor Lake è però importante in primo luogo parlare di tecnologie produttive. La roadmap di Intel in tema è molto ambiziosa e punta a mettere a disposizione 5 nuovi nodi nel corso di 4 anni, secondo queste tempistiche:
- Intel 7: processo con produzione in volumi al momento attuale
- Intel 4: in fase di lancio ora
- Intel 3: pronto per la produzione durante H2 2023
- Intel 20A: pronto per la produzione durante H1 2024
- Intel 18A: pronto per la produzione durante H2 2024
Se ora Intel ha in fase di lancio i processori costruiti con tecnologia Intel 4, il prossimo passaggio è già alle porte con il processo Intel 3 che sarà pronto per la prima attività di produzione in questi mesi. Meteor Lake è la prima architettura Intel a impiegare il processo Intel 4, ma è anche la prima a implementare molte importanti novità che sono tate rese accessibili sia grazie ad una forte rivisitazione dell'architettura, sia grazie all'utilizzo della tecnologia produttiva Intel 4. Il design alla base continua a essere di tipo ibrido, quindi ritroviamo core Performance ed Efficient, ma integra nuove microarchitetture tanto per i core Efficient come per quelli Performance.
Meteor Lake è costruito abbinando 4 tile, sfruttando la tecnologia Foveros 3D. Per la prima volta viene integrata in una CPU Intel un NPU AI Engine per le elaborazioni di inferenza a bassa potenza, al fine di accelerare in modo specifico le sempre più importanti e richieste elaborazioni di intelligenza artificiale senza impatti negativi su consumi. Non mancano i supporti nativi a reti Wi-Fi 6E e WiFi 7. L'IO Tile integra al proprio interno i controller Thunderbolt 4 e PCI Express Gen 5.0.
Le varie tile sono collegate in modo indipendente al fabric, così che non sia necessario accenderne uno affinché un altro venga utilizzato per una funzione specifica. Ogni IP può quindi essere gestita in modo indipendente a livello di alimentazione, così da minimizzare il consumo del processore nel complesso. Questa scelta di design ha portato a rivedere completamente il sistema di gestione del consumo implementando per ogni IP e Tile un power manager controller, che ne gestisce il consumo in modo specifico a seconda delle necessità di utilizzo.
Gestione energetica e Thread director
L'architettura a Tile delle CPU Intel Meteor Lake permette di ottimizzare la potenza di elaborazione e la gestione del risparmio energetico grazie a una struttura articolata basata su alcune ben precise scelte di design:
- architettura modulare e scalabile dei power management permette di ottenere la disaggregazione dei differenti elementi
- bandwidth ed efficienza sono migliorate grazie allo scalable fabric
- i differenti power management controller presenti su differenti tile operano in modo coordinato
- anche tra power management controller del SoC e il software del sistema è presente della coordinazione che ne migliora il funzionamento
Una peculiarità delle CPU Meteor Lake è quella di implementare la cosiddetta Low Power Island, nella quale sono integrati due core Efficient a bassa potenza della famiglia Crestmont che intervengono quando le elaborazioni da eseguire sono a basso carico.
In questo modo viene ottimizzato il funzionamento complessivo del sistema, alla ricerca della massima efficienza energetica, in quanto i low power E-Core integrati nel SOC tile e non nel Compute tile, vengono utilizzati in background per lungo tempo sgravando i core più potenti ed energivori da queste elaborazioni.
Quando questi core vengono attivati è possibile spegnere completamente il Compute tile nel quale si trovano gli altri core Efficient e Performance, a tutto vantaggio del contenimento dei consumi di sistema.
La presenza dei low power E-Core porta ad avere in Meteor Lake un'architettura che Intel definisce di tipo 3D Performance Hybrid, nella quale cioè le 3 tipologie di core presenti si alternano nell'elaborazione ricercando, a seconda della condizione d'uso e del tipo di carico di lavoro richiesto, l'ideale bilanciamento. Tanto i core Performance come quelli Efficient sono stati rivisti rispetto alle corrispondenti implementazioni nei processori Core di 13a generazione.
P-Core - Redwood Cove
• Efficienza migliorata
• Maggiore bandwidth per core package
• Performance monitoring unit migliorata
• Feedback Intel Thread Director migliorato
E-Core - Crestmont
• Miglioramenti in termini di IPC rispetto a precedente generazione
• AI acceleration
• Enhanced Branch Prediction
• Enhanced Feedback Intel Thread Director
A governare il funzionamento delle differenti tipologie di core integrate nelle CPU Meteor Lake troviamo l'Intel Thread Director, un componente hardware a cavallo tra lo scheduler del sistema operativo e i core Efficient e Performance. È il suo intervento che stabilisce quale task debba essere inviato, e quindi elaborato, da quale tipologia di core così da massimizzare le prestazioni quando richiesto o minimizzare il consumo energetico.
Intel 4, il nuovo processo produttivo
Intel 4 è il processo produttivo di nuova generazione adottato da Intel per la costruzione dei processori della famiglia Meteor Lake. Si tratta di un'evoluzione molto importante per Intel, che in questo modo è riuscita ad ottenere poco meno di un raddoppio dell'area delle librerie high-performance rispetto a quanto messo a disposizione con il processo Intel 7 (lo spessore è incrementato da 240 a 408 nanometri).
Le altre novità a livello costruttivo del processo Intel 4 vedono una riduzione dei fin dai precedenti 4 agli attuali 3, una riduzione dello spazio tra i gate ETE, uno scaling di 0,88x del FinPitch sceso a 30 nanometri oltre all'implementazione della seconda generazione di dummy gate removal e di contact on active gate.
La tecnologia produttiva vede l'utilizzo di 18 strati metallici, con 5 interconnessioni che ora sono effettuate in "enhanced copper" rispetto a quelle in rame e in cobalto adottate con Intel 7. L'utilizzo di litografia EUV (Extreme Ultra Violet) ha permesso di ridurre il numero di maschere del 20% rispetto al processo Intel 7, con una positiva ricaduta sui tempi di produzione che si sono ridotti del 5% circa.
Il risultato finale di tutto questo lavoro di ottimizzazione è un miglioramento superiore al 20% dell'efficienza energetica complessiva dei processori costruiti con tecnologia Intel 4 rispetto a quelli basati su processo Intel 7.
Foveros Packaging
Uno degli elementi tecnici alla base dei processori Intel Meteor Lake è l'utilizzo della tecnologia Foveros per il packaging dei vari componenti, grazie alla quale Intel può montare sullo stesso package die di silicio differenti tra di loro per tecnologia produttiva e finalità di utilizzo attraverso un'interconnessione a elevatissima bandwidth.
Nel corso degli anni l'evoluzione delle tecnologie produttive e del design dei processori ha trasformato lo scopo di utilizzo del packaging, inizialmente utilizzato per creare connessioni tra processore e scheda madre oltre che proteggere fisicamente il die.
La sua evoluzione l'ha portato a diventare strumento attraverso il quale permettere l'installazione di differenti package e unità di elaborazione sullo stesso processore garantendo bandwidth elevata e al contempo efficienze energetica.
Negli ultimi anni Intel ha reso disponibili diverse tecnologie di packaging per i propri prodotti, a partire da quella Foveros multi strato adottata con i processori della famiglia Lakefield con uno stacking 3D di tipo active-on-active.
L'evoluzione successiva è rappresentata dalla tecnologia EMIB: Embedded Multi-die Interconnect Bridge, tecnologia utilizzata oggi nelle CPU Xeon della famiglia Sapphire Rapids. Sua successiva evoluzione è quella Co-EMIB, che combina EMIB con tecnologia Foveros. Un esempio di questo è la GPU Intel Data center GPU Max "Ponte Vecchio".
In Meteor Lake le necessità specifiche di Intel hanno portato a utilizzare la tecnologia Foveros, sfruttandone i benefici in termini di potenza contenuta ed elevata densità nelle interconnessioni die-to-die direttamente nel silicio. La struttura prevede l'integrazione di 4 differenti tile per la componente grafica integrata, il SoC (System on a Chip), la CPU e il tile specifico per l'I/O.
L'integrazione di tile differenti permette di ottimizzare la produzione di ogni specifica tile: la superficie più contenuta, infatti, permette di ottenere una resa superiore per ogni wafer grazie a una più ottimale gestione dell'area complessiva a disposizione. La tecnologia Foveros offre inoltre maggiore flessibilità in termini di design del prodotto: è infatti possibile sostituire un tile con altro, magari con tecnologia produttiva più sofisticata, senza dover per questo modificare le restanti tile del processore.
La roadmap interna di Intel prevede un'ulteriore evoluzione delle tecnologie di packaging dei processori nel prossimo futuro, a partire da quella Foveros Direct che permetterà di ottenere una sensibile riduzione del bump pitch grazie a connessioni copper-to-copper: ne beneficerà la densità complessiva oltre al contenimento dei consumi. A seguire troveremo il Glass Core Substrate, approccio evolutivo che permetterà di migliorare ulteriormente la gestione energetica e la densità di elaborazione dei futuri processori di casa Intel.
Sempre più spazio per l'elaborazione dell'AI
L'evoluzione di mercato spinge sempre più verso sistemi che siano dotati di un'elevata potenza di elaborazione locale, nel client come nell'edge, andando a diminuire il ruolo che possono avere i grossi sistemi nei datacenter per gestire elaborazioni che siano più circoscritte. Per questo motivo Intel ha implementato in Meteor Lake un'elevata potenza di calcolo a livello di elaborazioni di Intelligenza Artificiale, anticipando di fatto una richiesta che si sta già in parte evidenziando legata all'elaborazione da parte di client ed edge a scapito del puro approccio cloud.
Da questo nasce e si sviluppa una strategia multi piattaforma per elaborare l'intelligenza artificiale: CPU, GPU e NPU operano in parallelo, scelte in funzione del tipo di elaborazione che deve essere svolta. La NPU è particolarmente adatta a gestire l'AI quando sono in gioco elaborazioni a complessità ridotta che si sviluppano per lunghi periodi di tempo, con le quali si ottiene un evidente beneficio in termini di risparmio energetico a fronte di un tempo di elaborazione nel complesso contenuto.
In Meteor Lake Intel ha implementato, nella componente GPU, il supporto al set di istruzioni DP4A per l'accelerazione delle elaborazioni di intelligenza artificiale. Accanto a questo trova spazio la NPU, sviluppata con un mix di fixed function e programmable compute così da offrire velocità efficienza energetica e flessibilità nell’elaborazione. Al proprio interno vi sono 2 neural compute engine, una inference pipeline e un DSP programmabile.
La GPU in Meteor Lake
La componente GPU integrata nei processori Intel Meteor Lake punta, nelle intenzioni dell'azienda, ad abbinare un raddoppio delle prestazioni velocistiche per watt consumato a un set di funzionalità grafiche che sia al top di quanto richiesto dalle più recenti applicazioni tanto videoludiche come di produttività personale.
Il design interno è basato su un'architettura disaggregata, nella quale i componenti legati alla parte grafica sono disposti in differenti tile. Nel SoC Tile è presente l'Xe media engine, che integra al proprio interno due MFX ciascuno con un modulo per encoding e uno per decoding. Sempre nel SoC Tile è presente l'Xe Display Engine, dotato di 4 display pipeline delle quali 2 sono di tipo a basso consumo; è presente una nuova modalità a bassa potenza per media playback.
Il display engine è dotato di supporto HDMI 2.1 e DP 2.1 20G oltre che eDP 1.4; permette di gestire quale massimo la risoluzione 8K60 HDR, oppure sino a 4 flussi video 4k60H HDR salendo sino ad una frequenza di refresh di 360Hz con risoluzione di 1080p e 1440p.
Il Graphics Tile è quello all'interno del quale risiede la componente GPU, indicata con il nome di XeLPG: questo il nome della GPU integrata in Meteor Lake. Nel confronto con la GPU di precedente generazione, indicata con il nome di XeLP, troviamo nel nuovo arrivato prestazioni che raddoppiano a parità di consumo grazie a clock superiore, GPU più ampia in termini di unità di elaborazione e con maggiore efficienza architetturale.
L'aumento della frequenza di clock è stato reso possibile dalla tecnologia produttiva a 5nm adottata per questo componente, delegata alla taiwanese TSMC per la produzione; la GPU è stata ampliata grazie all'integrazione di 8 core Xe, ai 128 vector engines contro i 96 precedenti, alla presenza di 2 geometry pipeline contro la singola precedente, all'aumento da 6 a 8 dei sample e da 3 a 4 dei pixel backend. Questa GPU integra, per la prima volta in un'architettura integrata Intel, il supporto al Ray Tracing, grazie a 8 unità di elaborazione dedicate.
24 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoMeglio pompare i consumi e fare andare una CPU il 20% in più con il 100% in più di energia, AMD ha fatto lo stesso.
Sono architetture molto efficienti se tenute basse di volt e senza arrivare a oltre 5.5GHz.
Guarda che non è che alla intel o alla AMD sono tutti stronzi eh.
In primis M1 ha i suoi alti e bassi, non è fatto di magia. Su alcune operazioni fortemente ottimizzate va alla grande ma se lo fai uscire dalla "zona di confort" la musica cambia di brutto.
In secondo luogo bisogna sempre ricordare che le cpu X86 per importanti questioni di retrocompatibilità sono costrette a portarsi non poca zavorra su ogni singolo core.
Al cinebench sembra discretamente più efficiente l'apu 7945HX da 16 coreche ha prestazioni più che doppie rispetto all'Apple m2 pro....
PS m1 pro ha un tdp dichiarato di 30W....
M1 10W ma non sembra più veloce del Ryzen 5675U @15W costruito con i meno efficienti 7nm..
Efficiente si, ma nulla di non visto.... anzi
Si e no. Nel senso che questo non ha impedito alle cpu con ISA x86 di essere più efficiente dai server fino agli smartphone... è l'implementazione a fare una grande differenza.
PS m1 pro ha un tdp dichiarato di 30W....
M1 10W ma non sembra più veloce del Ryzen 5675U @15W costruito con i meno efficienti 7nm..
Efficiente si, ma nulla di non visto.... anzi
Il 5675U però su quasi tutti i portatili su cui è montato è settato per poter andare a 20/25W, non a 15W. Che comunque sono il 50% in più eh.
Si può dare contro ad Apple per tanti motivi ma M1 è stato un bello scossone nel mondo dei SoC e sinceramente è innegabile.
Poi che possano essere in grado di fare roba simile anche Intel ed AMD nulla in contrario, sono sicuro.
Meglio pompare i consumi e fare andare una CPU il 20% in più con il 100% in più di energia, AMD ha fatto lo stesso.
Sono architetture molto efficienti se tenute basse di volt e senza arrivare a oltre 5.5GHz.
Aggiungere anche e come Nvidia che da una potenza in piu' a discapito di un consumo assurdo e vende comunque.
però vedo che il marketing intel ha inseguito per una volta quello AMD usando la parola 3D sia nelle slide che nel resto
aspettiamo nuovi picchi di perf/watt
Non credo valga la pena aspettare Meteor Lake/Arrow Lake in ambito desktop.
Il mese prossimo mi farò un 14900K con 192GB di DDR5...
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".