Intel Max Series: CPU e GPU con memoria HBM per velocizzare HPC e IA

Intel Max Series: CPU e GPU con memoria HBM per velocizzare HPC e IA

Intel si prepara a introdurre Xeon CPU Max Series (nome in codice Sapphire Rapids HBM) e Data Center GPU Max Series (nome in codice Ponte Vecchio): si tratta di CPU e GPU che, grazie alla memoria HBM a bordo, puntano a velocizzare una miriade di carichi di lavoro negli ambiti HPC e IA.

di pubblicata il , alle 15:01 nel canale Processori
IntelPonte VecchioSapphire RapidsXeon
 

In occasione dell'evento Supercomputing '22 di Dallas, Intel ha annunciato la famiglia di prodotti Intel Max Series destinata al settore HPC e a quello dell'intelligenza artificiale (IA). Al suo interno troviamo Intel Xeon CPU Max Series (nome in codice Sapphire Rapids HBM) e Intel Data Center GPU Max Series (nome in codice Ponte Vecchio). La casa di Santa Clara dà quindi un nome commerciale a due prodotti di cui si era parlato sinora usando i nomi interni.

Le due soluzioni saranno il cuore del supercomputer Aurora dell'Argonne National Laboratory, un sistema che aspira a offrire una potenza di picco con calcoli a doppia precisione superiore a 2 exaflops. Attualmente il supercomputer è ancora in fase di costruzione, ma tutto procede per il meglio: nei test con 200 server di storage DAOS (Distributed Asynchronous Object Storage), Intel ha registrato una bandwidth superiore a 6 Tebibyte/s (contrazione di tera binary byte, maggiori dettagli qui).

Intel, inoltre, prevede di mettere a disposizione dei ricercatori dell'Aurora Early Science Program un "Test Development System" di Aurora formato da 128 blade, nome in codice SunSpot, entro la fine dell'anno. Il supercomputer sarà ultimato nel 2023 e conterà oltre 10.000 blade, ognuno con sei Data Center GPU Max Series e due Xeon CPU Max Series.

L'offerta "Max Series" di Intel, disponibile da gennaio 2023 (è previsto un evento il 10 dello stesso mese), nasce per consentire ai carichi di lavoro che richiedono una bandwidth elevata di eludere i tradizionali colli di bottiglia rappresentati dalle CPU e GPU.

Jeff McVeigh, general manager del Super Compute Group di Intel, ha spiegato che mentre le CPU soffrono di una bandwidth ridotta per core e hanno accesso a un ampio quantitativo di RAM, le GPU hanno il problema opposto, ovvero tanta bandwidth e poca VRAM. Di conseguenza, ci sono carichi di lavoro che risultano frenati, in cui si potrebbero raggiungere prestazioni ben superiori.

La soluzione di Intel è quella di dotare tanto le CPU quanto le GPU di memoria HBM, ovvero High Bandwidth Memory. Inoltre, grazie a oneAPI e altri tool dedicati, permettere al codice di essere gestito più facilmente tra CPU e GPU in modo da ridurre ulteriormente il tempo di calcolo.

Le CPU Xeon Max offrono fino a 56 Performance Core "Golden Cove" all'interno di quattro tile connesse tramite la tecnologia di packaging "Embedded Multi-die Interconnect Bridge" (EMIB). Sempre sul package trovano posto 64 GB di memoria HBM, garantendo così oltre 1 GB di HBM per core. A queste caratteristiche si aggiungono il supporto agli standard DDR5, PCIe 5.0 e CLX 1.1. Il TDP massimo è pari a 350W.

Le CPU Xeon Max, secondo Intel, offrono prestazioni fino a 4,8 volte maggiori rispetto alla concorrenza rappresentata da AMD EPYC "Milan-X" in carichi HPC reali, consumando il 68% di energia in meno rispetto a un cluster AMD Milan-X a parità di prestazioni. Le nuove CPU server di Intel, inoltre, supportano le estensioni AMX per incrementare le prestazioni di IA e fornire un throughput di picco 8 volte maggiore rispetto a AVX-512 per INT8 con operazioni di accumulo INT32.

Le nuove CPU possono funzionare in diverse modalità: HBM Only, HBM Flat Mode e HBM Caching Mode. Nel primo caso non è richiesta DRAM e l'avvio e il funzionamento avviene sfruttando solo la memoria HBM. Nel secondo, HBM e DRAM lavorano di concerto, mentre la terza prevede una sorta di fusione delle due.

Nei test svolti internamente da Intel, ad esempio nella modellazione climatica, le CPU Xeon Max si sono dimostrate fino a 2,4 volte più veloci di AMD Milan-X su MPAS-A usando solo la memoria HBM. Per quanto riguarda la dinamica molecolare, Intel ha registrato su DeePMD un miglioramento prestazionale di 2,8 volte rispetto ai prodotti concorrenti con memoria DDR.

Oltre ad Aurora, le CPU Xeon Max Series saranno installate anche presso il Los Alamos National Laboratory, la Kyoto University e altri centri di supercomputer in tutto il mondo. Inoltre, si prevede l'arrivo di oltre 30 design dai principali produttori di server.

Per quanto riguarda l'offerta Intel Data Center GPU Max Series, ogni acceleratore prevede fino a 128 core Xe-HPC, 128 unità ray tracing, 408 MB di cache L2, 64 MB di cache L1 e un massimo di 128 GB di memoria HBM2e. Insomma, molta memoria a bordo della GPU affinché i calcoli vengano svolti più vicino alle unità di calcolo, limitando l'accesso a capacità di memoria esterna tramite bus che potrebbero rallentare le operazioni.

L'acceleratore che finora abbiamo conosciuto come Ponte Vecchio, a detta di Intel, è in grado di offrire prestazioni superiori rispetto NVIDIA A100 in diversi carichi di lavoro: si parla di 2,4 volte le prestazioni della controparte NVIDIA in Riskfuel (ambito finanziario) e 1,5 volte nella simulazione di reazioni con NekRS in ambito fisico.

Intel prevede di introdurre tre acceleratori chiamati Max Series 1100 GPU, Max Series 1350 GPU e Max Series 1550 GPU. Il primo è una scheda dual-slot PCI Express da 300W con 56 Xe-core e 48 GB di memoria HBM2e, collegabile in parallelo ad altri acceleratori Max Series tramite i bridge Intel Xe Link.

Max Series 1350 GPU si presenta invece come un modulo OAM da 450W con 112 Xe-core e 96 GB di memoria HBM2e. In ultimo, Max Series 1550 GPU prevede 128 Xe-core e 128 GB di HBM2e su un modulo OAM da 600W. Oltre ai singoli prodotti, Intel offrirà anche un cluster con 4 GPU in formato OAM e Intel Xe Link per il collegamento ad altri cluster.

La società statunitense ha inoltre ribadito l'arrivo nel 2024 del successore di Ponte Vecchio, nome in codice Rialto Bridge. Tra i passi avanti troviamo l'aumento degli Xe core, da un massimo di 128 fino a 160, per un incremento prestazionale del 30-35%, così così il passaggio a un formato OAM di seconda generazione per portare l'alimentazione fino 800W.

Infine, prosegue il lavoro per arrivare a Falcon Shores, la XPU che metterà su un unico package core x86 e Xe-core con prestazioni da supercomputer, ma non solo: come si può vedere si prevede l'integrazione anche di unità custom.

4 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Gringo [ITF]09 Novembre 2022, 15:20 #1
Certo che le SLIDE di intel battono tutti i concorrenti apple compresa, sono bellissime e con uno stile impeccabile.....
coschizza09 Novembre 2022, 15:58 #2
Originariamente inviato da: Gringo [ITF]
Certo che le SLIDE di intel battono tutti i concorrenti apple compresa, sono bellissime e con uno stile impeccabile.....


le slide mostrano benchmark reali quindi tanta sostanza
Gringo [ITF]09 Novembre 2022, 16:09 #3
le slide mostrano benchmark reali quindi tanta sostanza

Che la sostanza ci sia nessuno lo nega, la sezione server già si sapeva che il chippone pontevecchio, uno solo aveva le capacità computazionali di ben OTTO RTX 3090, solo che per il pubblico basilare, quello che anche invidia ci ha CAGATO SOPRA non cambiano la vita, tanta roba bella tutto fantastico, ora ci stà anche il computer quantico su silicio e ottico.

BELLO TUTTO BELLO
Nel frattempo per la plebe solo la "Farina di Tarme".
frankie09 Novembre 2022, 22:33 #4
Esatto, livelli esagerati per il top, alla plebe il 13100 che è un 12100 rimarchiato.
Ma voglio ringraziarli per un modello specifico:
Grazie ARCA770

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^