Instinct MI300, la APU per i supercomputer è già in funzione nei laboratori AMD

Instinct MI300, la APU per i supercomputer è già in funzione nei laboratori AMD

Durante il Wells Fargo 2022 TMT Summit, il CTO di AMD Mark Papermaster ha dichiarato che la APU Instinct MI300 destinata al settore dei supercomputer è già in funzione nei laboratori di AMD. Il progetto "fonde" i core Zen 4, quelli CDNA 3, Infinity Cache e memoria HBM su un unico package.

di pubblicata il , alle 10:01 nel canale Processori
Radeon InstinctAMDZenCDNA
 

La APU Instinct MI300 destinata al settore dei supercomputer, attesa nel 2023-2024, è già in funzione nei laboratori di AMD. La notizia arriva direttamente da Mark Papermaster, CTO della società, durante il Wells Fargo 2022 TMT Summit, dove ha parlato (via Seeking Alpha) di una MI300 già "ritornata nei laboratori", il che significa cha soluzione è già stata prodotta e gli ingegneri ne stanno verificando il funzionamento a tutto tondo.

La nuova APU segnerà probabilmente un punto di svolta per l'intera industria perché sarà il prodotto della fusione di diversi chiplet con core Zen 4, unità di calcolo CDNA 3, Infinity Cache e memoria HBM, tutto in un pool di memoria coerente on-package: si punta a garantire prestazioni di oltre 8 volte superiori nell'allenamento di IA rispetto all'attuale acceleratore Instinct MI250X. AMD, inoltre, prevede un miglioramento delle prestazioni per watt in ambito IA di oltre 5 volte da parte di CDNA 3 rispetto a CDNA 2.

La APU Instinct MI300 rappresenterà il cuore del supercomputer El Capitan, un sistema che punta a offrire prestazioni superiori a 2 exaflops con calcoli a doppia precisione. Installato presso il Lawrence Livermore National Laboratory (LLNL), entrerà completamente in funzione nel corso del 2024.

AMD si avvale del processo N5 di TSMC per realizzare i chiplet CPU e GPU di MI300, ma al momento non sono stati forniti dettagli su quanti core Zen 4 e quanti CDNA 3 vedremo a bordo dell'APU. Non è chiaro al momento nemmeno quali siano i piani per la diffusione di Instinct MI300 fuori dal contesto degli HPC, ma lo scopriremo il prossimo anno.

Si tratta senza dubbio di un prodotto fondamentale per il futuro di AMD nel comparto datacenter, e la dimostrazione che la società sta andando nella direzione giusta ce la dà il mercato: NVIDIA sta facendo qualcosa di simile con Grace Hopper Superchip, mentre Intel ha in cantiere un progetto apparentemente identico chiamato "Falcon Shores", la XPU che nel 2024 metterà su un unico package core x86 e Xe-HPC con prestazioni da supercomputer. Intel si aspetta che Falcon Shores offra prestazioni per watt più di 5 volte superiori a oggi, una densità di calcolo 5 volte maggiore e una capacità di memoria e una bandwidth anch'esse 5 volte più elevate.

7 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Gyammy8502 Dicembre 2022, 10:18 #1
Strano non ne abbiano parlato il 10 novembre alla presentaizone di epyc 4th gen
CDNA3 probabilmente integra gli ai cores come su RDNA3, che arriva a fare 2,7x su RDNA2, oltre a nuovi matrix cores...anche zen 4 ha unità specifiche per l'ia
Unrue02 Dicembre 2022, 14:00 #2
Se non fosse che i supercomputer top del settore dotati di GPU AMD sono molto instabili (Frontier, Lumi) la notizia sarebbe anche interessante.

Direi che hanno ancora molta strada da fare per arrivare a Nvidia, la potenza di calcolo è solo uno dei fattori.
frankie02 Dicembre 2022, 14:22 #3
Se non ho capito male, la vera novità è avere CPU e GPU insieme, finalmente.
k0nt302 Dicembre 2022, 16:53 #4
Originariamente inviato da: Unrue
Se non fosse che i supercomputer top del settore dotati di GPU AMD sono molto instabili (Frontier, Lumi) la notizia sarebbe anche interessante.

Direi che hanno ancora molta strada da fare per arrivare a Nvidia, la potenza di calcolo è solo uno dei fattori.


E dove hai letto che le GPU AMD siano la causa dell'instabilità? Sono solo rumors, mentre il direttore del centro di ricerca qualche tempo fa ha ribadito che la loro preoccupazione non riguarda i prodotti AMD.
Relativa_Mente03 Dicembre 2022, 13:03 #5
Per il settore HPC memoria unificata CPU e GPU è un passo in avanti gigantesco. Non tanto dal punto di vista delle performance pure che andranno verificate sul campo quando il "ferro" sarà disponibile; ma per quanto riguarda lo sforzo che le software house devono mettere nello sviluppo.Niente più gestioni complicate della memoria e niente più copie D2H e H2D. Meno codice, più semplice da scrivere, mantenere e modificare.
Unrue04 Dicembre 2022, 17:50 #6
Originariamente inviato da: k0nt3
E dove hai letto che le GPU AMD siano la causa dell'instabilità? Sono solo rumors, mentre il direttore del centro di ricerca qualche tempo fa ha ribadito che la loro preoccupazione non riguarda i prodotti AMD.


Lo so dall'esperienza di chi queste macchine le usa. Lo stack software AMD GPU in ambito HPC non è ancora stabile come quello Nvidia. Frontier ad esempio è sempre giù, non solo per colpa di gpu AMD, chiaramente, data la complessità di queste macchine, ma anche per quello.
ilrossofapupu05 Dicembre 2022, 02:07 #7
Se no fa almeno, dico almeno 100°C di hot-spot per me sono dei fail clamorosi

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^