AMD Instinct MI250X: 110 Compute Unit, 128 GB di memoria HBM2E e TDP di 500W

AMD Instinct MI250X: 110 Compute Unit, 128 GB di memoria HBM2E e TDP di 500W

Il noto leaker ExecutableFix ha svelato su Twitter alcuni interessanti dettagli tecnici sui nuovi acceleratori per HPC e IA di AMD, le proposte MI250 e MI250X basate su GPU Aldebaran (CDNA 2) e parte della linea Instinct.

di pubblicata il , alle 09:31 nel canale Schede Video
Radeon InstinctAMDCDNA
 

Il leaker ExecutableFix ha diffuso nuove indiscrezioni sui futuri acceleratori AMD della serie Instinct. Da tempo si vocifera l'arrivo della nuova offerta entro l'anno, ma adesso sembra che vedremo da subito due modelli chiamati MI250 e MI250X basati su una GPU a 7 nanometri  chiamata Aldebaran e basata sulla nuova architettura CDNA 2.

La MI250X dovrebbe avere un totale di 110 Compute Unit (7040 stream processor) con una frequenza di 1,7 GHz e ben 128 GB di memoria HBM2E, come da precedenti indiscrezioni. L'acceleratore dovrebbe avere un TDP di ben 500W e garantire una potenza di circa 48 TFLOPS sia con calcoli a doppia precisione (FP64) che singola precisione (FP32), mentre dovrebbe toccare ben 383 TFLOPS con calcoli FP16 (half precision).

Per quanto riguarda MI250, la GPU dovrebbe avere un numero inferiore di Compute Unit attive (e forse frequenze meno elevate), ma al momento le specifiche esatte non sono ancora trapelate. Entrambe dovrebbero quindi basarsi sulla GPU Aldebaran, la prima di casa AMD (anzi la prima in assoluto) basata su un progetto MCM (Multi-Chip Module), dove due GPU sono poste sullo stesso package e lavorano di concerto (una sorta CrossFire a livello molto più specifico, detta in modo dozzinale).

I due acceleratori di AMD dovrebbero vedersela sul mercato dei supercomputer e dell'intelligenza artificiale con Intel Ponte Vecchio (Xe HPC) ed NVIDIA H100 (Hopper), soluzioni che però dovrebbero debuttare solo il prossimo anno. Intanto, AMD avrebbe già iniziato a progettare gli acceleratori MI300 sempre su design MCM e ha annunciato l'intenzione di migliorare l'efficienza energetica di CPU EPYC e acceleratori Instinct di 30 volte entro il 2025.

6 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Gyammy8525 Ottobre 2021, 11:26 #1
Il TDP è molto alto ma sono due gpu in mcm 2x le cu sulla mi100 e 4x le performances, solo un assaggio di quello che faranno con rdna3
supertigrotto25 Ottobre 2021, 12:29 #2
Probabile che si sia tracciata la strada per MCM anche per il settore consumer
boboviz25 Ottobre 2021, 15:47 #3
"circa 48 TFLOPS sia con calcoli a doppia precisione (FP64) che singola precisione (FP32)"


Sembra strano facciano gli stessi numeri in singola e in doppia precisione....
tuttodigitale25 Ottobre 2021, 20:15 #4
Originariamente inviato da: boboviz
Sembra strano facciano gli stessi numeri in singola e in doppia precisione....

segno più che tangibile che questa non è una scheda da gamer . Probabilmente è dovuto al fatto che l'uso dei dati a singola precisione in ambiente HPC si sia ridotto in favore di un maggior uso ed efficienza dei dati a mezza precisione. (non ho dati, ma viene da sé che il loro uso, va a discapito di altri tipi)

più che altro quello che impressiona è il numero di TFLOPs in doppia precisione...Da una parte è vero che una soluzione nativa permette di risparmiare transistor, basta considerare che ci vogliono la metà di CU a parità di throughput....ma cavolo
Gyammy8526 Ottobre 2021, 09:09 #5
Originariamente inviato da: tuttodigitale
segno più che tangibile che questa non è una scheda da gamer . Probabilmente è dovuto al fatto che l'uso dei dati a singola precisione in ambiente HPC si sia ridotto in favore di un maggior uso ed efficienza dei dati a mezza precisione. (non ho dati, ma viene da sé che il loro uso, va a discapito di altri tipi)

più che altro quello che impressiona è il numero di TFLOPs in doppia precisione...Da una parte è vero che una soluzione nativa permette di risparmiare transistor, basta considerare che ci vogliono la metà di CU a parità di throughput....ma cavolo


La singola precisione si usa un pò per tutto, ma sono le bfloat e le fp64 che fanno davvero la differenza, sia per l'ia che per tutta la roba scientifica e finanziaria
coschizza26 Ottobre 2021, 10:07 #6
Originariamente inviato da: Gyammy85
solo un assaggio di quello che faranno con rdna3

queste non sono schede rdna

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^