Supercomputer, c'è una novità nella TOP 10: fate largo a Perlmutter

Supercomputer, c'è una novità nella TOP 10: fate largo a Perlmutter

La classifica TOP500 di giugno 2021 non vede sconvolgimenti rispetto al passato, ma c'è una new entry nella TOP 10: il supercomputer Perlmutter, un sistema con CPU AMD EPYC e acceleratori Nvidia A100 che tocca 64,6 petaflop/s.

di pubblicata il , alle 07:48 nel canale Server e Workstation
AMDIntelNVIDIA
 

C'è un nuovo ingresso nelle prime dieci posizioni della classifica TOP500 che mette in fila i supercomputer più potenti al mondo. Al quinto posto troviamo Perlmutter, un sistema ospitato al NERSC del Lawrence Berkeley National Laboratory del Dipartimento dell'Energia statunitense.

Basato sulla piattaforma HPE Cray "Shasta", è basato su CPU AMD EPYC e 1536 acceleratori Nvidia A100: questo connubio permette a Perlmutter di raggiungere una potenza di 64,6 petaflop/s. Al vertice rimane il giapponese Fugaku con 442 Pflop/s rilevati con il benchmark HPL (High-Performance Linpack): si tratta del supercomputer il più veloce al mondo per distacco in questo momento grazie a oltre 7,6 milioni di core custom ARM A64FX realizzati da Fujitsu. Al secondo posto troviamo infatti lo statunitense Summit con "appena" 148,8 Pflop/s.

Secondo alcuni, Fugaku può essere visto già come il primo computer exascale, ossia in grado di garantire prestazioni di un exaflop/s (mille petaflop/s). Secondo la TOP500, con calcoli "a singola o persino precisione inferiore, che spesso sono usati in machine learning e IA, le prestazioni di picco di Fugaku superano l'exaflop/s".

In questa edizione della classifica ci sono alcune novità da segnalare, ossia la grande crescita di AMD. Da novembre 2020 a giugno 2021, il numero di sistemi AMD nella TOP500 è più che raddoppiato, passando da 21 sistemi a 49, ma se si guarda la lista dal giugno 2020 a oggi, il numero di sistemi con hardware AMD è cresciuto di quasi 5 volte, da 10 a 49.

Al momento, si contano tre sistemi con CPU AMD nella TOP 10: oltre a Perlmutter (EPYC 7763), ecco al sesto posto Selene (EPYC 7742) e il JUWELS Booster Module in ottava posizione (EPYC 7402), tutti coadiuvati da acceleratori Nvidia A100.

Per quanto riguarda l'Italia, al nono posto troviamo l'HPC5 di Eni, una soluzione Dell EMC PowerEdge C4140 con CPU Intel Xeon Gold 6252 e acceleratori Nvidia Tesla V100 per una potenza di 35,5 Pflop/s.

Un altro elemento d'interesse è la riduzione del numero dei sistemi cinesi nella lista TOP500, con un calo da 212 a 186 unità. Al momento non è chiaro il motivo di questo arretramento, ma è senza dubbio da monitorare, anche se la Cina rimane comunque davanti a tutti, con gli Stati Uniti fermi a 123 sistemi (+10 rispetto alla lista precedente). Gli USA rimangono davanti in termini di potenza complessiva, con 856,8 Pflop/s a fronte dei 445,3 Pflop/s fatti segnare dai supercomputer cinesi.

Potenza non è però sempre sinonimo di efficienza e per questo nella lista parallela denominata Green500 non troviamo al vertice Fugaku ma MN-3, un sistema di Preferred Networks ubicato in Giappone. Con un'efficienza di 28,7 gigaflops/watt è davanti all'HiPerGator AI della University of Florida, che si ferma a 29,52 gigaflops/watt. Da segnalare anche in questa lista l'ottima performance di Perlmtter, sesto per efficienza (25,55 gigaflops/watt) e quinto per potenza. Trovate ulteriori informazioni sui supercomputer e le liste complete sul sito della TOP500.

10 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Piedone111330 Giugno 2021, 08:10 #1
Potenza non è però sempre sinonimo di efficienza e per questo nella lista parallela denominata Green500 non troviamo al vertice Fugaku ma MN-3, un sistema di Preferred Networks ubicato in Giappone. Con un'efficienza di 28,7 gigaflops/watt è davanti all'HiPerGator AI della University of Florida, che si ferma a 29,52 gigaflops/watt. Da segnalare anche in questa lista l'ottima performance di Perlmtter, sesto per efficienza (25,55 gigaflops/watt) e quinto per potenza.

Come Volevasi dimostrare Arm Aumentando le prestazioni perde in efficienza.
AceGranger30 Giugno 2021, 09:23 #2
Originariamente inviato da: Piedone1113
Come Volevasi dimostrare Arm Aumentando le prestazioni perde in efficienza.


non è dimostrato una fa va è...., solo che quel supercomputer è stato "disegnato" sulle massime prestazioni e non sull'efficienza .

anche perchè è in posizione 9 mica fuori classifica e, oltretutto, 5 dei 9 supercomputer green sono molto piccoli, e hanno molti meno problemi legati ai consumi dei nodi di interconnessione.
Moffus9830 Giugno 2021, 11:17 #3
Interessante
Notturnia30 Giugno 2021, 11:49 #4
credo ci sia un errore nell'articolo..

il primo ha 28,7 GF/Watt e il secondo 29,52 ?? credo sia sbagliato visto che 29,52 è migliore di 28,7 essendo un rapporto di efficienza
Piedone111330 Giugno 2021, 12:02 #5
Originariamente inviato da: AceGranger
non è dimostrato una fa va è...., solo che quel supercomputer è stato "disegnato" sulle massime prestazioni e non sull'efficienza .

anche perchè è in posizione 9 mica fuori classifica e, oltretutto, 5 dei 9 supercomputer green sono molto piccoli, e hanno molti meno problemi legati ai consumi dei nodi di interconnessione.

Uno ha 25.55 Gflop/watt (HPE cray dell'articolo) ( 5 come prestazioni assolute e [SIZE="3"]6[/SIZE] nella green 500)
l'altro ha 14,4 Gflop/watt (Fugaku) (1 come prestazioni assolute e [SIZE="3"]20[/SIZE] nella green500)
CrapaDiLegno30 Giugno 2021, 12:49 #6
Sì ma stai comparando mele con pere.
Uno è un PC full CPU, con solo unità vettoriali collegate a queste, tanto che si parla di qualche miliopne di core, non di migliaia, l'altro (o gli altri) server sono tutti formati da CPU e GPU che sono nettamente più efficienti a fare conti matriciali. Si parla di ordini di grandeza differenti per numero di nodi, di interconnessioni e necessità di raffreddamento.
Fai un server HPC di sole CPU Intel/AMD e poi mi dici a che consumi arrivi per avere le stesse prestazioni del Fugaku.

Quindi la tesi che ARM perde in efficienza quando si aumentano le prestazioni è tanto vera (perché è scontata la cosa) quando non dimostrata da questo esempio.
Il fatto è che pur perdendo in efficienza rimane decisamente più efficiente comunque dell'architettura x86 (vedesi per esempio l'M1 di Apple) che qui nel confronto che stai facendo è aiutata dalle immense capacità computazionali delle GPU.
Piedone111330 Giugno 2021, 13:10 #7
Originariamente inviato da: CrapaDiLegno
Sì ma stai comparando mele con pere.
Uno è un PC full CPU, con solo unità vettoriali collegate a queste, tanto che si parla di qualche miliopne di core, non di migliaia, l'altro (o gli altri) server sono tutti formati da CPU e GPU che sono nettamente più efficienti a fare conti matriciali. Si parla di ordini di grandeza differenti per numero di nodi, di interconnessioni e necessità di raffreddamento.
Fai un server HPC di sole CPU Intel/AMD e poi mi dici a che consumi arrivi per avere le stesse prestazioni del Fugaku.

Quindi la tesi che ARM perde in efficienza quando si aumentano le prestazioni è tanto vera (perché è scontata la cosa) quando non dimostrata da questo esempio.
Il fatto è che pur perdendo in efficienza rimane decisamente più efficiente comunque dell'architettura x86 (vedesi per esempio l'M1 di Apple).

Io starei comparando mele con pere?
M1 su PP5nm è solo il 30% più efficiente di apu zen lw su 7 nm.
Quindi l'esempio che hai riportato non fa testo.
Come ben saprai poi una infrastruttura non può essere separata dal resto, ed M1 non è solo Arm, ma tante cosette appicciache vicino, dunque perchè io non posso far riferimento all'infrastruttura mentre tu puoi?
CrapaDiLegno30 Giugno 2021, 14:00 #8
Originariamente inviato da: Piedone1113
Io starei comparando mele con pere?
M1 su PP5nm è solo il 30% più efficiente di apu zen lw su 7 nm.
Quindi l'esempio che hai riportato non fa testo.
Come ben saprai poi una infrastruttura non può essere separata dal resto, ed M1 non è solo Arm, ma tante cosette appicciache vicino, dunque perchè io non posso far riferimento all'infrastruttura mentre tu puoi?


"Solo" 30% direi che non è poco se quelle sono le misure. Hai link con le misurazioni precise? Perché visti i consumi dei portatili della Mela e delle prestazioni ottenute direi che sono un p' di più, ma magari sono solo impressioni e dei link con le misurazioni precise danno un quadro migliore.
E comunque che cosa c'entra il fatto che io abbia accennato all'M1 quando tu hai comparato mele con pere cercando di estrapolare l'efficienza di un core tramite i calcoli che fa (e non li fa nemmeno lui visto che li fa l'unità vettoriale creata da Fujitsu che non c'entra nulla con l''architettura ARM) mettendolo a confronto con un sistema x86+GPU in cui la capacità di calcolo (ed efficienza) è per l'80% è proprio dovuta alle GPU?
Ti sei mai chiesto perché i server HPC negli ultimi anni stanno diventando tutti ibridi e non ce ne sono più di nuovi basati solo su CPU x86 come prima?
Perché non c'è un sistema HPC con 7.6 milioni di core x86 capaci di andare come il Fugaku consumando uguale o meno?
Forse perché non ce la si fa con i soli core x86?

P.S: e dimenticavo, le Xeon Phi di Intel... stesso principio dei processori Fujitsu, x86 con unità di calcolo vettoriale dedicate (anzi due) che prendevano sberle da GPU con 2 PP più vecchi.
Piedone111330 Giugno 2021, 15:07 #9
Originariamente inviato da: CrapaDiLegno
"Solo" 30% direi che non è poco se quelle sono le misure. Hai link con le misurazioni precise? Perché visti i consumi dei portatili della Mela e delle prestazioni ottenute direi che sono un p' di più, ma magari sono solo impressioni e dei link con le misurazioni precise danno un quadro migliore.
E comunque che cosa c'entra il fatto che io abbia accennato all'M1 quando tu hai comparato mele con pere cercando di estrapolare l'efficienza di un core tramite i calcoli che fa (e non li fa nemmeno lui visto che li fa l'unità vettoriale creata da Fujitsu che non c'entra nulla con l''architettura ARM) mettendolo a confronto con un sistema x86+GPU in cui la capacità di calcolo (ed efficienza) è per l'80% è proprio dovuta alle GPU?
Ti sei mai chiesto perché i server HPC negli ultimi anni stanno diventando tutti ibridi e non ce ne sono più di nuovi basati solo su CPU x86 come prima?
Perché non c'è un sistema HPC con 7.6 milioni di core x86 capaci di andare come il Fugaku consumando uguale o meno?
Forse perché non ce la si fa con i soli core x86?

Forse perchè essendo molto nazionalisti i giapponesi preferiscono spendere i soldi statali dandoli alle aziende nazionali, invece che ad aziende estere?

Ma tornando al tuo sproliloquio:
Originariamente inviato da: Piedone1113
Come Volevasi dimostrare Arm Aumentando le prestazioni perde in efficienza.


dove avrei nominato le mele e dove le pere?

Da una semplice frase ( e constatazione oggettiva, basati su dati appurati) ti sei fatto un castello.
Per un confronto chip M1 vs Chip 5800U vai di ricerca e scoprirai che 5nm vs 7nm incide molto più che Arm vs X86 lato efficienza e che un'ipotetica APU 6800u su 5nm non avrebbe nulla di inconfrontabile con M1.
Quello che ancora non hanno capito in molti che ARM vs X86 oggi sono molto più simili di quanto si possa credere ( con le unità di calcolo interno di x86 che lavorano in risc e molte nuove istruzioni Arm che operano con frontend cisc è complicato anche definire x86 cisc e arm risc)
CrapaDiLegno30 Giugno 2021, 17:58 #10
Originariamente inviato da: Piedone1113
Ma tornando al tuo sproliloquio:


dove avrei nominato le mele e dove le pere?

Sproloquio?
Magari rileggi bene quello che hai scritto tu e quello che ho scritto io che qui di sproloqui per cercare di difendere un'affermazione buttata là senza alcun senso non li sto facendo io.
Comunque le mele e le pere stanno qui:
Originariamente inviato da: Piedone1113
Uno ha 25.55 Gflop/watt (HPE cray dell'articolo) ( 5 come prestazioni assolute e [SIZE="3"]6[/SIZE] nella green 500)
l'altro ha 14,4 Gflop/watt (Fugaku) (1 come prestazioni assolute e [SIZE="3"]20[/SIZE] nella green500)


Ovvero hai estrapolato le prestazioni di ARM da un sistema che non usa l'ISA ARM per fare i conti e lo hai confrontato con uno che non usa x86 per fare i conti ma "un'appendice" (per altro discreta e neanche integrata) senza ombra di dubbio (quello sì con prove, riprove e fatti certificati) che è molto ma molto più efficiente di quanto non possa fare x86 e le sue AVX 128,256 o 512 che siano, tanto che, ripeto, sono anni che nessuno pensa di fare più un sistema HPC con sole CPU x86, mentre di server con sole CPU ARM ci sono.

Poi boh, tutto il resto sull'M1 prendilo come vuoi, ma è un confronto mele con mele da cui poi puoi decidere come interpretare i numeri (più, meno, uguale), il tuo da cui hai tratto la conclusione:
Originariamente inviato da: Piedone1113
Come Volevasi dimostrare Arm Aumentando le prestazioni perde in efficienza.

è mele con pere, per cui la dimostrazione non ha senso.

Che poi qualsiasi cosa che è pensata per avere performance rinunci in parte anche ai consumi è ovvio, palese e scontato, ma non trova alcun riscontro nei numeri che hai voluto evidenziare.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^