Supercomputer, c'è una novità nella TOP 10: fate largo a Perlmutter [Archivio]

Redazione di Hardware Upg

30-06-2021, 06:48

Link alla notizia: https://www.hwupgrade.it/news/server-workstation/supercomputer-c-e-una-novita-nella-top-10-fate-largo-a-perlmutter_98849.html

La classifica TOP500 di giugno 2021 non vede sconvolgimenti rispetto al passato, ma c'è una new entry nella TOP 10: il supercomputer Perlmutter, un sistema con CPU AMD EPYC e acceleratori Nvidia A100 che tocca 64,6 petaflop/s.

Click sul link per visualizzare la notizia.

Piedone1113

30-06-2021, 07:10

Potenza non è però sempre sinonimo di efficienza e per questo nella lista parallela denominata Green500 non troviamo al vertice Fugaku ma MN-3, un sistema di Preferred Networks ubicato in Giappone. Con un'efficienza di 28,7 gigaflops/watt è davanti all'HiPerGator AI della University of Florida, che si ferma a 29,52 gigaflops/watt. Da segnalare anche in questa lista l'ottima performance di Perlmtter, sesto per efficienza (25,55 gigaflops/watt) e quinto per potenza.

Come Volevasi dimostrare Arm Aumentando le prestazioni perde in efficienza.

AceGranger

30-06-2021, 08:23

Come Volevasi dimostrare Arm Aumentando le prestazioni perde in efficienza.

non è dimostrato una fa va è...., solo che quel supercomputer è stato "disegnato" sulle massime prestazioni e non sull'efficienza :rolleyes: .

anche perchè è in posizione 9 mica fuori classifica :asd: e, oltretutto, 5 dei 9 supercomputer green sono molto piccoli, e hanno molti meno problemi legati ai consumi dei nodi di interconnessione.

Moffus98

30-06-2021, 10:17

Interessante

Notturnia

30-06-2021, 10:49

credo ci sia un errore nell'articolo..

il primo ha 28,7 GF/Watt e il secondo 29,52 ?? credo sia sbagliato visto che 29,52 è migliore di 28,7 essendo un rapporto di efficienza

Piedone1113

30-06-2021, 11:02

non è dimostrato una fa va è...., solo che quel supercomputer è stato "disegnato" sulle massime prestazioni e non sull'efficienza :rolleyes: .

anche perchè è in posizione 9 mica fuori classifica :asd: e, oltretutto, 5 dei 9 supercomputer green sono molto piccoli, e hanno molti meno problemi legati ai consumi dei nodi di interconnessione.
Uno ha 25.55 Gflop/watt (HPE cray dell'articolo) ( 5 come prestazioni assolute e 6 nella green 500)
l'altro ha 14,4 Gflop/watt (Fugaku) (1 come prestazioni assolute e 20 nella green500)

CrapaDiLegno

30-06-2021, 11:49

Sì ma stai comparando mele con pere.
Uno è un PC full CPU, con solo unità vettoriali collegate a queste, tanto che si parla di qualche miliopne di core, non di migliaia, l'altro (o gli altri) server sono tutti formati da CPU e GPU che sono nettamente più efficienti a fare conti matriciali. Si parla di ordini di grandeza differenti per numero di nodi, di interconnessioni e necessità di raffreddamento.
Fai un server HPC di sole CPU Intel/AMD e poi mi dici a che consumi arrivi per avere le stesse prestazioni del Fugaku.

Quindi la tesi che ARM perde in efficienza quando si aumentano le prestazioni è tanto vera (perché è scontata la cosa) quando non dimostrata da questo esempio.
Il fatto è che pur perdendo in efficienza rimane decisamente più efficiente comunque dell'architettura x86 (vedesi per esempio l'M1 di Apple) che qui nel confronto che stai facendo è aiutata dalle immense capacità computazionali delle GPU.

Piedone1113

30-06-2021, 12:10

Sì ma stai comparando mele con pere.
Uno è un PC full CPU, con solo unità vettoriali collegate a queste, tanto che si parla di qualche miliopne di core, non di migliaia, l'altro (o gli altri) server sono tutti formati da CPU e GPU che sono nettamente più efficienti a fare conti matriciali. Si parla di ordini di grandeza differenti per numero di nodi, di interconnessioni e necessità di raffreddamento.
Fai un server HPC di sole CPU Intel/AMD e poi mi dici a che consumi arrivi per avere le stesse prestazioni del Fugaku.

Quindi la tesi che ARM perde in efficienza quando si aumentano le prestazioni è tanto vera (perché è scontata la cosa) quando non dimostrata da questo esempio.
Il fatto è che pur perdendo in efficienza rimane decisamente più efficiente comunque dell'architettura x86 (vedesi per esempio l'M1 di Apple).
Io starei comparando mele con pere?
M1 su PP5nm è solo il 30% più efficiente di apu zen lw su 7 nm.
Quindi l'esempio che hai riportato non fa testo.
Come ben saprai poi una infrastruttura non può essere separata dal resto, ed M1 non è solo Arm, ma tante cosette appicciache vicino, dunque perchè io non posso far riferimento all'infrastruttura mentre tu puoi?

CrapaDiLegno

30-06-2021, 13:00

Io starei comparando mele con pere?
M1 su PP5nm è solo il 30% più efficiente di apu zen lw su 7 nm.
Quindi l'esempio che hai riportato non fa testo.
Come ben saprai poi una infrastruttura non può essere separata dal resto, ed M1 non è solo Arm, ma tante cosette appicciache vicino, dunque perchè io non posso far riferimento all'infrastruttura mentre tu puoi?

"Solo" 30% direi che non è poco se quelle sono le misure. Hai link con le misurazioni precise? Perché visti i consumi dei portatili della Mela e delle prestazioni ottenute direi che sono un p' di più, ma magari sono solo impressioni e dei link con le misurazioni precise danno un quadro migliore.
E comunque che cosa c'entra il fatto che io abbia accennato all'M1 quando tu hai comparato mele con pere cercando di estrapolare l'efficienza di un core tramite i calcoli che fa (e non li fa nemmeno lui visto che li fa l'unità vettoriale creata da Fujitsu che non c'entra nulla con l''architettura ARM) mettendolo a confronto con un sistema x86+GPU in cui la capacità di calcolo (ed efficienza) è per l'80% è proprio dovuta alle GPU?
Ti sei mai chiesto perché i server HPC negli ultimi anni stanno diventando tutti ibridi e non ce ne sono più di nuovi basati solo su CPU x86 come prima?
Perché non c'è un sistema HPC con 7.6 milioni di core x86 capaci di andare come il Fugaku consumando uguale o meno?
Forse perché non ce la si fa con i soli core x86?

P.S: e dimenticavo, le Xeon Phi di Intel... stesso principio dei processori Fujitsu, x86 con unità di calcolo vettoriale dedicate (anzi due) che prendevano sberle da GPU con 2 PP più vecchi.

Piedone1113

30-06-2021, 14:07

"Solo" 30% direi che non è poco se quelle sono le misure. Hai link con le misurazioni precise? Perché visti i consumi dei portatili della Mela e delle prestazioni ottenute direi che sono un p' di più, ma magari sono solo impressioni e dei link con le misurazioni precise danno un quadro migliore.
E comunque che cosa c'entra il fatto che io abbia accennato all'M1 quando tu hai comparato mele con pere cercando di estrapolare l'efficienza di un core tramite i calcoli che fa (e non li fa nemmeno lui visto che li fa l'unità vettoriale creata da Fujitsu che non c'entra nulla con l''architettura ARM) mettendolo a confronto con un sistema x86+GPU in cui la capacità di calcolo (ed efficienza) è per l'80% è proprio dovuta alle GPU?
Ti sei mai chiesto perché i server HPC negli ultimi anni stanno diventando tutti ibridi e non ce ne sono più di nuovi basati solo su CPU x86 come prima?
Perché non c'è un sistema HPC con 7.6 milioni di core x86 capaci di andare come il Fugaku consumando uguale o meno?
Forse perché non ce la si fa con i soli core x86?
Forse perchè essendo molto nazionalisti i giapponesi preferiscono spendere i soldi statali dandoli alle aziende nazionali, invece che ad aziende estere?

Ma tornando al tuo sproliloquio:
Come Volevasi dimostrare Arm Aumentando le prestazioni perde in efficienza.

dove avrei nominato le mele e dove le pere?

Da una semplice frase ( e constatazione oggettiva, basati su dati appurati) ti sei fatto un castello.
Per un confronto chip M1 vs Chip 5800U vai di ricerca e scoprirai che 5nm vs 7nm incide molto più che Arm vs X86 lato efficienza e che un'ipotetica APU 6800u su 5nm non avrebbe nulla di inconfrontabile con M1.
Quello che ancora non hanno capito in molti che ARM vs X86 oggi sono molto più simili di quanto si possa credere ( con le unità di calcolo interno di x86 che lavorano in risc e molte nuove istruzioni Arm che operano con frontend cisc è complicato anche definire x86 cisc e arm risc)

CrapaDiLegno

30-06-2021, 16:58

Ma tornando al tuo sproliloquio:

dove avrei nominato le mele e dove le pere?

Sproloquio?
Magari rileggi bene quello che hai scritto tu e quello che ho scritto io che qui di sproloqui per cercare di difendere un'affermazione buttata là senza alcun senso non li sto facendo io.
Comunque le mele e le pere stanno qui:
Uno ha 25.55 Gflop/watt (HPE cray dell'articolo) ( 5 come prestazioni assolute e 6 nella green 500)
l'altro ha 14,4 Gflop/watt (Fugaku) (1 come prestazioni assolute e 20 nella green500)

Ovvero hai estrapolato le prestazioni di ARM da un sistema che non usa l'ISA ARM per fare i conti e lo hai confrontato con uno che non usa x86 per fare i conti ma "un'appendice" (per altro discreta e neanche integrata) senza ombra di dubbio (quello sì con prove, riprove e fatti certificati) che è molto ma molto più efficiente di quanto non possa fare x86 e le sue AVX 128,256 o 512 che siano, tanto che, ripeto, sono anni che nessuno pensa di fare più un sistema HPC con sole CPU x86, mentre di server con sole CPU ARM ci sono.

Poi boh, tutto il resto sull'M1 prendilo come vuoi, ma è un confronto mele con mele da cui poi puoi decidere come interpretare i numeri (più, meno, uguale), il tuo da cui hai tratto la conclusione:
Come Volevasi dimostrare Arm Aumentando le prestazioni perde in efficienza.
è mele con pere, per cui la dimostrazione non ha senso.

Che poi qualsiasi cosa che è pensata per avere performance rinunci in parte anche ai consumi è ovvio, palese e scontato, ma non trova alcun riscontro nei numeri che hai voluto evidenziare.