Entra

View Full Version : L'acceleratore Hopper H100 stupisce anche NVIDIA: è più potente di quanto dichiarato in origine


Redazione di Hardware Upg
04-10-2022, 07:01
Link alla notizia: https://www.hwupgrade.it/news/skvideo/l-acceleratore-hopper-h100-stupisce-anche-nvidia-e-piu-potente-di-quanto-dichiarato-in-origine_110672.html

NVIDIA ha aggiornato i dati sulla potenza di calcolo dell'acceleratore H100: da 30 e 60 TFLOPs con calcoli FP64 e FP32 si passa a 34 e 67 TFLOPs. Un miglioramento probabilmente dovuto a una frequenza operativa del chip pił alta delle attese iniziali.

Click sul link per visualizzare la notizia.

Sp3cialFx
04-10-2022, 08:10
siamo ormai ai 2 petaflops in INT8 / FP8 (senza sparsity), sticazzi

joe4th
04-10-2022, 10:21
Quindi ratio FP64/FP32 1:2. Bisognerebe capire se quei 34 TFLOPS in FP64 sono "semplici" oppure riferiti al FP64 tensor core. La precedente A100, infatti aveva 9.7 TFLOPS FP64 e 19.5 TFLOPS tensor core. Mi sembrerebbe strano che siano riusciti a triplicare le prestazioni FP64, dove di solito tengono il braccino corto.

Comunque vedremo quale sistema T500 equipaggeranno...

Gyammy85
04-10-2022, 11:08
Quindi ratio FP64/FP32 1:2. Bisognerebe capire se quei 34 TFLOPS in FP64 sono "semplici" oppure riferiti al FP64 tensor core. La precedente A100, infatti aveva 9.7 TFLOPS FP64 e 19.5 TFLOPS tensor core. Mi sembrerebbe strano che siano riusciti a triplicare le prestazioni FP64, dove di solito tengono il braccino corto.

Comunque vedremo quale sistema T500 equipaggeranno...

Sono 34 normali e 67 con i tensor
La mi250x fa 47,9 normali e 95,7 con le matrici, la h100 arriva a 700 watt mentre la amd max 560 watt
La metteranno in sistemi ia, ma a livello generico e alta precisone resta sempre sotto

Sp3cialFx
04-10-2022, 11:12
Quindi ratio FP64/FP32 1:2. Bisognerebe capire se quei 34 TFLOPS in FP64 sono "semplici" oppure riferiti al FP64 tensor core. La precedente A100, infatti aveva 9.7 TFLOPS FP64 e 19.5 TFLOPS tensor core. Mi sembrerebbe strano che siano riusciti a triplicare le prestazioni FP64, dove di solito tengono il braccino corto.

Comunque vedremo quale sistema T500 equipaggeranno...

FP64: 34 base, 67 tensor core

joe4th
04-10-2022, 18:27
FP64: 34 base, 67 tensor core

OK, grazie, quindi 34 TFLOPS base, che diventano 26 TFLOPS per la versione PCIe, magari abbinato a un dual EPYC 7773X (che un 3 TFLOPS li dovrebbe fare), senza l'ambaradan custom SMX5. Peccato per la RAM, che non e' aumentata da 80GB della versione precedente. Inoltre se ho ben capito la versione PCIe consuma meno (350W rispetto ai 700W dell'SMX5).

Si conoscono gia' i prezzi delle due versioni?