|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
www.hwupgrade.it
Iscritto dal: Jul 2001
Messaggi: 75173
|
Link alla notizia: https://www.hwupgrade.it/news/skvide...or_105766.html
NVIDIA ha presentato l'architettura Hopper, alla base dei futuri acceleratori H100 in formato SXM e PCI Express 5.0. Forte di una GPU con 80 miliardi di transistor e fino a 18432 CUDA core, le soluzioni NVIDIA H100 promettono di far mangiare la polvere alla concorrenza e alla precedente generazione A100. Click sul link per visualizzare la notizia. |
![]() |
![]() |
![]() |
#2 |
Member
Iscritto dal: Jun 2021
Messaggi: 395
|
Mamma mia che MOSTRO....ma ci gira crisys ? ahahaha
|
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Feb 2005
Città: Padova
Messaggi: 898
|
"Venti GPU H100 possono sostenere l'equivalente del traffico Internet mondiale"
Poteva non scappare? |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Mar 2002
Città: Milano
Messaggi: 1715
|
|
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Nov 2017
Città: Emilia
Messaggi: 2267
|
Per curiosità, il formato FP8 citato nell'articolo è un virgola mobile a 8 bit (?) o un virgola fissa con 8 cifre decimali? Fosse quest'ultimo caso, di quanti byte è composto? Ho cercato su Wikipedia e Google ma non sono riuscito a trovare nulla...
__________________
Ci sono 10 tipi di persone: quelli che capiscono il codice binario e quelli che non lo capiscono (cit.) Il mio brano preferito di sempre |
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Sep 2006
Città: Firenze
Messaggi: 4072
|
In trepidante attesa delle versioni per comuni mortali, anche se dovessero essere introvabili e costosissime, solo per sbavare davanti al monitor
![]() |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Jan 2003
Messaggi: 2355
|
Certo e' notevole il 30 TFLOPS di FP64 e il 30 di FP32 con rapporto FP64/FP32 1:2, per quanto alla fine l'algebra lineare densa non e' molto utilizzata nelle simulazioni dei problemi fisici reali, bensi' quella sparsa e quindi tutti quei TFLOPS vanno ridimensionati di un bel po'... Volendo dal modello PCIe si possono estrapolare le prestazioni delle prossime schede RTX4090 o come si chiameranno. La RTX3090 aveva FP32 a 35.6 TFLOPS (e 1:64 per l'FP64, praticamente ininfluente, poiche' a livello delle CPU). Qui siamo a 48/60 tra PCIe e SXM5. Si puo' ipotizzare quidni una RTX4090 allineata tra quei valori, praticamente un 50-60% piu' veloce della generazione precedente.
|
![]() |
![]() |
![]() |
#8 | |
Member
Iscritto dal: Sep 2014
Messaggi: 202
|
Quote:
1 - 5 - 2 e 1 - 4 - 3 (bit per il segno - bit per la mantissa - bit per l'esponente) per completezza: 16bit -> 1 - 5 - 10 32bit -> 1 - 8 - 23 64bit -> 1 - 11 - 52 128bit -> 1 - 15 - 112 Nel pdf che ho linkato si parla anche di FFP8, che dovrebbe essere Flexible Floating-Point Format a 8 bit, ma non ho idea di come funzioni. |
|
![]() |
![]() |
![]() |
#9 |
Senior Member
Iscritto dal: Feb 2007
Città: Cosenza
Messaggi: 400
|
La versione PCe 5.0 sarà più tipo le Tesla,quindi con dissipatore passivo,oppure è probabile vederne una come la vecchia Titan V?
|
![]() |
![]() |
![]() |
#10 | |
Bannato
Iscritto dal: Sep 2010
Città: Messina
Messaggi: 18789
|
Quote:
Per il resto, credo che lovelace sia anche più veloce rispetto alla 3090, +60% mi sembra pochino, considerando che rdna3 sembra andare molto molto forte |
|
![]() |
![]() |
![]() |
#11 | |
Senior Member
Iscritto dal: May 2005
Messaggi: 12046
|
Quote:
AMD è arrivata tardi sia nell'AI sia nell'interconnessione delle GPU, per non parlare della piattaforma sotftware dove è inesistente. E' normale che AMD punti sull'unico mercato dove ha qualche possibilita di vendita.
__________________
AMD 3970X - TRX40 PRO 10G - 128 Gb - 2080Ti - Dual 4K - No More Render - Leica RTC360 & BLK360 ![]() |
|
![]() |
![]() |
![]() |
#12 | |
Bannato
Iscritto dal: Sep 2010
Città: Messina
Messaggi: 18789
|
Quote:
|
|
![]() |
![]() |
![]() |
#13 | |
Senior Member
Iscritto dal: May 2005
Messaggi: 12046
|
Quote:
![]()
__________________
AMD 3970X - TRX40 PRO 10G - 128 Gb - 2080Ti - Dual 4K - No More Render - Leica RTC360 & BLK360 ![]() |
|
![]() |
![]() |
![]() |
#14 |
Bannato
Iscritto dal: Sep 2010
Città: Messina
Messaggi: 18789
|
|
![]() |
![]() |
![]() |
#15 |
Senior Member
Iscritto dal: May 2005
Messaggi: 12046
|
quelli annunciati che conosci TU
![]() quando si aggirnerà la lista dei supercomputer attivi e rimarrà tale per svariato tempo ne riparleremo.
__________________
AMD 3970X - TRX40 PRO 10G - 128 Gb - 2080Ti - Dual 4K - No More Render - Leica RTC360 & BLK360 ![]() Ultima modifica di AceGranger : 23-03-2022 alle 08:38. |
![]() |
![]() |
![]() |
#16 |
Senior Member
Iscritto dal: Jul 2003
Città: Civis Romanus Sum
Messaggi: 7388
|
sei rimasto indietro! oggi si chiede quanto fa di hash rate/s
![]()
__________________
Asrock Q1900M , SSD 1TB, Pico Psu 90W, No Fans , No HD, zero meccanica, zero rumore! |
![]() |
![]() |
![]() |
#17 | |
Senior Member
Iscritto dal: Jan 2011
Messaggi: 3443
|
Quote:
La Mi250 fa 45TFLOPS in FP64, ma ne fa 45 anche in FP32. Ed è un doppio die. Il TPD della versione che fa questi numeri, con una banda di 3GB/s, è di 560W, non 300. Quella da 300 fa la metà di tutto, essendo un singolo die. E il doppio die sono sempre 60 miliardi di transistor. La comparazione poi con l'uso delle unità matriciali poi è improponibile, ed è proprio questo che aumenta il consumo. Questo mostro è un singolo die, che va 1 volta e mezza nei calcoli "tradizionali", rispetto a quello che AMD fa con 2 die e soprattutto questa è una vera GPU, cioè può elaborare dati grafici anche sotto virtualizzazione, roba che la Mi250 non fa essendo solo un mero coprocessore matematico. Stiamo parlando di 2 prodotti completamente diversi, con capacità diverse. Per i calcoli "tradizionali," che sono sempre meno richiesti, comunque non pongono alcun problema.. basta mettere più GPU di questo tipo e con la connessione NVLink che scala molto bene raggiungi le prestazioni che vuoi e sicuramente i consumi non sono quelli del TPD se usi solo quelle unità. Non parliamo poi del supporto SW: AMD è inesistente proprio, con Nvidia non solo hai tutto lo stack per lavorare con le GPU e sfruttarle al massimo hai anche la sicurezza che il tuo lavoro non è da buttare quando cambia l'architettura della GPU. Ricicli tutto, con la sicurezza che con la nuova generazione tutto sarà automaticamente ottimizzato per funzionare al meglio con la nuova architettura. Quindi i puri numeri che sono scritti sulla carta interessano fino ad un certo punto, perché poi per riuscire a far macinare la scheda al massimo diminuendo i tempi di elaborazione serve un lavoro dietro non indifferente, soprattutto se non hai librerie, framework e middleware già sviluppato e che sai che funziona perfettamente con l'HW a disposizione. Se dimezzo i tempi di calcolo di 2 giorni perché ho più potenza FP64 ma ci impiego 4 giorni di più a preparare modelli e dati, alla fine non risparmio niente. |
|
![]() |
![]() |
![]() |
#18 | |
Bannato
Iscritto dal: Sep 2010
Città: Messina
Messaggi: 18789
|
Quote:
E figuriamoci se non veniva fuori la storia del "2 contro 1", 700 watt a 4 nm, contenti loro, non oso immaginare il pacco completo con più gpu quanto costerà e consumerà Ricicli tutto? ma se tirano fuori una uber features ad ogni arch, mi spieghi cosa ci fai oggi con una P100 o una V100? i toast? Ah già ci fai girare il codice generico, cosa che fai con una mi25 rozza e zozza che ormai viene due soldi |
|
![]() |
![]() |
![]() |
#19 | |
Senior Member
Iscritto dal: May 2005
Messaggi: 12046
|
Quote:
in sostanza al mondo sono tutti scemi tranne te, buttano via tutti i soldi. ![]()
__________________
AMD 3970X - TRX40 PRO 10G - 128 Gb - 2080Ti - Dual 4K - No More Render - Leica RTC360 & BLK360 ![]() |
|
![]() |
![]() |
![]() |
#20 | |
Bannato
Iscritto dal: Apr 2016
Messaggi: 19106
|
Quote:
Quindi la domanda dei miners dovrebbe calare significativamente. E anche quella dei cheaters. |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 00:18.