View Single Post
Old 14-05-2020, 23:03   #46654
nico88desmo
Senior Member
 
Iscritto dal: Jul 2006
Città: Treviso
Messaggi: 1559
Quote:
Originariamente inviato da mikael84 Guarda i messaggi
I tensor saranno sicuramente così anche nelle gaming (16 partizioni fp16)
Le gaming ovviamente avranno gli RT core, metà lds e meno L1.




Volta
Quindi, riassumendo nel modo più conciso possibile, a livello di SM i cambiamenti maggiori sono relativi ai tensor core e la cache L1 aumentata di 1.5x. FP32, INT32 e FP64 sono rimaste immutate a livello di quantità (ci sono ottimizzazioni?...boh).
Poi a livello di GPC, hanno portato i TPC da 7 a 8 per GPC e infine i GPC passano da 6 a 8.

Ma... guardando il diagramma a blocchi della GPU, io quasi intravedo una prima di bozza di MCM. Di fatto la cache L2 è vero che è aumentata di ~6x, però è suddivisa in due macro blocchi. Pare siano 2 GPU accoppiate...o la faccio troppo semplice?

Altra cosa molto interessante è la feature MIG, ovvero la suddivisione di una singola GPU fino ad un massimo di 7 GPU (non ho capito se indipendenti, però pare sia così).

Comunque mi viene da pensare che più passa il tempo, più sia complicato sfruttare appieno le capacità computazionali delle GPU. Lato prestazioni pure ok, ma la gestione della memoria diventa sempre più complicata.

Cosa ne pensi Mikael?
nico88desmo è offline   Rispondi citando il messaggio o parte di esso