Quote:
Originariamente inviato da mikael84
I tensor saranno sicuramente così anche nelle gaming (16 partizioni fp16)
Le gaming ovviamente avranno gli RT core, metà lds e meno L1.
Volta
|
Quindi, riassumendo nel modo più conciso possibile, a livello di SM i cambiamenti maggiori sono relativi ai tensor core e la cache L1 aumentata di 1.5x. FP32, INT32 e FP64 sono rimaste immutate a livello di quantità (ci sono ottimizzazioni?...boh).
Poi a livello di GPC, hanno portato i TPC da 7 a 8 per GPC e infine i GPC passano da 6 a 8.
Ma... guardando il diagramma a blocchi della GPU, io quasi intravedo una prima di bozza di MCM. Di fatto la cache L2 è vero che è aumentata di ~6x, però è suddivisa in due macro blocchi. Pare siano 2 GPU accoppiate...o la faccio troppo semplice?
Altra cosa molto interessante è la feature MIG, ovvero la suddivisione di una singola GPU fino ad un massimo di 7 GPU (non ho capito se indipendenti, però pare sia così).
Comunque mi viene da pensare che più passa il tempo, più sia complicato sfruttare appieno le capacità computazionali delle GPU. Lato prestazioni pure ok, ma la gestione della memoria diventa sempre più complicata.
Cosa ne pensi Mikael?