NVIDIA annuncia Tesla P100, la prima soluzione della famiglia Pascal

NVIDIA annuncia Tesla P100, la prima soluzione della famiglia Pascal

Al GTC di San Jose NVIDIA, come atteso, annuncia la prima GPU basata su architettura Pascal di prossima generazione. La scheda Tesla P100 è pensata per deep learning e calcolo parallelo, ma sarà disponibile non prima di vari mesi

di Paolo Corsini pubblicata il , alle 19:48 nel canale Schede Video
NVIDIATesla
 

tesla_p100.jpg (21441 bytes)

NVIDIA ha annunciato durante il keynote di apertura del prorpio GPU Technology Conference Tesla P100, nuova architettura di GPU della famiglia Pascal. Si tratta della GPU top di gamma della serie di nuova generazione, che NVIDIA presenta al GTC nell'implementazione destinata ai sistemi di calcolo parallelo della famiglia Tesla.

P100_SXM2.jpg

P100_SXM2_back-500x290.png

Le specifiche tecniche fornite al momento sono estremamente interessanti:

  • superficie di 610 millimetri quadrati, dato riferito alla sola GPU;
  • 3.584 CUDA cores integrati, divisi in 56 SM con 28 TPC in totale;
  • 224 texture units
  • frequenza di clock della GPU pari a 1.328 MHz, con un picco di 1.480 MHz di boost clock;
  • tecnologia di memoria HBM2, in quantitativo di 16 Gbytes;
  • frequenza di clcok della memoria pari a 1,4 GHz effettivi, per una bandwidth pari a 720 Gbytes al secondo;
  • un totale di 150 miliardi di transistor compongono questa soluzione, dato che integra sia i transistor che compongono la GPU sia quelli richiesti dalla memoria HBM2;
  • 15,3 miliardi di transistor nella sola GPU;
  • chip prodotto con tecnologia FinFET a 16 nanometri;
  • potenza di calcolo di picco pari a 5,3 TFLOPs con elaborazioni FP64 in double precision;
  • potenza di calcolo di picco pari a 10,6 TFLOPs con elaborazioni FP32 in single precision;
  • 14 Mbytes shared memory register files;
  • 4MBytes Cache L2;
  • TDP della scheda pari a 300 Watt;
  • tecnologia NVLink, per un collegamento con bandwidth aggregata pari a 5 volte quella di un collegamento PCI Express 3.0;
  • architettura di memoria di tipo unificata tra GPU e CPU, non limitato dal quantitativo di memoria complessivamente abbinato alla GPU.

Segnaliamo come il rapporto tra doppia e singola precisione, in termini di potenza di elaborazione complessiva, sia pari a 1/2, contro un valore di 1/3 nelle architetture Kepler. Questo indica in modo chiaro che il focus dell'architettura Pascal, nell'ottica di NVIDIA, è quello del calcolo parallelo. Significativo notare come le unità FP32 possano eseguire due operazioni FP16 in contemporanea, cosa non accessibile con le precedenti generazioni di GPU NVIDIA: questo permette di velocizzare ulteriormente le elaborazioni di AI che per loro natura possono venir eseguite con precizione FP16 non richiedendo un approccio più complesso.

Tesla P100 utilizza un approccio alla costruzione di tipo Chip on Wafer on Substrate, risultando essere il chip più grande costruito sino ad ora di questo tipo di tecnologia. Da questo deriva la costruzione adottata, con GPU e memoria montate su una scheda che si interfaccia direttamente con la scheda madre, nel caso di integrazione in sistemi server, permettendo il collegamento tramite NVLink sino ad un massimo di 8 GPU in parallelo.

tesla_p100_600_2.jpg

NVIDIA ha confermato come il chip P100 sia in produzione quest'oggi; i primi server basati su questa GPU, sviluppati in collaborazione con i principali partner produttori di server, arriveranno sul mercato a partire dal primo trimestre 2017. Le schede Tesla P100 non sono ancora state consegnate ai partner da NVIDIA e non è stato indicato quando lo saranno. Nelle parole di Jen-Hsun Huang le prime soluzioni Tesla P100 saranno accessibili via cloud verso la fine dell'anno e questo lascia pensare che resteranno all'interno di NVIDIA per gestire elaborazioni parallele di deep learning via calcolo remoto.

Resta aggiornato sulle ultime offerte

Ricevi comodamente via email le segnalazioni della redazione di Hardware Upgrade sui prodotti tecnologici in offerta più interessanti per te

Quando invii il modulo, controlla la tua inbox per confermare l'iscrizione

8 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
ziobepi05 Aprile 2016, 20:43 #1
HBM2!

E perche' AMD le implementerà solo con Vega?
Ho dei dubbi che Polaris possa competere...
Bivvoz05 Aprile 2016, 20:56 #2
Originariamente inviato da: ziobepi
HBM2!

E perche' AMD le implementerà solo con Vega?
Ho dei dubbi che Polaris possa competere...


NVIDIA ha confermato come il chip P100 sia in produzione quest'oggi; i primi server basati su questa GPU, sviluppati in collaborazione con i principali partner produttori di server, arriveranno sul mercato a partire dal primo trimestre 2017


Vega è previsto per inizi 2017 comunque.
conroe7105 Aprile 2016, 21:14 #3

ma è la Titan ?

ma sarebbe la nuova Titan ?
MaximilianPs05 Aprile 2016, 21:17 #4
Quindi posso farmi la 980 senza troppe remore perché di 'sto passo la nuova serie arriverà nel 2018?
AceGranger05 Aprile 2016, 21:18 #5
Originariamente inviato da: ziobepi
HBM2!

E perche' AMD le implementerà solo con Vega?
Ho dei dubbi che Polaris possa competere...


perchè questo è un grasso paper-launch; le GPU vere e proprie arriveranno nel 2017 come Vega.

Originariamente inviato da: conroe71
ma sarebbe la nuova Titan ?


teoricamente si, la ricaveranno da questo chip.
Bivvoz05 Aprile 2016, 21:19 #6
Originariamente inviato da: conroe71
ma sarebbe la nuova Titan ?


No è la Tesla, sono schede di GPU computing, in pratica accelerano le elaborazioni complesse come simulazioni di fisica, fluodinamica e cose simili (i campi sono centinaia).
Sono simili alle schede grafiche come architettura ma in realtà non sono schede grafiche.
Probabilmente la futura Titan avrà lo stesso chip.
Mparlav06 Aprile 2016, 09:24 #7
Stupisce la dimensione della gpu, persino maggiore di Maxwell ed il relativo clock (1328Mhz base vs 948Mhz della Tesla M40).

Non mi dispiacerebbe una "GTX1080" con un paio di SM disabilitati ed un clock di 1500 Mhz base: va bene anche con 8GB GDDR5+
CrapaDiLegno06 Aprile 2016, 13:06 #8
Chip realizzato senza compromessi.
Grande, anzi grandissimo, con le capacità DP al massimo (più di metà rispetto al FP32 non si può, frequenza pompata e TDP aggressivo, struttura interna ottimizzata per molti thread "stretti", continuando la diminuzione di ALU per SM iniziata con Kepler.
Direi che nvidia ha cercato il massimo per questo chippozzo. Ora vediamo cosa sforna la concorrenza.

Sarebbe interessante capire se le unità DP sono aggiunte o se nvidia con questa architettura ha adottato la soluzione di AMD di usare 2 unità FP32 per realizzare una unità FP64. Visto lo spazio occupato per "soli" 3800 shaders FP32 però sembra di no.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^