NVIDIA GeForce GTX 780: nella tradizione di GeForce GTX Titan

NVIDIA GeForce GTX 780: nella tradizione di GeForce GTX Titan

Con GeForce GTX 780 NVIDIA estende la propria gamma di soluzioni desktop per videogiocatori appassionati, utilizzzando la stessa GPU GK110 adottata per il modello GeForce GTX Titan. La risultante sono prestazioni velocistiche sempre più elevate di GeForce GTX 680, con un funzionamento ancor più silenzioso

di pubblicato il nel canale Schede Video
NVIDIAGeForce
 

Introduzione

Sin dal debutto della scheda video GeForce GTX Titan, nuova top di gamma dell'offerta NVIDIA per sistemi desktop, si è discusso della possibilità di avere a disposizione una scheda basata sulla stessa GPU adottata da GTX Titan con però un costo d'acquisto più contenuto dei 999 dollari, tasse escluse, ai quali quest'ultima è proposta. Una proposta di questo tipo avrebbe utilizzato una declinazione della GPU GK110 con un numero inferiore di CUDA cores abilitati e presumibilmente altre semplificazioni architetturali, così da rendere tale scheda maggiormente accessibile in termini di prezzo.

Quest'oggi NVIDIA propone, con la scheda GeForce GTX 780, non solo la prima proposta della famiglia GTX 700 ma anche la seconda scheda dotata di GPU GK110 destinata al pubblico dei videogiocatori. Prima che in GeForce GTX Titan questo chip è stato infatti utilizzato da NVIDIA per due schede della famiglia Tesla, i modelli Testa K20 e Tesla K20X, destinati all'utilizzo in server per GPU Computing. Le specifiche tecniche di questa scheda ricalcano quelle di GeForce GTX Titan, distanziandosi in misura piuttosto marcata da GeForce GTX 680 come possiamo dedurre dall'analisi della tabella seguente.

Modello

GeForce GTX 680 GeForce GTX 780 GeForce GTX Titan
GPU GK104 GK110 GK110
n° GPU 1 1 1
CUDA cores
stream processors
1.536 2.304 2.688
clock GPU 1.006 MHz 863 MHz 837 MHz
turbo clock GPU 1.058 MHz 900 MHz 876 MHz
ROPs 32 48 48
TMU 128 192 224
clock memoria 6.008 MHz 6.008 MHz 6.008 MHz
dotazione memoria 2 Gbytes 3 Gbytes 6 Gbytes
bandwidth memoria 192 GB/s 288 GB/s 288 GB/s
bus memoria 256bit 384bit 384bit
alimentazione 2x6pin 8pin+6pin 8pin+6pin

Diminuisce il numero di CUDA Cores integrati in GeForce GTX 780 rispetto a GeForce GTX Titan: passiamo da 2.688 a 2.304, con quindi 12 dei 15 streaming multiprocessors implementati nella GPU GK110 che sono attivi. Le frequenze di clock, tanto default come turbo, della GPU sono leggermente più elevate in GeForce GTX 780 mentre non cambia il sottosistema memoria, sempre con moduli GDDR5 a 6.008 MHz di clock effettivo. A variare è il quantitativo di memoria video, che passa dai 6 Gbytes di GeForce GTX Titan sino ai 3 Gbytes di GeForce GTX 780.

gpu_z.png (10800 bytes)

Nel confronto con GeForce GTX 680 tutto aumenta considerevolmente: a fronte di una diminuzione nella frequenza di clock della GPU (863 MHz contro 1.006 MHz per il valore di default) troviamo in GeForce GTX 780 il 50% in più di CUDA cores, un incremento sempre del 50% nella bandwidth massima teorica della memoria video e una variazione di simile portata nel quantitativo di memoria video.

Modello

Tesla K20 Tesla K20X GeForce GTX 780 GeForce GTX Titan
GPU GK110 GK110 GK110 GK110
n° GPU 1 1 1 1
CUDA cores 2.496 2.688 2.304 2.688
clock GPU 706 MHz 732 MHz 863 MHz 837 MHz
boost clock GPU - - 900 MHz 876 MHz
clock memoria 5.200 MHz 5.200 MHz 6.008 MHz 6.008 MHz
dotazione memoria 5 Gbytes 6 Gbytes 3 Gbytes 6 Gbytes
bandwidth memoria 208 GB/s 250 GB/s 288 GB/s 288 GB/s
bus memoria 320bit 384bit 384bit 384bit
ECC si si no no

Mettiamo ora a confronto tutte le schede NVIDIA basate su GPU GK110 appartenenti alle famiglie GeForce e Tesla. Le implementazioni più complete, quelle con 14 dei 15 streaming multiprocessors attivi per un totale di 2.688 CUDA Cores, sono dei modelli GeForce GTX Titan e Tesla K20X, entrambe dotate di 6 Gbytes di memoria video. La scheda GeForce GTX 780 integra un numero inferiore di CUDA cores rispetto al modello Tesla K20, 2.304 contro 2.496, ma guadagna margine in termini di sottosistema memoria utilizzando un bus da 384bit contro quello a 320bit della proposta Tesla. Per questo motivo differisce anche il quantitativo di memoria video, pari a 3 Gbytes nel modello GTX 780 e a 5 Gbytes in quello Tesla K20.

Una delle peculiarità della GPU GK110 di NVIDIA è quella di vantare una potenza di elaborazione in double precision che è pari a 1/3 di quella in single precision. Nella GPU GK104 il numero di unità di elaborazione in double precision è tale da mettere a disposizione una potenza di elaborazione che è di 1/24 rispetto a quella in single precision. Questa caratteristica rende la GPU GK110 particolarmente interessante in ambito di GPU Computing, lo scenario tipico di utilizzo delle soluzioni della famiglia Tesla, ma sappiamo che in GeForce GTX Titan NVIDIA ha scelto di mantenere abilitate tutte le unità di calcolo in double precision, permettendone il funzionamento a frequenza di clock di default della GPU abilitando una voce nei driver video. Con GeForce GTX 780 questo non è stato fatto, considerando il costo inferiore della scheda, anche se abbiamo intuito che sia possibile bypassare questa limitazione attraverso un qualche hack software.

shadowplay.jpg (37972 bytes)

Una interessante funzionalità che NVIDIA rende disponibile con il debutto delle schede GeForce GTX 780 prende il nome di Shadowplay. Si tratta di un pacchetto software, integrato nel tool GeForce Experience, che permette di eseguire una registrazione automatica della propria sessione di gioco, sino ad un massimo di 20 minuti, così che questa possa venir utilizzata in un secondo tempo per poter essere rivista o caricata su un servizio di streaming video.

Alla base di Shadowplay l'utilizzo del video encoder H.264 integrato nelle schede della famiglia Kepler, grazie al quale l'acquisizione del video può venir fatta senza generare un carico di lavoro addizionale per il sistema così come avviene ad esempio con approcci software tradizionali (Fraps ad esempio). Questa funzionalità verrà proposta per tutte le schede GeForce delle serie 700 e 600 basate su architettura Kepler con un aggiornamento previsto nel corso dell'estate.

 
^