GeForce GTX 970 e partizioni memoria: nuovi dettagli tecnici

GeForce GTX 970 e partizioni memoria: nuovi dettagli tecnici

NVIDIA fornisce nuove informazioni tecniche sul perché le schede GeForce GTX 970 abbiano una doppia partizione del controller memoria. Le ricadute prestazionali sono specifiche e molto contenute e non tali da cambiare il quadro complessivo su questo prodotto

di pubblicata il , alle 09:59 nel canale Schede Video
NVIDIAGeForce
 

Nella giornata di ieri, con questa notizia, abbiamo segnalato come le schede NVIDIA GeForce GTX 970 siano caratterizzate da un quantitativo di memoria video pari a 4 Gbytes ma che questo sia in realtà diviso in due distinte partizioni. La prima, di capacità pari a 3,5 Gbytes, è quella principale ed è chiamata in causa da GPU e driver video in ogni momento in cui venga richiesta della memoria video. La seconda, da 0,5 Gbytes di capacità, è invece attivata solo quando i 3,5 Gbytes iniziali non sono più sufficienti a gestire tutti i dati a disposizione.

Una prima spiegazione ufficiale fornita da NVIDIA evidenzia come siano presenti due partizioni e come l'utilizzo di tutto il quantitativo a disposizione porti a prestazioni velocistiche che sono pressoché proporzionali a quanto ottenibile con le schede GeForce GTX 980 in pari condizioni. Queste ultime sono dotate sempre di 4 Gbytes di memoria video, alla stessa frequenza di clock di 7 GHz effettivi dei moduli adottati dalle schede GeForce GTX 970.

Sono emersi nuovi dettagli più approfonditi sul motivo per il quale NVIDIA ha scelto di dotare le schede GeForce GTX 970, e non quelle GeForce GTX 980, di questo particolare partizionamento della memoria video onboard. La prima novità è una rivisitazione delle specifiche delle schede GeForce GTX 970 in due elementi: il numero di ROPs e il quantitativo di memoria cache L2 integrato nella GPU. La rivisitazione non riguarda una modifica intervenuta nel tempo ma una correzione di quanto inizialmente indicato da NVIDIA nella propria reviewer's guide fornita alla stampa. In questo documento, che fornisce indicazioni su vari parametri tecnici delle GPU in prova, l'azienda americana ha originariamente ed erroneamente indicato per GeForce GTX 970 la presenza dello stesso numero di ROPs di GeForce GTX 980 oltre che del medesimo quantitativo di memoria cache L2 quando in realtà, per via dell'architettura di GeForce GTX 970, così non è. Nella tabella seguente sono messe a confronto le specifiche precedenti con quelle aggiornate, accanto a quelle di GeForce GTX 980.

Modello

GeForce GTX 980 GeForce GTX 970
specifiche errate
GeForce GTX 970
nuove specifiche
GPU GM204 GM204 GM204
CUDA cores 2.048 1.664 1.664
clock GPU 1.126 MHz 1.050MHz 1.050MHz
boost clock GPU 1.216 MHz 1.178 MHz 1.178 MHz
ROPs 64 64 56
TMU 128 104 104
cache L2 2MB 2MB 1,75MB
clock memoria 7.008 MHz 7.008 MHz 7.008 MHz
dotazione memoria 4 Gbytes 4 Gbytes 4 Gbytes
bandwidth memoria 224 GB/s 224 GB/s 192 GB/s
bus memoria 256bit 256bit 256bit
alimentazione 6pin+6pin 6pin+6pin 6pin+6pin

La riduzione nel numero di ROPs e della cache L2 è legata alla presenza nella GPU GeForce GTX 970 di 13 SMM attivi contro i 16 della GPU GeForce GTX 980, senza tuttavia una relazione lineare tra questi componenti. L'architettura Maxwell adottata per queste GPU ha quale caratteristica tecnica quella di poter disabilitare alcune delle ROP presenti, oltre che di partizioni del controller memoria, indipendentemente dal numero di CUDA cores che sono attivati. Tale caratteristica tecnicha non era presente nelle soluzioni di precedente generazione: per questo motivo la cache L2 in GeForce GTX 970 è 14/16 di quella di GeForce GTX 980, al pari del numero di ROPs, mentre il rapporto tra i CUDA cores delle due GPU è di 13/16.

Il controller memoria integrato nelle GPU della famiglia Maxwell ha un design di tipo Crossbar, nel quale da un lato troviamo le connessioni con le varie SMM e quindi con gli stream processors abilitati nella specifica GPU in uso e dall'altro troviamo le partizioni della cache L2 e i memory controller. Nella GPU GeForce GTX 970 3 SMM sono disabilitate mentre unitamente ad una delle 8 partizioni della cache L2.

nvidia_gm204_crossbar.jpg (60706 bytes)
schema controller memoria e SMM di GeForce GTX 970 - fonte: NVIDIA

Ad ogni partizione della cache L2, ciascuna grande 256 Kbytes, è collegato uno degli 8 memory controller da 32bit al quale è a sua volta collegata della memoria DRAM. Notiamo come l'ultimo memory controller non sia associato ad un modulo cache L2, in quanto disabilitato: questa partizione, dalla dimensione di 0,5 Gbytes, deve quindi dipendere dalla cache L2 del blocco adiacente sfruttando una connessione appositamente prevista da NVIDIA per questo scopo. Dinamica simile vale per il blocco di ROPs associate al moduli L2 disabilitato: anche questi componenti sono in GeForce GTX 970 disabilitati, portando il loro numero complessivo a 56.

Da questo ne origina il particolare comportamento di GeForce GTX 970 e la presenza di due distinte partizioni della memoria: la prima da 3,5 Gbytes e la seconda da 0,5 Gbytes che interviene quando la prima è stata saturata dai dati necessari per la elaborazione 3D. Per via di questo design la bandwidth massima teorica della scheda, pari a 224 Gbytes al secondo, deve essere ricalcolata indicando il valore di 196 Gbytes al secondo generato dai primi 7 memory controller, cioè dalla partizione principale da 3,5 GBytes della memoria video, accanto ai 28 Gbytes al secondo provenienti dall'ultimo memory controller quando si accede a questa partizione da 512 Mbytes. Di fatto quindi la scheda o accede a banda piena al primo segmento da 3,5 Gbytes, con 196 Gbytes al secondo (7 GHz x 7 memory controller ciascuno da 32bit di ampiezza) di banda massima teorica a disposizione, oppure accede alla seconda partizione da 0,5 Gbytes con una bandwidth massima teorica di 28 Gbytes al secondo (7 GHz x 1 memory controller da 32bit di ampiezza).

Quando i dati presenti nella memoria video siano tali da saturare quanto accessibile dalla prima partizione da 3,5 Gbytes si deve necessariamente fare ricorso alla seconda da 0,5 Gbytes, con prestazioni che sono inferiori a motivo della bandwidth più ridotta. Il dato di 28 Gbytes al secondo è in ogni caso ben superiore a quanto messo a disposizione in condizioni ideali dal bus PCI Express 16x adottato dalla scheda video per collegarsi al sistema.

Quali le implicazioni pratiche di tutto questo? Il fatto che NVIDIA abbia fornito una informazione non corretta sul numero di ROPs e sulla dimensione della cache L2 integrate in GeForce GTX 970 in alcun modo influenza le prestazioni velocistiche che abbiamo rilevato con queste schede. A essere errata era l'informazione tecnica ma la GPU è sempre stata così internamente in termini di modalità di funzionamento: NVIDIA ha voluto sviluppare in questo modo questa GPU e il comportamento ottenuto sul campo è quello che NVIDIA aveva teoricamente previsto in fase di design del prodotto.

Le considerazioni sulle prestazioni di queste schede rimangono pertanto invariate: si tratta di un eccellente prodotto per il prezzo al quale viene proposto. Come abbiamo già segnalato in questo pezzo è però da rimarcare come in quelle condizioni d'uso che vanno oltre la partizione memoria da 3,5 Gbytes si possa avere un impatto prestazionale, tipicamente molto contenuto anche in virtù della potenza di elaborazione complessiva: parliamo di scenari con risoluzione 4K o superiore, quindi non di quelli che tipicamente sono utilizzati al momento dai videogiocatori anche molto appassionati.

Da tempo si attende il debutto di schede GeForce GTX 970 dotate di 8 Gbytes di memoria video; per questi prodotti, alla luce di quanto indicato qui sopra, il partizionamento della memoria passerà ad una struttura con 7 Gbytes affiancati da 1 Gbyte, ovviando quindi a possibili ricadute prestazionali nell'utilizzo di risoluzioni video che possono diventare per la memoria video un collo di bottiglia con le declinazioni a 4 Gbytes.

77 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Lio8627 Gennaio 2015, 10:27 #1
come faranno i partner a creare modelli con più di 4gb di memoria? la prima parte, i 3,5gb, rimarranno tali e ipoteticamente la seconda parte modificata dai partner avrà 2,5gb ma un po più lenti?
Capozz27 Gennaio 2015, 10:33 #2
Sono emersi nuovi dettagli più approfonditi sul motivo per il quale NVIDIA ha scelto di dotare le schede GeForce GTX 970, e non quelle GeForce GTX 980, di questo particolare partizionamento della memoria video onboard. La prima novità è una rivisitazione delle specifiche delle schede GeForce GTX 970 in due elementi: il numero di ROPs e il quantitativo di memoria cache L2 integrato nella GPU. La rivisitazione non riguarda una modifica intervenuta nel tempo ma una correzione di quanto inizialmente indicato da NVIDIA nella propria reviewer's guide fornita alla stampa. In questo documento, che fornisce indicazioni su vari parametri tecnici delle GPU in prova, l'azienda americana ha originariamente ed erroneamente indicato per GeForce GTX 970 la presenza dello stesso numero di ROPs di GeForce GTX 980 oltre che del medesimo quantitativo di memoria cache L2 quando in realtà, per via dell'architettura di GeForce GTX 970, così non è. Nella tabella seguente sono messe a confronto le specifiche precedenti con quelle aggiornate, accanto a quelle di GeForce GTX 980.


http://www.tomshw.it/cont/news/la-g...he/62075/1.html

Alben ha ammesso che Nvidia ha fallito nel comunicare correttamente le specifiche alla stampa. Problemi di comunicazione interna, a quanto pare (e visto che siamo buoni, ci crediamo, anche se...). Per quanto riguarda l'uso effettivo della memoria da parte della GTX 970 l'argomento si fa ancora più complesso.


Si, erroneamente, come no... Chiaramente lo sapevano benissimo, ma chiaramente hanno taciuto finché non sono stati beccati, e poi hanno cambiato le specifiche.
opt3ron27 Gennaio 2015, 10:35 #3
Hanno pure ammesso di averlo fatto apposta(non che ci fossero dubbi),quindi si tratta di frode a danno degli utenti a tutti gli effetti, sulla confezione avrebbero dovuto scrivere 3,5 GB .Veramente hanno la faccia come il lato b, mi sa che sono andati alla lezione universitaria di Schettino.Comunque il problema ¨¦ sicuramente risolvibile via driver, basterebbe imporre alla gpu di usare quel mezzo giga solo per le texture e non per vertici e frame buffer in modo da eliminare lo stuttering .
Alekos Panagulis27 Gennaio 2015, 10:36 #4
Corsini, sei un giornalista o un dattilografo?
Prendere una posizione, seppur cauta, nel merito sarebbe stato opportuno, anziché limitarsi a scopiazzare da altri siti i dati tecnici e stop.
Non chiedo niente di estremo, sia chiaro...ma almeno un "Siamo sorpresi dal modo in cui Nvidia abbia omesso di dichiarare i reali dettagli tecnici della scheda" o cose simili.
Cloud7627 Gennaio 2015, 10:38 #5
NVIDIA ha voluto sviluppare in questo modo questa GPU e il comportamento ottenuto sul campo è quello che NVIDIA aveva teoricamente previsto in fase di design del prodotto.


Sì va be' avevano sbagliato la slide con i dettagli... e allora perché è uscita solo adesso tutta la paginetta con i dettagli tecnici giusti?
Perché sono stati beccati... e nei forum gli utenti si sono accorti che qualcosa non andava come doveva.
Avrebbero dovuto mandare subito una errata corrige e questa pagina doveva essere dentro alla recensione, che si sarebbe poi dovuto aggiornare. Quanto tempo è passato invece? 4 mesi?!
Comunque a me non piace per nulla questo dettaglio tecnico, sicuramente non comprerò schede con tale tipo di funzionamento.
jok3r8727 Gennaio 2015, 10:39 #6
Questa è una truffa bella e buona, guarda caso fino a quando non sono circolati i primi test online nvidia non si era accorta dell'errore. Mai più un prodotto nvidia.
il menne27 Gennaio 2015, 10:41 #7
Originariamente inviato da: Lio86
come faranno i partner a creare modelli con più di 4gb di memoria? la prima parte, i 3,5gb, rimarranno tali e ipoteticamente la seconda parte modificata dai partner avrà 2,5gb ma un po più lenti?


Presumibilmente un ipotetico modello a 8gb di questo tipo dovrebbe avere 7gb di vram "veloce" e 1gb di vram castrata.

Ma non credo uscirà mai. Neppure a 6gb.

Dopo tutto questo polverone che si sta alzando di sicuro in USA qualcuno starà preparando una bella class action, perché indipendentemente dallo scarso impatto o meno della cosa ( ancora da valutare ) il discorso dell "errore interno" nella comunicazione che fa dare specifiche errate della vga mi sembra davvero una presa per il colossale, e l'immagine di nvidia ne esce davvero a pezzi.

Sembra quasi come quando si coglie in flagrante qualcuno con le mani nella marmellata ( ossia mentre conta i soldi ).

Vediamo come andrà a finire.

Anche se prevedo che ora si affretteranno a rilasciare qualche nuovo modello funzionante e di insabbiare il più possibile.

Mah.

Comunque ora si è alzato davvero un bel vespaio.
bobafetthotmail27 Gennaio 2015, 10:43 #8
Quindi Nvidia ha trovato il modo di evitare che gli OEM aggiungano 45 GB di memoria alle schede scrause? Sarebbe positivo.

Ma qui mi sembra che lo stiano applicando per castrare le schede medio-alte... non buono. Assolutamente no. Che sarebbe sta stronzata?
il menne27 Gennaio 2015, 10:48 #9
Originariamente inviato da: Alekos Panagulis
Corsini, sei un giornalista o un dattilografo?
Prendere una posizione, seppur cauta, nel merito sarebbe stato opportuno, anziché limitarsi a scopiazzare da altri siti i dati tecnici e stop.
Non chiedo niente di estremo, sia chiaro...ma almeno un "Siamo sorpresi dal modo in cui Nvidia abbia omesso di dichiarare i reali dettagli tecnici della scheda" o cose simili.


Considerando che il sito di hwu debba essere "imparziale" e che di fatto prendere una qualsiasi posizione può essere sconveniente ( probabilmente nvidia è anche uno dei tanti sponsor del sito ) per molte ragioni, penso che mantenere una posizione il più possibile distaccata sia una scelta saggia e condivisibile ( al suo posto l'avrei fatto pure io ), anche se per alcuni possa risultare impopolare.
Alekos Panagulis27 Gennaio 2015, 10:51 #10
Originariamente inviato da: il menne
Considerando che il sito di hwu debba essere "imparziale" e che di fatto prendere una qualsiasi posizione può essere sconveniente ( probabilmente nvidia è anche uno dei tanti sponsor del sito ) per molte ragioni, penso che mantenere una posizione il più possibile distaccata sia una scelta saggia e condivisibile ( al suo posto l'avrei fatto pure io ), anche se per alcuni possa risultare impopolare.


I maggiori siti online (come Anandtech) hanno preso una posizione moderatamente critica nei confronti di Nvidia, senza gettare fango su nessuno.
E gli sponsor ce li hanno tutti.
Con il tuo ragionamento togli completamente credibilità a questo sito, che di fatto l'ha già persa.
Sia chiaro, nulla di personale contro chi scrive, ci mancherebbe.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^