NVIDIA GeForce GTX 980: efficienza al primo posto

Un mix ideale tra prestazioni e consumi? E' questo l'obiettivo dichiarato dell'architettura Maxwell di NVIDIA, adottata per la GPU GM204 che equipaggia le schede video GeForce GTX 980 e GeForce GTX 970 al debutto quest'oggi sul mercato. Una nuova architettura top di gamma che sorprende per le prestazioni, ma più di tutto ricorda come per andare forte non serva sempre consumare tanto
di Rosario Grasso , Paolo Corsini pubblicato il 19 Settembre 2014 nel canale Schede VideoNVIDIAGeForce
Maxwell: architettura di GM204
GM204 è il nome del primo chip video di NVIDIA destinato alle schede di fascia più alta ad essere basato su architettura Maxwell, ma non si tratta della prima GPU di questa famiglia; nel mese di Febbraio 2014 NVIDIA ha presentato la scheda GeForce GTX 750Ti, basata su GPU GM107 ma posizionata in un segmento di mercato completamente differente rispetto a GeForce GTX 980 e GeForce GTX 970. GM204 è un chip di dimensioni medio grandi, con una superficie di 398 millimetri quadrati e costruito con circa 5,2 miliardi di transistor, ma non arriva ai livelli toccati da GK110 che integra circa 7,1 miliardi di transistor con una superficie di circa 551 millimetri quadrati. Per entrambi la tecnologia produttiva è quella a 28 nanometri, con produzione affidata alla taiwanese TSMC.
Il chip utilizza, al pari delle soluzioni basate su architetture Fermi e Kepler, una combinazione di Graphics Processing Clusters (GPC): sono pari a 4 nell'implementazione adottata per la scheda GeForce GTX 980 e in ognuno di essi sono presenti 4 SMM o Maxwell Streaming Multiprocessors. Ogni GPC è collegato ad un controller memoria da 64bit di ampiezza, per un totale di 256bit con memoria GDDR5 ed è abbinato ad un proprio Raster Engine; al centro del chip spicca la cache L2 in quantitativo di 2 Mbytes (4 volte superiore ai 512 Kbytes integrati nella GPU GK104) mentre a monte troviamo il GigaThread Engine che suddivide il carico di elaborazione complessivo tra i 4 GPC presenti nel chip.
Ogni SMM integra al proprio interno 128 CUDA cores: questo porta ad un totale di 2.048 CUDA Cores nell'implementazione completa del chip GM204 utilizzata con la scheda GeForce GTX 980, e a 1.664 CUDA Cores totali per la scheda GeForce GTX 970, che utilizza una declinazione di GPU GK204 con 13 dei 16 SMM abilitati.
In testa ad ogni SMM abbiamo il PolyMorph Engine 3.0, nel quale trovano posto tra le altre le unità di Vertex Fetch e per la gestione delle tecniche di tessellation. Per ogni SMM sono presenti 4 warp scheduler, capaci di inviare due istruzioni per warp per ogni ciclo di clock, e sono presenti varie ottimizzazioni rispetto a quanto implementato in Kepler per ottenere una superiore efficienza complessiva durante il funzionamento. Ogni SMM integra 128 CUDA Cores divisi in 4 blocchi da 32 ciascuno, contro i 192 presenti nelle soluzioni della famiglia Kepler: questa divisione ha permesso di dotare ogni blocco da 32 CUDA Cores di risorse specifiche per scheduling e buffering delle istruzioni, con la risultante di una gestione interna più efficiente e quindi con minore incidenza sui consumi rispetto alla struttura implementata in Kepler.
NVIDIA sottolinea come le innovazioni introdotte nell'architettura Maxwell rispetto a quella Kepler hanno permesso di ottenere un incremento delle prestazioni per ogni CUDA core pari a circa il 40%, con un raddoppio delle prestazioni a parità di consumo.
GM204 utilizza un controller memoria a 256bit, architetturalmente identico all'apparenza a quello della GPU GK104 e inferiore ai 384bit abbinati alle GPU GK110. Con l'architettura Maxwell NVIDIA è intervenuta per incrementare sensibilmente l'efficienza del controller memoria, lavorando sull'efficienza interna della GPU e abbinando una cache L2 di dimensioni superiori così da minimizzare le richieste di dati alla memoria video. Oltre a questo in GK204 è stata implementata una nuova tecnica di compressione della memoria grazie alla quale è stato possibile ottenere un'efficienza superiore rispetto ad un design tradizionale: secondo quanto dichiarato da NVIDIA, si ottiene così un incremento della bandwidth effettiva che è variabile tra il 20% e il 30% a seconda del tipo di gioco utilizzato.
In GM204 NVIDIA ha introdotto una versione evoluta del proprio NVENC encoder, capace di supportare ora anche l'encoding in standard H.265. Migliorata anche la capacità di encoding di flussi video H.264: rispetto a Kepler NVIDIA dichiara prestazioni superiori di 2,5 volte, con la possibilità quindi di gestire encoding di flussi video 4K a 60Hz in tempo reale.