NVIDIA Tesla T10: GPU Computing di seconda generazione

La seconda generazione di sistemi NVIDIA Tesla, per elaborazioni GPU Computing, utilizza i 240 stream processors delle nuove architetture GT200 per sfruttare la GPU con elaborazioni che non siano grafiche. Raddoppio delle prestazioni e introduzione della double precision tra le caratteristiche peculiari.

di Paolo Corsini pubblicato il 17 Giugno 2008 nel canale Schede Video
NVIDIA Tesla

Incrementi prestazionali

Abbiamo evidenziato, nell'analisi architetturale, come una delle principali innovazioni introdotte da NVIDIA con le soluzioni Tesla serie 10 sia l'implementazione della double precision, caratteristica che è parsa subito essere la principale limitazione all'adozione della prima generazione di soluzioni Tesla per quegli ambiti di elaborazione che possono essere impostati con una elevata parallelizzazione del codice.

E' bene ricordare come non tutti gli ambiti di elaborazione necessitino di double precision: per alcuni quella single precision è ideale in quanto permette di ottenere tempi di elaborazione particolarmente ridotti, mentre in altri ambiti ci si può addirittura accontentare di half precision, così da velocizzare ulteriormente l'esecuzione. Un esempio pratico sono le elaborazioni sul genoma, con le quali l'utilizzo della single precision è più che sufficiente; in ambito finanziario la possibilità di eseguire elaborazioni in double precision è invece un elemento di notevole portata, che dovrebbe portare ad un'accelerazione nell'adozione di GPU per le elaborazioni da parte delle aziende impegnate in questi ambiti.

9.jpg (42856 bytes)

NVIDIA ha fornito alcune analisi comparative che permettono di evidenziare quale sia l'incremento prestazionale ottenibile passando da soluzioni Tesla della serie G80 a quelle di nuova generazione, indicate con il nome di T10P: si noti come gli incrementi partano da un raddoppio, chiaramente giustficato dal passaggio a 240 thread processors dagli originari 128 delle architetture G80, per evidenziare margini ancor più elevati con quelle applicazioni che beneficino, per il loro particolare dataset, di una maggiore dotazione di memoria video.

Evidenziamo in particolare i risultati ottenuti con Reverse Time Migration, che permettono di evidenziare come l'incremento nel quantitativo di memoria video montata sulla nuova generazione di scheda Tesla permetta di ottenere significativi incrementi prestazionali che vanno ben oltre quanto ottenibile grazie all'incrementato numero di stream processors e alle ottimizzazioni interne alla GPU. Il passaggio alla nuova GPU, in questo caso, ha portato ad una scalabilità di 1,9x ferma restando la dotazione di memoria video rispetto alla scheda Tesla G80; portando la memoria a 4 GBytes si è giunti invece ad un incremento delle prestazioni di 3,5x rispetto al valore iniziale. E' bene segnalare come NVIDIA non preveda di commercializare una scheda Tesla T10 con 1,5 Gbytes di memoria video: questi risultati sono stati infatti ottenuti con un engineering sample preliminare dotato di quel quantitativo di memoria.

2.jpg (54308 bytes)

Il punto di riferimento per valutare quali possano essere i benefici prestazionali dati dall'utilizzo di GPU per elaborazioni parallele tipicamente delegate alle CPU è indubbimente il confronto con quanto ottenibile con i processori: NVIDIA ha evidenziato, con la nuova famiglia di soluzioni Tesla, livelli di incrementi prestazionali variabili a seconda del tipo di codice eseguito ma in generale estremamente elevati. Incrementi che sfiorano le 150 volte sono ovviamente ottimi veicoli marketing, ottenuti sfruttando codice che si adatta in modo pressoché ideale all'elaborazione parallela via GPU; nella maggior parte dei case study che NVIDIA ci ha mostrato è stato possibile evidenziare miglioramenti medi nei tempi di elaborazione nell'ordine di 10x, risultato che richiederebbe ingenti investimenti in server tradizionali per poter essere anche solo avvicinato.

3.jpg (19942 bytes)

Un ambito di elaborazione da poco accessibile anche con architetture GPU NVIDIA è quello Folding@Home: nei dati forniti da NVIDIA si evidenzia come una GPU Tesla serie 10 sia in grado di eseguire un numero di simulazioni estremamente più elevato rispetto a quello di un processore moderno, distanziando nettamente in questo sia la cpu Cell integrata nella console Sony Playstation 3 che una fantomatica "GPU rossa" che facilmente identifichiamo nelle soluzioni RV670 di ATI.

Nel corso delle prossime settimane l'università di Stanford, responsabile di questo progetto, renderà ufficialmente disponibile una versione pubblica del client per GPU NVIDIA, utilizzabile non solo con le nuove architetture di decima generazione ma anche con le altre GPU programmabili, dalla serie GeForce 8 in poi.

Segue: Oltre CUDA 2.0

Indice
Pagina 1: GeForce, Tesla e Quadro
Pagina 2: Tesla serie 10: l'architettura
Pagina 3: Le soluzioni Tesla di seconda generazione: Tesla C1060
Pagina 4: Tesla S1070: tutti in un server rack
Pagina 5: Incrementi prestazionali
Pagina 6: Oltre CUDA 2.0
Vai ai Commenti (50)

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Nissan LEAF terza generazione

Assetto Corsa Rally debutta a novembre: prime foto ufficiali

Renault 5 Turbo 3E mostra i muscoli: drift e accelerazioni in Corsica

Ecco gli interni della Porsche Cayenne Electric: 13 configurazioni e display OLED da record

Dongfeng Box, prima volta dal vivo, tutti i dettagli

Destiny Rising

ASUS GeForce RTX 5080 Noctua OC Edition: una custom fenomenale, ma anche enorme ASUS e Noctua tornano a collaborare con la GeForce RTX 5080 Noctua OC Edition, una scheda pensata per chi cerca potenza estrema e silenziosità assoluta. Il nuovo...

Recensione Realme 15 Pro Game Of Thrones: un vero cimelio tech per pochi eletti Siamo volati fino a Belfast, capitale dell'Irlanda Del Nord, per scoprire il nuovo Realme 15 Pro 5G Game Of Thrones Limited Edition. Una partnership coi fiocchi,...

Recensione Borderlands 4, tra divertimento e problemi tecnici Gearbox Software rilancia la saga con Borderlands 4, ora disponibile su PS5, Xbox Series X|S e PC. Tra le novità spiccano nuove abilità di movimento, un pianeta...

FUJIFILM X-T30 III, la nuova mirrorless compatta FUJIFILM X-T30 III è la nuvoa fotocamera mirrorless pensata per chi si avvicina alla fotografia e ricerca una soluzione leggera e compatta, da avere sempre a disposizione...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Oracle AI World 2025: l'IA cambia tutto, a partire dai dati Da Las Vegas, la visione di Larry Ellison e la concretezza di Clay Magouyrk definiscono la nuova traiettoria di Oracle: portare l’intelligenza artificiale ai dati,...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Dreame Aqua10 Ultra Roller, la pulizia di casa con un rullo Il più recente robot per la pulizia domestica di Dreame, modello Aqua10 Ultra Roller, abbina un potente motore di aspirazione della polvere a un sofisticato sistema...