NVIDIA Tesla T10: GPU Computing di seconda generazione

La seconda generazione di sistemi NVIDIA Tesla, per elaborazioni GPU Computing, utilizza i 240 stream processors delle nuove architetture GT200 per sfruttare la GPU con elaborazioni che non siano grafiche. Raddoppio delle prestazioni e introduzione della double precision tra le caratteristiche peculiari.
di Paolo Corsini pubblicato il 17 Giugno 2008 nel canale Schede VideoNVIDIATesla
Tesla S1070: tutti in un server rack
Con la prima generazione di prodotti Tesla NVIDIA ha presentato un sistema server rack a 1 unità dotato di 4 schede video Tesla integrate al proprio interno; con la seconda generazione di soluzioni Tesla questo approccio viene ripetuto con il modello S1070.
La costruzione riprende quanto abbiamo visto con la precedente generazione di server CPU Computing: 4 schede video sono montate nel sistema, con ogni scheda accoppiata ad un'altra attraverso un bridge PCI Express Gen 2.0 con un approccio che ricalca di fatto quello adottato da NVIDIA per le soluzioni desktop GeForce 9800 GX2. La risultante è un server che prevede due coppie di schede Tesla, con ogni coppia terminante in una connessione PCI Express 2.0 che deve interfacciarsi ad un server di controllo supplementare.
L'approccio seguito da NVIDIA è pertanto identico al precedente: troviamo nuovamente per ogni server Tesla S1070 la necessità di avere almeno un server host di controllo, possibilmente con almeno 1 core di processore che sia a disposizione di ogni GPU presente nel server GPU Computing. NVIDIA ha optato per fornite, assieme al server S1070, anche i cavi di collegamento PCI Express Gen 2.0 e le schede di interfaccia con il server, queste ultime basate su un chip di controllo appositamente sviluppato dalla stessa NVIDIA.
Le connessioni External PCI Express 2.0 sono chiaramente identificabili nella parte posteriore dello chassis. Il pannello frontale è caratterizzato da una griglia che si sviluppa lungo tutta la sua larghezza, così da permettere l'adeguato ricambio d'aria all'interno del Rack. Il raffreddamento dei componenti interni è assicurato da una serie di 14 ventole, che aspirano aria dalla parte frontale soffiandola verso quella posteriore così che attraversi le alette di raffreddamento dei dissipatori di calore montati sulle schede Tesla e sugli altri componenti interni quali i bridge PCI Express.
Le schede Tesla utilizzate nella soluzione Rack si differenziano da quelle C1060 della pagina precedente innanzitutto per il sistema di raffreddamento: scompare la ventola per lasciare spazio ad un radiatore passivo che ricopre tutto il PCB, a diretto contatto sia con GPU che con chip memoria. Grazie a questo approccio, oltre che all'implementazione nel server di un sistema di monitoraggio termico, NVIDIA ha incrementato le frequenze di lavoro degli stream processors in questa soluzione, portandola a 1.500 MHz. Resta invece invariato il quantitativo di memoria video, sempre pari a 4 GBytes con bus da 512bit di ampiezza e frequenza di lavoro di 800 MHz (1.600 MHz effettivi) per la memoria GDDR3.