Hardware Upgrade - il sito italiano sulla tecnologia - www.hwupgrade.it
«Torna alla News  -  Stampa
448 stream processors per le GPU Fermi per schede Tesla
Paolo Corsini - 23/12/2009, 12:15
"Grazie ad un documento pubblicato sul sito NVIDIA trapelano alcuni nuovi dettagli architetturali delle prime schede Tesla basate su GPU della famiglia Fermi"

Poco più di un mese fa, in concomitanza con il SuperComputing Conference di Portland, NVIDIA ha annunciato le prime soluzioni appartenenti alla famiglia Fermi, basate quindi sulla prossima generazione di GPU attesa al debutto nel corso del primo trimestre 2010.

In quella occasione, visto il contesto, sono state presentate le soluzioni Fermi della famiglia Tesla, specificamente indirizzate per l'utilizzo in supercomputer sia nella forma di scheda singola, sia in quella di sistema rack con 4 GPU da collegare ad un server di controllo via connessione PCI Express.

Durante la conferenza NVIDIA ha divulgato alcune informazioni sulle caratteristiche tecniche delle soluzioni Fermi per sistemi Tesla, senza tuttavia specificare elementi tipici quali frequenze di clock della GPU e degli stream processors, oltre al numero preciso di questi ultimi. Grazie alla scoperta fatta da un utente del nostro forum, è emersa l'esistenza sul sito NVIDIA di un documento pdf informativo che riporta alcune delle caratteristiche tecniche base delle soluzioni Fermi della famiglia Tesla.

Queste le caratteristiche tecniche così come riportate nel pdf:

KEY FEATURES

GPU

  • Number of processor cores: 448
  • Processor core clock: 1.25 GHz to 1.40 GHz
  • Voltage: 1.05 V
  • Package size: 42.5 mm × 42.5 mm 1981-pin ball grid array (BGA)

Board

  • Ten layers printed circuit board (PCB)
  • PCI Express Gen2 ×16 system interface
  • Physical dimensions: 4.376 inches × 9.75 inches, dual slot
  • Board power dissipation: < = 225 W

External Connectors

  • Single port, dual-link DVI-I

Internal Connectors and Headers

  • One 6-pin PCI Express power connector
  • One 8-pin PCI Express power connector
  • 4-pin fan connector

Memory

  • Memory clock: 1.8 GHz to 2.0 GHz
  • Interface: 384-bit
  • Tesla C2050
         3 GB
         24 pieces 32M × 32 GDDR5 136-pin BGA, SDRAM
  • Tesla C2070
         6GB
         24 pieces 64M × 32 GDDR5 136-pin BGA, SDRAM

BIOS

  • 2Mbit Serial ROM

All'annuncio delle prime schede Tesla basate su architettura Fermi NVIDIA aveva anticipato potenze di elaborazione previste tra 520 e 630 GFlops a doppia precisione. La frequenza di clock e il numero di stream processors non erano stati specificati in quel momento, mentre ora sono dati noti quantomeno indicativamente: nel proprio documento NVIDIA indica 448 stream processors con frequenza di clock che potrebbe variare da 1,25 GHz a 1,4 GHz.

Le GPU Fermi sono state sviluppate da NVIDIA pensando alla disponibilità di un massimo di 512 stream processors. Il documento prevede per le prime soluzioni Tesla un quantitativo di 448 stream processors: questo lascia intendere che NVIDIA abbia disabilitato due dei 16 streaming multiprocessors da 32 stream processors ciascuno integrati nella GPU, presumibilmente per poter ottenere sufficienti rese produttive. E' significativo evidenziare, alla luce delle informazioni presenti nel documento, come al momento attuale NVIDIA non abbia in previsione una scheda Tesla dotata di GPU Fermi con 512 stream processors.

Passando al versante memoria, viene indicata una frequenza di clock compresa tra 1,8 GHz e 2 GHz, utilizzando moduli GDDR5. Considerando il bus a 384bit di ampiezza se ne ottengono valori di bandwidth massima teorica compresi tra 160 e 180 Gbytes al secondo.

NVIDIA indica per queste schede Fermi un livello di consumo pari a 225 Watt quale massimo; è presumibile che a parità di frequenze di clock e di numero di stream processors le corrispondenti soluzioni della serie GeForce avranno un consumo più ridotto, a motivo dell'inferiore quantitativo di memoria video integrata sui ogni scheda. Questo potrebbe lasciar spazio a frequenze di clock incrementate sia per memoria sia per GPU, oltre a soluzioni che integrino tutti i 512 stream processors di cui l'architettura Fermi è capace quale massimo.