NVIDIA Tesla Personal Supercomputer per GPU Computing [Archivio]

Redazione di Hardware Upg

18-11-2008, 16:40

Link alla notizia: http://www.hwupgrade.it/news/business/nvidia-tesla-personal-supercomputer-per-gpu-computing_27215.html

NVIDIA estende la gamma di prodotti della famiglia Tesla con un sistema desktop dotato di 4 schede video proposto come personal supercomputer

Click sul link per visualizzare la notizia.

amagriva

18-11-2008, 16:47

Chissà se ci gira Crysis (l'ho scritto subito io così non ci pensiamo più...)

ottoking

18-11-2008, 16:47

Roadrunner arrivo !!!
se si pensa che sono 4 teraflops è Incredibile

axias41

18-11-2008, 16:49

Per favore, evitate i soliti flame su un fps ben noto e dalle "scarse" pretese HW, per una volta...

kierlo

18-11-2008, 16:49

si con 4 schede....roadrunner ha 20000 cpu tipo

axias41

18-11-2008, 16:50

X amagriva:
mi hai preceduto di un soffio!

ottoking

18-11-2008, 16:53

appunto con sole 4 schede 4TFlops se ne mettono 1000 ecco che roadrunner è raggiunto

stanga_92

18-11-2008, 16:54

ma è in vendira????ho capito bene???!ma come fa ad avere 960 cpu in parallelo in cosi poco spazio?

ottoking

18-11-2008, 16:55

non sono CPU sono core

demon77

18-11-2008, 16:57

Che volponi eh?
Vogliono che ci metti i tesla così i prezzi sono nella fascia SUPERCOMPUTER!! :D

Sempre usando cuda si può fare la stessa identica cosa con delle sk video standard!
Certo magari sei un po' più a rischio di crash per via della memoria "più sfigata".. ma guardando il listino prezzi forse forse vale la pena di correre il rischio!

GByTe87

18-11-2008, 17:01

Personal mica tanto, costerà 4 polmoni :D

yossarian

18-11-2008, 17:05

ora gli stream processor sono diventati core, ma pur sempre di alu si tratta :D

le 4 Tflops sono, di fatto poco più di 3,8

PhoEniX-VooDoo

18-11-2008, 17:06

ma è in vendira????ho capito bene???!ma come fa ad avere 960 cpu in parallelo in cosi poco spazio?

Sono null'altro che gli Stream Processors, infatti una GTX280 ne ha 240, che guardacaso moltiplicato per 4 fa 960 :D

Praticamente nVidia con una architettura e pochissime differenze hardware vende 3 soluzioni:

- Desktop: nVidia GeForce GTX280 (prezzo che sappiamo)
- Workstation: nVidia Quadro FX 5800 (prezzo x5 circa)
- High Performance Computing: Tesla Series (prezzo x ??)

Human_Sorrow

18-11-2008, 17:06

"Personal mica tanto, costerà 4 polmoni"

non so quanto vanno i polmoni sul mercato ma questo viene dato " UNDER 10,000 $ " ... :D
Troppo per uno sviluppatore e inutile per un'azienda che punta su rack di server.
Non capisco a che serve...

monsterman

18-11-2008, 17:07

c'è scritto nella foto available now under $10.000. Beh direi costoso ma non troppo per certi scopi.

Paganetor

18-11-2008, 17:19

be', pensate a studi di progettazione che, con un computer normale, impiegano diverse ore per generare un progetto o una simulazione...

mio fratello progetta motori elettrici usando un software FEM (che costa 18.000 euro)... 10.000 euro di computer in grado di ridurre da 8 ore a (ipotizzo) mezz'ora una simulazione sarebbe come la manna dal cielo!

non lo vedo così fuori mercato, anzi... ;)

MiKeLezZ

18-11-2008, 17:22

$10'000, se per tutto il sistema, è pure poco :)

^Robbie^

18-11-2008, 17:28

Credo ci sia un errore nel titolo dell'articolo: "Testa Personal Supercomputer". Forse nn bastano i polmoni, devi venderti anche il cervello :D
Certo però 4 TeraFlops (sai che RAC su BOINC :asd: )

Byez!

PhoEniX-VooDoo

18-11-2008, 17:30

$10'000 è pure poco :)

VIDIA consiglia per un sistema di questo tipo almeno un processore quad core e 16 Gbytes di memoria di sistema;

Quindi nVidia cosa ci mette, per 10 mila bigliettoni?
- 4 Schede
- MoBo (siamo sicuri?)
- Case (siamo sicuri?)

Quindi ti devi ancora prendere:
- 1x Quad Core (e di certo non ci metti un Q8200 :asd: )
- 16GB di RAM
- Ali con i contro cojons
- Sistema di dischi di fascia Pro (SAS?)

Quindi la cifra sale, parecchio ;)

P.S. Con quò non dico che non conviene, questo bisognerebbe vederlo con un analisi costi-benefici...

gabi.2437

18-11-2008, 17:30

Credo ci sia un errore nel titolo dell'articolo: "Testa Personal Supercomputer". Forse nn bastano i polmoni, devi venderti anche il cervello :D
Certo però 4 TeraFlops (sai che RAC su BOINC :asd: )

Byez!

il progetto GPUGrid è lì per quello, sfrutta le nvidia su BOINC!!! E vai verso nuove vette di RAC

Cmq paragonare roadrunner a sto robo ha poco senso, un conto è cpu, un conto è gpu

E cmq il prezzo non è alto

Marko91

18-11-2008, 17:47

Non dimenticate che sono 4 Teraflops in single-precision. Per il DP GT200 ha una ALU dedicata in ognuno dei 30 thread processor cluster. Ogni GT200 ha quindi all'incirca 80 Gigaflops in DP. Questa soluzione ha quindi un totale di 320Gigaflops in DP.
Larabee e' accreditato con all'incirca 1 Teraflops in DP e 2 Teraflops in SP. RV770 e' 1 Teraflop in SP e 200 Gigaflops in DP. Roadrunner e' 1 Petaflops in DP.
Inoltre le CPU hanno vantaggi sulle GPU in termini di cache e altre funzioni. Le GPU richiedono codice altamente parallelizzato e architetture software apposite.

yossarian

18-11-2008, 18:01

Non dimenticate che sono 4 Teraflops in single-precision. Per il DP GT200 ha una ALU dedicata in ognuno dei 30 thread processor cluster. Ogni GT200 ha quindi all'incirca 80 Gigaflops in DP. Questa soluzione ha quindi un totale di 320Gigaflops in DP.
Larabee e' accreditato con all'incirca 1 Teraflops in DP e 2 Teraflops in SP. RV770 e' 1 Teraflop in SP e 200 Gigaflops in DP. Roadrunner e' 1 Petaflops in DP.
Inoltre le CPU hanno vantaggi sulle GPU in termini di cache e altre funzioni. Le GPU richiedono codice altamente parallelizzato e architetture software apposite.

le cifre su larrabee sono aleatorie e dipendono dal numero di core. Comunque ogni core ha 16 alu fp32 ciascuna capace di una MAD (quindi 32 ops per ciclo); in DP equivalgono a 8 alu fp64 ciascuna capace di una MAD. Supponendo 2 GHz per core, con 16 core avresti in totale circa 1 Tflops in fp32 che diventano 500 Gflpos in fp64.
RV770 in versione 4870 arriva a 1,2 Tflops in fp32 e 240 Gflpops in fp64.

Ovviamente tutti valori teorici

appleroof

18-11-2008, 18:15

credo che questi sistemi Nvidia si pongano nell'ottica della "sfida" ad Intel, certo che la strada mi pare ancora lunga ma Nvidia insiste molto su questo aspetto (a Amd a sua volta si comincia a muovere concretamente)

floc

18-11-2008, 18:24

mah.sulla carta impressionante ma ricordiamoci che non e' roba general pourpose che per quanto bistrattata "vacontutto", qui c'e' bisogno di sw apposito, programmato a dovere per la piattaforma.

ai posteri l'ardua sentenza :)

yossarian

18-11-2008, 18:29

credo che questi sistemi Nvidia si pongano nell'ottica della "sfida" ad Intel, certo che la strada mi pare ancora lunga ma Nvidia insiste molto su questo aspetto (a Amd a sua volta si comincia a muovere concretamente)

fidandosi dei meri dati numerici e considerando l'importanza della DP nei calcoli scientifici, tra le tre soluzioni la migliore appare, almeno sulla carta, quella Intel

gabi.2437

18-11-2008, 18:54

Ok, chi raccoglie i fondi per comprarne due o tre a nome di hwupgrade e buttarli su folding@home o gpugrid? :O

ottoking

18-11-2008, 19:02

Non avevo considerato la questione doppia - singola precisione effettivamente c' è una bella differenza
320Gigaflops in DP vs 4 TeraFlops in SP :)

YYD

18-11-2008, 19:04

http://www.nvidia.com/object/tesla_supercomputer_wtb.html

Ce n'è per tutti i gusti, è vero che con meno di 10.000 dollari ti porti a casa un sistema come questo:
http://www.tycrid.com/?page_id=85

Luposardo

18-11-2008, 19:04

Esiste già un sistema di 170 Tesla S1070 1U a Tokyo! cercate su un qualsiasi motore di ricerca

maumau138

18-11-2008, 20:23

E' un'ottima proposta per quegli ambienti di lavoro che non si possono permettere di spendere miliardi per un CRAY.
Ad esempio io faccio simulazioni fluidodinamiche e attualmente con un quad-core posso usare solamente simulazioni 2D, in quanto sono abbastanza semplici. Per una simulazione 3D o chiedi di usare i computer del CNR o del CIRA (e te li fanno usare solo se interessa anche a loro), o ti attacchi.
Un sistema di questo tipo è una manna dal cielo, anche se al momento preferirei ATI, almeno per il costo totale. Inoltre la difficoltà di programmazione è identica per tutte e due le piattaforme..

demon77

18-11-2008, 21:03

E' un'ottima proposta per quegli ambienti di lavoro che non si possono permettere di spendere miliardi per un CRAY.
Ad esempio io faccio simulazioni fluidodinamiche e attualmente con un quad-core posso usare solamente simulazioni 2D, in quanto sono abbastanza semplici. Per una simulazione 3D o chiedi di usare i computer del CNR o del CIRA (e te li fanno usare solo se interessa anche a loro), o ti attacchi.
Un sistema di questo tipo è una manna dal cielo, anche se al momento preferirei ATI, almeno per il costo totale. Inoltre la difficoltà di programmazione è identica per tutte e due le piattaforme..

Beh.. su questo penso che per te arriveranno presto giorni migliori!
Le elaborazioni che fai tu sono molto pesanti per una CPU ma una GPU ci va a nozze..
Credo che tra non molto (forse non più di un paio d'anni) usando un normalissimo pc con una buona scheda video potrai fare simulazioni in 3d con tempi più che accettabili demandando il tutto alla (alle) GPU!

Certo resta il neo della double precision però penso ti possa accontentare! ;)

maumau138

18-11-2008, 21:41

Beh.. su questo penso che per te arriveranno presto giorni migliori!
Le elaborazioni che fai tu sono molto pesanti per una CPU ma una GPU ci va a nozze..
Credo che tra non molto (forse non più di un paio d'anni) usando un normalissimo pc con una buona scheda video potrai fare simulazioni in 3d con tempi più che accettabili demandando il tutto alla (alle) GPU!

Certo resta il neo della double precision però penso ti possa accontentare! ;)

Be' per quanto riguarda la DP, siamo comunque al di sopra delle CPU, e penso che fra un paio di generazioni di schede anche il DP sarà oltre il Teraflop, però quì il vantaggio grosso ce l'hai nella possibilità di usare quattro GPU in parallelo, mentre per mettere quattro CPU devi prendere un server rack, o un Blade, con i relativi costi.
Aspettiamo fiduciosi i software commerciali.

maumau138

18-11-2008, 22:06

A proposito, immagino necessitino di una VGA integrata sulla Scheda madre per gestire la grafica, mi pare non abbiano nemmeno i connettori per lo schermo.

Dandrake

19-11-2008, 03:10

Penso ci sia un errore nel titolo: "Testa" invece che "Tesla"...

cignox1

19-11-2008, 08:03

Ho letto di alcuni tipi che hanno utilizzato alcune schede video nVidia (gtx280 credo, ma forse erano delle 8800 di qualche tipo) in parallelo per velocizzare l'analisi dei dati di Tac/RMN (non ricordo con precisione): il tempo richiesto si era ridotto di svariate volte (anche una decina).

Quindi credo che in questi ambiti possano essere utili: in una sala di un ospedale ci vedo meglio un sistema come questo piuttosto che un rack con una dozzina di processori... (anche per i costi)

!fazz

19-11-2008, 09:53

A proposito, immagino necessitino di una VGA integrata sulla Scheda madre per gestire la grafica, mi pare non abbiano nemmeno i connettori per lo schermo.
infatti le tesla sono di fatto delle specie di coprocessori matematici quindi non hanno uscite video

il progetto GPUGrid è lì per quello, sfrutta le nvidia su BOINC!!! E vai verso nuove vette di RAC

Cmq paragonare roadrunner a sto robo ha poco senso, un conto è cpu, un conto è gpu

E cmq il prezzo non è alto

mi sa che non hai presente bene cosa è roadrunner :D :D , roadrunner usa un'architettura mista cpu/gpu (cell infatti è più simile ad una gpu che ad una cpu) comunque un conto è una workstation come questa con 4 schede dedicate ai calcoli, un conto è roadrunner che è un cluster con diverse migliaia di cpu opteron e diverse migliaia di ibm cells che necessita di svariati MegaWatt per funzionare

Mparlav

19-11-2008, 10:15

Anche il sistema a cui hanno aggiunto i 170 Tesla:
http://www.guru3d.com/news/170-tesla-s1070-1u-systems-make-tokyo-supercomputer-/

è l'upgrade ad un sistema misto esistente con cpu Opteron e Xeon:
http://www.top500.org/list/2008/11/100

certo è al 29° posto, ma concettualmente non è diverso a Roadrunner, nelle dovute proporzioni, con la differenza che hanno deciso di adottare Tesla invece dei PoweXcell del Roadrunner.

zzalex

19-11-2008, 10:15

Questa operazione mi ricorda il progetto indipendente Fastra ottenuto comunque con meno di 4000euro,un signor computer molto ben ottimizzato per gli scopi prefissati.

TroopeR_x17

19-11-2008, 11:21

mio fratello progetta motori elettrici usando un software FEM (che costa 18.000 euro)

che software usa?
io ne ho fatto uno di programma in matlab FEM per analisi strutturale :D

!fazz

19-11-2008, 11:30

be', pensate a studi di progettazione che, con un computer normale, impiegano diverse ore per generare un progetto o una simulazione...

mio fratello progetta motori elettrici usando un software FEM (che costa 18.000 euro)... 10.000 euro di computer in grado di ridurre da 8 ore a (ipotizzo) mezz'ora una simulazione sarebbe come la manna dal cielo!

non lo vedo così fuori mercato, anzi... ;)

infatti, anche noi usiamo un software per analisi ad elementi finiti che costicchia (costa all'anno circa 5 volte quello che usa tuo fratello) e il costo della macchina dedicata è una spesa minimale rispetto al software.
per adesso usiamo una configurazione certificata dal produttore del software( workstation dell con windows xp 8Gb ram 2 dischi sas da 15k rpm ). se questa piattaforma viene certificata (e di conseguenza il sw viene ottimizzato per essa) 10.000 euro potrebbero essere un investimento che rientra in poco tempo

TroopeR_x17

19-11-2008, 11:41

Beh.. su questo penso che per te arriveranno presto giorni migliori!
Le elaborazioni che fai tu sono molto pesanti per una CPU ma una GPU ci va a nozze..
Credo che tra non molto (forse non più di un paio d'anni) usando un normalissimo pc con una buona scheda video potrai fare simulazioni in 3d con tempi più che accettabili demandando il tutto alla (alle) GPU!

Certo resta il neo della double precision però penso ti possa accontentare! ;)

beh anche ora con una gtx280 fai cose che i quad non riescono
usando il cuda..
per esempio c'è un plugin per matlab che riduce a 1 decimo il tempo di calcolo
usando appunto matlab..che non è male..

!fazz

19-11-2008, 11:50

beh anche ora con una gtx280 fai cose che i quad non riescono
usando il cuda..
per esempio c'è un plugin per matlab che riduce a 1 decimo il tempo di calcolo
usando appunto matlab..che non è male..
interessante... ma a stabilità come siamo messi? ps se mi mandi via pm il nome / link al plugin ti ringrazio.

TroopeR_x17

19-11-2008, 11:55

interessante... ma a stabilità come siamo messi? ps se mi mandi via pm il nome / link al plugin ti ringrazio.

sul sito nvidia.com
alla sezione CUDA trovi tutti

!fazz

19-11-2008, 11:57

sul sito nvidia.com
alla sezione CUDA trovi tutti

ok, grazie, pensavo ad un plugin di terze parti

TroopeR_x17

19-11-2008, 12:00

ok, grazie, pensavo ad un plugin di terze parti

quello per matlab è fatto direttamenta da Nvidia credo..
cmq se ne trovano molti anche di terze parti per molti software..
io aspetto fine anno .. ritorno all'uni e poi testo tutto per benino..

indio68

19-11-2008, 16:25

ma il titolo è giusto o invece di testa supercomputer doveva essere tesla supercomputer??

yossarian

19-11-2008, 17:29

infatti le tesla sono di fatto delle specie di coprocessori matematici quindi non hanno uscite video

mi sa che non hai presente bene cosa è roadrunner :D :D , roadrunner usa un'architettura mista cpu/gpu (cell infatti è più simile ad una gpu che ad una cpu) comunque un conto è una workstation come questa con 4 schede dedicate ai calcoli, un conto è roadrunner che è un cluster con diverse migliaia di cpu opteron e diverse migliaia di ibm cells che necessita di svariati MegaWatt per funzionare

a dire il vero, cell non ha nulla della gpu: è single threaded, non ha unità di texturing, non ha rop's; ha delle alu vettoriali con architettura altivec in grado di effettuare 1 MAD ciascuna su un vettore (ovvero 4 MAD di tipo fp32) per ciclo; in fp64 la velocità di calcolo è dimezzata. Quindi si passa di 8 ops a 4 per ciclo, per ogni spu (sempre teoricamente)

Anche il sistema a cui hanno aggiunto i 170 Tesla:
http://www.guru3d.com/news/170-tesla-s1070-1u-systems-make-tokyo-supercomputer-/

è l'upgrade ad un sistema misto esistente con cpu Opteron e Xeon:
http://www.top500.org/list/2008/11/100

certo è al 29° posto, ma concettualmente non è diverso a Roadrunner, nelle dovute proporzioni, con la differenza che hanno deciso di adottare Tesla invece dei PoweXcell del Roadrunner.

esatto; in uno hai una cpu che pilota 2 cell, nell'altro una cpu che pilota 4 GT200 come coprocessori matematici (motivo per cui su roadrunner utilizzano opteron dual core e con tesla sarebbe opportuno avere cpu quad core)

bio82

19-11-2008, 20:01

E' un'ottima proposta per quegli ambienti di lavoro che non si possono permettere di spendere miliardi per un CRAY.
Ad esempio io faccio simulazioni fluidodinamiche e attualmente con un quad-core posso usare solamente simulazioni 2D, in quanto sono abbastanza semplici. Per una simulazione 3D o chiedi di usare i computer del CNR o del CIRA (e te li fanno usare solo se interessa anche a loro), o ti attacchi.
Un sistema di questo tipo è una manna dal cielo, anche se al momento preferirei ATI, almeno per il costo totale. Inoltre la difficoltà di programmazione è identica per tutte e due le piattaforme..

che software usi? sul mio portatile dual core (32 bit) riesco a far girare simulazioni 3d nell'ordine del milione di nodi..su questo fisso ho fatto girare (per un test sabato pomeriggio) un modello da circa 3 milioni di elementi con una regione rotante e 3 interfacce fluido-fluido....ho un e8200 con 4 giga di ram...

infatti, anche noi usiamo un software per analisi ad elementi finiti che costicchia (costa all'anno circa 5 volte quello che usa tuo fratello) e il costo della macchina dedicata è una spesa minimale rispetto al software.
per adesso usiamo una configurazione certificata dal produttore del software( workstation dell con windows xp 8Gb ram 2 dischi sas da 15k rpm ). se questa piattaforma viene certificata (e di conseguenza il sw viene ottimizzato per essa) 10.000 euro potrebbero essere un investimento che rientra in poco tempo

confermo che quando ti pelano il fondoschiena con le licenze, le macchine non sono un problema...bisogna anche pensare, però, il costo di una macchina puramente di calcolo...2700€ + iva e dell ti vende una dual quad core con 16 giga di ram...

bio

maumau138

20-11-2008, 00:08

che software usi? sul mio portatile dual core (32 bit) riesco a far girare simulazioni 3d nell'ordine del milione di nodi..su questo fisso ho fatto girare (per un test sabato pomeriggio) un modello da circa 3 milioni di elementi con una regione rotante e 3 interfacce fluido-fluido....ho un e8200 con 4 giga di ram...

Uso Fluent su un Q6600 con 4GB RAM e Xp-64, come SO non è proprio il meglio ma è quello che passa il convento.
Avevo provato a fare una mesh 3D qualche mese fa, e ho superato abbondantemente i 9 milioni di nodi, anche se era una struttura complicatissima (ci ho messo due settimane solo per meshare). Ovviamente era un chiodo, e ci ho rinunciato, aspettando una versione GPGPU di Fluent.

Il problema è che per creare un software alle Navier-Stokes, che sia stabile e che riesca ad essere abbastanza flessibile ci vuole parecchio tempo, e ad un certo punto non ne vale neanche la pena.

maumau138

20-11-2008, 00:11

Ho letto di alcuni tipi che hanno utilizzato alcune schede video nVidia (gtx280 credo, ma forse erano delle 8800 di qualche tipo) in parallelo per velocizzare l'analisi dei dati di Tac/RMN (non ricordo con precisione): il tempo richiesto si era ridotto di svariate volte (anche una decina).

Quindi credo che in questi ambiti possano essere utili: in una sala di un ospedale ci vedo meglio un sistema come questo piuttosto che un rack con una dozzina di processori... (anche per i costi)

Le schede erano quattro 9800 GX2, quindi otto GPU e venivano usate per le TAC.
Il progetto si chiama FASTRA

PhoEniX-VooDoo

20-11-2008, 12:55

sono in vendita anche separatamente, trovato la Tesla C1060 in uno shop Online dove acquisto spesso

http://www.tomshw.it/articles/20080617/tesla_c1060_3qtr_lg_c.jpg

PNY Tesla C1060 (PCIe 16x)

TCSC1060-PB - nVidia Tesla C1060 HPC - 1 x Tesla C1060 1.30 GHz GPU - 4 GB GDDR3 @ 800 MHz - 102 GB/sec (512-bit) - 225W

CHF 2.292,00 (EUR 1.507,3876)

bio82

20-11-2008, 15:13

Uso Fluent su un Q6600 con 4GB RAM e Xp-64, come SO non è proprio il meglio ma è quello che passa il convento.
Avevo provato a fare una mesh 3D qualche mese fa, e ho superato abbondantemente i 9 milioni di nodi, anche se era una struttura complicatissima (ci ho messo due settimane solo per meshare). Ovviamente era un chiodo, e ci ho rinunciato, aspettando una versione GPGPU di Fluent.

Il problema è che per creare un software alle Navier-Stokes, che sia stabile e che riesca ad essere abbastanza flessibile ci vuole parecchio tempo, e ad un certo punto non ne vale neanche la pena.

con 9 milioni di nodi la ferrari ci fa praticamente tutta la macchina :D se stai sui 2 milioni di nodi stai con 4 giga di ram senza problemi e con un quad hai tempi veramente accettabili...

a meno che non stai simulando il rientro dallo spazio di uno sciattol della eneiesei...

hanno promesso una versione di cfx (e magari di fluent, dato che ormai diventeranno una cosa unica) entro un annetto per sfruttare le gpgpu, ma conoscendoli avrà costi improponibili (un parallelo da 100 cpu costa al momento qualcosa come 500k € di licenze, vedrai che per ogni gpu vorranno 100k € come minimo)...

bio

edit: sto sclerando...numeri sistemati..