IBM mostra blade server con Cell

Al recente evento fieristico E3 IBM ha mostrato un prototipo di piattaforma blade server basata su cpu Cell.
di Fabio Boneschi pubblicata il 31 Maggio 2005, alle 08:45 nel canale ProcessoriIBM
Al recente evento fieristico E3 IBM ha mostrato un prototipo di piattaforma blade server basata su cpu Cell.
di Fabio Boneschi pubblicata il 31 Maggio 2005, alle 08:45 nel canale Processori
89 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoho letto tutta la discussione e mi è chiaro che il cell nel general purpose è una chiavica, ora la mia curiosità è questa, per il rendering queste cpu saranno performanti?
mi interessa perché pare che la mental images stia pensando di supportare i processori cell... a questo punto avere una play3, installarci linux e usarla come renderfarm potrebbe diventare una buona opportunità a basso costo, voi che ne pensate? se il cell fa ca**re anche per il render allora è proprio da buttare sta roba
Sicuro, ma certamente sarai costretto a comprare il kit di installazione di sony, così come per la play2.
ho letto tutta la discussione e mi è chiaro che il cell nel general purpose è una chiavica, ora la mia curiosità è questa, per il rendering queste cpu saranno performanti?
mi interessa perché pare che la mental images stia pensando di supportare i processori cell... a questo punto avere una play3, installarci linux e usarla come renderfarm potrebbe diventare una buona opportunità a basso costo, voi che ne pensate? se il cell fa ca**re anche per il render allora è proprio da buttare sta roba
E' ottimo come DSP "intelligente", come per la decodifica di flussi video. Il Cell e' eccellente in tutti i campi in cui c'e' un flusso di dati in ingresso sul quale eseguire un certo numero di operazioni.
Non e' il caso del rendering, che e' una tipico algoritmo di "gathering and scattering", in cui si raccolgono dati sparsi casualmente in memoria, li si elabora e li riscrive casualmente (piu' o meno) in memoria. Le GPU hanno molta logica per rendere queste operazioni veloci e nascondere le latenze degli accessi a memoria. Da poco si inizia ad usare le GPU anche per accelerare il rendering offline dei film, ad esempio.
uno pneumatico che va bene per la Punto, non vedo come
la Fiat possa pretendere e obbligarmi a pagare dei soldi perché
produco un pneumatico che va bene per la loro vettura).
un pneumatico posso produrlo ma magari la Fiat mi può imporre di pagare una royalty se voglio commercializzarlo come "accessorio certificato" per il suo modello di auto
per me c'è anche da tenere conto di una cosa che forse potrà apparire banale: nel mondo It, dove la soluzione al problema di dover fare del computing è risolvibile diversamente a seconda di chi studia una soluzione, non mi pare ci sia una ISA che possa essere riconosciuta come LA piattaforma, lo "standard", che sia nata da un qualche forum o SIG aperto e certificata da qualche numero di iso, IEEE o altro (interfacce a parte)...
tutti stiamo usando macchine nate come proprietarie con OS nati come proprietari (per ciò che concerne le specifiche, non l' implementazione, ), e poi più o meno evolutesi per la loro strada...
conseguenza di ciò è che ogni cosa, dalla scheda aggiuntiva al programma che gira su quel certo OS, è in effetti un "accessorio" per qualcos' altro
da questo punto di vista apparirebbe logico che le royalty si inseriscano nel meccanismo, in quanto la validazione di un prodotto diviene discrezionale , dipendendo da chi produce l' elemento ospitante o vi detiene i diritti
in quel caso, mi pare che ci fossero delle limitazioni date dall' uso della gpu per il rendering offline ...
nel senso, il render ottenuto sfruttando gli shader risulterebbe, anche alla massima qualità impostabile, un' approssimazione di ciò che consente un algoritmo puramente SW
il che sarebbe dovuto all set di istruzioni delle unità shader , alla dimensione della memoria locale (frame buffer) e alla lunghezza massima degli shader programs, che porrebbero restrizioni alla complessità degli algoritmi di calcolo e agli effetti ottenibili...
...o è cambiato qualcosa nell' ultimo periodo (magari con i nuovi shader model)?
...o sono del tutto fuori strada?
Non e' il caso del rendering, che e' una tipico algoritmo di "gathering and scattering", in cui si raccolgono dati sparsi casualmente in memoria, li si elabora e li riscrive casualmente (piu' o meno) in memoria. Le GPU hanno molta logica per rendere queste operazioni veloci e nascondere le latenze degli accessi a memoria. Da poco si inizia ad usare le GPU anche per accelerare il rendering offline dei film, ad esempio.
bene quindi manco nel rendering vanno bene!
e invece la nuova x-box in questo caso come se la caverebbe?
aaah ma quanti muscoli non sfruttabili uff
nel senso, il render ottenuto sfruttando gli shader risulterebbe, anche alla massima qualità
Sei piu' o meno in strada. E' verissimo che la qualita' ottenibile e' ancora limitata da una combinazione di fattori, fra i quali:
- il set di istruzioni degli shader model a disposizione (SM2.0 e SM3.0) non ancora particolarmente ricco da poter implementare tutto cio' che e' implementabile offline su CPU general purpose
- le GPU offrono ad oggi precisione massima di 32 bit per componente (R, G, B, A) dove il rendering offline arriva fino a 64 bit e 128 bit per componente.
In sintesi e' il solito discorso, quando una GPU puo' eseguire un algoritmo, e' un missile confrontato alle CPU general purpose, anche diversi ordini di grandezza nelle situazioni ideali. Quando non puo' eseguire l'algoritmo, le CPU vincono per la loro maggiore flessibilita' a scapito delle prestazioni.
Lo stesso identico discorso e' applicabile al Cell.
[quote]
bene quindi manco nel rendering vanno bene! fantastico...
e invece la nuova x-box in questo caso come se la caverebbe?
aaah ma quanti muscoli non sfruttabili uff
Vanno
Sicuramente alcuni algoritmo di rendering offline possono essere accelerati enormemente dal Cell, altri no. Dipende.
Non e' una questione di muscoli sprecati. Potresti dire che un centrometrista ha muscoli sprecati perche' con quella velocita' potrebbe segnare tantissimi gol giocasse a calcio. Ma il centrometrista si e' specializzato in quello, lui non sa giocare a calcio
I microprocessori "general purpose" sono sempre stati più lenti di circuiti integrati predisposti all'uopo per l'accelerazione di en precisi algoritmi di calcolo....
Nessuno si ricorda del Weitek 3167 coprocessore matematico per 80386 molto più rapido dell'80387....
E che dire dei Transputer della Inmos...
Per non parlare della fortunatissima serie di D.S.P 56xxx della Motorola che è stata utilizzata anche nei telefoni cellulari tipo il 920/930...
D.S.P potentissimi, molto più dei processori nei personal computer "I.B.M compatibili", li potete trovare anche dentro alcuni modelli di lavatrici (Texas Instruments) per il controllo del moto.
Ecc. ecc.
Non è la prima nè l'ultima volta che si "grida al miracolo" per un processore dedicato che sarà inserito in una console piuttosto che in telefono U.M.T.S od altro...
Piuttosto mi piacerebbe sapere se Cell risponde agli stringenti requisiti del formato in virgola mobile I.E.E.E 754/854...
Grazie.
Marco71.
Poi vorrei sapere perchè non specificano mai le condizioni ed il tipo di benchmark utilizzato: f.l.o.p.s in sè vuol dire tanto/poco.
1) sono f.l.o.p.s. in singola o doppia precisione magari I.E.E.E 754/854...
2) sono f.l.o.p.s provenienti dal caro "vecchio" benchmark Whetstone...
3) sono f.l.o.p.s Linpack risultato di operazioni "vettoriali" per la soluzione di sistemi lineari...
4) sono f.l.o.p.s del tipo: "somma 1.234 ad 1.5667"...
Insomma non si può sempre "sparare ad alzo zero"...
Grazie.
Marco71.
Sono d'accordo FLOPS ormai non vuol dire niente: poteva avere un senso quando coi primi processori RISC che integravano FPU e che avevano dei tempi di esecuzione precisi per le istruzioni; ha un senso per i DSP, che per loro natura eseguono le istruzioni in tempi fissi (assolutamente necessario per sapere esattamente in quanti cicli di clock, e quindi tempo di esecuzione, è richiesto per una ben precisa routine).
1) In questo caso si tratta sicuramente di FLOPS in singola precisione, dato l'elevato numero che viene fuori. Coi numeri in doppia precisione il numero di FLOPS diventa un decimo.
Non credo che siano FLOPS che seguano lo standard IEEE754, perché generalmente le unità SIMD eseguono calcoli in virgola mobile senza tanti controlli e semplificazioni per accelerare i tempi di esecuzione; eventualmente generano delle eccezioni nel caso in cui si ottengano risultati particolari (infinito positivo o negativo, Not-A-Number, overflow o underflow), ma di Cell non si sa ancora bene come funzionino le otto SPE.
2) Non penso che abbiano usato un vecchio benchmark come il Whetstone.
3) Se hanno usato LinPack per misurare le prestazioni, mi sembra strano un valore così elevato per Cell e così basso per gli Opteron: sembra che abbiano "conteggiato" la potenza di calcolo in singola precisione per il primo, mentre quella in doppia precisione per il secondo.
Questo perché un Opteron può eseguire fino a due istruzioni in floating point a doppia precisione per ciclo di clock con la vecchia FPU x87 o usando le SIMD a doppia precisione introdotte con le SSE2; in singola precisione, invece, un Opteron può calcolare fino a 4 dati in singola precisione per ciclo di clock con le SSE/2.
Quindi nei conti e nei confronti che sono stati fatti c'è qualcosa che non quadra.
4) In genere per i FLOPS si conteggiano le istruzioni che eseguono dei calcoli aritmetici (somma/sottrazione, prodotto e alcune volte la divisione) e non quelle di Load / Store. Dipende dal contesto. E questo dimostra che il termine "FLOPS" non può essere usato come valida unità di misura delle prestazioni (come pure i MIPS).
P.S. Per il 386 c'era anche il coprocessore matematico della ITT, se non erro, che aveva delle eccellenti prestazioni...
usassero le firme digitali per consentire il funzionamento
dei giochi e che quindi fosse "imposto" sia legalmente
che tecnicamente...
No, non usavano firme digitali.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".