AMD dialoga con Clearspeed per i coprocessori matematici

La compagnia di Sunnyvale interessata ad un coporocessore matematico ad elevate prestazioni per i prossimi Opteron quad-core
di Andrea Bai pubblicata il 17 Marzo 2006, alle 16:05 nel canale ProcessoriAMD
Clearspeed è una compagnia fabless (ovvero senza alcun stabilimento di produzione diretta) specializzata nella progettazione di processori specializzati nel calcolo a virgola mobile e indirizzati all'impiego con complesse simulazioni matematiche.
E' di questi giorni la notizia che AMD avrebbe intenzione di trattare con Clearspeed per la fornitura di un coprocessore matematico da abbinare alle prossime CPU Opteron quad-core, eventualità che darebbe luogo ad particolarmente indicata per applicazioni scientifiche.
Secondo le informazioni disponibili nell'obiettivo di AMD vi sarebbe in particolare il processore CSX600, conosciuto anche con il nome in codice di Avebury. Si tratta di un processore a 64-bit caratterizzato da 96 PE (processing elements) o core di ridotte dimensioni, ognuno dei quali provvisto di due ALU (aritmetical-logic unit), un file di registro e 6Kb di cache per dati.

I PE del CSX600 sono molto più semplici rispetto a quelli che si possono trovare, ad esempio, nel processore Cell e non possono eseguire programmi in modo indipendente ma richiedono un host general-purpose che passi loro i comandi e i dati. Ogni core opera a 250MHz e richiede meno di 10W di potenza. Un processore CSX600 è in grado di sviluppare una potenza elaborativa di 25 gigaFLOP. Tale soluzione viene di norma implementata su una scheda PCI-X e può utilizzare fino ad un massimo di 4GB di memoria DDR2 come buffer.
La scorsa estate è stata realizzata una stazione IntelliStation IBM dual-Opteron con una scheda dual-chip di Clearspeed: la piattaforma è stata in grado di segnare una potenza elaborativa di 100 gigaFLOP.
Fonte: Arstechnica - TechPowerUp
34 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoUna scheduzza di quelle sarebbe bello vederla anche su pc casalinghi come optional..
Chissà che potenza nella codifica DIVX.. o con sismicad.. o con 3D studio...
Si tratta di un processore a 64-bit caratterizzato da 96 PE (processing elements) o core di ridotte dimensioni
poi questo:
Ogni core opera a 250MHz e richiede meno di 10W di potenza.
quindi 96 core x 10 W l'uno sono 960 W (arrotondiamo a 900, visto che si parla di "meno di 10 W di potenza"
immagino sia un errore di trascrizione
altra cosa: 25 giga FLOP sono tanti o sono pochi? io non ne capisco molto
grassie
grassie
una cpu intel o amd moderna ha circa 15-20 GFlops per core
una console di nuova generazione ne ha circa 110(xbox 360) 210 (ps3)
considerando quanto costerà e la difficolta di dividere il codice in 96 parti ritengo che non avrà molto seguito, almeno non in questa implementazione ha troppa poca cache per i dati per SPE da renderla inutilizzabile in molti campi.
è una scheda di nicchia che andrà benissimo in certi calcoli particari ma sicuramente in nulla che possiamo usare noi "comuni mortali"
quindi IMHO utilizzare una futura console next gen è molto meglio oltre che essere piu versatile, per esempio come pensano di utilizzare 6Kb per la cache in maniera efficiante? già con i 256Kb di memoria locale per ogni SPE molti lo trovano limitativo, 6 possono bastare solo in certi tipi di algoritmi ma questo pone la scheda fuori dal mercato consumer
ovviamente questo sistema è piu scalabile perche puoi mettere 1-10-100 + di queste schede in parallelo per un bel cluster, sul sito del produttore
http://www.clearspeed.com
mostrano appunto un bel sistema da oltre 85Tera Flops che è un enormità
Si tratta di un processore a 64-bit caratterizzato da 96 PE (processing elements) o core di ridotte dimensioni
poi questo:
Ogni core opera a 250MHz e richiede meno di 10W di potenza.
quindi 96 core x 10 W l'uno sono 960 W (arrotondiamo a 900, visto che si parla di "meno di 10 W di potenza"
immagino sia un errore di trascrizione
altra cosa: 25 giga FLOP sono tanti o sono pochi? io non ne capisco molto
grassie
Ciao,
mi sono.. anzi mi ero posto la stessa domanda anch'io (non per niente avevo già fornito il link alla notizia l'altro ieri.. Hw Up sempre a scoppio ritardato eh..
Credo che intendano 25 Watt in totale, anche perchè una cpu o co-processore che sia quanto deve dissipare a quella frequenza? Un inezia no.
Dovrebbe essere una stima del consumo complessivo di tutti i cores.
Supponi che: 25 Watt (complessivi) / 90 core = 0,27 Watt
--(assorbiti da ogni singolo core)--
Direi che è ragionevole per un dispositivo lavorante a quella frequenza.
* poi che siano stati rilevati in condizioni di idle o full load questo non viene precisato.
Forse che AMD sia sulla strada di possibili schede dedicate da collegare attraverso il bus HTT e sulle quali basare eventuali schede madri dedicate a questo genere di lavori? Opteron mentre lavora in FPU è sicuramente in grado di pilotare le altre FPU esterne con tutto il resto di istruzioni e unità di gestione/calcolo che si ritrova all'interno, per di più che un processore di pilotaggio/alimentazione dati non dovrebbe essere così complicato e impegnativo.
[commento costruito a spanne... per ovvi motivi]
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".