Occamy, il processore per metà italiano con 432 core RISC-V che punta allo Spazio

Occamy, il processore per metà italiano con 432 core RISC-V che punta allo Spazio

Con l'obiettivo di incrementare la capacità di calcolo a disposizione delle missioni spaziali, l'ESA sta vagliando diversi progetti tra cui Occamy, un processore con 432 core RISC-V messo a punto da ETH Zürich e Università di Bologna. 

di pubblicata il , alle 08:01 nel canale Processori
RISC-VESA
 

Un processore per metà italiano nello Spazio grazie alla European Space Agency (ESA)? Forse. Come riportato dal sito HPCwire, l'agenzia spaziale europea sta cercando di aumentare la potenza di calcolo nello Spazio e un progetto, sviluppato da ricercatori della ETH Zürich e dell'Università di Bologna (Alma Mater Studiorum), sembra promettere più che bene.

Occamy, questo il nome del processore, è un progetto open source basato su architettura RISC-V ormai completo, dopo aver superato la fase di tape out lo scorso anno. Basato su chiplet (ognuno da circa 73 mm2), Occamy prevede un totale di 432 core.

HPCwire descrive Occamy come "un chip a basso consumo per IA ed elaborazione ad alte prestazioni", il cui indirizzo spaziale potrebbe, in futuro, essere esteso anche a compiti più terreni. Il chip è stato sviluppato nell'ambito del programma EuPilot, attraverso il quale il Vecchio Continente vuole ridurre la propria dipendenza dalle soluzioni proprietarie x86 e ARM.

"L'ESA è interessata al chip perché consentirà alle apparecchiature nello spazio di svolgere l'analisi dei dati su chip. Sebbene non vi sia alcuna garanzia che l'ESA metterà in funzione Occamy, è uno dei tanti processori in fase di valutazione. […] I ricercatori che progettano il chip Occamy sperano che il design venga adottato e riprodotto per l'uso in più applicazioni".

Sul package di Occamy trovano posto due chiplet con 216 core RISC-V "Snitch" organizzati in quattro cluster, ognuno collegato a un chip di memoria da 16 GB HBM2e. Un interposer passivo mette in comunicazioni le due anime del chip. L'anima open source e il design modulare permettono, eventualmente, di aggiungere altre unità dedicate sul package espandendone le funzionalità.

Quanto alla potenza di calcolo, Occamy raggiunge i 6 TFLOPs con calcoli FP8 e 0,75 TFLOPs con quelli FP64. Particolare di non poco conto, non richiede dissipazione attiva per funzionare al meglio.

"Occamy ha un core a 32 bit che funge più da chip di controllo ed è responsabile del reindirizzamento delle attività ai core AI, che sono estensioni dell'ISA. La memoria HBM2e è stata fornita da Micron e il chip è prodotto da Globalfoundries a 12 nanometri (12LPP)", conclude il sito. Ulteriori informazioni su Occamy le trovate a questo indirizzo.

7 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
andbad09 Maggio 2023, 09:28 #1
Occamy raggiunge i 6 TFLOPs con calcoli FP8 e 0,75 TFLOPs con quelli FP64.


Più o meno come un i9-12900K? (che intel dice fare 820GLOPS)
Capisco che non sia possibile paragonare semplicemente due CPU così diverse, ma era per avere almeno un ordine di grandezza da valutare.
Forse avrebbe più senso paragonarlo ad una GPU?

By(t)e
bio8209 Maggio 2023, 09:58 #2
Originariamente inviato da: andbad
Più o meno come un i9-12900K? (che intel dice fare 820GLOPS)
Capisco che non sia possibile paragonare semplicemente due CPU così diverse, ma era per avere almeno un ordine di grandezza da valutare.
Forse avrebbe più senso paragonarlo ad una GPU?

By(t)e


come un 12900k ma senza richiedere dissipazione.. il 12900K che avevo sotto la scrivania faceva 250W sotto sforzo...

inoltre scrivono che è a basso consumo (che corrisponde al fatto che abbia dissipazione passiva)...

immagino i vantaggi siano questi...

una cosa che mi lascia perplesso è che indicano come tecnologia 65 nm nell'infografica.. parlano di qualcos'altro? nell'articolo è segnalato il processo a 12 nm (che mi sembra decisamente più sensato)

bio
supertigrotto09 Maggio 2023, 12:18 #3
Ho sempre detto che risc-V ha un elevato potenziale,bisogna crederci di più e investire....
andbad09 Maggio 2023, 20:30 #4
Originariamente inviato da: bio82
come un 12900k ma senza richiedere dissipazione.. il 12900K che avevo sotto la scrivania faceva 250W sotto sforzo...

inoltre scrivono che è a basso consumo (che corrisponde al fatto che abbia dissipazione passiva)...

immagino i vantaggi siano questi...

una cosa che mi lascia perplesso è che indicano come tecnologia 65 nm nell'infografica.. parlano di qualcos'altro? nell'articolo è segnalato il processo a 12 nm (che mi sembra decisamente più sensato)

bio


Non me ne intendo, ma interposer mi lascia pensare ai collegamenti tra i core e i pin.

By(t)e
arunax10 Maggio 2023, 19:47 #5
Ciao a tutti, io sono un ricercatore dell'Unibo e membro da oltre 10 anni del team che ha lavorato anche su questa architettura (non ho lavorato a questo progetto personalmente), il progetto PULP (https://pulp-platform.org). Purtroppo molte delle informazioni nell'articolo non sono accurate, perché la fonte (HPC Wire) deve aver fatto molta confusione, diciamo così . ESA non c'entra nulla (almeno per il momento) con il progetto Occamy, che è un processore di ricerca e assolutamente non un prodotto. Si tratta di un processore che, per fare un paragone alla Piero Angela, ha un livello di complessità (num. di transistor) paragonabile ad un processore high-end di una decina di anni fa, quindi un traguardo importante per un team di ricerca e una architettura assolutamente affascinante per noi che lavoriamo su queste cose ma non un prodotto ribadisco.

Dato che la filosofia di lavoro del PULP team, che si occupa di ricerca e non di prodotti, è di apertura nella fase di specifica, design e rilascio open-source, è abbastanza strano che si sia potuto fare questa confusione: comunque, stiamo cercando di riparare al danno. Qui potete trovare il Tweet relativo:
https://twitter.com/pulp_platform/s...0427870209?s=20
E qui tutte le info:
https://pulp-platform.org/occamy/

Originariamente inviato da: andbad
Non me ne intendo, ma interposer mi lascia pensare ai collegamenti tra i core e i pin.

By(t)e


Parzialmente corretto. Uno dei trend maggiori dell'elettronica negli ultimi anni è di muoversi da System-on-Chip a System-on-Package, in cui i dispositivi del sistema sono su molti die (chip, o meglio "chiplet" di silicio) piccoli a integrazione spinta (<12nm), integrati ("incollati" su uno o più chip molto più grandi ma integrazione rilassata (es. 65nm) usati come interposer appunto.
L'integrazione spinta è necessaria per avere alte performance ma si paga con resa bassa e costi alti; scalare le dimensioni di un sistema facendo chip più grossi alla lunga diventa enormemente costoso.
I chip a 65nm hanno resa altissima e costi bassi e possono essere usati per connettere più chiplet assieme in un sistema che, dal punto di vista di potenza, dimensione, e performance si comporta praticamente come un unico grande chip.
andbad11 Maggio 2023, 08:54 #6
Originariamente inviato da: arunax
Ciao a tutti, io sono un ricercatore dell'Unibo e membro da oltre 10 anni del team che ha lavorato anche su questa architettura (non ho lavorato a questo progetto personalmente), il progetto PULP (https://pulp-platform.org). Purtroppo molte delle informazioni nell'articolo non sono accurate, perché la fonte (HPC Wire) deve aver fatto molta confusione, diciamo così . ESA non c'entra nulla (almeno per il momento) con il progetto Occamy, che è un processore di ricerca e assolutamente non un prodotto. Si tratta di un processore che, per fare un paragone alla Piero Angela, ha un livello di complessità (num. di transistor) paragonabile ad un processore high-end di una decina di anni fa, quindi un traguardo importante per un team di ricerca e una architettura assolutamente affascinante per noi che lavoriamo su queste cose ma non un prodotto ribadisco.

Dato che la filosofia di lavoro del PULP team, che si occupa di ricerca e non di prodotti, è di apertura nella fase di specifica, design e rilascio open-source, è abbastanza strano che si sia potuto fare questa confusione: comunque, stiamo cercando di riparare al danno. Qui potete trovare il Tweet relativo:
https://twitter.com/pulp_platform/s...0427870209?s=20
E qui tutte le info:
https://pulp-platform.org/occamy/



Parzialmente corretto. Uno dei trend maggiori dell'elettronica negli ultimi anni è di muoversi da System-on-Chip a System-on-Package, in cui i dispositivi del sistema sono su molti die (chip, o meglio "chiplet" di silicio) piccoli a integrazione spinta (<12nm), integrati ("incollati" su uno o più chip molto più grandi ma integrazione rilassata (es. 65nm) usati come interposer appunto.
L'integrazione spinta è necessaria per avere alte performance ma si paga con resa bassa e costi alti; scalare le dimensioni di un sistema facendo chip più grossi alla lunga diventa enormemente costoso.
I chip a 65nm hanno resa altissima e costi bassi e possono essere usati per connettere più chiplet assieme in un sistema che, dal punto di vista di potenza, dimensione, e performance si comporta praticamente come un unico grande chip.


Grazie per le precisazioni. Avevo intuito, infatti scrivevo "tra I core" proprio per indicare l'interconnessione tra i vari chip in un die. Ma il tuo chiarimento sui processi produttivi è molto interessante. In effetti ha molto senso usare un PP "antidiluviano" e quindi immagino a costi bassissimi come "bus" tra i vari chiplet (che ora vado a vedere cosa significa ).

Ho letto il link, ma ne approfitto per chiederti una stima sulle prestazioni, perché 0,768 TFLOp/s con 10W (seppur sulla carta) confrontati con 820GLOp/s di un Core i9 che ne consuma 280 fa un po' impressione.
So che i FLOp come misuratore delle prestazioni di una CPU ha un valore relativo, ma comunque sarebbe interessante capire in che fascia prestazionale si posizionerebbe.

By(t)e
arunax14 Maggio 2023, 18:06 #7
Direi due cose:
[LIST]
[*] mentre è abbastanza facile predire la performance di picco in fase di design, la potenza consumata, soprattutto considerando tutto il sistema, non è facile da predire (e il sistema "integrato" ancora non è stato pubblicato). Quindi nel concreto è difficile fare confronti in termini di performance/Watt, perché i Watt sono noti solo in termini grossolani e conservativi ("low 10s of Watts".
[*] al di là di questo, è probabilmente più corretto confrontare un processore di questo tipo con una GPU che con un core out-of-order tipo i9. I 432 core utilizzati in Occamy (si chiamano "Snitch", come il boccino di Harry Potter, e sono open-source https://github.com/pulp-platform/snitch) sono più completi dei CUDA cores di una GPU NVIDIA, ma comunque molto piccoli e finalizzati interamente a "dar in pasto" dati a tante floating-point units.
[/LIST]

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^