[poem@Home] [Archivio] - Hardware Upgrade Forum

View Full Version : [poem@Home]

pier4reich

07-08-2009, 08:38

http://boinc.fzk.de/poem/img/header.jpg

Home page (http://boinc.fzk.de/poem/index.php)

Dettagli progetto

Come dice l'immagine, questo progetto simula i ripiegamenti di forme molecolari (le proteine) basandosi sull'energia complessiva dei legami. (La natura aggrega gli elementi delle proteine in modo tale che questi utilizzino minor energia possibile)
Le proteine sono importantissime negli organismi svolgendo funzioni chiave. Il problema e che quando le proteine funzionano male spesso generano (o favoriscono) le malattie. Si conoscono migliaia di proteine relazionate ad una certa malattia (e ciò vle per molte malattie), ma di molte non si conosce la struttira tridimensionale.
Per capire, controllare e anche progettare le proteine dobbiamo capirne la struttura. Questa è difficilissima da ottenere sperimentalmente (le proteine si ripiegano in frazioni di secondo, quindi non si capisce come si sviluppa il ripiegamento e perchè cambiano forma), mente è relativamente semplice sapere la sequenza di atomi che compongono una proteina.

Basandosi quindi sulla sequenza di atomi e su ipotesi termodinamiche (per calcolare l'energia complessiva) di C. B. Anfinsen (http://en.wikipedia.org/wiki/Christian_B._Anfinsen), noi cerchiamo di capire la probabile strttura delle proteine. Ovviamente, per fare questo tramite simulazioni, bisogna disporre di una potenza di calcolo quasi illimitata (visto che i calcoli non sono pochi e le proteine nemmeno).

Quindi, chi ci aiuterà nel progetto permetterà di:

Predire la struttura attiva (che cambia) delle proteine
Comprendere il meccanismo di tramissione dei segnali tra proteine
Comprendere che funzione hanno i malfunzionamenti o le aggregazioni di proteine relazionate a specifiche malattie
Sviluppare nuovi farmaci che si basano sulla struttura tridimensionale delle proteine

i risultati del pragetto sono disponibili a tutti attraverso pubblicazioni, i ricercatori quindi non ci guadagnano niente, se non permettere lo sviluppo di metodi nti malattia più efficaci.

progetti simili

In pratica il progetto è simile a Folding@home (http://www.hwupgrade.it/forum/showthread.php?t=1438537) (consigliato per chi non ha problemi di compatibilità) e rosetta@home (http://www.hwupgrade.it/forum/showthread.php?t=1287402), soltanto che si basa su approcci differenti in termini computazionali (e forse anche in termini di ipotesi termodinamiche).

Osservazioni personali sul client di elaborazione

Il non plus ultra in termini di ottimizzazioni del client spetta a folding@home.
Poichè volevo partecipare a più progetti contemporaneamente, la piattaforma BOINC mi è sembrata più valida. Allora ho cercato progetti simili a folding su boinc. Ho trovato Rosetta e poem.
Per prima cosa (come fan tutti) ho provato il progetto più popoloso, rosetta. Il client mi ha deluso molto: richiede un mare di ram per portare a termine l'elaborazione e facendo confronti su diverse cpu, ho visto che non si avvantaggiava delle nuove architetture (in pratica puntava molto sull'efficienza di funzioni base e non su funzioni aggiuntive). Su processori "datati" (pentium 3) accadevano sempre errori computazionali, insomma, dal mio punto di vista, un disastro di progetto.
Con poem invece le cose andavano molto meglio, il quantitativo di ram utilizzato non è esorbitante (per ora stiamo sui 43 megabyte), si datta a qualsiasi archietettura (un celeron 566 completa una wu molto prima della scadenza) anche datata ed è un client che si avvantaggia molto delle nuove architetture (anche se non ho trovato nulla riguardo ad uso di eventuali SIMD).

Per vedere se un client è ottimizzato rispetto alle nuove architetture di processore, io mi baso sui risultati ottenuti con sisoftSandra (http://www.hwupgrade.it/forum/showthread.php?t=1556203). Sysoft sandra migliora costantemente due benchmark di vecchia data, il drystone ed il whetstone, ottimizzandoli per le nuove migliorie architetturali delle cpu. Sono test molto compatti che stanno in pochi kbyte di cache. In pratica rappresentano il "massimo" ottenibile dalla cpu.
Mi sono messo a confrontare diverse archietetture di processore su Sandra, pesando i risultati così: 60% del peso al risultato per gli interi (che sono normalmente più usati) ed il 40% per i calcoli in virgola mobile.
Poi ho confrontato i coefficenti ottenuti (per esempio tra un coppermine ed un barton).

Similmente ho preso in esame i tempi medi di risoluzione delle wu da parte di diverse architetture di CPU, certo due wu sono diverse, ma una media è un buon indicatore, tra l'altro ho verificato che le wu elaborate da diverse CPU appartenessero alla stessa macrofamiglia (quindi sostanzialmente la stessa quantità di calcoli, al'incirca).

Secondo sandra, per esempio, devo aspettarmi una riduzione del tempo di 2,5 volte tra due cpu diverse, invece ottengo una riduzione di 2 volte (contando che sandra è immune alla cache, non è male!). Allo stesso mondo, due cpu con lo stesso coefficente di efficienza in sandra, ma diversa frequenza e cache, ottengo risultati migliori rispetto a quanto si ci aspetta con sandra.
Secondo i miei calcoli, concludendo, il client di poem è il miglior client per le simulazioni mediche, ed uno dei migliori client in assoluto (dopo quelli di seti, einstein, etc..).

Link utili

Thread ufficiale su boinc italy (http://www.boincitaly.org/index.php?option=com_fireboard&Itemid=2&func=view&id=976&catid=20)

Osservazioni personali sul calcolo distribuito e BOINC

4° post (http://www.hwupgrade.it/forum/showpost.php?p=28529039&postcount=4)

(in costante aggiornamento, tempo permettendo)

nn020

09-08-2009, 15:15

Ci sono, sto macinando ;)

GHz

13-08-2009, 01:59

Ciao,
segnalo che BOINC.Italy è presente su poem@home da tempo (http://www.hwupgrade.it/forum/showthread.php?t=1620824), il team è qui: http://boinc.fzk.de/poem/team_display.php?teamid=319
Effettivamente qui mancava un thread ufficiale, quindi hai fatto bene ad aprirlo, c'è bisogno di diffondere questo progetto ed aumentare la nostra potenza elaborativa! http://www.webalice.it/landipaolo/immagini/ruota.gif
Un pò di informazioni sul progetto le trovate nella pagina del progetto (http://www.boincitaly.org/index.php?option=com_content&task=view&id=18&Itemid=32) o sul thread ufficiale (http://www.boincitaly.org/index.php?option=com_fireboard&Itemid=2&func=view&id=976&catid=20) di poem@home nel portale di BOINC.Italy! ;)

Ciao,
GHz

pier4reich

14-08-2009, 09:09

Grazie non sto avendo molto tempo, ma hwupgrade è (spesso) un riferimento per le ricerche in italiano... anche se il non plus utra è sul wiki.

Mi rifarò anche ai vostri thread per aggiornare quello principale

Osservazioni personali sul calcolo distribuito e boinc

Quel che segue sono opinioni personali, non deve essere la verità e sono difficilmente (se le discussioni non sono supportate da ragionamenti logici obiettivi) modificabili

Il calcolo distribuito è davvero una cosa eccezionale. Si utilizzano sicuramente meglio le CPU di molti computer che altrimenti sfruttrebbero poco la loro potenza di calcolo, ma così facendo si ottimizzano le risorse presenti sul pianeta (piuttosto che fabbricarne altre per lo stesso scopo) per uno obbiettivo utile: la ricerca scientifica (che è quella che ci manda avanti, poche scuse).

Il problema e che, per me, come in altri campi lo sforzo punta a progetti non immediatmente utili, in tal caso Seti@home che ha un bacino di utenti pauroso (anche se gli utenti globali sono un'inezia rispetto agli utenti i internet, peccato). Sicuramente seti ha guadagnato un pochino i rispetto, nei miei pensieri, in quanto oltre a cercare ET (che probabilmente c'è, ma non è immeditamente utile) trova anche qualsiasi ogetto celeste che emette onde radio, e ciò permette di aumentare la nostra conoscenza dell'universo (almeno questo!).

Per progetti utili nel breve termine io intendo quelli che hanno maggiore probabilità di successo visti i trend precedenti, e maggiore utilità a breve termine (a lungo termine son tutti utili), nello specifico i progetti sulle malattie o sulla fisica, o comunque di risultati sicuramente raggiungibili.

Però devo anche essere obbiettivo. Seti sarà anche inutile (o quasi) a livello di scopo, ma raggiunge risultati secondari non di poco conto. Grazie all'enorme numero di utenti (che io pregiudizievolmente non stimo moltissimo), gli sviluppatori si son resi conto dell'enorme potenzialità del calcolo distribuito ed han sviluppato BOINC.
Grazie all'enorme numero di utenti, è più probabile trovare programmatori appassionati, che si con resi conto che il loro client non era ottimizzato per le SIMD e l'han reso tale. Ma così facendo, spingono tutte le altre comunitò di altri progetti a fare lo stesso (il massimo sono gli utenti che ottimizzano più progetti, come aksoF ), magari senza il contriuto di seti si otteneva questo molto dopo.

Poi muovo una critica verso chi sviluppa il progetto. L'obbiettivo iniziale è sicuramente quello di creare un algoritmo di simulazione corretto, indipendentemente dall'ottimizzazione. Il passo successivo, a mio modo di vedere, è ottimizzare parti dell'algoritmo (se questo risulta riutilizzabile in più simulazioni, o le simulazioni che deve affrontare son tante). Infatti l'ottimizzazione permette risultati più rapidi, e ciò non è mai un male. Che ottimizzazione? In prima istanza si ottimizza il codice di base, non in modo estremo, ma un minimo, e poi si cercano di applicare le ottimizzazioni relative alle nuove architetture (specialmente le SIMD).

Ora, se gli sviluppatori fossero una community, non gli si potrebbe recriminare molto, ma, praticamente sempre, gli sviluppatori fanno parte di dipartimenti universitari, e quindi non dovrebbero essere tanto estranei a questi concetti... Invece, puntualmente, in quasi ogni progetto in cui esistono ottimizzazioni, queste sono state apportate, per la prima volta, dagli utenti (tramite il reverse engineering).
Ciò mi delude molto, soprattutto se penso che ormai il calcolo distribuito esiste da 4-5 anni.

Tommy81

14-08-2009, 11:49

Anch'io scaccolo il Poem :D

pier4reich

14-08-2009, 12:16

Ok aggiornato.

[FVG] bax

31-12-2011, 13:36

Finalmente un progetto in ambito medico (bioinformatica) che usa le GPU ATI !!

E' stato rilasciato ufficialmente il client per GPU ATI, sfrutta OpenCL e gira anche su GPU "datate" come la 4870

E' necessario aggiornare BOINC alla versione 7.0.3, è inoltre consigliato aggiornare i driver della scheda video.

Per il resto, per una elaborazione standard non è necessario fare i salti mortali: basta abilitare la ricezione delle WU per GPU sul sito del progetto e abilitare l'elaborazione per GPU sul vostro BOINC Manager.

A breve dovrebbe essere rilasciata anche l'applicazione per GPU nVidia.

Mediamente una WU di POEM@home sfrutta il 50% di un core della CPU e non satura la GPU. E' quindi possibile (per ora, poi magari la perfezionano) elaborare più WU contemporaneamente modificando un file della configurazione di BOINC.... qui le cose si fanno un pelino più complicate quindi se vi interessa c'è una spiegazione sul portale di BOINC.Italy

winebar

01-01-2012, 13:04

bax;36643926']Finalmente un progetto in ambito medico (bioinformatica) che usa le GPU ATI !!

E' stato rilasciato ufficialmente il client per GPU ATI, sfrutta OpenCL e gira anche su GPU "datate" come la 4870

E' necessario aggiornare BOINC alla versione 7.0.3, è inoltre consigliato aggiornare i driver della scheda video.

Per il resto, per una elaborazione standard non è necessario fare i salti mortali: basta abilitare la ricezione delle WU per GPU sul sito del progetto e abilitare l'elaborazione per GPU sul vostro BOINC Manager.

A breve dovrebbe essere rilasciata anche l'applicazione per GPU nVidia.

Mediamente una WU di POEM@home sfrutta il 50% di un core della CPU e non satura la GPU. E' quindi possibile (per ora, poi magari la perfezionano) elaborare più WU contemporaneamente modificando un file della configurazione di BOINC.... qui le cose si fanno un pelino più complicate quindi se vi interessa c'è una spiegazione sul portale di BOINC.Italy

Sto scaccolando su POEM da ieri, la mia CPU ha tutti i core al 100%. Inoltre sembra che riesco ad elaborare con la GPU anche con la versione 6.12.34, da notare che sul sito dell'università di Berkeley la 7.0.3 non è presente.
Piccolo appunto: noto che sono praticamente nulli i progetti multithreaded (solo milkyway semnbrerebbe, a vedere dal client, supportare la funzionalità), ciò è un vero peccato, perchè in questo modo le varie WU terminerebbero ancora prima e si ottimizzerebbe lo scaccolo worldwide.

PS: Auguri a tutti!

[FVG] bax

01-01-2012, 14:28

Sto scaccolando su POEM da ieri, la mia CPU ha tutti i core al 100%. Inoltre sembra che riesco ad elaborare con la GPU anche con la versione 6.12.34, da notare che sul sito dell'università di Berkeley la 7.0.3 non è presente.
Piccolo appunto: noto che sono praticamente nulli i progetti multithreaded (solo milkyway semnbrerebbe, a vedere dal client, supportare la funzionalità), ciò è un vero peccato, perchè in questo modo le varie WU terminerebbero ancora prima e si ottimizzerebbe lo scaccolo worldwide.

PS: Auguri a tutti!

mmmhhh... la richiesta di aggiornare BOINC viene dagli sviluppatori di POEM. Io ho provato a scaccolare senza aggiornarla ma non mi scaricava lavoro! Controlla se stai elaborando le POEM per CPU o quelle per ATI ;)

La versione 7 è ancora in fase di sviluppo, quindi non stabile (anche se in realtà lo è, solo che da problemi di validazione delle WU su qualche progetto) ed è scaricabile da una pagina apposita del sito BOINC: questa (http://boinc.berkeley.edu/download_all.php).

Riguardo al multithread: AQUA lo utilizzava ma per quello che ne so io solamente perché un core da solo non era sufficiente. Ho idea che la gran parte degli utenti BOINC preferiscano WU monocore perché così possono decidere su quali progetti scaccolare (solitamente più di uno)

winebar

01-01-2012, 19:28

bax;36646807']mmmhhh... la richiesta di aggiornare BOINC viene dagli sviluppatori di POEM. Io ho provato a scaccolare senza aggiornarla ma non mi scaricava lavoro! Controlla se stai elaborando le POEM per CPU o quelle per ATI ;)

La versione 7 è ancora in fase di sviluppo, quindi non stabile (anche se in realtà lo è, solo che da problemi di validazione delle WU su qualche progetto) ed è scaricabile da una pagina apposita del sito BOINC: questa (http://boinc.berkeley.edu/download_all.php).

Riguardo al multithread: AQUA lo utilizzava ma per quello che ne so io solamente perché un core da solo non era sufficiente. Ho idea che la gran parte degli utenti BOINC preferiscano WU monocore perché così possono decidere su quali progetti scaccolare (solitamente più di uno)

Presumo che scaccoli via CPU dato che mi da attive 4 WU e tutte ci mettono circa lo stesso tempo.
Comunque non importa, scarico la 7.0.3 e uso quella, almeno ho la certezza.
Giusto per sicurezza aspetto che finisca queste WU e le invii al server, anche perchè sarebbe un peccato aver sprecato tempo inutilmente.

Infatti (c.v.d.) stava scaccolando tramite CPU, da quando ho messo la GPU noto un boost non indifferente. L'unica cosa che ho notato è che se scaccolo via GPU non posso tenere WU attive via CPU perchè si "contrastano".

code

02-01-2012, 13:04

Presumo che scaccoli via CPU dato che mi da attive 4 WU e tutte ci mettono circa lo stesso tempo.
Comunque non importa, scarico la 7.0.3 e uso quella, almeno ho la certezza.
Giusto per sicurezza aspetto che finisca queste WU e le invii al server, anche perchè sarebbe un peccato aver sprecato tempo inutilmente.

Infatti (c.v.d.) stava scaccolando tramite CPU, da quando ho messo la GPU noto un boost non indifferente. L'unica cosa che ho notato è che se scaccolo via GPU non posso tenere WU attive via CPU perchè si "contrastano".

In che senso contrastano?