pier4reich
07-08-2009, 07:38
http://boinc.fzk.de/poem/img/header.jpg
Home page (http://boinc.fzk.de/poem/index.php)
Dettagli progetto
Come dice l'immagine, questo progetto simula i ripiegamenti di forme molecolari (le proteine) basandosi sull'energia complessiva dei legami. (La natura aggrega gli elementi delle proteine in modo tale che questi utilizzino minor energia possibile)
Le proteine sono importantissime negli organismi svolgendo funzioni chiave. Il problema e che quando le proteine funzionano male spesso generano (o favoriscono) le malattie. Si conoscono migliaia di proteine relazionate ad una certa malattia (e ciò vle per molte malattie), ma di molte non si conosce la struttira tridimensionale.
Per capire, controllare e anche progettare le proteine dobbiamo capirne la struttura. Questa è difficilissima da ottenere sperimentalmente (le proteine si ripiegano in frazioni di secondo, quindi non si capisce come si sviluppa il ripiegamento e perchè cambiano forma), mente è relativamente semplice sapere la sequenza di atomi che compongono una proteina.
Basandosi quindi sulla sequenza di atomi e su ipotesi termodinamiche (per calcolare l'energia complessiva) di C. B. Anfinsen (http://en.wikipedia.org/wiki/Christian_B._Anfinsen), noi cerchiamo di capire la probabile strttura delle proteine. Ovviamente, per fare questo tramite simulazioni, bisogna disporre di una potenza di calcolo quasi illimitata (visto che i calcoli non sono pochi e le proteine nemmeno).
Quindi, chi ci aiuterà nel progetto permetterà di:
Predire la struttura attiva (che cambia) delle proteine
Comprendere il meccanismo di tramissione dei segnali tra proteine
Comprendere che funzione hanno i malfunzionamenti o le aggregazioni di proteine relazionate a specifiche malattie
Sviluppare nuovi farmaci che si basano sulla struttura tridimensionale delle proteine
i risultati del pragetto sono disponibili a tutti attraverso pubblicazioni, i ricercatori quindi non ci guadagnano niente, se non permettere lo sviluppo di metodi nti malattia più efficaci.
progetti simili
In pratica il progetto è simile a Folding@home (http://www.hwupgrade.it/forum/showthread.php?t=1438537) (consigliato per chi non ha problemi di compatibilità) e rosetta@home (http://www.hwupgrade.it/forum/showthread.php?t=1287402), soltanto che si basa su approcci differenti in termini computazionali (e forse anche in termini di ipotesi termodinamiche).
Osservazioni personali sul client di elaborazione
Il non plus ultra in termini di ottimizzazioni del client spetta a folding@home.
Poichè volevo partecipare a più progetti contemporaneamente, la piattaforma BOINC mi è sembrata più valida. Allora ho cercato progetti simili a folding su boinc. Ho trovato Rosetta e poem.
Per prima cosa (come fan tutti) ho provato il progetto più popoloso, rosetta. Il client mi ha deluso molto: richiede un mare di ram per portare a termine l'elaborazione e facendo confronti su diverse cpu, ho visto che non si avvantaggiava delle nuove architetture (in pratica puntava molto sull'efficienza di funzioni base e non su funzioni aggiuntive). Su processori "datati" (pentium 3) accadevano sempre errori computazionali, insomma, dal mio punto di vista, un disastro di progetto.
Con poem invece le cose andavano molto meglio, il quantitativo di ram utilizzato non è esorbitante (per ora stiamo sui 43 megabyte), si datta a qualsiasi archietettura (un celeron 566 completa una wu molto prima della scadenza) anche datata ed è un client che si avvantaggia molto delle nuove architetture (anche se non ho trovato nulla riguardo ad uso di eventuali SIMD).
Per vedere se un client è ottimizzato rispetto alle nuove architetture di processore, io mi baso sui risultati ottenuti con sisoftSandra (http://www.hwupgrade.it/forum/showthread.php?t=1556203). Sysoft sandra migliora costantemente due benchmark di vecchia data, il drystone ed il whetstone, ottimizzandoli per le nuove migliorie architetturali delle cpu. Sono test molto compatti che stanno in pochi kbyte di cache. In pratica rappresentano il "massimo" ottenibile dalla cpu.
Mi sono messo a confrontare diverse archietetture di processore su Sandra, pesando i risultati così: 60% del peso al risultato per gli interi (che sono normalmente più usati) ed il 40% per i calcoli in virgola mobile.
Poi ho confrontato i coefficenti ottenuti (per esempio tra un coppermine ed un barton).
Similmente ho preso in esame i tempi medi di risoluzione delle wu da parte di diverse architetture di CPU, certo due wu sono diverse, ma una media è un buon indicatore, tra l'altro ho verificato che le wu elaborate da diverse CPU appartenessero alla stessa macrofamiglia (quindi sostanzialmente la stessa quantità di calcoli, al'incirca).
Secondo sandra, per esempio, devo aspettarmi una riduzione del tempo di 2,5 volte tra due cpu diverse, invece ottengo una riduzione di 2 volte (contando che sandra è immune alla cache, non è male!). Allo stesso mondo, due cpu con lo stesso coefficente di efficienza in sandra, ma diversa frequenza e cache, ottengo risultati migliori rispetto a quanto si ci aspetta con sandra.
Secondo i miei calcoli, concludendo, il client di poem è il miglior client per le simulazioni mediche, ed uno dei migliori client in assoluto (dopo quelli di seti, einstein, etc..).
Link utili
Thread ufficiale su boinc italy (http://www.boincitaly.org/index.php?option=com_fireboard&Itemid=2&func=view&id=976&catid=20)
Osservazioni personali sul calcolo distribuito e BOINC
4° post (http://www.hwupgrade.it/forum/showpost.php?p=28529039&postcount=4)
(in costante aggiornamento, tempo permettendo)
Home page (http://boinc.fzk.de/poem/index.php)
Dettagli progetto
Come dice l'immagine, questo progetto simula i ripiegamenti di forme molecolari (le proteine) basandosi sull'energia complessiva dei legami. (La natura aggrega gli elementi delle proteine in modo tale che questi utilizzino minor energia possibile)
Le proteine sono importantissime negli organismi svolgendo funzioni chiave. Il problema e che quando le proteine funzionano male spesso generano (o favoriscono) le malattie. Si conoscono migliaia di proteine relazionate ad una certa malattia (e ciò vle per molte malattie), ma di molte non si conosce la struttira tridimensionale.
Per capire, controllare e anche progettare le proteine dobbiamo capirne la struttura. Questa è difficilissima da ottenere sperimentalmente (le proteine si ripiegano in frazioni di secondo, quindi non si capisce come si sviluppa il ripiegamento e perchè cambiano forma), mente è relativamente semplice sapere la sequenza di atomi che compongono una proteina.
Basandosi quindi sulla sequenza di atomi e su ipotesi termodinamiche (per calcolare l'energia complessiva) di C. B. Anfinsen (http://en.wikipedia.org/wiki/Christian_B._Anfinsen), noi cerchiamo di capire la probabile strttura delle proteine. Ovviamente, per fare questo tramite simulazioni, bisogna disporre di una potenza di calcolo quasi illimitata (visto che i calcoli non sono pochi e le proteine nemmeno).
Quindi, chi ci aiuterà nel progetto permetterà di:
Predire la struttura attiva (che cambia) delle proteine
Comprendere il meccanismo di tramissione dei segnali tra proteine
Comprendere che funzione hanno i malfunzionamenti o le aggregazioni di proteine relazionate a specifiche malattie
Sviluppare nuovi farmaci che si basano sulla struttura tridimensionale delle proteine
i risultati del pragetto sono disponibili a tutti attraverso pubblicazioni, i ricercatori quindi non ci guadagnano niente, se non permettere lo sviluppo di metodi nti malattia più efficaci.
progetti simili
In pratica il progetto è simile a Folding@home (http://www.hwupgrade.it/forum/showthread.php?t=1438537) (consigliato per chi non ha problemi di compatibilità) e rosetta@home (http://www.hwupgrade.it/forum/showthread.php?t=1287402), soltanto che si basa su approcci differenti in termini computazionali (e forse anche in termini di ipotesi termodinamiche).
Osservazioni personali sul client di elaborazione
Il non plus ultra in termini di ottimizzazioni del client spetta a folding@home.
Poichè volevo partecipare a più progetti contemporaneamente, la piattaforma BOINC mi è sembrata più valida. Allora ho cercato progetti simili a folding su boinc. Ho trovato Rosetta e poem.
Per prima cosa (come fan tutti) ho provato il progetto più popoloso, rosetta. Il client mi ha deluso molto: richiede un mare di ram per portare a termine l'elaborazione e facendo confronti su diverse cpu, ho visto che non si avvantaggiava delle nuove architetture (in pratica puntava molto sull'efficienza di funzioni base e non su funzioni aggiuntive). Su processori "datati" (pentium 3) accadevano sempre errori computazionali, insomma, dal mio punto di vista, un disastro di progetto.
Con poem invece le cose andavano molto meglio, il quantitativo di ram utilizzato non è esorbitante (per ora stiamo sui 43 megabyte), si datta a qualsiasi archietettura (un celeron 566 completa una wu molto prima della scadenza) anche datata ed è un client che si avvantaggia molto delle nuove architetture (anche se non ho trovato nulla riguardo ad uso di eventuali SIMD).
Per vedere se un client è ottimizzato rispetto alle nuove architetture di processore, io mi baso sui risultati ottenuti con sisoftSandra (http://www.hwupgrade.it/forum/showthread.php?t=1556203). Sysoft sandra migliora costantemente due benchmark di vecchia data, il drystone ed il whetstone, ottimizzandoli per le nuove migliorie architetturali delle cpu. Sono test molto compatti che stanno in pochi kbyte di cache. In pratica rappresentano il "massimo" ottenibile dalla cpu.
Mi sono messo a confrontare diverse archietetture di processore su Sandra, pesando i risultati così: 60% del peso al risultato per gli interi (che sono normalmente più usati) ed il 40% per i calcoli in virgola mobile.
Poi ho confrontato i coefficenti ottenuti (per esempio tra un coppermine ed un barton).
Similmente ho preso in esame i tempi medi di risoluzione delle wu da parte di diverse architetture di CPU, certo due wu sono diverse, ma una media è un buon indicatore, tra l'altro ho verificato che le wu elaborate da diverse CPU appartenessero alla stessa macrofamiglia (quindi sostanzialmente la stessa quantità di calcoli, al'incirca).
Secondo sandra, per esempio, devo aspettarmi una riduzione del tempo di 2,5 volte tra due cpu diverse, invece ottengo una riduzione di 2 volte (contando che sandra è immune alla cache, non è male!). Allo stesso mondo, due cpu con lo stesso coefficente di efficienza in sandra, ma diversa frequenza e cache, ottengo risultati migliori rispetto a quanto si ci aspetta con sandra.
Secondo i miei calcoli, concludendo, il client di poem è il miglior client per le simulazioni mediche, ed uno dei migliori client in assoluto (dopo quelli di seti, einstein, etc..).
Link utili
Thread ufficiale su boinc italy (http://www.boincitaly.org/index.php?option=com_fireboard&Itemid=2&func=view&id=976&catid=20)
Osservazioni personali sul calcolo distribuito e BOINC
4° post (http://www.hwupgrade.it/forum/showpost.php?p=28529039&postcount=4)
(in costante aggiornamento, tempo permettendo)