Discussione: Folding@Home
View Single Post
Old 14-06-2007, 21:11   #2
gabi.2437
Senior Member
 
L'Avatar di gabi.2437
 
Iscritto dal: Sep 2006
Messaggi: 6950
Ma cosa elaboriamo in sostanza? Beh proteine, non si capisce? Ok, ma cosa fanno ste proteine? Sono quelle che in tivù dicono si trovano nella carne e quindi bisogna mangiare tanta carne per aver tante proteine? L'idea è quella, ma la situazione è diversa

Insomma, cos'è questo Folding, questo Folding proteico?
Le proteine sono dei composti organici molto complessi, che vengono sintetizzati dagli organismi viventi (animali e piante) utilizzando una serie di “mattoncini elementari” chiamati “amminoacidi”. Gli amminoacidi che formano le proteine sono 20 in totale.

Le funzioni svolte dalle proteine sono talmente numerose, che elencarle e discuterle tutte richiederebbe un libro di centinaia di pagine. Riassumendo, possiamo dire che hanno 2 funzioni principali:

1. Funzione strutturale : le proteine costituiscono il materiale strutturale di cui sono formati i capelli, le unghie, la pelle, gli artigli degli animali (alfa e beta-cheratine), i tessuti connettivi come i tendini (collagene) ed i nostri muscoli (miosina e actina).
2. Funzioni regolatorie e di trasporto: gli enzimi, che regolano i processi metabolici del nostro corpo, sono tutti delle proteine. L’insulina, l’ormone che regola il metabolismo del glucosio e che viene somministrato ai diabetici, è anch’esso una proteina. Emogoblina e Miogoblina sono le proteine responsabili del trasporto dell’ossigeno nel sangue e nei tessuti. Anche gli anticorpi, che hanno il compito di difendere il nostro organismo dalle aggressioni esterne, sono delle proteine.

Le proteine vengono sintetizzate a partire dal DNA, che contiene al suo interno tutte le informazioni necessarie per creare la corretta sequenza di amminoacidi che formerà la proteina.

La successione di amminoacidi all’interno di una proteina costituisce la struttura primaria. Gli amminoacidi che formano le proteine sono solo 20, ma questi si possono ripetere più volte lungo la catena. Proteine di piccole dimensioni contengono un centinaio di amminoacidi, mentre le proteine più grandi contengono fino a 10.000 – 20.000 amminoacidi.
Ecco una rappresentazione schematica della struttura primaria di una proteina, in cui ogni pallina corrisponde ad un amminoacido.



Veniamo adesso al nocciolo della questione, ovvero quello di cui si occupa concretamente il progetto Folding@Home.
Affinché una proteina svolga correttamente le funzioni per cui è stata sintetizzata, non deve essere rispettata solo la struttura primaria, ma anche la sua struttura secondaria, terziaria e quaternaria.

La struttura secondaria è una struttura spaziale, regolare e ripetitiva, che può essere di 2 diversi tipi: α-elica (in cui la catena proteica si avvolge come una vite) e foglietto pieghettato β (in cui la catena proteica assume una struttra planare)


La struttura terziaria riguarda la disposizione delle alfa eliche e dei foglietti beta in strutture ancor più complesse chiamate domini o subunità.
In figura vediamo un esempio di struttura terziaria. Evidenziate in rosso le alfa-eliche e in giallo i foglietti beta.


Ogni subunità, può aggregarsi ad altre subunità creando una struttura ancor piu complessa, la struttura quaternaria. In figura, è mostrata la disposizione spaziale delle 4 subunità (alfa1, alfa2, beta1, beta2) che formano l’emoglobina umana, ognuna evidenziata con un colore diverso:


Conoscere la sequenza amminoacidica di una proteina (la struttura primaria) ci dice ben poco circa le sue funzioni, infatti per svolgere correttamente le proprie funzioni, le proteine devono assumere una corretta disposizione tridimensionale (la struttura secondaria, terziaria e quaternaria di cui abbiamo appena parlato). Il processo di avvolgimento delle proteine in una struttura tridimensionale organizzata e regolare, viene chiamato folding (dall’inglese TO FOLD = piegare).

Si ritiene che malattie come il morbo di Alzheimer, il morbo di Parkinson, il morbo della mucca pazza (noto anche come BSE = encefalopatia spongiforme bovina) e molti tipi di cancro, siano il risultato di un processo non corretto di folding delle proteine (misfolding).
La conclusione a cui si è pervenuti è che: IL CORRETTO AVVOLGIMENTO (FOLDING) DI UNA PROTEINA È CRITICO PER IL CORRETTO FUNZIONAMENTO DELLA PROTEINA STESSA.

Per comprendere come le proteine possono avvolgersi, è necessario effettuare delle simulazioni al computer, utilizzando programmi specifici. Credo che F@H utilizzi il software GROMACS. Potete verificare questo aprendo il file logfile_01.txt che si trova nella cartella C:\Documents and Settings\NOME UTENTE\Dati applicazioni\Folding@home-x86\work. Leggerete la dicitura: Folding@Home Gromacs Core Version 1.90 (March 8, 2006)

Se si considera che il numero di amminoacidi presenti in ogni proteina è dell’ordine di 100 – 10.000 (vedi struttura primaria), è facile capire queste enormi molecole (macromolecole) possono avvolgersi in un numero enorme di modi differenti!!

2. QUALI OPERAZIONI ESEGUE IL PROGRAMMA DI F@H?
Ogni qual volta avviate F@H, il vostro computer esegue una serie di calcoli atti a simulare il modo in cui una proteina può avvolgersi, tenendo conto di tutte le forze interatomiche che si stabiliscono tra le centinaia di migliaia di atomi che formano la proteina (abbiamo detto che le proteine più grandi hanno un numero di amminoacidi dell’ordine 10.000 – 20.000, ma ogni amminoacido è formato da circa 10-20 atomi, quindi il conto è presto fatto!).
In definitiva, F@H È UNA SIMULAZIONE VIA SOFTWARE DELLA STRUTTURA SECONDARIA, TERZIARIA E PRIMARIA DI ALCUNE PROTEINE COINVOLTE IN MALATTIE COME ALZHEIMER, PARKINSON, CANCRO, ecc....

Per complicare ulteriormente le cose, ricordate che le proteine non sono isolate, ma negli organismi viventi si trovano circondate da molecole di acqua (ambiente acquoso), quindi una simulazione che abbia senso deve tener conto anche delle interazioni tra le molecole di acqua e la proteina. Infine, ogni simulazione deve tenere conto della temperatura. Una proteina può avvolgersi in una determinata maniera a 20°C, ma può avvolgersi in maniera completamente differente a 30°C o a 35°C. Conclusione: al variare della temperatura, il folding della proteina varia di conseguenza.

Adesso, dovreste aver capito come mai anche un velocissimo processore N-core lanciato a 6 GHz, impiega tante ore per effettuare questi calcoli: la mole di lavoro richiesta per una simulazione completa e accurata è davvero impressionante!

Contributo di Mr6600 (quindi per eventuali errori insultate lui)


Perche' se guardo nel log file mi capitano più WU di uno stesso progetto? Sto rifacendo le stesse cose?

No c'è nessun mistero nè complotto , la spiegazione sta tutta nel

Run 0, Clone 221, Gen 198 (numeri inventati eh...)

Per ogni progetto, per esempio 5769, ci sono migliaia, anzi, milioni di WU da fare, definite appunto dal trio Run Clone Gen
Per ogni progetto, e quindi proteina in una certa condizione, si parte da più basi che dovrebbero essere i Run. Se sono 1000, già per il solo progetto 5769 partiamo con 1000 WU, poi abbiamo i Clone, per ogni base si fanno partire più rami perchè ovviamente l'evoluzione di una proteina non è fissa (sebbene lo sia la struttura finale) ma dipende appunto dai miliardi di collisioni atomiche, quindi se si parte da una base sola, se si ha sfiga ci si blocca in una struttura che non si verifica mai E metti 100 Clone, si hanno centomila WU di partenza
Infine arriviamo ai Gen che dovrebbero essere il punto del ramo a cui siamo arrivati, ogni WU contiene solo una piccola parte del progresso della proteina, quando viene conclusa, viene spedita un'altra WU che continua il tutto, finchè non si arriva finalmente alla simulazione completa
Quindi siamo a centomila WU in contemporanea (non si può far la prossima finchè non si hanno i risultati di quella precedente, è uno dei motivi per cui talvolta dicono che per loro è importante ricevere i risultati in fretta e il perchè nn hanno, come invece altri progetti, deadline lunghe settimane se non mesi) moltiplicati per tutti i passetti necessari per arrivare alla fine, metti che per ogni ramo si abbiano mille passi, siamo a centomila per mille WU totali.

E questo solo per il 5769

Contando tutti i progetti, ecco spiegato perchè si va avanti da anni con processori, schede video e Playstation 3

(nota, i numeri delle WU li ho inventati, non so se è davvero centomila per mille oppure no )
__________________

Ultima modifica di gabi.2437 : 22-02-2009 alle 20:35.
gabi.2437 è offline   Rispondi citando il messaggio o parte di esso