Torna indietro   Hardware Upgrade Forum > Software > Programmazione

BOOX Note Air4 C è uno spettacolo: il tablet E Ink con Android per lettura e scrittura
BOOX Note Air4 C è uno spettacolo: il tablet E Ink con Android per lettura e scrittura
BOOX Note Air4 C rappresenta l'ultima incarnazione della categoria dei tablet E Ink a colori di Onyx, e combina le prestazioni di un dispositivo Android con l'ottima tecnologia Kaleido 3 per il display. Con schermo da 10,3 pollici, un processore Qualcomm Snapdragon 750G e 6 GB di RAM, promette un'esperienza completa per lettura, scrittura e produttività. Il prezzo lo posiziona nel segmento premium, ma questo dispositivo è un vero spettacolo!
Recensione Sony Xperia 1 VII: lo smartphone per gli appassionati di fotografia
Recensione Sony Xperia 1 VII: lo smartphone per gli appassionati di fotografia
Sony Xperia 1 VII propone un design sobrio e funzionale, con un comparto fotografico di ottimo livello caratterizzato da uno zoom continuo e prestazioni generali da top di gamma puro. Viene proposto con una personalizzazione software sobria e affidabile, ma presenta qualche criticità sul fronte ricarica rapida. Il dispositivo punta su continuità stilistica e miglioramenti mirati, rivolgendosi al solito pubblico specifico del brand giapponese.
Attenti a Poco F7: può essere il best buy del 2025. Recensione
Attenti a Poco F7: può essere il best buy del 2025. Recensione
Poco F7 5G, smartphone che punta molto sulle prestazioni grazie al processore Snapdragon 8s Gen 4 e a un display AMOLED da ben 6,83 pollici. La casa cinese mantiene la tradizione della serie F offrendo specifiche tecniche di alto livello a un prezzo competitivo, con una batteria generosissima da 6500 mAh e ricarica rapida a 90W che possono fare la differenza per gli utenti più esigenti.
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 12-12-2009, 12:50   #1
Lucrezio
Senior Member
 
L'Avatar di Lucrezio
 
Iscritto dal: Dec 2003
Città: Trento, Pisa... ultimamente il mio studio...
Messaggi: 4389
[Fortan77] Parallelizzazione di una semplice routine

Ciao a tutti!
Mi sono ritrovato a dover calcolare una funzione di correlazione, di cui poi devo fare la trasformata di fourier, fra velocita' di atomi ottenute con una dinamica molecolare.

Ho scritto un programmino che mi permette di fare il calcolo, ma dovendo trattare anche quantita' piuttosto ingenti di dati (Il calcolo scala come O(N^2)) mi piacerebbe sfruttare tutti i core del mio processore parallelizzando l'esecuzione.
Ho provato - non sono un programmatore se non per necessita', quindi ho cercato la soluzione piu' facile! - ad usare le opzioni di autoparallelizzazione dei compilatori che ho a disposizione (intel ifort e portland pgf77), ma la cosa non ha dato risultati.
La parte da parallelizzare sarebbe questa:
Codice:
      do I = 1, Lenght+1, IFr
        do J = 1, NStep - I + 1, IFr
          Fac = Dble(NStep-I+1)/Dble(NStep*(NStep+1)/2)
          VVx(I) = VVx(I) + Fac*Vel(1,IAt1,J)*Vel(1,IAt2,J+I-1)
          VVy(I) = VVy(I) + Fac*Vel(2,IAt1,J)*Vel(2,IAt2,J+I-1)
          VVz(I) = VVz(I) + Fac*Vel(3,IAt1,J)*Vel(3,IAt2,J+I-1)
        enddo
        ACF(I) = (VVx(I)+VVy(I)+VVz(I))/Three
        write(2,*) I,ACF(I)
      enddo
Come vedete non e' nulla di difficile. Le cose potenzialmente utili sarebbero
- far fare ogni somma (VVx,VVy,VVz) ad un core diverso
- parallelizzare l'esecuzione del ciclo esterno
- parallelizzare l'esecuzione del ciclo interno

Qualcuno ha qualche dritta da darmi sul come fare?
Grazie mille!
__________________
"Expedit esse deos, et, ut expedit, esse putemus" (Ovidio)
Il mio "TESSORO": SuperMicro 733TQ, SuperMicro X8DAI I5520, 2x Xeon Quad E5620 Westmere, 12x Kingston 4GB DDR3 1333MHz, 4x WD 1Tb 32MB 7.2krpm
Lucrezio è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2009, 14:18   #2
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Dai un'occhiata ad OpenMP: http://en.wikipedia.org/wiki/OpenMP
Dovrebbe essere compatibile con Fortran e con il compilatore Intel
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2009, 15:10   #3
gugoXX
Senior Member
 
L'Avatar di gugoXX
 
Iscritto dal: May 2004
Città: Londra (Torino)
Messaggi: 3692
Per esperienza io affronterei il problema parallelizzando unicamente il ciclo esterno, distribuendo gli indici tra i diversi core.
Ma non saprei affrontare il probelma In Fortran.
__________________
Se pensi che il tuo codice sia troppo complesso da capire senza commenti, e' segno che molto probabilmente il tuo codice e' semplicemente mal scritto.
E se pensi di avere bisogno di un nuovo commento, significa che ti manca almeno un test.
gugoXX è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2009, 15:26   #4
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Con OpenMP parallelizzarlo sarebbe una cavolata, basta una direttiva per parallelizzare il ciclo più esterno
https://computing.llnl.gov/tutorials/openMP/#Combined

Le versioni del compilatore Intel che supportano OpenMP sono le versioni 11.0 e 11.1.

Ultima modifica di cionci : 12-12-2009 alle 15:31.
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2009, 15:44   #5
Lucrezio
Senior Member
 
L'Avatar di Lucrezio
 
Iscritto dal: Dec 2003
Città: Trento, Pisa... ultimamente il mio studio...
Messaggi: 4389
Era effettivamente una boiata!
Posto la soluzione, così per curiosità:
Codice:
C$omp parallel do
C$omp& shared(VVx,VVy,VVz,Vel,NThr,NStep,IFr)
C$omp& private (I,J)
      do I = 1, Lenght+1, IFr
        NThr = OMP_GET_NUM_THREADS()
        do J = 1, NStep - I + 1, IFr
          Fac = Dble(NStep-I+1)/Dble(NStep*(NStep+1)/2)
          VVx(I) = VVx(I) + Fac*Vel(1,IAt1,J)*Vel(1,IAt2,J+I-1)
          VVy(I) = VVy(I) + Fac*Vel(2,IAt1,J)*Vel(2,IAt2,J+I-1)
          VVz(I) = VVz(I) + Fac*Vel(3,IAt1,J)*Vel(3,IAt2,J+I-1)
        enddo
        ACF(I) = (VVx(I)+VVy(I)+VVz(I))/Three
      enddo
C$omp end parallel do
Bisogna aggiungere anche
Codice:
include 'omp_lib.h'
Ho compilato con il comando
Codice:
 ifort -o acf -O3 -openmp acf.f
Grazie a tutti!
__________________
"Expedit esse deos, et, ut expedit, esse putemus" (Ovidio)
Il mio "TESSORO": SuperMicro 733TQ, SuperMicro X8DAI I5520, 2x Xeon Quad E5620 Westmere, 12x Kingston 4GB DDR3 1333MHz, 4x WD 1Tb 32MB 7.2krpm
Lucrezio è offline   Rispondi citando il messaggio o parte di esso
Old 12-12-2009, 15:47   #6
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Azz...l'hai fatto in 10 minuti
OpenMP

Dicci qualcosa sulle prestazioni...hai sempre quella workstation con otto core ?
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 13-12-2009, 00:27   #7
Lucrezio
Senior Member
 
L'Avatar di Lucrezio
 
Iscritto dal: Dec 2003
Città: Trento, Pisa... ultimamente il mio studio...
Messaggi: 4389
Quote:
Originariamente inviato da cionci Guarda i messaggi
Azz...l'hai fatto in 10 minuti
OpenMP

Dicci qualcosa sulle prestazioni...hai sempre quella workstation con otto core ?
se mi ricordi come diavolo si chiama il comando linux per sapere il tempo di esecuzione ci provo! (tic [comando] tac? o qualcosa del genere...)

Cmq... sto lavorando su un dual xeon quad core nehalem con 48GB di ram, ma per fare queste cosine uso il personal...
__________________
"Expedit esse deos, et, ut expedit, esse putemus" (Ovidio)
Il mio "TESSORO": SuperMicro 733TQ, SuperMicro X8DAI I5520, 2x Xeon Quad E5620 Westmere, 12x Kingston 4GB DDR3 1333MHz, 4x WD 1Tb 32MB 7.2krpm
Lucrezio è offline   Rispondi citando il messaggio o parte di esso
Old 13-12-2009, 08:30   #8
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
time [comando]

Comunque tic e tac esistono, ma non fanno quello
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 13-12-2009, 18:45   #9
Lucrezio
Senior Member
 
L'Avatar di Lucrezio
 
Iscritto dal: Dec 2003
Città: Trento, Pisa... ultimamente il mio studio...
Messaggi: 4389
Quote:
Originariamente inviato da cionci Guarda i messaggi
time [comando]

Comunque tic e tac esistono, ma non fanno quello
Non scala proprio linearmente per via dell'algoritmo (il numero di somme del secondo loop dipende dall'indice del primo, quindi finisce prima l'ultimo thread e così via...) però c'è una bella differenza!
Considera che sto facendo calcoli con un milione di punti, quindi O(10^12) operazioni
Un fattore 2 è già importante!
__________________
"Expedit esse deos, et, ut expedit, esse putemus" (Ovidio)
Il mio "TESSORO": SuperMicro 733TQ, SuperMicro X8DAI I5520, 2x Xeon Quad E5620 Westmere, 12x Kingston 4GB DDR3 1333MHz, 4x WD 1Tb 32MB 7.2krpm
Lucrezio è offline   Rispondi citando il messaggio o parte di esso
Old 13-12-2009, 19:06   #10
cionci
Senior Member
 
L'Avatar di cionci
 
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
Hai guardato l'utilizzo dei vari core ? Come vengono utilizzati ?
cionci è offline   Rispondi citando il messaggio o parte di esso
Old 17-12-2009, 21:48   #11
tiMo
Member
 
Iscritto dal: Jan 2005
Messaggi: 157
Quote:
Originariamente inviato da Lucrezio Guarda i messaggi
Ciao a tutti!
Mi sono ritrovato a dover calcolare una funzione di correlazione, di cui poi devo fare la trasformata di fourier, fra velocita' di atomi ottenute con una dinamica molecolare.

Ho scritto un programmino che mi permette di fare il calcolo, ma dovendo trattare anche quantita' piuttosto ingenti di dati (Il calcolo scala come O(N^2)) mi piacerebbe sfruttare tutti i core del mio processore parallelizzando l'esecuzione.
Ho provato - non sono un programmatore se non per necessita', quindi ho cercato la soluzione piu' facile! - ad usare le opzioni di autoparallelizzazione dei compilatori che ho a disposizione (intel ifort e portland pgf77), ma la cosa non ha dato risultati.
La parte da parallelizzare sarebbe questa:
Codice:
      do I = 1, Lenght+1, IFr
        do J = 1, NStep - I + 1, IFr
          Fac = Dble(NStep-I+1)/Dble(NStep*(NStep+1)/2)
          VVx(I) = VVx(I) + Fac*Vel(1,IAt1,J)*Vel(1,IAt2,J+I-1)
          VVy(I) = VVy(I) + Fac*Vel(2,IAt1,J)*Vel(2,IAt2,J+I-1)
          VVz(I) = VVz(I) + Fac*Vel(3,IAt1,J)*Vel(3,IAt2,J+I-1)
        enddo
        ACF(I) = (VVx(I)+VVy(I)+VVz(I))/Three
        write(2,*) I,ACF(I)
      enddo
Come vedete non e' nulla di difficile. Le cose potenzialmente utili sarebbero
- far fare ogni somma (VVx,VVy,VVz) ad un core diverso
- parallelizzare l'esecuzione del ciclo esterno
- parallelizzare l'esecuzione del ciclo interno

Qualcuno ha qualche dritta da darmi sul come fare?
Grazie mille!
Su OpenMP ti hanno già risposto, mi limito ad alcune osservazioni sul tuo codice

1. Mi sembra che Fac non dipenda da J per cui la moltiplicazione la potresti fare fuori dal ciclo su J.
2. Non mi è chiaro il ruolo di Fac che non può essere altro che il denominatore ma non capisco che formula usi. Su una serie lunga N lo stimatore migliore per la ACF al lag k ha denominatore N (e non N-k) per questioni teoriche su cui non mi dilungo.
3. Mi sembra che tu stia calcolando la covarianza e non la correlazione.
4. Giusto per la precisione, il calcolo della correlazione su di una serie lunga N ha senso se N>50 e se il numero di lag k è minore di N\4.
5. Una curiosità : come mai rimani su f77 e non passi al F90?


HTH
ciao

tiMo
__________________
The plural of anecdote is not data.
~ Roger Brinner
tiMo è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


BOOX Note Air4 C è uno spettacolo: il tablet E Ink con Android per lettura e scrittura BOOX Note Air4 C è uno spettacolo: il tab...
Recensione Sony Xperia 1 VII: lo smartphone per gli appassionati di fotografia Recensione Sony Xperia 1 VII: lo smartphone per ...
Attenti a Poco F7: può essere il best buy del 2025. Recensione Attenti a Poco F7: può essere il best buy...
Recensione Samsung Galaxy Z Fold7: un grande salto generazionale Recensione Samsung Galaxy Z Fold7: un grande sal...
The Edge of Fate è Destiny 2.5. E questo è un problema The Edge of Fate è Destiny 2.5. E questo ...
DJI OSMO Mobile SE a 69€: il gimbal comp...
Scope elettriche da record su Amazon: du...
GTA 6 a 80 euro? Take-Two frena sul prez...
I 3 portatili più convenienti su ...
AirPods Pro 2 a soli 199€: su Amazon anc...
2 Smart TV 4K Hisense con doppio sconto ...
Portatili Apple ai minimi: MacBook Pro c...
Come mantenere Windows 10 sicuro dopo il...
Finalmente è tornato su Amazon l'...
Auto nuove? Per il 65% degli italiani so...
Droni solari Airbus volano nella stratos...
Colpo da 15 milioni di dollari: chi ha r...
Elon Musk lancia l'allarme su GPT-5: 'Op...
iPhone 17 Pro sarà più cos...
Leapmotor spinge sull'acceleratore: nuov...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 22:53.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v