Quote:
Originariamente inviato da Pihippo
Ciao
Open 64 ha un flag interessantissimo -MSO che impratica ottimizza l'utilizzo di mem bandwidth, se il codice che eseguirai, è ricco di data parallelism cosa che penso che sia, potresti provare questo flag insieme a -LNO che esegue dei loop unrolling abbastanza aggressivi.
|
Ciao, si, si, si... pensavo proprio al flag -mso che è pure usato estesamente nei test di spec.org... siccome avrò a che fare con CPU multicore sulla stessa MB.
Nel programma che dovrò compilare consigliano di usare più OpenMPI (per CPU che risiedono su MB diverse) che OpenMP (CPU sulla stessa MB). Non sono convintissimo che sia la soluzione più performante. Pure in questo caso dovrò fare dei test (triplo sigh!).
Ma voglio proprio spremere ben benino i 48 core che avrò a disposizione
Edit: si, il codice è zeppo di parallelism (Quantum espresso), ma penso sia già ottimizzato per lavorare in parallelo, per cui a volte spingere troppo in là le ottimizzazioni del compilatore portano ad un degrado delle performances... altri test...