22-02-2011, 17:28
|
#5
|
Senior Member
Iscritto dal: Oct 2008
Messaggi: 10402
|
Quote:
Originariamente inviato da Pihippo
Ciao
Scusami se ti sembrerà una checklist:
Che liberia di math hai utilizzato?
Hai provato a vettorizzare gli accessi alla memoria? E' possibile? Il kernel principale in cosa consiste ?(provo ad indovinare moltiplicazioni ed addizioni di matrici non sparse ?)
Se è possibile fare tutto ciò, allora ti conviene fare un porting su cuda\opencl. Altrimenti un sistema 2p opteron 6100.
|
quoto
|
|
|