[CUDA] Problema di risultati con la FFT - Hardware Upgrade Forum

		Hardware Upgrade Forum > Software > Programmazione
[CUDA] Problema di risultati con la FFT

Segna i forum come letti

	Recensione HONOR Magic V6: spessore record e super batteria. È lui il fold da battere? HONOR Magic V6 è arrivato in Italia a 2.299,90 euro con una promessa precisa: unire 4 mm di spessore da aperto (8,75 mm chiuso nel modello White, 9 mm negli altri colori) a una batteria da 6.660 mAh, la più capiente mai vista su un pieghevole. Lo abbiamo usato per oltre una settimana in versione Red 16/512 GB per capire se lo Snapdragon 8 Elite Gen 5 tiene testa alla concorrenza anche fuori dai benchmark ufficiali
	Redmi Pad 2 9.7: ampio display, economico e peso contenuto, ma qualche limite nelle prestazioni Redmi Pad 2 9.7 punta su un display ampio e fluido, una batteria capace di accompagnare l'uso quotidiano senza ansie da ricarica e un prezzo accessibile, a partire da 179,90 euro per la versione con 64 GB di storage. Lo Snapdragon 6s 4G Gen 2 e i 4 GB di RAM della configurazione più diffusa frenano però chi cerca reattività e multitasking spinto: ecco il bilancio dopo due settimane di prova diretta
	Peugeot Polygon Concept: ecco il futuro delle utilitarie Polygon è la concept car di Peugeot che mostra il futuro delle soluzioni del segmento B: tra design compatti e innovativi affiancati da dimensioni compatte uno scherzo dalla manovrabilità incredibile per le manovre a bassa velocità

SK Hynix debutta a Wall Street con una raccolta record da 26,5 miliardi di dollari

QuTech annuncia Tuna-17, un processore quantistico al 100% europeo

Chat Control: il Parlamento europeo vieta l'accesso alle chat end-to-end per individuare gli abusi sui minori

vivo Watch GT 2: stile, salute e autonomia in un unico dispositivo. La recensione

Il fix di Microsoft Defender è peggio del problema? La patch su Windows riempie il disco

SentinelOne integra Prompt Security con Amazon Bedrock AgentCore

Ha fotografato Giove con una Game Boy Camera: ora il progetto è di tutti

Sony RX10 V: tornano le fotocamere bridge con un'ottica zoom fino a 600 mm, il prezzo non è basso

OpenAI lancia ChatGPT Lavoro: l'agente che porta a termine progetti da solo

GPT-5.6 Sol 'asfalta' Claude Fable 5: OpenAI ne è sicura e rivendica il trono dell'IA

Netflix ha ucciso la TV coi canali, ora vuole resuscitarla

Tutti gli articoli

Vai al Forum

Rispondi

22-09-2010, 09:59	#1
Manugal Senior Member Iscritto dal: Jan 2001 Città: Villanova di Guidonia (RM) Messaggi: 1079	[CUDA] Problema di risultati con la FFT Ciao a tutti! Sono giorni che sto impazzendo su questo problema. Devo fare il porting di un programma Matlab in CUDA. La situazione in CUDA è la seguente: - Ho definito alcune variabili: Nblock = 1014, Ncell = 256 - Inizialmente lancio un kernel che restituisce una matrice di (Nblock-1)Ncell elementi (in realtà è un array di cufftComplex di dimensione (Nblock-1)Ncell). Tale array, chiamato snap_shot, ha gli stessi valori di quelli prodotti dal suo equivalente in Matlab (solo che in Matlab è proprio una matrice e non un array). - Dopo questo kernel, ho bisogno di calcolare la FFT su questa matrice/vettore. Su Matlab viene lanciata la seguente istruzione: Codice: // temp_fft alla fine del calcolo sarà una matrice di 1024256 elementi temp_fft = fft(snap_shot, 2^nextpow2(Nblock), 1); % 2^nextpow2(Nblock)==1024 In CUDA invece ho lanciato le seguenti istruzioni: Codice: int main(int argc, char argv[]) { ... float2 dAmb; cudaMalloc((void ) &dAmb, nxtPow2NblockNcellsizeof(float2)); cufftComplex dsnap_shot; cudaMalloc((void *) &dsnap_shot, nxtPow2NblockNcellsizeof(cufftComplex)); cufftComplex temp_fft; cudaMalloc((void *) &temp_fft, nxtPow2NblockNcellsizeof(cufftComplex)); cufftHandle plan; cufftPlan2d(&plan,Ncell,nxtPow2Nblock,CUFFT_C2C); // La eseguo con la dimensione x e y scambiata di posto, perché Matlab tratta le matrici in column-major order. Ma anche se metto x e y al loro posto il risultato è lo stesso float2 hAmb; cudaMallocHost((void *) &hAmb, nxtPow2NblockNcellsizeof(float2)); ... ambfunc_kern<<<numBlocks,numThreads>>>(dhNc,dhNblock,Nblock,block_size,dsnap_shot); // Alla fine del kernel dsnap_shot avrà i valori calcolati correttamente (in confronto a Matlab) cudaThreadSynchronize(); cufftExecC2C(plan,dsnap_shot,temp_fft,CUFFT_FORWARD); // Dopo la FFT, temp_fft avrà valori sballati (in confronto a Matlab) cudaThreadSynchronize(); fftshift_kern<<<numBlocks,numThreads>>>(temp_fft,nxtPow2NblockNcell,nxtPow2Nblock,block_size,dAmb); cudaMemcpy(hAmb,dAmb,nxtPow2NblockNcellsizeof(float2),cudaMemcpyDeviceToHost); ... } Quindi il problema è che la FFT di CUDA mi restituisce risultati differenti da quella di Matlab. Non riesco a capire perché, mi pare di aver fatto tutto bene. P.S.: Già ho cercato sui forum di nVidia e di Matlab e dicono che il problema è dovuto al fatto che CUDA tratta i vettori/matrici in row-major order mentre Matlab in column-major order e inoltre perché CUDA memorizza i numeri complessi in modo interfogliato (cioè attraverso un'Array of Struct), mentre Matlab memorizza la parte reale e immaginaria separatamente (cioè attraverso una Struct of Array). Però nel mio caso non capisco cosa altro debba fare per far combaciare i risultati. __________________ Intel Core 2 Duo Q6600 G0, 4GB DDR2-800 A-Data, ABIT AB9, XFX GeForce 8800 GTS 320MB, Sound Blaster X-Fi Extreme Music, Seagate 320GB SATA2, Maxtor 80GB ATA-133, Western Digital 1TB SATA2 Ho concluso affari positivamente con: scandalf, Sinclair63, mstella, checcodag, wilson

Rispondi

« Discussione precedente | Discussione successiva »

	Recensione HONOR Magic V6: spessore record e sup...
	Redmi Pad 2 9.7: ampio display, economico e peso...
	Peugeot Polygon Concept: ecco il futuro delle ut...
	Reno16 Pro: il compatto di OPPO punta su fotocam...
	Hisense 55U7SE: tuttofare e accessibile, il Min...

	SK Hynix debutta a Wall Street con una r...
	QuTech annuncia Tuna-17, un processore q...
	Chat Control: il Parlamento europeo viet...
	vivo Watch GT 2: stile, salute e autonom...
	Il fix di Microsoft Defender è pe...
	SentinelOne integra Prompt Security con ...
	Ha fotografato Giove con una Game Boy Ca...
	Sony RX10 V: tornano le fotocamere bridg...
	OpenAI lancia ChatGPT Lavoro: l'agente c...
	GPT-5.6 Sol 'asfalta' Claude Fable 5: Op...
	Netflix ha ucciso la TV coi canali, ora ...
	Kyndryl estende i servizi per il cloud s...
	Addio allo scalino delle fotocamere? Una...
	"Il mio piccolo sporco segreto"...
	Instagram e Facebook sotto accusa: secon...

	Chromium
	GPU-Z
	OCCT
	LibreOffice Portable
	Opera One Portable
	Opera One 106
	CCleaner Portable
	CCleaner Standard
	Cpu-Z
	Driver NVIDIA GeForce 546.65 WHQL
	SmartFTP
	Trillian
	Google Chrome Portable
	Google Chrome 120
	VirtualBox

Tutti gli articoli

Tutti i download

Strumenti
Mostra una versione stampabile Invia questa pagina per email

Regole
Non Puoi aprire nuove discussioni Non Puoi rispondere ai messaggi Non Puoi allegare file Non Puoi modificare i tuoi messaggi Il codice vB è On Le Faccine sono On Il codice [IMG] è On Il codice HTML è Off

Vai al Forum

Tutti gli orari sono GMT +1. Ora sono le: 22:07.

Hisense 55U7SE: tuttofare e accessibile, il MiniLED per film, sport e gioco MiniLED di fascia media con local dimming a 192 zone, 144 Hz nativi e audio firmato Devialet. La prova strumentale riscontra colori affidabili e gaming reattivo,...

Recensione HONOR Magic V6: spessore record e super batteria. È lui il fold da battere? HONOR Magic V6 è arrivato in Italia a 2.299,90 euro con una promessa precisa: unire 4 mm di spessore da aperto (8,75 mm chiuso nel modello White, 9 mm negli altri...

Forza Horizon 6 Recensione: si vola in Giappone! Forza Horizon 6 arriva con la nuova ambientazione in Giappone, il paese più desiderato dalla community fin dal debutto della serie nel 2012. Playground Games ha...

Da oggi mirrorless full-frame Canon EOS R6 V e RF 20-50mm F4 L IS USM PZ, il meglio per i video a mano libera Disponibili da oggi sia una nuova mirrorless full-frame, Canon EOS R6 V, sia l'obiettivo RF 20-50mm F4 L IS USM PZ, il primo RF full-frame serie L con power zoom...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

L'IA cambia tutte le regole della sicurezza tra vulnerabilità e sorveglianza. Intervista al CEO di Proofpoint Abbiamo intervistato Sumit Dhawan, CEO di Proofpoint, per capire come stia cambiando il mondo della sicurezza con l'avvento dell'intelligenza artificiale e con il...

Peugeot Polygon Concept: ecco il futuro delle utilitarie Polygon è la concept car di Peugeot che mostra il futuro delle soluzioni del segmento B: tra design compatti e innovativi affiancati da dimensioni compatte uno scherzo...

Dreame X60 Pro Ultra Complete: i bracci si estendono sempre di più Dreame X60 Pro Ultra Complete implementa due bracci estensibili, per spazzola e moccio, che si spingono ben oltre quanto visto sino ad oggi permettendo una pulizia...

© 1997 - 2018 - Hardware Upgrade S.r.l. P.iva: 02560740124
Hardware Upgrade, testata giornalistica con registrazione tribunale di Varese, n. 879 del 30/07/2005. Iscrizione ROC n. 13366 - Ulteriori informazioni.
Per eventuali segnalazioni, inviare una mail all'indirizzo [email protected]