PDA

View Full Version : Riconoscimento e confronto immagini Java-Android


-kinn91-
18-09-2014, 13:18
Salve a tutti, credo di avere una richiesta un po atipica.

Sono un laureando di primo livello in ingegneria informatica e a giorni dovrò cominciare un tirocinio di 250 ore.
Premetto che le conoscenze acquisite durante la triennale in campo software riguardano la programmazione generale in C, java e javascript.

Parlando con il mio tutor abbiamo convenuto per la creazione di un applicazione di realtà aumentata, che dati in ingresso una foto (appena scattata) e info georefenziate ed eseguendo un matching su un database di opere d'arte (quadri e simili) fornisca info sul manufatto in questione.
Tale applicazione deve girare su terminali Android. Se dal lato dell'applicazione Android sono certo di non aver alcun tipo di problema, sto incontrando moltissime difficoltà sul lato di elaborazione dell'immagine.
Non so proprio da dove cominciare.

Dopo aver adocchiato sdk del tipo di Vuforia di Qualcomm (bocciato dal tutor), mi è stato detto di cercare come poter implementare un algoritmo di questo genere (Cattura-Elaborazione e confronto-Riconoscimento). Pure se perplesso (non ho alcuna base di visione artificiale ne di elaborazione di immagini e segnali), sono tornato a casa e mi sono dato da fare.

Quello che mi si evidenzia di fronte mi sembra un problema ben al di là delle mie attuali conoscenze e che certo non posso pensare di padroneggiare in sole 250 ore. In particolare ho notato che progetti simili a quello appena descritto sono stati realizzati per tesi magistrali :S

Sto cercando un sdk, librerie o qualcosa che possa rendere questo lavoro più semplice, ma non riesco a trovare nulla che mi aiuti ed anzi ricevo solo inviti a lasciar perdere. Sono deciso a chiedere delucidazioni al mio tutor, quantomeno su che strumenti utilizzare.

Avete consigli in merito? Qualche framework che pensate possa fare al caso mio? :'(

!fazz
18-09-2014, 13:22
Salve a tutti, credo di avere una richiesta un po atipica.

Sono un laureando di primo livello in ingegneria informatica e a giorni dovrò cominciare un tirocinio di 250 ore.
Premetto che le conoscenze acquisite durante la triennale in campo software riguardano la programmazione generale in C, java e javascript.

Parlando con il mio tutor abbiamo convenuto per la creazione di un applicazione di realtà aumentata, che dati in ingresso una foto (appena scattata) e info georefenziate ed eseguendo un matching su un database di opere d'arte (quadri e simili) fornisca info sul manufatto in questione.
Tale applicazione deve girare su terminali Android. Se dal lato dell'applicazione Android sono certo di non aver alcun tipo di problema, sto incontrando moltissime difficoltà sul lato di elaborazione dell'immagine.
Non so proprio da dove cominciare.

Dopo aver adocchiato sdk del tipo di Vuforia di Qualcomm (bocciato dal tutor), mi è stato detto di cercare come poter implementare un algoritmo di questo genere (Cattura-Elaborazione e confronto-Riconoscimento). Pure se perplesso (non ho alcuna base di visione artificiale ne di elaborazione di immagini e segnali), sono tornato a casa e mi sono dato da fare.

Quello che mi si evidenzia di fronte mi sembra un problema ben al di là delle mie attuali conoscenze e che certo non posso pensare di padroneggiare in sole 250 ore. In particolare ho notato che progetti simili a quello appena descritto sono stati realizzati per tesi magistrali :S

Sto cercando un sdk, librerie o qualcosa che possa rendere questo lavoro più semplice, ma non riesco a trovare nulla che mi aiuti ed anzi ricevo solo inviti a lasciar perdere. Sono deciso a chiedere delucidazioni al mio tutor, quantomeno su che strumenti utilizzare.

Avete consigli in merito? Qualche framework che pensate possa fare al caso mio? :'(

enjoy

http://opencv.org/

monte.cristo
18-09-2014, 14:31
Premetto che la mia conoscenza è teorica perchè io ho affrontato all'università la teoria dei segnali, ma non l'ho mai messa in pratica con framework specifici perciò non so consigliarti uno strumento in particolare.
La mia opinione è che, se nel tuo corso di studi non hai sostenuto nessun esame di elaborazione numerica dei segnali o almeno di teoria dei segnali, indipendentemente dal framework, avrai difficoltà a comprendere la terminologia usata. La prima cosa che mi viene in mente, ad esempio, è che in un'operazione di confronto potrebbe essere data per scontata la conoscenza teorica di cos'è la correlazione incrociata o la convoluzione di due segnali.Inoltre, il concetto di "filtro" da applicare alle immagini è abbastanza comune quando si parla dell'elaborazione delle stesse.
Il mio consiglio è, se possibile, prima di cominciare le 250 ore di tirocinio, di farti almeno un'infarinatura della materia.
Secondo me questo ti permetterà di scegliere in maniera più consapevole se un certo frameowk è adatto al tuo scopo oppure no.
Il rischio, infatti, è quello di partire con uno strumento molto potente, ma che magari ha una curva di apprendimento troppo ripida e quindi non ti permetterebbe di restare nel limite delle 250 ore.

-kinn91-
20-09-2014, 10:20
Grazie a entrambi per aver risposto.

Ho in effetti seguito un paio di corsi di teoria dei segnali, ma nell'ambito communications, e quindi mi trovo completamente spaesato di fronte all'elaborazione di immagini.

Per quanto riguarda OpenCV lo conoscevo solo in C++, ma ho visto che esiste un estensione per Android. Ci darò sicuramente un occhiata! Grazie!