PDA

View Full Version : [C#/C++]Lettura testo da PDF


advapi
19-01-2011, 08:33
Ciao a tutti,
volevo sapere se conoscete una libreria .NET o C++ che permetta di ricercare del testo all'interno di un PDF ... ho provato sia con iTextSharp che con PDFSharp ma non ci sono riuscito.... inoltre la proposta di ADOBE (PDF Library SDK) è inavvicinabile...

Grazie ciao

tomminno
19-01-2011, 09:15
Con iTextSharp dovresti riuscire a leggere il testo che cerchi. In che senso non ci sei riuscito?

advapi
19-01-2011, 09:21
non ho trovato i metodi per la ricerca... non è che per caso avresti un esempio? ieri ho usato la search di adobe reader per cercare in 18mila documenti 11 parole chiave differenti....... non ti dico che giornata fantastica :D

tomminno
19-01-2011, 12:26
non ho trovato i metodi per la ricerca... non è che per caso avresti un esempio? ieri ho usato la search di adobe reader per cercare in 18mila documenti 11 parole chiave differenti....... non ti dico che giornata fantastica :D

Ho idea che la funzione specifica di ricerca la debba implementare tu da codice cercando i blocchi TK_STRING.

advapi
19-01-2011, 12:59
ciao,
ho trovato questa classe hxxp://thottingal.in/blog/2009/06/24/pdfbox-extract-text-from-pdf/ che estrae il testo...... l'unico neo è che io ho utilizzato stream di .NET e questa lavora con il porting degli stream di java quindi in memoria mi tengo il doppio dei dati....