Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Ecovacs Goat O1200 LiDAR Pro: la prova del robot tagliaerba con tagliabordi integrato
Ecovacs Goat O1200 LiDAR Pro: la prova del robot tagliaerba con tagliabordi integrato
Nuova frontiera per i robot tagliaerba, con Ecovacs GOAT O1200 LiDAR Pro che riconosce l'ambiente in maniera perfetta, grazie a due sensori LiDAR, e dopo la falciatura può anche rifinire il bordo con il tagliabordi a filo integrato
Recensione Samsung Galaxy S26+: sfida l'Ultra, ma ha senso di esistere?
Recensione Samsung Galaxy S26+: sfida l'Ultra, ma ha senso di esistere?
Equilibrio e potenza definiscono il Samsung Galaxy S26+, un flagship che sfida la variante Ultra e la fascia alta del mercato con il primo processore mobile a 2nm. Pur mantenendo l'hardware fotografico precedente, lo smartphone brilla per un display QHD+ da 6,7 pollici d'eccellenza, privo però del trattamento antiriflesso dell'Ultra, e per prestazioni molto elevate. Completano il quadro la ricarica wireless a 20W e, soprattutto, un supporto software settennale
Zeekr X e 7X provate: prezzi, autonomia fino a 615 km e ricarica in 13 minuti
Zeekr X e 7X provate: prezzi, autonomia fino a 615 km e ricarica in 13 minuti
Zeekr sbarca ufficialmente in Italia con tre modelli elettrici premium, X, 7X e 001, distribuiti da Jameel Motors su una rete di 52 punti vendita già attivi. La Zeekr X parte da 39.900 euro, la 7X da 54.100: piattaforma a 800V, chip Snapdragon di ultima generazione, ricarica ultraveloce e un'autonomia dichiarata fino a 615 km WLTP. Le prime consegne sono previste a metà aprile
Tutti gli articoli Tutte le news

Risultati sondaggio: Quale libreria pensiate sia la migliore per lavorare con i .pdf?
PDFTextStream 0 0%
IText 1 100.00%
PdfBox 0 0%
PdfToText 0 0%
Altra proposta 0 0%
Votanti: 1. Non puoi votare in questo sondaggio

Vai al Forum
Rispondi
 
Strumenti
Old 10-10-2011, 11:40   #1
ZanTeo
Member
 
Iscritto dal: Oct 2011
Messaggi: 45
Estrarre testo da un file PDF in java

Devo sviluppare un applicazione java che estragga il testo di più file pdf, lo copi in un database per poi eseguire delle ricerche.
Il mio problema principale e riuscire ad estrarre interamente il testo ,i file pdf sono molto grandi (100 pg o più).
Ho letto e cercato in rete ma ci sono poche informazioni e vaghe su delle librerie come:
- IText
- PDFTextStram
- PJX
- PdfBox
sapreste indicarmi cosa fanno? e qual'è la migliore da usare nel mio caso? eventualmente se dovete segnalarmene altre fatelo.
Spero ne esca una bella discussione che sia utile, visto la scarsità della rete.
__________________
Teo
ZanTeo è offline   Rispondi citando il messaggio o parte di esso
Old 10-10-2011, 11:50   #2
clockover
Senior Member
 
L'Avatar di clockover
 
Iscritto dal: Oct 2004
Messaggi: 1945
Dai uno sguardo qui... io non l'ho mai provato però mi sembra che sia ben documentato iText http://itextpdf.com/book/examples.php

naviga il sito che c'è tutto
clockover è offline   Rispondi citando il messaggio o parte di esso
Old 11-10-2011, 22:14   #3
ZanTeo
Member
 
Iscritto dal: Oct 2011
Messaggi: 45
grazie ma mi serve anche qualche esempio pratico di codice
__________________
Teo
ZanTeo è offline   Rispondi citando il messaggio o parte di esso
Old 12-10-2011, 00:25   #4
clockover
Senior Member
 
L'Avatar di clockover
 
Iscritto dal: Oct 2004
Messaggi: 1945
Quote:
Originariamente inviato da ZanTeo Guarda i messaggi
grazie ma mi serve anche qualche esempio pratico di codice
Allora non hai visitato il sito
clockover è offline   Rispondi citando il messaggio o parte di esso
Old 12-10-2011, 07:24   #5
ZanTeo
Member
 
Iscritto dal: Oct 2011
Messaggi: 45
no no il sito l'ho visitato tutto, e mi sarà molto utile, volevo anche qualche piccolo stralcio di codice del mio caso specifico. In oltre mi servirebbe qualche informazione sulle altre librerie perchè per quello che dovrò fare IText forse non mi basta.
__________________
Teo
ZanTeo è offline   Rispondi citando il messaggio o parte di esso
Old 13-10-2011, 13:26   #6
gokan
Senior Member
 
L'Avatar di gokan
 
Iscritto dal: Apr 2002
Città: Palermo
Messaggi: 4913
Apache pdfBox

http://java-rude-inside.blogspot.com...e-in-java.html

http://www.hwupgrade.it/forum/showpo...93&postcount=6

Ciao
__________________
Sun Certified Java Programmer - Sun Certified Web Component Developer - Sun Certified Business Component Developer
gokan è offline   Rispondi citando il messaggio o parte di esso
Old 13-10-2011, 13:32   #7
VICIUS
Senior Member
 
L'Avatar di VICIUS
 
Iscritto dal: Oct 2001
Messaggi: 11471
iText è veramente facile da usare. Devi prima di tutto creare un PdfReader del file da cui vuoi estrarre il testo. Poi chiami PdfTextExtractor.getTextFromPage() a cui passi il reader, il numero della pagina e la strategia di estrazione. Ce ne sono un paio che funzionano più o meno bene in base ai tipi di documento. Guarda la documentazione e sperimenta un po' per capire quella che fa al caso tuo.
VICIUS è offline   Rispondi citando il messaggio o parte di esso
Old 17-10-2011, 21:03   #8
ZanTeo
Member
 
Iscritto dal: Oct 2011
Messaggi: 45
Quote:
Originariamente inviato da VICIUS Guarda i messaggi
iText è veramente facile da usare. Devi prima di tutto creare un PdfReader...
ecco una parte del codice che ho sviluppato:
FileInputStream f2=new FileInputStream("TestRighe.pdf");
PdfReader lettore2 = new PdfReader(f2);
String testoSenzaS2=PdfTextExtractor.getTextFromPage(lettore2,1);
System.out.println(testoSenzaS2);

che stampa:
1agina p
iivnideerutaizapsacifirev876543agiradnoces2agiramirp1doc

TestRighe.pdf contiene:
doc
1 prima riga
2 seconda riga
3
4
5
6
7
8
verifica spaziature ed invii

ora devo riuscire a sviluppare una strategia che mantenga l'ordine esatto del testo senza incasinare le lettere, appena ho qualcosa la posto qui
__________________
Teo
ZanTeo è offline   Rispondi citando il messaggio o parte di esso
Old 21-10-2011, 09:36   #9
ZanTeo
Member
 
Iscritto dal: Oct 2011
Messaggi: 45
Ho risolto
__________________
Teo
ZanTeo è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Ecovacs Goat O1200 LiDAR Pro: la prova del robot tagliaerba con tagliabordi integrato Ecovacs Goat O1200 LiDAR Pro: la prova del robot...
Recensione Samsung Galaxy S26+: sfida l'Ultra, ma ha senso di esistere? Recensione Samsung Galaxy S26+: sfida l'Ultra, m...
Zeekr X e 7X provate: prezzi, autonomia fino a 615 km e ricarica in 13 minuti Zeekr X e 7X provate: prezzi, autonomia fino a 6...
Marathon: arriva il Fortnite hardcore Marathon: arriva il Fortnite hardcore
HP Imagine 2026: abbiamo visto HP IQ all’opera, ecco cosa può (e non può) fare HP Imagine 2026: abbiamo visto HP IQ all’opera, ...
La toilette della capsula Orion Integrit...
GeForce NOW: ecco tutte le novità in arr...
Il Realme 16 5G debutta sul mercato glob...
HONOR svela tre nuovi tablet: il più int...
Tineco Floor One S9 Master: aspira e pul...
Vivo X300 Ultra, il lancio globale è ini...
Offerte robot aspirapolvere Amazon: ECOV...
L'AI genera codice in 8 minuti e i senio...
Ring Intercom Audio a 44,99€ su Amazon: ...
Apple iPhone 16 crolla a 689€: ecco perc...
Google Pixel 9 a 449,90€ con caricatore ...
Ecco la top 7 delle offerte Amazon, aggi...
Ex ingegnere ammette il sabotaggio: migl...
I coupon nascosti di Amazon si rinnovano...
Disponibili i video e le immagini in alt...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 22:10.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v