PDA

View Full Version : programma per decrittografare PDF


serbring
10-01-2011, 22:32
Ho scaricato dei PDF da una rivista scientifica di cui il mio dipartimento ha l'abbonamento. Ho notato che tutti questi PDF sono crittografati e pertanto nonostante riesca a leggerli non riesco a cercare il testo all'interno del pdf. Sapete se è possible decrittografarli in qualche maniera?

serbring
22-04-2011, 15:46
up!

TheQ.
22-04-2011, 19:41
Se lo crittografano per il copyrght non è proprio legale utilizzare un software OCR per rilevare testo ed immagini dei PDF ( ;) ).

Secondo me il migliore ocr è abbyy finereader.
Però costa molto

serbring
23-04-2011, 00:11
Se lo crittografano per il copyrght non è proprio legale utilizzare un software OCR per rilevare testo ed immagini dei PDF ( ;) ).

Secondo me il migliore ocr è abbyy finereader.
Però costa molto

ho già provato con foxit phantom ad usare l'ocr, ma non funziona...dici che un altro sw ocr può risolvere il problema?

TheQ.
23-04-2011, 13:39
Abbyy generalmente riesce a interpretare in modo corretto le diverse aree di un documento e convertirle in doc - docx. In alternativa si possono modificare manualmente le aree distinguendo fra testo, tabelle, immagini, ...
Il problema è forse con formule matematiche complesse, dove la grafia è quella delle formule matematiche e non quella di un normale font a lettere comuni.
In quel caso basta indicare che le formule siano copiate come immagini definendo le aree.

Mi sfugge però cosa devi fare. Se il tuo interesse è quello di avere il testo per selezionarlo e magari copiarlo in un traduttore, potrebbe andar bene la conversione.
Se semplicemente ti manca l'opzione "search" delle parole nel testo, forse basta solo agire su adobe pdf reader (o sumatra pdf reader) per farla comparire fra le icone.
La selezione e copia del testo invece mi pare rientri nelle caratteristiche che possono essere bloccate con "adobe professional" quando si crea il file pdf, appunto per proteggere il copyright del documento (http://help.adobe.com/it_IT/Photoshop/10.0/help.html?content=WSD8510F96-61B5-4c27-8F88-291514A5C7DF.html).
Comunque un OCR supera le protezioni :D

serbring
23-04-2011, 15:00
Abbyy generalmente riesce a interpretare in modo corretto le diverse aree di un documento e convertirle in doc - docx. In alternativa si possono modificare manualmente le aree distinguendo fra testo, tabelle, immagini, ...
Il problema è forse con formule matematiche complesse, dove la grafia è quella delle formule matematiche e non quella di un normale font a lettere comuni.
In quel caso basta indicare che le formule siano copiate come immagini definendo le aree.

Mi sfugge però cosa devi fare. Se il tuo interesse è quello di avere il testo per selezionarlo e magari copiarlo in un traduttore, potrebbe andar bene la conversione.
Se semplicemente ti manca l'opzione "search" delle parole nel testo, forse basta solo agire su adobe pdf reader (o sumatra pdf reader) per farla comparire fra le icone.
La selezione e copia del testo invece mi pare rientri nelle caratteristiche che possono essere bloccate con "adobe professional" quando si crea il file pdf, appunto per proteggere il copyright del documento (http://help.adobe.com/it_IT/Photoshop/10.0/help.html?content=WSD8510F96-61B5-4c27-8F88-291514A5C7DF.html).
Comunque un OCR supera le protezioni :D

Adesso proverò a scaricare la demo di abbyy. Il mio interesse è solo quello di poter fare la ricerca, in quanto se copio il testo e lo incollo da qualche parte, ottengo dei simboli strani che non sono correlati al testo.

TheQ.
23-04-2011, 16:47
Su adobe reader (ho guardato nella versione 9) per far comparire il pulsante "ricerca" che passa il testo cercando una data parola devi andare in:
Strumenti / personalizza barre degli strumenti / e nella finestra che si apre circa a metà trovi il ricerca con il simbolo del canocchiale.

serbring
24-04-2011, 04:06
Su adobe reader (ho guardato nella versione 9) per far comparire il pulsante "ricerca" che passa il testo cercando una data parola devi andare in:
Strumenti / personalizza barre degli strumenti / e nella finestra che si apre circa a metà trovi il ricerca con il simbolo del canocchiale.

aspetta posso fare la ricerca, ma non trova nulla, questo perchè il testo in realtà se lo copio e lo incollo da qualche parte ottengo dei caratteri strani

rbon
24-04-2011, 17:50
Ho scaricato dei PDF da una rivista scientifica di cui il mio dipartimento ha l'abbonamento. Ho notato che tutti questi PDF sono crittografati e pertanto nonostante riesca a leggerli non riesco a cercare il testo all'interno del pdf. Sapete se è possible decrittografarli in qualche maniera?
Per i files PDF protetti NON è possibile recuperare la password, è solo possibile annullarla sovrascrivendola (con spazi).
Fra i migliori programmi che si trovano "in giro" ci sono quelli di Elcomsoft www.elcomsoft.com.
Tale società vende dei tools specifici che consentono di decrittare file propri per i quali si è smarrita la password: ogni utilizzo diverso non è consentito.
La pagina dove si trova il programma di Elcomsoft è questa: http://www.elcomsoft.com/apdfpr.html

serbring
24-04-2011, 18:22
Per i files PDF protetti NON è possibile recuperare la password, è solo possibile annullarla sovrascrivendola (con spazi).
Fra i migliori programmi che si trovano "in giro" ci sono quelli di Elcomsoft www.elcomsoft.com.
Tale società vende dei tools specifici che consentono di decrittare file propri per i quali si è smarrita la password: ogni utilizzo diverso non è consentito.
La pagina dove si trova il programma di Elcomsoft è questa: http://www.elcomsoft.com/apdfpr.html

i miei file non hanno psw, è solo che il testo benchè sia visualizzato in maniera corretta non è interpretato come testo bensì come una sfilza di caratteri stranissimi