PDA

View Full Version : Preservare il passato con la tecnologia: i manoscritti di una biblioteca


Redazione di Hardware Upg
15-09-2012, 08:01
Link alla notizia: http://www.businessmagazine.it/news/preservare-il-passato-con-la-tecnologia-i-manoscritti-di-una-biblioteca_43767.html

La scansione dei manoscritti della Biblioteca Vaticana apre una riflessione sul ruolo dei formati di salvataggio che siano aperti, a contrasto con quanto è attualmente utilizzato nella maggior parte dei casi ma che non sembra poter essere garanzia per il futuro

Click sul link per visualizzare la notizia.

Chelidon
15-09-2012, 09:53
Non conoscevo questo formato, immagino sarà molto particolare e offrirà certe garanzie, ma senza arrivare al PDF o al TIFF c'è da parecchio tempo un formato molto più intelligente come strategia di compressione (divide lo sfondo dal testo e permette di arrivare a qualche decina di kb per pagina con la stessa qualità del PDF) che è il DJVU (http://it.wikipedia.org/wiki/DjVu).

Per i libri o le riviste scansionate è molto più adatto, soprattutto se c'è molto testo rispetto alle immagini, del PDF che peserebbero assurdamente per non dare niente di più (non parliamo del TIFF). Forse è un po' meno conosciuto, ma è molto più adeguato (http://www.opendoc.it/articles/djvu_fullarticle.php). C'è da dire che il PDF deve molto del suo successo al fatto che è nato per i file generati elettronicamente da stampare su più piattaforme e poi è stato molto spinto da Adobe per favorire i suoi prodotti a pagamento di modifica come altri loro formati pubblici che usano come "testa di ponte" per vendere i loro prodotti.

total9999
15-09-2012, 12:17
Non conoscevo questo formato, immagino sarà molto particolare e offrirà certe garanzie, ma senza arrivare al PDF o al TIFF c'è da parecchio tempo un formato molto più intelligente come strategia di compressione (divide lo sfondo dal testo e permette di arrivare a qualche decina di kb per pagina con la stessa qualità del PDF) che è il DJVU (http://it.wikipedia.org/wiki/DjVu).

Per i libri o le riviste scansionate è molto più adatto, soprattutto se c'è molto testo rispetto alle immagini, del PDF che peserebbero assurdamente per non dare niente di più (non parliamo del TIFF). Forse è un po' meno conosciuto, ma è molto più adeguato (http://www.opendoc.it/articles/djvu_fullarticle.php). C'è da dire che il PDF deve molto del suo successo al fatto che è nato per i file generati elettronicamente da stampare su più piattaforme e poi è stato molto spinto da Adobe per favorire i suoi prodotti a pagamento di modifica come altri loro formati pubblici che usano come "testa di ponte" per vendere i loro prodotti.
Io invece non avevo mai sentito parlare di questo DJVU, sembra interessante e utile.

Chelidon
15-09-2012, 12:32
Molto utile il fatto che ci siano i programmi per produrre da sé i DJVU a partire dalle scansioni fra l'altro.. ;)

Forse è poco conosciuto effettivamente al pubblico ampio, ma se si cercano vecchie scansioni è di solito abbastanza facile trovarlo.. (e tra l'altro è supportato da tutti i visualizzatori/impaginatori almeno quelli liberi su linux, ovvio non da Acrobat :asd:)
Però è un peccato che non sia molto comune nelle pagine web visto che lì avrebbe la superiorità eccezionale rispetto al PDF di accelerare di molto la consultazione di pagine e lo scambio dei dati... :sofico:

Rubberick
15-09-2012, 15:03
si ma il DjVu è lossy? in tal caso certamente non è paragonabile ai formati lossless

Chelidon
15-09-2012, 19:51
Quali formati il TIFF? Ovvio che DJVU è lossy, non potrebbe essere così fruibile altrimenti (una pagina poche decine di kb) ma è fatto in modo che il layer del testo (o delle figure) è compresso diversamente dallo sfondo, che non contiene solitamente informazioni importanti, ma solo polvere e difetti delle pagine che possono perdersi e non necessitano di una compressione di qualità. ;)

Nel caso di scansioni comunque anche il PDF è lossy (in genere sono praticamente JPEG incorporati come pagine), infatti resta migliore per documenti prodotti elettronicamente (cioè come testo+font), mentre è nel caso delle scansioni che è molto superiore la qualità di un DJVU e soprattutto il peso irrisorio. :read:

Se devi archiviare una gran mole di dati come le immagini di un testo scansito, comunque non ti conviene certo farlo in TIFF per quanto non sia lossy, comunque oltre un certo dettaglio non ha più senso registrare informazioni inutili che aumentano solo la dimensione dei file in maniera spropositata.

eeetc
16-09-2012, 14:28
Non conoscevo questo formato, immagino sarà molto particolare e offrirà certe garanzie, ma senza arrivare al PDF o al TIFF c'è da parecchio tempo un formato molto più intelligente come strategia di compressione (divide lo sfondo dal testo e permette di arrivare a qualche decina di kb per pagina con la stessa qualità del PDF) che è il DJVU (http://it.wikipedia.org/wiki/DjVu).

Da quanto ho letto esiste un'implementazione libera di DjVU su Sourceforge, ma nasce ed esiste anche come software commerciale, e non essendo forse chiaro se in futuro possono nascere conflitti tra le porzioni free e quelle closed, agli occhi dei legali del Vaticano ha fatto la differenza indirizzandosi verso FITS, che nascendo in ambito governativo USA in quanto tale è sicuramente libero da copyright e royalty.

Elettrocinghia
17-09-2012, 09:12
Le scansioni di questo tipo non possono essere lossy, perchè lo sfondo è tutt'altro che povero di informazioni: la maggior parte dei manoscritti sono miniati e ricchissimi di informazioni: sono dei veri e propri capolavori e l'Italia è da sempre maestra in queste cose.
Tale ricchezza di dettagli non può venire compressa con perdita di qualità, anche perchè questa conservazione in forma elettronica deve essere in grado di riprodurre fedelmente l'originale in caso di deterioramento di quest'ultimo.

Gannjunior
17-09-2012, 17:17
Ho cercato info sul FITS

http://fits.gsfc.nasa.gov/fits_standard.html

ma mi pare che non sia aggiornato da parecchio tempo ormai...

Chelidon
17-09-2012, 21:45
La qualità alta la puoi ottenere anche con la compressione del DJVU usando probabilmente dei profili diversi, certo è nato per rendere fruibili testi scansiti più che per l'archiviazione a lungo termine.

In questo secondo caso, penso che la scelta del formato dipenda anche molto dalla "stabilità" nel futuro. Nel senso che se archivi qualcosa oggi devi essere certo di poterla aprire anche tra 50 anni (e non è cosa banale i formati cambiano ed evolvono e uno non può riconvertire ogni volta da capo), probabilmente sotto questo aspetto un formato usato dalla NASA dà ovviamente più garanzie. ;)

Da quanto ho letto esiste un'implementazione libera di DjVU su Sourceforge, ma nasce ed esiste anche come software commerciale Non è che esiste da quanto hai letto, :p esistono e funzionano sia per leggere che per esportare nel formato soluzioni open-source, così come esistono anche i programmi commerciali che ovviamente permettono più funzioni e possibilità d'azione. Ciò non toglie che questo c'entra poco col fatto che il formato sia aperto e quindi quando hai il tuo file non devi più rendere conto a nessuno. ;)

eeetc
18-09-2012, 20:06
Non è che esiste da quanto hai letto, :p esistono e funzionano sia per leggere che per esportare nel formato soluzioni open-source, così come esistono anche i programmi commerciali che ovviamente permettono più funzioni e possibilità d'azione. Ciò non toglie che questo c'entra poco col fatto che il formato sia aperto e quindi quando hai il tuo file non devi più rendere conto a nessuno. ;)
Non è così semplice e lineare, leggendo la versione inglese della pagina su Wikipedia si capisce meglio: esiste l'implementazione free, ma sul codice originale ci sono copyright, una situazione simile a quella dell'MP3.
Il codice originale ha dei copyright, ma esiste l'implementazione libera di LAME.
Sinceramente pensando anche a esempi passati su queste questioni direi che hanno fatto benissimo ad andare con i piedi di piombo e scegliere un formato sul quale sicuramente non sorgeranno dispute, patent trolling o reclami vari...

eeetc
18-09-2012, 20:09
Ho cercato info sul FITS

http://fits.gsfc.nasa.gov/fits_standard.html

ma mi pare che non sia aggiornato da parecchio tempo ormai...
Un formato bitmap lossless non è che possa evolvere più di tanto, una volta raggiunta la maturità ci saranno pochi cambiamenti "di servizio" e che non andranno a stravolgere l'architettura di base... e meno male! :)