|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Junior Member
Iscritto dal: Aug 2013
Messaggi: 5
|
WARC - Web Archive File
ciao a tutti, spero possiate aiutarmi.
da un paio d'anni mi occupo di backup-restauro di vecchi siti web e servizi online di vario genere. ho sempre utilizzato WebReaper, tuttavia ho scoperto che esiste un'estensione per Google Chrome in grado di creare dei backup istantanei dei siti o di ciò che ne rimane. il problema è che i suddetti fie-archivio vengono salvati con estensione *.WARC. grazie a qualche ricerca in rete ho capito che si tratta di file-archivio che tutti i browser (in particolare Safari) dovrebbero essere in grado di aprire/leggere. insomma, convinto, ho provato ad aprire un file WARC con Chrome stesso. il risultato? osceno: una sfilza di codice lunga un kilometro. impossibile da gestire. da canto mio, ho trovato un metodo molto arcaico: apro il file WARC con WinZip - estraggo i file (TXT) - cambio l'intestazione dei file TXT e ne cambio l'estensione in HTML. tutto ciò funziona, e non ci sarebbero problemi se dovessi cambiare l'intestazione di 10-20 file, ma di 25402 ..rischio di impazzire. mi pare strano che esista il modo di creare questi archivi per poi non ri-leggerli. chiedo il vostro aiuto per trovare un software in grado leggere questo tipo di file-archivio (WARC), per piacere. attendo risposte, grazie in anticipo. -redpill |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jan 2010
Messaggi: 37084
|
E' un argomento che non conosco, comunque ti segnalo che per Safari c'è una estensione apposita per aprire vecchi siti che normalmente non si aprono restituendo errore. Nel caso credo che una volta aperti con Safari si possano anche salvare in un formato più leggibile. Ma di più non saprei dire.
http://antelle.net/safari/ |
![]() |
![]() |
![]() |
#3 | |
Junior Member
Iscritto dal: Aug 2013
Messaggi: 5
|
Quote:
non mi è mai interessato scaricare da cima a fondo tutto un sito internet, ma solo il codice residuo dello stesso. ecco perchè la mia scelta ricade sul formato WARC; questo formato sembra essere in grado di scaricare solo l'indispensabile: il codice HTML, che praticamente è quello che mi interessa. spero di riuscire a trovare un programma in grado di leggere questo file-archivio, al contrario mi toccherà crearlo da me usando Java. la cosa mi urta particolarmente considerando che sono stati "loro" (chi, non si sa) a creare questo formato. attendo ulteriori chiarimenti e suggerimenti. grazie! |
|
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Jan 2010
Messaggi: 37084
|
|
![]() |
![]() |
![]() |
#5 | |
Junior Member
Iscritto dal: Aug 2013
Messaggi: 5
|
Quote:
anche se il formato WARC ha qualche anno di vita, non sembra così "standard". fin tanto che qualcuno non crea un programma user-friendly che permetta la visualizzazione in chiaro ed intelligibile dei contenuti dell'archivio, penso che resterà nel suo piccolo angolino ancora per un bel pezzo. qualche minuto fa ho completato il mio "de-compilatore" senza sfruttare alcun tipo di libreria esterna.. vabbeh, non sarà il massimo, ma almeno qualcosina riesco a fare. yeah gg colgo l'occasione per ringraziarti nuovamente. |
|
![]() |
![]() |
![]() |
#7 | |
Junior Member
Iscritto dal: Aug 2013
Messaggi: 5
|
Quote:
grazie a tutti per l'aiuto. ![]() |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 14:35.