Torna indietro   Hardware Upgrade Forum > Software > Programmi e Utility

Hisense M2 Pro: dove lo metti, sta. Mini proiettore laser 4K per il cinema ovunque
Hisense M2 Pro: dove lo metti, sta. Mini proiettore laser 4K per il cinema ovunque
Dal salotto al giardino, il nuovo proiettore laser di Hisense promette esperienze cinematografiche in qualsiasi contesto: qualità d’immagine, semplicità d’uso, versatilità e prezzo competitivo il suo poker d'assi
Lenovo ThinkPad X1 2-in-1 G10 Aura Edition: il convertibile di classe
Lenovo ThinkPad X1 2-in-1 G10 Aura Edition: il convertibile di classe
La flessibilità di configurazione è il punto di forza di questo 2-in-1, che ripropone in un form factor alternativo tutta la tipica qualità dei prodotti Lenovo della famiglia ThinkPad. Qualità costruttiva ai vertici, ottima dotazione hardware ma costo che si presenta molto elevato.
Intervista a Stop Killing Games: distruggere videogiochi è come bruciare la musica di Mozart
Intervista a Stop Killing Games: distruggere videogiochi è come bruciare la musica di Mozart
Mentre Ubisoft vorrebbe chiedere agli utenti, all'occorrenza, di distruggere perfino le copie fisiche dei propri giochi, il movimento Stop Killing Games si sta battendo per preservare quella che l'Unione Europea ha già riconosciuto come una forma d'arte. Abbiamo avuto modo di parlare con Daniel Ondruska, portavoce dell'Iniziativa Europa volta a preservare la conservazione dei videogiochi
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 30-08-2013, 01:04   #1
redpill
Junior Member
 
Iscritto dal: Aug 2013
Messaggi: 5
WARC - Web Archive File

ciao a tutti, spero possiate aiutarmi.

da un paio d'anni mi occupo di backup-restauro di vecchi siti web e servizi online di vario genere. ho sempre utilizzato WebReaper, tuttavia ho scoperto che esiste un'estensione per Google Chrome in grado di creare dei backup istantanei dei siti o di ciò che ne rimane.

il problema è che i suddetti fie-archivio vengono salvati con estensione *.WARC. grazie a qualche ricerca in rete ho capito che si tratta di file-archivio che tutti i browser (in particolare Safari) dovrebbero essere in grado di aprire/leggere. insomma, convinto, ho provato ad aprire un file WARC con Chrome stesso. il risultato? osceno: una sfilza di codice lunga un kilometro. impossibile da gestire.

da canto mio, ho trovato un metodo molto arcaico: apro il file WARC con WinZip - estraggo i file (TXT) - cambio l'intestazione dei file TXT e ne cambio l'estensione in HTML. tutto ciò funziona, e non ci sarebbero problemi se dovessi cambiare l'intestazione di 10-20 file, ma di 25402 ..rischio di impazzire.

mi pare strano che esista il modo di creare questi archivi per poi non ri-leggerli.
chiedo il vostro aiuto per trovare un software in grado leggere questo tipo di file-archivio (WARC), per piacere.

attendo risposte, grazie in anticipo.
-redpill
redpill è offline   Rispondi citando il messaggio o parte di esso
Old 30-08-2013, 08:34   #2
Eress
Senior Member
 
L'Avatar di Eress
 
Iscritto dal: Jan 2010
Messaggi: 37084
E' un argomento che non conosco, comunque ti segnalo che per Safari c'è una estensione apposita per aprire vecchi siti che normalmente non si aprono restituendo errore. Nel caso credo che una volta aperti con Safari si possano anche salvare in un formato più leggibile. Ma di più non saprei dire.

http://antelle.net/safari/
__________________
Analemma - Slowdive - Facebook
Motto Microsoft: "If it's broken, and I'm the one who broke it, don't fix it!"
Eress è offline   Rispondi citando il messaggio o parte di esso
Old 30-08-2013, 11:26   #3
redpill
Junior Member
 
Iscritto dal: Aug 2013
Messaggi: 5
Quote:
Originariamente inviato da Eress Guarda i messaggi
E' un argomento che non conosco, comunque ti segnalo che per Safari c'è una estensione apposita per aprire vecchi siti che normalmente non si aprono restituendo errore. Nel caso credo che una volta aperti con Safari si possano anche salvare in un formato più leggibile. Ma di più non saprei dire.

http://antelle.net/safari/
grazie per la tua disponibilità. - quella funzione già la conoscevo, più-o-meno equivale al formato MHT di Internet Explorer (per capirci).

non mi è mai interessato scaricare da cima a fondo tutto un sito internet, ma solo il codice residuo dello stesso. ecco perchè la mia scelta ricade sul formato WARC; questo formato sembra essere in grado di scaricare solo l'indispensabile: il codice HTML, che praticamente è quello che mi interessa.

spero di riuscire a trovare un programma in grado di leggere questo file-archivio, al contrario mi toccherà crearlo da me usando Java. la cosa mi urta particolarmente considerando che sono stati "loro" (chi, non si sa) a creare questo formato.

attendo ulteriori chiarimenti e suggerimenti. grazie!
redpill è offline   Rispondi citando il messaggio o parte di esso
Old 30-08-2013, 11:53   #4
Eress
Senior Member
 
L'Avatar di Eress
 
Iscritto dal: Jan 2010
Messaggi: 37084
Vedi qui se può esserti utile

http://boston.lti.cs.cmu.edu/clueweb...ith+WARC+Files
__________________
Analemma - Slowdive - Facebook
Motto Microsoft: "If it's broken, and I'm the one who broke it, don't fix it!"
Eress è offline   Rispondi citando il messaggio o parte di esso
Old 30-08-2013, 13:04   #5
redpill
Junior Member
 
Iscritto dal: Aug 2013
Messaggi: 5
Quote:
Originariamente inviato da Eress Guarda i messaggi
grazie! quel link mi è nuovo - provato - indicizza i file dell'archivio, in breve. ho recuperato anche qualche script in Phyton, e il risultato non cambia (qualcosa a che fare con warc-tools).

anche se il formato WARC ha qualche anno di vita, non sembra così "standard". fin tanto che qualcuno non crea un programma user-friendly che permetta la visualizzazione in chiaro ed intelligibile dei contenuti dell'archivio, penso che resterà nel suo piccolo angolino ancora per un bel pezzo.

qualche minuto fa ho completato il mio "de-compilatore" senza sfruttare alcun tipo di libreria esterna.. vabbeh, non sarà il massimo, ma almeno qualcosina riesco a fare. yeah gg

colgo l'occasione per ringraziarti nuovamente.
redpill è offline   Rispondi citando il messaggio o parte di esso
Old 31-08-2013, 18:37   #6
malatodihardware
Senior Member
 
L'Avatar di malatodihardware
 
Iscritto dal: Sep 2008
Messaggi: 3583
Puoi provare anche HTTrack se non ho capito male dovrebbe fare quello che chiedi e direttamente in HTML..
malatodihardware è offline   Rispondi citando il messaggio o parte di esso
Old 03-09-2013, 01:11   #7
redpill
Junior Member
 
Iscritto dal: Aug 2013
Messaggi: 5
Quote:
Originariamente inviato da malatodihardware Guarda i messaggi
Puoi provare anche HTTrack se non ho capito male dovrebbe fare quello che chiedi e direttamente in HTML..
assolutamente sì - praticamente fa la stessa cosa di WebReaper. il "problema" è che entrambi i programmi scaricano tutti file separati con le relative "minchiate" (immagini, javascript ecc.). il mio obbiettivo, vista la struttura WARC, era di ottenere degli archivi unici leggerissimi, ben organizzati. l'ovvia conseguenza era (per me) riuscire a leggere l'archivio stesso e modificarlo. -- come ho già scritto, lascio perdere e continuo a seguire il vecchio metodo: vedo il sito, lo analizzo, e lo sistemo "on the fly".

grazie a tutti per l'aiuto.
redpill è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Hisense M2 Pro: dove lo metti, sta. Mini proiettore laser 4K per il cinema ovunque Hisense M2 Pro: dove lo metti, sta. Mini proiett...
Lenovo ThinkPad X1 2-in-1 G10 Aura Edition: il convertibile di classe Lenovo ThinkPad X1 2-in-1 G10 Aura Edition: il c...
Intervista a Stop Killing Games: distruggere videogiochi è come bruciare la musica di Mozart Intervista a Stop Killing Games: distruggere vid...
Samsung Galaxy S25 Edge: il top di gamma ultrasottile e leggerissimo. La recensione Samsung Galaxy S25 Edge: il top di gamma ultraso...
HP Elitebook Ultra G1i 14 è il notebook compatto, potente e robusto HP Elitebook Ultra G1i 14 è il notebook c...
100€ di sconto reale, solo 399€ per la P...
Oggi i Macbook Air da 13 pollici con chi...
Meta ruba il futuro dell'AI ad Apple: fu...
Torna a 104€ il robot bestseller Lefant ...
Groq, la startup che vuole sfidare NVIDI...
AMD Ryzen AI Max+: ora anche gli LLM da ...
ChatGPT diventa tutor, addio risposte fa...
Cooler Master MasterFrame 600: modularit...
Questi case sembrano GPU RTX 50 e costan...
Elgato Facecam 4K: ecco la nuova webcam ...
Stampa 3D senza sprechi e senza rifiuti?...
OPPO Find X9 Pro potrebbe battere ogni r...
Le nuove Sony WH-1000XM6 ora disponibili...
ChatGPT Agent come un essere umano: l'AI...
Samsung rivaluta la fabbrica per il pack...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 07:44.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v