Torna indietro   Hardware Upgrade Forum > Software > Programmi e Utility

Samsung Galaxy S25 Edge: il top di gamma ultrasottile e leggerissimo. La recensione
Samsung Galaxy S25 Edge: il top di gamma ultrasottile e leggerissimo. La recensione
Abbiamo provato il nuovo Galaxy S25 Edge, uno smartphone unico per il suo spessore di soli 5,8 mm e un peso super piuma. Parliamo di un device che ha pro e contro, ma sicuramente si differenzia dalla massa per la sua portabilità, ma non senza qualche compromesso. Ecco la nostra prova completa.
HP Elitebook Ultra G1i 14 è il notebook compatto, potente e robusto
HP Elitebook Ultra G1i 14 è il notebook compatto, potente e robusto
Pensato per il professionista sempre in movimento, HP Elitebook Ultra G1i 14 abbina una piattaforma Intel Core Ultra 7 ad una costruzione robusta, riuscendo a mantenere un peso contenuto e una facile trasportabilità. Ottime prestazioni per gli ambiti di produttività personale con un'autonomia lontano dalla presa di corrente che permette di lavorare per tutta la giornata
Microsoft Surface Pro 12 è il 2 in 1 più compatto e silenzioso
Microsoft Surface Pro 12 è il 2 in 1 più compatto e silenzioso
Basato su piattaforma Qualcomm Snapdragon X Plus a 8 core, il nuovo Microsoft Surface Pro 12 è un notebook 2 in 1 molto compatto che punta sulla facilità di trasporto, sulla flessibilità d'uso nelle differenti configurazioni, sul funzionamento senza ventola e sull'ampia autonomia lontano dalla presa di corrente
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 30-08-2013, 01:04   #1
redpill
Junior Member
 
Iscritto dal: Aug 2013
Messaggi: 5
WARC - Web Archive File

ciao a tutti, spero possiate aiutarmi.

da un paio d'anni mi occupo di backup-restauro di vecchi siti web e servizi online di vario genere. ho sempre utilizzato WebReaper, tuttavia ho scoperto che esiste un'estensione per Google Chrome in grado di creare dei backup istantanei dei siti o di ciò che ne rimane.

il problema è che i suddetti fie-archivio vengono salvati con estensione *.WARC. grazie a qualche ricerca in rete ho capito che si tratta di file-archivio che tutti i browser (in particolare Safari) dovrebbero essere in grado di aprire/leggere. insomma, convinto, ho provato ad aprire un file WARC con Chrome stesso. il risultato? osceno: una sfilza di codice lunga un kilometro. impossibile da gestire.

da canto mio, ho trovato un metodo molto arcaico: apro il file WARC con WinZip - estraggo i file (TXT) - cambio l'intestazione dei file TXT e ne cambio l'estensione in HTML. tutto ciò funziona, e non ci sarebbero problemi se dovessi cambiare l'intestazione di 10-20 file, ma di 25402 ..rischio di impazzire.

mi pare strano che esista il modo di creare questi archivi per poi non ri-leggerli.
chiedo il vostro aiuto per trovare un software in grado leggere questo tipo di file-archivio (WARC), per piacere.

attendo risposte, grazie in anticipo.
-redpill
redpill è offline   Rispondi citando il messaggio o parte di esso
Old 30-08-2013, 08:34   #2
Eress
Senior Member
 
L'Avatar di Eress
 
Iscritto dal: Jan 2010
Messaggi: 37084
E' un argomento che non conosco, comunque ti segnalo che per Safari c'è una estensione apposita per aprire vecchi siti che normalmente non si aprono restituendo errore. Nel caso credo che una volta aperti con Safari si possano anche salvare in un formato più leggibile. Ma di più non saprei dire.

http://antelle.net/safari/
__________________
Analemma - Slowdive - Facebook
Motto Microsoft: "If it's broken, and I'm the one who broke it, don't fix it!"
Eress è offline   Rispondi citando il messaggio o parte di esso
Old 30-08-2013, 11:26   #3
redpill
Junior Member
 
Iscritto dal: Aug 2013
Messaggi: 5
Quote:
Originariamente inviato da Eress Guarda i messaggi
E' un argomento che non conosco, comunque ti segnalo che per Safari c'è una estensione apposita per aprire vecchi siti che normalmente non si aprono restituendo errore. Nel caso credo che una volta aperti con Safari si possano anche salvare in un formato più leggibile. Ma di più non saprei dire.

http://antelle.net/safari/
grazie per la tua disponibilità. - quella funzione già la conoscevo, più-o-meno equivale al formato MHT di Internet Explorer (per capirci).

non mi è mai interessato scaricare da cima a fondo tutto un sito internet, ma solo il codice residuo dello stesso. ecco perchè la mia scelta ricade sul formato WARC; questo formato sembra essere in grado di scaricare solo l'indispensabile: il codice HTML, che praticamente è quello che mi interessa.

spero di riuscire a trovare un programma in grado di leggere questo file-archivio, al contrario mi toccherà crearlo da me usando Java. la cosa mi urta particolarmente considerando che sono stati "loro" (chi, non si sa) a creare questo formato.

attendo ulteriori chiarimenti e suggerimenti. grazie!
redpill è offline   Rispondi citando il messaggio o parte di esso
Old 30-08-2013, 11:53   #4
Eress
Senior Member
 
L'Avatar di Eress
 
Iscritto dal: Jan 2010
Messaggi: 37084
Vedi qui se può esserti utile

http://boston.lti.cs.cmu.edu/clueweb...ith+WARC+Files
__________________
Analemma - Slowdive - Facebook
Motto Microsoft: "If it's broken, and I'm the one who broke it, don't fix it!"
Eress è offline   Rispondi citando il messaggio o parte di esso
Old 30-08-2013, 13:04   #5
redpill
Junior Member
 
Iscritto dal: Aug 2013
Messaggi: 5
Quote:
Originariamente inviato da Eress Guarda i messaggi
grazie! quel link mi è nuovo - provato - indicizza i file dell'archivio, in breve. ho recuperato anche qualche script in Phyton, e il risultato non cambia (qualcosa a che fare con warc-tools).

anche se il formato WARC ha qualche anno di vita, non sembra così "standard". fin tanto che qualcuno non crea un programma user-friendly che permetta la visualizzazione in chiaro ed intelligibile dei contenuti dell'archivio, penso che resterà nel suo piccolo angolino ancora per un bel pezzo.

qualche minuto fa ho completato il mio "de-compilatore" senza sfruttare alcun tipo di libreria esterna.. vabbeh, non sarà il massimo, ma almeno qualcosina riesco a fare. yeah gg

colgo l'occasione per ringraziarti nuovamente.
redpill è offline   Rispondi citando il messaggio o parte di esso
Old 31-08-2013, 18:37   #6
malatodihardware
Senior Member
 
L'Avatar di malatodihardware
 
Iscritto dal: Sep 2008
Messaggi: 3583
Puoi provare anche HTTrack se non ho capito male dovrebbe fare quello che chiedi e direttamente in HTML..
malatodihardware è offline   Rispondi citando il messaggio o parte di esso
Old 03-09-2013, 01:11   #7
redpill
Junior Member
 
Iscritto dal: Aug 2013
Messaggi: 5
Quote:
Originariamente inviato da malatodihardware Guarda i messaggi
Puoi provare anche HTTrack se non ho capito male dovrebbe fare quello che chiedi e direttamente in HTML..
assolutamente sì - praticamente fa la stessa cosa di WebReaper. il "problema" è che entrambi i programmi scaricano tutti file separati con le relative "minchiate" (immagini, javascript ecc.). il mio obbiettivo, vista la struttura WARC, era di ottenere degli archivi unici leggerissimi, ben organizzati. l'ovvia conseguenza era (per me) riuscire a leggere l'archivio stesso e modificarlo. -- come ho già scritto, lascio perdere e continuo a seguire il vecchio metodo: vedo il sito, lo analizzo, e lo sistemo "on the fly".

grazie a tutti per l'aiuto.
redpill è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Samsung Galaxy S25 Edge: il top di gamma ultrasottile e leggerissimo. La recensione Samsung Galaxy S25 Edge: il top di gamma ultraso...
HP Elitebook Ultra G1i 14 è il notebook compatto, potente e robusto HP Elitebook Ultra G1i 14 è il notebook c...
Microsoft Surface Pro 12 è il 2 in 1 più compatto e silenzioso Microsoft Surface Pro 12 è il 2 in 1 pi&u...
Recensione REDMAGIC Astra Gaming Tablet: che spettacolo di tablet! Recensione REDMAGIC Astra Gaming Tablet: che spe...
Dopo un mese, e 50 foto, cosa abbiamo capito della nuova Nintendo Switch 2 Dopo un mese, e 50 foto, cosa abbiamo capito del...
Retelit punta sulla connettività ...
Novità WhatsApp: promemoria sui m...
AMD: la prossima generazione di schede v...
MediaWorld potrebbe diventare cinese: Ce...
Amazon in delirio da sconti: 22 articoli...
EOLO ha più di 700 mila utenti in...
Una spin-off del MIT ha creato dei super...
Il radiatore di una BMW M4 per raffredda...
OpenAI accelera su GPT-5: lancio estivo ...
È indietro e deve reagire: il CEO...
Samsung Galaxy Buds3 a 86€, Bose QuietCo...
Addio feed MSN: Microsoft punta tutto su...
GPD Win 5 con il superchip AMD fa volare...
Top 7 Amazon bestseller: classifica scon...
Nexamp ha un'idea per attivare un campo ...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 14:35.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v