|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Gualdo Tadino, Perugia
Messaggi: 1692
|
scaricare intero sito, come?
salve a tutti...
ho la necessità di scaricare l'intero contenuto di un sito questo sito ha come pagina principale molti collegamenti ad ulteriori pagine, ognuna delle queli contiene un'immagine se non ulteriori collegamenti... come posso fare? che programma uso sotto linux? viaggio con la linux mint 4 se può esser utile... sotto win ho provato con httrack, ma non ho avuto molto successo...
__________________
E d'un tratto capii che il pensare è per gli stupidi, mentre i cervelluti si affidano all'ispirazione. |
|
|
|
|
|
#2 |
|
Senior Member
Iscritto dal: Nov 2007
Città: Bergamo
Messaggi: 307
|
Per win esite Teleport Pro.
Lo usavo e funziona benone. Ha la funzione "Copia struttura sito", o qualcosa di simile, che ti fa la copia "browsabile" del sito sul tuo pc. Per il pinguino non saprei. |
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Gualdo Tadino, Perugia
Messaggi: 1692
|
ho visto che esiste httrack per linux, l'ho installato ma non lo so adoperare come si deve
se qualche anima pia mi sa dare una mano... se volete ci possiamo sentire anche su msn... mandatemi un mp semmai...
__________________
E d'un tratto capii che il pensare è per gli stupidi, mentre i cervelluti si affidano all'ispirazione. |
|
|
|
|
|
#4 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Roma
Messaggi: 15625
|
wget non va bene?
__________________
0: or %edi, %ecx; adc %eax, (%edx); popf; je 0b-22; pop %ebx; fadds 0x56(%ecx); lds 0x56(%ebx), %esp; mov %al, %al andeqs pc, r1, #147456; blpl 0xff8dd280; ldrgtb r4, [r6, #-472]; addgt r5, r8, r3, ror #12 |
|
|
|
|
|
#5 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Gualdo Tadino, Perugia
Messaggi: 1692
|
ho visto che c'è anche wget, ma non riesco a definire i limiti di scaricamento...
faccio un esempio pratico, se io volessi scaricare il mio sito su pbase che è www.pbase.com/nomeutente/ come faccio a dirgli di scaricare tutto quanto comincia con www.pbase.com/nomeutente senza andare a scaricare l'intero pbase? inoltre sotto al sito ci sono ulteriori sottocartelle, come gli dico di scaricare tutti i link in cui inciampa (soprattutto deve scaricare le foto) senza però uscire da quel dominio?
__________________
E d'un tratto capii che il pensare è per gli stupidi, mentre i cervelluti si affidano all'ispirazione. |
|
|
|
|
|
#6 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Roma
Messaggi: 15625
|
--no-parent
__________________
0: or %edi, %ecx; adc %eax, (%edx); popf; je 0b-22; pop %ebx; fadds 0x56(%ecx); lds 0x56(%ebx), %esp; mov %al, %al andeqs pc, r1, #147456; blpl 0xff8dd280; ldrgtb r4, [r6, #-472]; addgt r5, r8, r3, ror #12 |
|
|
|
|
|
#7 |
|
Senior Member
Iscritto dal: Apr 2005
Città: Gualdo Tadino, Perugia
Messaggi: 1692
|
grazie, ora sto andando con
wget --mirror --no-parent http://sito da scaricare pare che funzioni, ma ancora è presto per dirlo ps c'è un modo per interrompere momentaneamente il download e riprenderlo più avanti?
__________________
E d'un tratto capii che il pensare è per gli stupidi, mentre i cervelluti si affidano all'ispirazione. |
|
|
|
|
|
#8 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Roma
Messaggi: 15625
|
-c
(mi hai preso per la man page di wget?
__________________
0: or %edi, %ecx; adc %eax, (%edx); popf; je 0b-22; pop %ebx; fadds 0x56(%ecx); lds 0x56(%ebx), %esp; mov %al, %al andeqs pc, r1, #147456; blpl 0xff8dd280; ldrgtb r4, [r6, #-472]; addgt r5, r8, r3, ror #12 |
|
|
|
|
|
#9 |
|
Senior Member
Iscritto dal: Jan 2001
Messaggi: 3363
|
usa httrack, è semplicissimo.
lo lanci con httrack in una console poi rispondi semplicemente alle domande che ti fa (e se non hai esigenze particolari, o dietro firewall, proxy, ecc...) accetti le impostazioni di default. Se vuoi esiste anche whttrack che ha un'interfaccia grafica ma secondo me è più complicato. Comunque il sito lo scarichi ...se vuole farsi scaricare ... [giorgio@mandriva_2007_spring ~]$ httrack Welcome to HTTrack Website Copier (Offline Browser) 3.40-2-nossl Copyright (C) Xavier Roche and other contributors To see the option list, enter a blank line or try httrack --help Enter project name Base path (return=/home/giorgio/websites/) : Enter URLs (separated by commas or blank spaces) :www.pippo.it www.pluto.com Action: (enter) 1 Mirror Web Site(s) 2 Mirror Web Site(s) with Wizard 3 Just Get Files Indicated 4 Mirror ALL links in URLs (Multiple Mirror) 5 Test Links In URLs (Bookmark Test) 0 Quit : 1 Proxy (return=none) : You can define wildcards, like: -*.gif +www.*.com/*.zip -*img_*.zip Wildcards (return=none) : You can define additional options, such as recurse level (-r<number>), separed by blank spaces To see the option list, type help Additional options (return=none) : ---> Wizard command line: httrack www.pippo.it www.pluto.com -O "/home/giorgio/websites/pippo" -%v Ready to launch the mirror? (Y/n) :y Mirror launched on Mon, 26 Nov 2007 17:51:18 by HTTrack Website Copier/3.40-2-nossl [XR&CO'2006] ........................................................................................................ ...................................................................................................... crea una dir "pippo" nella dir locale "/home/giorgio/websites/" (ovviamente puoi metterci quella che vuoi tu) memorizzandovi, in formato navigabile i siti "www.pippo.it" e "www.pluto.com" nella dir "pippo" ti trovi questi file |
|
|
|
|
|
#10 |
|
Senior Member
Iscritto dal: Jan 2001
Messaggi: 3363
|
usa httrack, è semplicissimo.
lo lanci con httrack in una console poi rispondi semplicemente alle domande che ti fa (e se non hai esigenze particolari, o dietro firewall, proxy, ecc...) accetti le impostazioni di default. Se vuoi esiste anche whttrack che ha un'interfaccia grafica ma secondo me è più complicato. Comunque il sito lo scarichi ...se vuole farsi scaricare ... [giorgio@mandriva_2007_spring ~]$ httrack Welcome to HTTrack Website Copier (Offline Browser) 3.40-2-nossl Copyright (C) Xavier Roche and other contributors To see the option list, enter a blank line or try httrack --help Enter project name Base path (return=/home/giorgio/websites/) : Enter URLs (separated by commas or blank spaces) :www.pippo.it www.pluto.com Action: (enter) 1 Mirror Web Site(s) 2 Mirror Web Site(s) with Wizard 3 Just Get Files Indicated 4 Mirror ALL links in URLs (Multiple Mirror) 5 Test Links In URLs (Bookmark Test) 0 Quit : 1 Proxy (return=none) : You can define wildcards, like: -*.gif +www.*.com/*.zip -*img_*.zip Wildcards (return=none) : You can define additional options, such as recurse level (-r<number>), separed by blank spaces To see the option list, type help Additional options (return=none) : ---> Wizard command line: httrack www.pippo.it www.pluto.com -O "/home/giorgio/websites/pippo" -%v Ready to launch the mirror? (Y/n) :y Mirror launched on Mon, 26 Nov 2007 17:51:18 by HTTrack Website Copier/3.40-2-nossl [XR&CO'2006] ........................................................................................................ ...................................................................................................... crea una dir "pippo" nella dir locale "/home/giorgio/websites/" (ovviamente puoi metterci quella che vuoi tu) memorizzandovi, in formato navigabile i siti "www.pippo.it" e "www.pluto.com" nella dir "pippo" ti trovi questi file hts-cache www.pippo.it backblue.gif fade.gif index.html hts-in_progress.lock hts-log.txt Clicchi su index.html e navighi in locale sul tuo sito. Facile no ? |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 13:05.



















