|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 | |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Non capisco la sintassi del wget :(
Quote:
Io vorrei usale le opz: Codice:
-P, --directory-prefix=PREFISSO salva i file in PREFISSO/...
--cut-dirs=NUMERO ignora NUMERO componenti delle directory
remote.
E: Codice:
-D, --domains=LISTA lista di domini accettati, separati da
virgole.
--exclude-domains=LISTA lista di domini rifiutati, separati da
virgole.
--follow-ftp segue i link FTP dai documenti HTML.
--follow-tags=LISTA lista di tag HTML, separati da virgole,
che vengono seguiti nello scaricamento.
--ignore-tags=LISTA lista di tag HTML, separati da virgole,
che vengono ignorati.
Secondo voi come si usano?!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
|
#2 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Ho provato anche così:
wget -D i,br http://www.repubblica.it e così: wget --ignore-tags=<br> http://www.repubblica.it , ma niente da fare!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Per completezza riporto il suo HELP:
Codice:
GNU Wget 1.10.2, un programma non interattivo per scaricare file dalla rete.
Uso: wget [OPZIONE]... [url]...
Gli argomenti obbligatori per le opzioni lunghe lo sono anche per quelle corte.
Avvio:
-V, --version mostra la versione di Wget ed esce.
-h, --help mostra questo aiuto.
-b, --background va in background dopo l'avvio.
-e, --execute=COMANDO esegue COMANDO come se fosse scritto in ".wgetrc".
File di log e di input:
-o, --output-file=FILE registra i messaggi su FILE.
-a, --append-output=FILE accoda i messaggi a FILE.
-d, --debug mostra le informazioni di debug.
-q, --quiet silenzioso (nessun output).
-v, --verbose prolisso (predefinito).
-nv, --no-verbose meno prolisso, ma non silenzioso.
-i, --input-file=FILE scarica gli URL scritti in FILE.
-F, --force-html tratta il file di input come HTML.
-B, --base=URL aggiunge URL ai link relativi quando si usa -F
sul file indicato con -i.
Scaricamento:
-t, --tries=NUMERO imposta il NUMERO di tentativi (0 = illimitati).
--retry-connrefused riprova anche se la connessione è rifiutata.
-O --output-document=FILE scrive tutti i documenti in un singolo FILE.
-nc, --no-clobber non scaricare file già esistenti.
-c, --continue riprende a scaricare un file parzialmente
scaricato.
--progress=TIPO sceglie il TIPO di misurazione di progresso.
-N, --timestamping non scarica file più vecchi di quelli locali.
-S, --server-response mostra le risposte del server.
--spider non scarica niente.
-T, --timeout=SECONDI imposta tutti i timeout a SECONDI.
--dns-timeout=SECONDI imposta il timeout per la risoluzione del DNS
a SECONDI.
--connect-timeout=SECONDI imposta il timeout di connessione a SECONDI.
--read-timeout=SECONDI imposta il timeout di lettura a SECONDI.
-w, --wait=SECONDI aspetta SECONDI tra i vari download.
--waitretry=SECONDI aspetta 1...SECONDI tra i tentativi di
scaricamento.
--random-wait aspetta tra 0...2*WAIT secondi tra scaricamenti.
-Y, --proxy attiva esplicitamente l'uso del proxy.
--no-proxy disattiva esplicitamente l'uso del proxy.
-Q, --quota=NUMERO imposta la quota di scaricamento a NUMERO.
--bind-address=INDIRIZZO lega l'INDIRIZZO (nome dell'host o IP)
all'host locale.
--limit-rate=VELOCITÀ limita la VELOCITÀ di scaricamento in byte.
--no-dns-cache disattiva la cache per la risoluzione del DNS.
--restrict-file-names=SO limita i caratteri nei nomi dei file a quelli
permessi dal sistema operativo SO indicato.
-4, --inet4-only si connette solo a indirizzi IPv4.
-6, --inet6-only si connette solo a indirizzi IPv6.
--prefer-family=FAMIGLIA si connette di preferenza ad indirizzi della
FAMIGLIA specificata (IPv6, IPv4 o none).
--user=UTENTE imposta il nome utente ftp e http a UTENTE.
--password=PASS imposta la password ftp e http a PASS.
Directory:
-nd, --no-directories non crea directory.
-x, --force-directories forza la creazione di directory.
-nH, --no-host-directories non crea directory sull'host.
--protocol-directories usa il nome di protocollo nelle directory.
-P, --directory-prefix=PREFISSO salva i file in PREFISSO/...
--cut-dirs=NUMERO ignora NUMERO componenti delle directory
remote.
Opzioni HTTP:
--http-user=UTENTE imposta l'utente http a UTENTE.
--http-passwd=PASS imposta la password http a PASS.
--no-cache non permette la cache dei dati sul server.
-E, --html-extension salva con estensione ".html" i documenti HTML.
--ignore-length ignora il campo Content-Length degli header.
--header=STRINGA inserisce STRINGA tra gli header.
--proxy-user=UTENTE imposta il nome utente per il proxy a UTENTE.
--proxy-passwd=PASS imposta la password per il proxy a PASS.
--referer=URL include l'header "Referer: URL" nella richiesta
HTTP.
--save-headers salva gli header HTTP su file.
-U, --user-agent=AGENTE si identifica come AGENTE invece che come
Wget/VERSIONE.
--no-http-keep-alive disabilita l'HTTP keep-alive (connessioni
persistenti).
--no-cookies non usa i cookies.
--load-cookies=FILE carica i cookies dal FILE prima della sessione.
--save-cookies=FILE salva i cookies sul FILE dopo la sessione.
--keep-session-cookies carica e salva i cookies per la sessione
(non permanenti).
--post-data=STRINGA usa il metodo POST; spedisce STRINGA come dati.
--post-file=FILE usa il metodo POST; spedisce i contenuti del FILE.
Opzioni HTTPS (SSL/TLS):
--secure-protocol=PROT. sceglie il protocollo sicuro, uno tra auto,
SSLv2, SSLv3,e TLSv1.
--no-check-certificate non valida il certificato del server.
--certificate=FILE file di certificato del client.
--certificate-type=TIPO tipo di certificato del client, PEM o DER.
--private-key=FILE file della chiave privata.
--private-key-type=TIPO tipo di chiave privata, PEM o DER.
--ca-certificate=FILE file with the bundle of CA's.
--ca-directory=DIR directory dove è memorizzata la lista dei CA.
--random-file=FILE file con dati casuali per inizializzare
SSL PRNG.
--egd-file=FILE file naming the EGD socket with random data.
Opzioni FTP:
--ftp-user=UTENTE imposta l'utente ftp a UTENTE.
--ftp-password=PASS imposta la password ftp a PASS.
--no-remove-listing non elimina i file ".listing".
--no-glob disabilita il globbing FTP dei nome di file.
--no-passive-ftp disabilita la modalità di trasferimento passiva.
--retr-symlinks scarica i file (non le directory) puntati dai
link simbolici quando si è in modalità ricorsiva.
--preserve-permissions preserva i permessi remoti dei file.
Scaricamento ricorsivo:
-r, --recursive scaricamento ricorsivo.
-l, --level=NUMERO profondità massima di ricorsione
(inf o 0 = illimitata).
--delete-after elimina localmente i file dopo averli scaricati.
-k, --convert-links converte i link assoluti in relativi.
-K, --backup-converted salva il file X come X.orig prima di convertirlo.
-m, --mirror scorciatoia per -N -r -l inf --no-remove-listing.
-p, --page-requisites scarica tutte le immagini, ecc, necessarie per
visualizzare la pagina HTML.
--strict-comments tratta i commenti HTML in modalità strict (SGML).
Accetto/rifiuto ricorsivo:
-A, --accept=LISTA lista di estensioni accettate, separate da
virgole.
-R, --reject=LISTA lista di estensioni rifiutate, separate da
virgole.
-D, --domains=LISTA lista di domini accettati, separati da
virgole.
--exclude-domains=LISTA lista di domini rifiutati, separati da
virgole.
--follow-ftp segue i link FTP dai documenti HTML.
--follow-tags=LISTA lista di tag HTML, separati da virgole,
che vengono seguiti nello scaricamento.
--ignore-tags=LISTA lista di tag HTML, separati da virgole,
che vengono ignorati.
-H, --span-hosts visita anche altri host quando si è in
modalità ricorsiva.
-L, --relative segue solo i link relativi.
-I, --include-directories=LISTA lista di directory permesse.
-X, --exclude-directories=LISTA lista di directory escluse.
-np, --no-parent non risale alla directory superiore.
Inviare segnalazioni di bug e suggerimenti a <[email protected]>.
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
#4 | ||
|
Senior Member
Iscritto dal: Jun 2002
Città: Piacenza - Bergamo
Messaggi: 1688
|
Quote:
Quote:
man wget: Codice:
--ignore-tags=list
This is the opposite of the --follow-tags option. To skip certain
HTML tags when recursively looking for documents to download, spec-
ify them in a comma-separated list.
In the past, this option was the best bet for downloading a single
page and its requisites, using a command-line like:
wget --ignore-tags=a,area -H -k -K -r http://<site>/<document
>
However, the author of this option came across a page with tags
like "<LINK REL="home" HREF="/">" and came to the realization that
specifying tags to ignore was not enough. One can't just tell Wget
to ignore "<LINK>", because then stylesheets will not be down-
loaded. Now the best bet for downloading a single page and its
requisites is the dedicated --page-requisites option.
__________________
Good Kitty: "Jo'z heer!" |
||
|
|
|
|
|
#5 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Grazie.
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
#6 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Niente non ci riesco:
![]() EDIT OK c'è l'ho fatta così:
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. Ultima modifica di Matrixbob : 11-01-2007 alle 15:23. |
|
|
|
|
|
#7 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Dovrei lanciare il wget in modo silenzioso che però mi vada a scrivere 1 file di log.
Per evitare che stampi inutilmente a video, ma mi faccia il report in 1 file. Come si fa?!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
#8 | |
|
Senior Member
Iscritto dal: Jan 2001
Messaggi: 2289
|
Quote:
$TUO_COMANDO >> file_dove_vuoi_salvare non so pero' se da windows funziona...
__________________
FreeBSD, OpenBSD and GNU/Linux User Free Software Foundation Associate Member proudly member of poco-serio™ team! nella foto son quello simpatico... l'altro e' |Stan| |
|
|
|
|
|
|
#9 | |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Quote:
-o, --output-file=FILE log messages to FILE.
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
|
#10 |
|
Senior Member
Iscritto dal: Jan 2001
Città: Milano
Messaggi: 5707
|
|
|
|
|
|
|
#11 | |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Quote:
Ora vorrei ottimizzare il lancio del WGET perchè devo usarlo in una procedura automatica e vorrei che NON si bloccasse mai altrimenti il resto della procedura si blocca anch'essa. Ad esempio il timeout x il download si mette così: wget --timeout=30 --output-file=./log/scaricare.log -O output_file -i input_file
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
|
#12 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
... o meglio mettere:
--tries=10 al posto del timeout?
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
#13 | |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Quote:
wget --wait=2 --timeout=30 , così in teoria in 30 secondi faccio 15 tentativi di download del file. Va bene x non sovraccaricare la rete?!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
|
#14 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Non riesco a scaricare questi link col wget:
http://video.google.it/videofile/The...0256191&itag=7 è 1 sua limitazione o posso risolvere in qualche modo?!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
#15 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Si pianta sul &itag mi pare:
![]() Come aggiro il problema?!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. Ultima modifica di Matrixbob : 19-06-2007 alle 15:24. |
|
|
|
|
|
#16 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
|
|
|
|
|
|
#17 | |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Il file IMHO in remoto c'è:
![]() Ma il wget fa così: Quote:
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
|
#18 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Adesso forse non riesce solo a scriverlo mi pare, trovarlo lo trova ne?!
Devo rinominarlo al volo? Si può?
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
|
#19 |
|
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Più che altro sembra che non trovi la directory canale1
|
|
|
|
|
|
#20 |
|
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Mah io mi riordo che la creava da lei, adesso provo a crearla io.
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 15:06.























