|
|
|
![]() |
|
Strumenti |
![]() |
#1 | |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Non capisco la sintassi del wget :(
Quote:
Io vorrei usale le opz: Codice:
-P, --directory-prefix=PREFISSO salva i file in PREFISSO/... --cut-dirs=NUMERO ignora NUMERO componenti delle directory remote. E: Codice:
-D, --domains=LISTA lista di domini accettati, separati da virgole. --exclude-domains=LISTA lista di domini rifiutati, separati da virgole. --follow-ftp segue i link FTP dai documenti HTML. --follow-tags=LISTA lista di tag HTML, separati da virgole, che vengono seguiti nello scaricamento. --ignore-tags=LISTA lista di tag HTML, separati da virgole, che vengono ignorati. Secondo voi come si usano?!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Ho provato anche così:
wget -D i,br http://www.repubblica.it e così: wget --ignore-tags=<br> http://www.repubblica.it , ma niente da fare! ![]() ![]()
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Per completezza riporto il suo HELP:
Codice:
GNU Wget 1.10.2, un programma non interattivo per scaricare file dalla rete. Uso: wget [OPZIONE]... [url]... Gli argomenti obbligatori per le opzioni lunghe lo sono anche per quelle corte. Avvio: -V, --version mostra la versione di Wget ed esce. -h, --help mostra questo aiuto. -b, --background va in background dopo l'avvio. -e, --execute=COMANDO esegue COMANDO come se fosse scritto in ".wgetrc". File di log e di input: -o, --output-file=FILE registra i messaggi su FILE. -a, --append-output=FILE accoda i messaggi a FILE. -d, --debug mostra le informazioni di debug. -q, --quiet silenzioso (nessun output). -v, --verbose prolisso (predefinito). -nv, --no-verbose meno prolisso, ma non silenzioso. -i, --input-file=FILE scarica gli URL scritti in FILE. -F, --force-html tratta il file di input come HTML. -B, --base=URL aggiunge URL ai link relativi quando si usa -F sul file indicato con -i. Scaricamento: -t, --tries=NUMERO imposta il NUMERO di tentativi (0 = illimitati). --retry-connrefused riprova anche se la connessione è rifiutata. -O --output-document=FILE scrive tutti i documenti in un singolo FILE. -nc, --no-clobber non scaricare file già esistenti. -c, --continue riprende a scaricare un file parzialmente scaricato. --progress=TIPO sceglie il TIPO di misurazione di progresso. -N, --timestamping non scarica file più vecchi di quelli locali. -S, --server-response mostra le risposte del server. --spider non scarica niente. -T, --timeout=SECONDI imposta tutti i timeout a SECONDI. --dns-timeout=SECONDI imposta il timeout per la risoluzione del DNS a SECONDI. --connect-timeout=SECONDI imposta il timeout di connessione a SECONDI. --read-timeout=SECONDI imposta il timeout di lettura a SECONDI. -w, --wait=SECONDI aspetta SECONDI tra i vari download. --waitretry=SECONDI aspetta 1...SECONDI tra i tentativi di scaricamento. --random-wait aspetta tra 0...2*WAIT secondi tra scaricamenti. -Y, --proxy attiva esplicitamente l'uso del proxy. --no-proxy disattiva esplicitamente l'uso del proxy. -Q, --quota=NUMERO imposta la quota di scaricamento a NUMERO. --bind-address=INDIRIZZO lega l'INDIRIZZO (nome dell'host o IP) all'host locale. --limit-rate=VELOCITÀ limita la VELOCITÀ di scaricamento in byte. --no-dns-cache disattiva la cache per la risoluzione del DNS. --restrict-file-names=SO limita i caratteri nei nomi dei file a quelli permessi dal sistema operativo SO indicato. -4, --inet4-only si connette solo a indirizzi IPv4. -6, --inet6-only si connette solo a indirizzi IPv6. --prefer-family=FAMIGLIA si connette di preferenza ad indirizzi della FAMIGLIA specificata (IPv6, IPv4 o none). --user=UTENTE imposta il nome utente ftp e http a UTENTE. --password=PASS imposta la password ftp e http a PASS. Directory: -nd, --no-directories non crea directory. -x, --force-directories forza la creazione di directory. -nH, --no-host-directories non crea directory sull'host. --protocol-directories usa il nome di protocollo nelle directory. -P, --directory-prefix=PREFISSO salva i file in PREFISSO/... --cut-dirs=NUMERO ignora NUMERO componenti delle directory remote. Opzioni HTTP: --http-user=UTENTE imposta l'utente http a UTENTE. --http-passwd=PASS imposta la password http a PASS. --no-cache non permette la cache dei dati sul server. -E, --html-extension salva con estensione ".html" i documenti HTML. --ignore-length ignora il campo Content-Length degli header. --header=STRINGA inserisce STRINGA tra gli header. --proxy-user=UTENTE imposta il nome utente per il proxy a UTENTE. --proxy-passwd=PASS imposta la password per il proxy a PASS. --referer=URL include l'header "Referer: URL" nella richiesta HTTP. --save-headers salva gli header HTTP su file. -U, --user-agent=AGENTE si identifica come AGENTE invece che come Wget/VERSIONE. --no-http-keep-alive disabilita l'HTTP keep-alive (connessioni persistenti). --no-cookies non usa i cookies. --load-cookies=FILE carica i cookies dal FILE prima della sessione. --save-cookies=FILE salva i cookies sul FILE dopo la sessione. --keep-session-cookies carica e salva i cookies per la sessione (non permanenti). --post-data=STRINGA usa il metodo POST; spedisce STRINGA come dati. --post-file=FILE usa il metodo POST; spedisce i contenuti del FILE. Opzioni HTTPS (SSL/TLS): --secure-protocol=PROT. sceglie il protocollo sicuro, uno tra auto, SSLv2, SSLv3,e TLSv1. --no-check-certificate non valida il certificato del server. --certificate=FILE file di certificato del client. --certificate-type=TIPO tipo di certificato del client, PEM o DER. --private-key=FILE file della chiave privata. --private-key-type=TIPO tipo di chiave privata, PEM o DER. --ca-certificate=FILE file with the bundle of CA's. --ca-directory=DIR directory dove è memorizzata la lista dei CA. --random-file=FILE file con dati casuali per inizializzare SSL PRNG. --egd-file=FILE file naming the EGD socket with random data. Opzioni FTP: --ftp-user=UTENTE imposta l'utente ftp a UTENTE. --ftp-password=PASS imposta la password ftp a PASS. --no-remove-listing non elimina i file ".listing". --no-glob disabilita il globbing FTP dei nome di file. --no-passive-ftp disabilita la modalità di trasferimento passiva. --retr-symlinks scarica i file (non le directory) puntati dai link simbolici quando si è in modalità ricorsiva. --preserve-permissions preserva i permessi remoti dei file. Scaricamento ricorsivo: -r, --recursive scaricamento ricorsivo. -l, --level=NUMERO profondità massima di ricorsione (inf o 0 = illimitata). --delete-after elimina localmente i file dopo averli scaricati. -k, --convert-links converte i link assoluti in relativi. -K, --backup-converted salva il file X come X.orig prima di convertirlo. -m, --mirror scorciatoia per -N -r -l inf --no-remove-listing. -p, --page-requisites scarica tutte le immagini, ecc, necessarie per visualizzare la pagina HTML. --strict-comments tratta i commenti HTML in modalità strict (SGML). Accetto/rifiuto ricorsivo: -A, --accept=LISTA lista di estensioni accettate, separate da virgole. -R, --reject=LISTA lista di estensioni rifiutate, separate da virgole. -D, --domains=LISTA lista di domini accettati, separati da virgole. --exclude-domains=LISTA lista di domini rifiutati, separati da virgole. --follow-ftp segue i link FTP dai documenti HTML. --follow-tags=LISTA lista di tag HTML, separati da virgole, che vengono seguiti nello scaricamento. --ignore-tags=LISTA lista di tag HTML, separati da virgole, che vengono ignorati. -H, --span-hosts visita anche altri host quando si è in modalità ricorsiva. -L, --relative segue solo i link relativi. -I, --include-directories=LISTA lista di directory permesse. -X, --exclude-directories=LISTA lista di directory escluse. -np, --no-parent non risale alla directory superiore. Inviare segnalazioni di bug e suggerimenti a <bug-wget@gnu.org>.
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
![]() |
![]() |
![]() |
#4 | ||
Senior Member
Iscritto dal: Jun 2002
Città: Piacenza - Bergamo
Messaggi: 1688
|
Quote:
Quote:
man wget: Codice:
--ignore-tags=list This is the opposite of the --follow-tags option. To skip certain HTML tags when recursively looking for documents to download, spec- ify them in a comma-separated list. In the past, this option was the best bet for downloading a single page and its requisites, using a command-line like: wget --ignore-tags=a,area -H -k -K -r http://<site>/<document > However, the author of this option came across a page with tags like "<LINK REL="home" HREF="/">" and came to the realization that specifying tags to ignore was not enough. One can't just tell Wget to ignore "<LINK>", because then stylesheets will not be down- loaded. Now the best bet for downloading a single page and its requisites is the dedicated --page-requisites option.
__________________
Good Kitty: "Jo'z heer!" |
||
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Grazie.
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Niente non ci riesco:
![]() EDIT OK c'è l'ho fatta così: ![]()
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. Ultima modifica di Matrixbob : 11-01-2007 alle 14:23. |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Dovrei lanciare il wget in modo silenzioso che però mi vada a scrivere 1 file di log.
Per evitare che stampi inutilmente a video, ma mi faccia il report in 1 file. Come si fa?!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Jan 2001
Messaggi: 2289
|
Quote:
$TUO_COMANDO >> file_dove_vuoi_salvare non so pero' se da windows funziona...
__________________
FreeBSD, OpenBSD and GNU/Linux User Free Software Foundation Associate Member proudly member of poco-serio™ team! nella foto son quello simpatico... l'altro e' |Stan| |
|
![]() |
![]() |
![]() |
#9 | |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Quote:
-o, --output-file=FILE log messages to FILE.
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
![]() |
![]() |
![]() |
#10 |
Senior Member
Iscritto dal: Jan 2001
Città: Milano
Messaggi: 5707
|
|
![]() |
![]() |
![]() |
#11 | |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Quote:
Ora vorrei ottimizzare il lancio del WGET perchè devo usarlo in una procedura automatica e vorrei che NON si bloccasse mai altrimenti il resto della procedura si blocca anch'essa. ![]() Ad esempio il timeout x il download si mette così: wget --timeout=30 --output-file=./log/scaricare.log -O output_file -i input_file
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
![]() |
![]() |
![]() |
#12 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
... o meglio mettere:
--tries=10 al posto del timeout?
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
![]() |
![]() |
![]() |
#13 | |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Quote:
wget --wait=2 --timeout=30 , così in teoria in 30 secondi faccio 15 tentativi di download del file. Va bene x non sovraccaricare la rete?! ![]()
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
![]() |
![]() |
![]() |
#14 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Non riesco a scaricare questi link col wget:
http://video.google.it/videofile/The...0256191&itag=7 è 1 sua limitazione o posso risolvere in qualche modo?!
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
![]() |
![]() |
![]() |
#15 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Si pianta sul &itag mi pare:
![]() Come aggiro il problema?! ![]()
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. Ultima modifica di Matrixbob : 19-06-2007 alle 14:24. |
![]() |
![]() |
![]() |
#16 |
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
|
![]() |
![]() |
![]() |
#17 | |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Il file IMHO in remoto c'è:
![]() Ma il wget fa così: Quote:
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
|
![]() |
![]() |
![]() |
#18 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Adesso forse non riesce solo a scriverlo mi pare, trovarlo lo trova ne?!
Devo rinominarlo al volo? Si può?
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
![]() |
![]() |
![]() |
#19 |
Senior Member
Iscritto dal: Apr 2000
Città: Vicino a Montecatini(Pistoia) Moto:Kawasaki Ninja ZX-9R Scudetti: 29
Messaggi: 53971
|
Più che altro sembra che non trovi la directory canale1
|
![]() |
![]() |
![]() |
#20 |
Senior Member
Iscritto dal: Jul 2001
Messaggi: 9947
|
Mah io mi riordo che la creava da lei, adesso provo a crearla io.
__________________
Aiuta la ricerca col tuo PC: >>Calcolo distribuito BOINC.Italy: unisciti anche tu<< Più largo è il sorriso, più affilato è il coltello. |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 11:26.