|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: May 2002
Città: udine
Messaggi: 546
|
html parser
Salve,
mi sono fatto un parser html molto banale per scaricare dei dati da un sito... ho messo uno spleep di 2 secondi tra una richiesta e l'altra ma dovrò consultare circa 10000 pagine. Quanto tempo passerà prima che mi blocchino l'IP? ![]() ![]() ![]() ciao
__________________
a chi non piace il vino... dio neghi anche l'acqua! ![]() DELL Latitude E4300, iPhone 6 |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Jun 2001
Città: Alessandria (provincia)
Messaggi: 4772
|
E che è? Ti scarichi un'enciclopedia?
Ci sono programmi per fare il mirror (WinHTTrack per esempio), che credo "attacchino" abbastanza i server. Sarebbe da valutare la tua applicazione che impatto abbia sui loro server. Credo che senza maggiori informazioni, sarà dura darti una risposta sicura. |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: May 2002
Città: udine
Messaggi: 546
|
accedo alla pagina e leggo il contenuto... così per capirci:
Codice:
#Region "Lettura dati da un URL passato come stringa" Public Function LeggiURL(ByVal URL As String) As String Dim wc As New System.Net.WebClient() Dim s As System.IO.Stream = wc.OpenRead(URL) Dim r As String Dim sr As System.IO.StreamReader = New System.IO.StreamReader(s, System.Text.Encoding.UTF7, False) r = sr.ReadToEnd() Return r End Function #End Region
__________________
a chi non piace il vino... dio neghi anche l'acqua! ![]() DELL Latitude E4300, iPhone 6 |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Jun 2001
Città: Alessandria (provincia)
Messaggi: 4772
|
No, anche se è in un linguaggio che non mi è familiare.
Cerca però di fare le operazioni in sequenza senza parallerizzarle troppo (10.000 accessi contemporanei farebbero sì casino) e cercando di chiudere bene tutte le connessioni, per non lasciarne di appese.... |
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: May 2002
Città: udine
Messaggi: 546
|
E' scritto in Visual Basic .NET!
Effettivamente o fatto in modo che gli accessi non siano contemporanei ma sequenziali... dovessero bloccarmi mi posso lamentare in qualche modo? ne avrei diritto?
__________________
a chi non piace il vino... dio neghi anche l'acqua! ![]() DELL Latitude E4300, iPhone 6 |
![]() |
![]() |
![]() |
#6 |
Senior Member
Iscritto dal: May 2002
Città: udine
Messaggi: 546
|
ok, al momento ho "parserizzato" circa 50,000 pagine html e non mi hanno ancora mandato nessun sicario
![]() ![]()
__________________
a chi non piace il vino... dio neghi anche l'acqua! ![]() DELL Latitude E4300, iPhone 6 |
![]() |
![]() |
![]() |
#7 |
Senior Member
Iscritto dal: Sep 2002
Città: Celano (AQ) Segno_Zodiacale: Leone Ascendente: Cammello Segni_Particolari: Quello
Messaggi: 9571
|
cipi hai bisogno del manuale Visual Basic .NET 2003 Passo per passo, MAI e dico MAI usato?
|
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Jun 2001
Città: Alessandria (provincia)
Messaggi: 4772
|
Quote:
Che ci vuoi fare tutto quello che è .NET mi dà l'orticaria ![]() Ultima modifica di pinok : 23-11-2005 alle 19:15. |
|
![]() |
![]() |
![]() |
#9 | |
Senior Member
Iscritto dal: May 2002
Città: udine
Messaggi: 546
|
Quote:
![]()
__________________
a chi non piace il vino... dio neghi anche l'acqua! ![]() DELL Latitude E4300, iPhone 6 |
|
![]() |
![]() |
![]() |
#10 | |
Senior Member
Iscritto dal: May 2002
Città: udine
Messaggi: 546
|
[quote=pinok][quote=cipi]E' scritto in Visual Basic .NET!
Quote:
![]() ![]() ![]()
__________________
a chi non piace il vino... dio neghi anche l'acqua! ![]() DELL Latitude E4300, iPhone 6 |
|
![]() |
![]() |
![]() |
#11 | |
Senior Member
Iscritto dal: Sep 2002
Città: Celano (AQ) Segno_Zodiacale: Leone Ascendente: Cammello Segni_Particolari: Quello
Messaggi: 9571
|
Quote:
|
|
![]() |
![]() |
![]() |
#12 | |
Senior Member
Iscritto dal: May 2002
Città: udine
Messaggi: 546
|
Quote:
Ti mando pvt! ciao
__________________
a chi non piace il vino... dio neghi anche l'acqua! ![]() DELL Latitude E4300, iPhone 6 |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 00:31.