|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Senior Member
Iscritto dal: Aug 2005
Città: Genova
Messaggi: 2285
|
[JAVA] Estrapolare il codice HTML di una pagina passata e estrarre info dal codice
Avrei bisogno di una mano per fare un programma che deve autoaggiornarsi tramite le info di una pagina web che gli passo.
Per evitare problemi vari ho pensato di prendere queste info direttamente dal codice html (tra l'altro sono ben identificabili). Quello che mi manca è però come fare per: data una una pagina web --> restituisci il codice html come fosse un file txt Qualcuno riesce ad aiutarmi? ![]() ![]()
__________________
Lego ™ Fans Club |
![]() |
![]() |
![]() |
#2 |
Senior Member
Iscritto dal: Oct 2007
Città: Frosinone
Messaggi: 576
|
Ciao, non so se hai confidenza con Java, soprattutto per quanto riguarda i package di java.net. Comunque ti scrivo un semplice esempio di codice per scaricare una pagina html specificata:
Codice:
// Apro la connessione impostando alcuni parametri URL u = new URL("http://www.nerthase.com"); HttpURLConnection huc = (HttpURLConnection) u.openConnection(); BufferedReader br = new BufferedReader(new InputStreamReader(huc.getInputStream())); // Leggo la pagina di riposta String pagina = ""; String tmp; while ((tmp = br.readLine()) != null) pagina += tmp; br.close(); Senza dilungarmi troppo in questo post, ti consiglio l'uso di espressioni regolari per catturare la porzione di pagina che ti interessa. Puoi trovare qualche mio esempio qui: http://www.nerthase.com/blog/java-espressioni-regolari Dimmi se qualcosa non è chiaro. A presto
__________________
Ho conluso positivamente con backstage_fds, casacup, ceolo, CharliEK, ddaniele, devilred, DexTer82, diba, EasyD, fedevi, fuckaldo, Gica78R, Ippo 2001, jimmy41, jolly90aa , Jonny1600, kamoscio, Knukcles, k3vin, Lunar Wolf, marcopino1982, Mecoita, Mokurai77, pelatoscatenato, sadap, subaugusta, zakkos e ^VaMpIr0^ Find me on www.nerthase.com |
![]() |
![]() |
![]() |
#3 |
Senior Member
Iscritto dal: Aug 2005
Città: Genova
Messaggi: 2285
|
ammazz...tutto il codice html in una stringa?
![]()
__________________
Lego ™ Fans Club |
![]() |
![]() |
![]() |
#4 |
Senior Member
Iscritto dal: Nov 2004
Città: Tra Verona e Mantova
Messaggi: 4553
|
Usa Scanner, BufferedReader fa tanto "amarcord".
Codice:
InputStream in = url.openStream(); String pagina = new Scanner(in).useDelimiter("\\Z").next();
__________________
Uilliam Scecspir ti fa un baffo? Gioffri Cioser era uno straccione? E allora blogga anche tu, in inglese come me! |
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Oct 2007
Città: Frosinone
Messaggi: 576
|
Ciao, non credo ci siano problemi a memorizzare un codice HTML in una stringa... io l'ho sempre fatto e non ho mai avuto problemi...
Se hai dei problemi, possiamo cercare di risolverli. Ricorda, che le classi per le espressioni regolari che ti ho linkato, lavorano proprio sulle stringe. Quindi è il metodo più veloce per realizzare quello che hai in mente. A presto
__________________
Ho conluso positivamente con backstage_fds, casacup, ceolo, CharliEK, ddaniele, devilred, DexTer82, diba, EasyD, fedevi, fuckaldo, Gica78R, Ippo 2001, jimmy41, jolly90aa , Jonny1600, kamoscio, Knukcles, k3vin, Lunar Wolf, marcopino1982, Mecoita, Mokurai77, pelatoscatenato, sadap, subaugusta, zakkos e ^VaMpIr0^ Find me on www.nerthase.com |
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 01:47.