|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Junior Member
Iscritto dal: Aug 2006
Messaggi: 18
|
[JAVA] Semplice parser di un file html
ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo <html> <head> </head> <body> <br> Nome1 <br> Nome2 etc. </body> </html> a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc. qualcuno ha qualche idea?
__________________
|
|
|
|
|
|
#2 | |
|
Senior Member
Iscritto dal: Jul 2009
Messaggi: 1161
|
Quote:
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II |
|
|
|
|
|
|
#3 |
|
Junior Member
Iscritto dal: Aug 2006
Messaggi: 18
|
si..ho sempre il tag <br> , provo a vedere come funzionano in java le espressioni regolari ( so cosa sono ).
Grazie
__________________
|
|
|
|
|
|
#4 | |
|
Senior Member
Iscritto dal: Jul 2009
Messaggi: 1161
|
Quote:
occhio al classico problema che devi escapare due volte il backslash
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II |
|
|
|
|
|
|
#5 |
|
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
se le pagine sono xhtml puoi anche usare uno degli n parser xml a disposizione, come jdom ad esempio....
__________________
|
|
|
|
|
|
#6 | |
|
Senior Member
Iscritto dal: Jul 2009
Messaggi: 1161
|
Quote:
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II |
|
|
|
|
|
|
#7 |
|
Junior Member
Iscritto dal: Aug 2006
Messaggi: 18
|
ciao, è una semplice pagina html , rispetta quello scheletro perchè sono io a generarla
ho risolto cosi Codice:
public static String[] parser(String pHtml) {
Pattern p = Pattern.compile("<body>+.*|\\t* +</body>");
Matcher m = p.matcher(pHtml);
String line="";
String app="";
while (m.find()) {
app = m.group();
line+=app;
}
String[] pageSplit = line.split("<br>");
return pageSplit;
}
Grazie.
__________________
Ultima modifica di Wall4c3 : 28-07-2009 alle 00:27. |
|
|
|
|
|
#8 | |
|
Senior Member
Iscritto dal: Jan 2006
Città: Perugia - San Benedetto del Tronto
Messaggi: 348
|
Quote:
Hai provato con la classe String Tokenizer? A me è tornata molto utile quando ho fatto un programma per disegnare funzioni. http://java.sun.com/j2se/1.4.2/docs/...Tokenizer.html |
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 05:43.




















