|
|
|
![]() |
|
Strumenti |
![]() |
#1 |
Junior Member
Iscritto dal: Aug 2006
Messaggi: 18
|
[JAVA] Semplice parser di un file html
ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo <html> <head> </head> <body> <br> Nome1 <br> Nome2 etc. </body> </html> a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc. qualcuno ha qualche idea?
__________________
![]() |
![]() |
![]() |
![]() |
#2 | |
Senior Member
Iscritto dal: Jul 2009
Messaggi: 1161
|
Quote:
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II |
|
![]() |
![]() |
![]() |
#3 |
Junior Member
Iscritto dal: Aug 2006
Messaggi: 18
|
si..ho sempre il tag <br> , provo a vedere come funzionano in java le espressioni regolari ( so cosa sono ).
Grazie ![]()
__________________
![]() |
![]() |
![]() |
![]() |
#4 | |
Senior Member
Iscritto dal: Jul 2009
Messaggi: 1161
|
Quote:
occhio al classico problema che devi escapare due volte il backslash ![]()
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II |
|
![]() |
![]() |
![]() |
#5 |
Senior Member
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
|
se le pagine sono xhtml puoi anche usare uno degli n parser xml a disposizione, come jdom ad esempio....
__________________
![]() |
![]() |
![]() |
![]() |
#6 | |
Senior Member
Iscritto dal: Jul 2009
Messaggi: 1161
|
Quote:
![]()
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II |
|
![]() |
![]() |
![]() |
#7 |
Junior Member
Iscritto dal: Aug 2006
Messaggi: 18
|
ciao, è una semplice pagina html , rispetta quello scheletro perchè sono io a generarla
![]() ho risolto cosi Codice:
public static String[] parser(String pHtml) { Pattern p = Pattern.compile("<body>+.*|\\t* +</body>"); Matcher m = p.matcher(pHtml); String line=""; String app=""; while (m.find()) { app = m.group(); line+=app; } String[] pageSplit = line.split("<br>"); return pageSplit; } ![]() ![]() Grazie.
__________________
![]() Ultima modifica di Wall4c3 : 27-07-2009 alle 23:27. |
![]() |
![]() |
![]() |
#8 | |
Senior Member
Iscritto dal: Jan 2006
Città: Perugia - San Benedetto del Tronto
Messaggi: 348
|
Quote:
Hai provato con la classe String Tokenizer? A me è tornata molto utile quando ho fatto un programma per disegnare funzioni. http://java.sun.com/j2se/1.4.2/docs/...Tokenizer.html |
|
![]() |
![]() |
![]() |
Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 12:29.