Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Dreame Aqua10 Ultra Roller, la pulizia di casa con un rullo
Dreame Aqua10 Ultra Roller, la pulizia di casa con un rullo
Il più recente robot per la pulizia domestica di Dreame, modello Aqua10 Ultra Roller, abbina un potente motore di aspirazione della polvere a un sofisticato sistema di lavaggio con rullo integrato. Il tutto governato dalla logica di intelligenza artificiale, per i migliori risultati
Recensione Realme 15 Pro Game Of Thrones: un vero cimelio tech per pochi eletti
Recensione Realme 15 Pro Game Of Thrones: un vero cimelio tech per pochi eletti
Siamo volati fino a Belfast, capitale dell'Irlanda Del Nord, per scoprire il nuovo Realme 15 Pro 5G Game Of Thrones Limited Edition. Una partnership coi fiocchi, quella tra Realme e HBO, un esercizio di stile davvero ben riuscito. Ma vi raccontiamo tutto nel nostro articolo
GIGABYTE GAMING A16, Raptor Lake e RTX 5060 Laptop insieme per giocare al giusto prezzo
GIGABYTE GAMING A16, Raptor Lake e RTX 5060 Laptop insieme per giocare al giusto prezzo
Il Gigabyte Gaming A16 offre un buon equilibrio tra prestazioni e prezzo: con Core i7-13620H e RTX 5060 Laptop garantisce gaming fluido in Full HD/1440p e supporto DLSS 4. Display 165 Hz reattivo, buona autonomia e raffreddamento efficace; peccano però le USB e la qualità cromatica del pannello. Prezzo: circa 1200€.
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 27-07-2009, 14:24   #1
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
[JAVA] Semplice parser di un file html

ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?
__________________
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 14:29   #2
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?
Se sei certo che attorno ai dati che ti servono hai tag ben identificabili.. puoi andare di espressioni regolari (se le sai usare) oppure prova a far le cose semplici usando banali funzioni su stringhe.
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 14:36   #3
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
si..ho sempre il tag <br> , provo a vedere come funzionano in java le espressioni regolari ( so cosa sono ).
Grazie
__________________
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 14:39   #4
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
si..ho sempre il tag <br> , provo a vedere come funzionano in java le espressioni regolari ( so cosa sono ).
Grazie


occhio al classico problema che devi escapare due volte il backslash
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 18:20   #5
^TiGeRShArK^
Senior Member
 
L'Avatar di ^TiGeRShArK^
 
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
se le pagine sono xhtml puoi anche usare uno degli n parser xml a disposizione, come jdom ad esempio....
__________________
^TiGeRShArK^ è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 19:47   #6
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da ^TiGeRShArK^ Guarda i messaggi
se le pagine sono xhtml puoi anche usare uno degli n parser xml a disposizione, come jdom ad esempio....
sì.. ma è difficile trovare pagine che rispettano perfettamente apertura/chiusura dei tag ecc
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 23:24   #7
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
ciao, è una semplice pagina html , rispetta quello scheletro perchè sono io a generarla
ho risolto cosi
Codice:
public static String[] parser(String pHtml) {
Pattern p = Pattern.compile("<body>+.*|\\t* +</body>");
Matcher m = p.matcher(pHtml);
String line="";
String app="";
while (m.find()) {
     app = m.group();
     line+=app;
}

String[] pageSplit = line.split("<br>");

return pageSplit;
}
a funzionare funziona anche se si può fare di meglio penso(sicuramente)...nel vettore pageSplit ho i dati che mi interessano..anche se la prima e l ultima stringa sono rispettivamente <body> e </body><html> Non considerandole va bene il risultato. Se avete proposte migliori sono ben accette
Grazie.
__________________

Ultima modifica di Wall4c3 : 27-07-2009 alle 23:27.
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 28-07-2009, 09:22   #8
:.Blizzard.:
Senior Member
 
L'Avatar di :.Blizzard.:
 
Iscritto dal: Jan 2006
Città: Perugia - San Benedetto del Tronto
Messaggi: 348
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?

Hai provato con la classe String Tokenizer? A me è tornata molto utile quando ho fatto un programma per disegnare funzioni.

http://java.sun.com/j2se/1.4.2/docs/...Tokenizer.html
:.Blizzard.: è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Dreame Aqua10 Ultra Roller, la pulizia di casa con un rullo Dreame Aqua10 Ultra Roller, la pulizia di casa c...
Recensione Realme 15 Pro Game Of Thrones: un vero cimelio tech per pochi eletti Recensione Realme 15 Pro Game Of Thrones: un ver...
GIGABYTE GAMING A16, Raptor Lake e RTX 5060 Laptop insieme per giocare al giusto prezzo GIGABYTE GAMING A16, Raptor Lake e RTX 5060 Lapt...
iPhone 17 Pro: più di uno smartphone. È uno studio di produzione in formato tascabile iPhone 17 Pro: più di uno smartphone. &Eg...
Intel Panther Lake: i processori per i notebook del 2026 Intel Panther Lake: i processori per i notebook ...
Panasonic Lumix S9: disponibile in quatt...
Nikon presenta due obiettivi: NIKKOR Z D...
Horizon vs Light of Motiram, si entra ne...
Atari rilancia Intellivision Sprint e fa...
Leapmotor lancia in Italia il SUV elettr...
QNAP punta sempre più in alto con...
Scandalo ibride plug-in: consumano come ...
L'intelligenza artificiale fa sempre pi&...
Oracle dal punto di vista dell’Europa: l...
James Dyson Award 2025: dall'accessibili...
Xiaomi: gli smartphone con display poste...
Final Fantasy 7 Remake Part 3 offrir&agr...
Chery presenta Omoda 4, da benzina a ele...
TSMC alza i prezzi: Qualcomm e MediaTek ...
Una Offline Room per aiutare gli student...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 00:35.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v