Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto
Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto
Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine, arricchita da una simmetria interna curata nei minimi dettagli. Il sistema Glyph si evolve, riducendosi nelle dimensioni ma aumentando l'utilità quotidiana grazie a nuove funzioni software integrate e notifiche visive. Ecco tutti i dettagli nella recensione completa
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale
Nelle ultime settimane abbiamo provato la Corsair Vanguard Air 99 Wireless, una tastiera tecnicamente da gaming, ma che in realtà offre un ampio ventaglio di possibilità anche al di fuori delle sessioni di gioco. Flessibilità e funzionalità sono le parole d'ordine di una periferica che si rivolge a chi cerca un prodotto capace di adattarsi a ogni esigenza e ogni piattaforma
Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio
Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio
DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare al meglio le superfici di casa minimizzando i tempi di lavoro. Un robot completo che riesce anche ad essere sottile e garantire automazione ed efficienza nelle operazioni di pulizia di casa
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 27-07-2009, 15:24   #1
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
[JAVA] Semplice parser di un file html

ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?
__________________
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 15:29   #2
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?
Se sei certo che attorno ai dati che ti servono hai tag ben identificabili.. puoi andare di espressioni regolari (se le sai usare) oppure prova a far le cose semplici usando banali funzioni su stringhe.
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 15:36   #3
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
si..ho sempre il tag <br> , provo a vedere come funzionano in java le espressioni regolari ( so cosa sono ).
Grazie
__________________
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 15:39   #4
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
si..ho sempre il tag <br> , provo a vedere come funzionano in java le espressioni regolari ( so cosa sono ).
Grazie


occhio al classico problema che devi escapare due volte il backslash
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 19:20   #5
^TiGeRShArK^
Senior Member
 
L'Avatar di ^TiGeRShArK^
 
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
se le pagine sono xhtml puoi anche usare uno degli n parser xml a disposizione, come jdom ad esempio....
__________________
^TiGeRShArK^ è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 20:47   #6
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da ^TiGeRShArK^ Guarda i messaggi
se le pagine sono xhtml puoi anche usare uno degli n parser xml a disposizione, come jdom ad esempio....
sì.. ma è difficile trovare pagine che rispettano perfettamente apertura/chiusura dei tag ecc
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 28-07-2009, 00:24   #7
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
ciao, è una semplice pagina html , rispetta quello scheletro perchè sono io a generarla
ho risolto cosi
Codice:
public static String[] parser(String pHtml) {
Pattern p = Pattern.compile("<body>+.*|\\t* +</body>");
Matcher m = p.matcher(pHtml);
String line="";
String app="";
while (m.find()) {
     app = m.group();
     line+=app;
}

String[] pageSplit = line.split("<br>");

return pageSplit;
}
a funzionare funziona anche se si può fare di meglio penso(sicuramente)...nel vettore pageSplit ho i dati che mi interessano..anche se la prima e l ultima stringa sono rispettivamente <body> e </body><html> Non considerandole va bene il risultato. Se avete proposte migliori sono ben accette
Grazie.
__________________

Ultima modifica di Wall4c3 : 28-07-2009 alle 00:27.
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 28-07-2009, 10:22   #8
:.Blizzard.:
Senior Member
 
L'Avatar di :.Blizzard.:
 
Iscritto dal: Jan 2006
Città: Perugia - San Benedetto del Tronto
Messaggi: 348
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?

Hai provato con la classe String Tokenizer? A me è tornata molto utile quando ho fatto un programma per disegnare funzioni.

http://java.sun.com/j2se/1.4.2/docs/...Tokenizer.html
:.Blizzard.: è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Recensione Nothing Phone 4(a): sempre iconico ma...
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale Corsair Vanguard Air 99 Wireless: non si era mai...
Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lav...
Recensione Samsung Galaxy S26 Ultra: finalmente qualcosa di nuovo Recensione Samsung Galaxy S26 Ultra: finalmente ...
Diablo II Resurrected: il nuovo DLC Reign of the Warlock Diablo II Resurrected: il nuovo DLC Reign of the...
NVIDIA: raggiungeremo almeno 1 triliardo...
Lenovo presenta workstation e server con...
Nuova BMW i3: la Serie 3 elettrica debut...
NVIDIA torna in Cina: stretto un accordo...
Vibe coding nel mirino di Apple: ecco le...
Smart TV QLED 50'' a un super prezzo: 4K...
Horizon Worlds lascia i visori Quest: Me...
Lexar compie 30 anni e cambia le regole ...
Questo SSD fornisce memoria aggiuntiva a...
PlayStation Portal si aggiorna: arriva l...
Akamai, le API nel mirino dei cyber atta...
Spider-Man: Brand New Day, finalmente on...
La serie TV di Hitman è ufficialmente fe...
"Grazie e arrivederci": Sam Al...
Il CEO di Take-Two critica l'idea che l'...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 19:04.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v