Torna indietro   Hardware Upgrade Forum > Software > Programmazione

KTC H27E6 a 300Hz e 1ms: come i rivali ma a metà prezzo
KTC H27E6 a 300Hz e 1ms: come i rivali ma a metà prezzo
KTC lancia il nuovo monitor gaming H27E6, un modello da 27 pollici che promette prestazioni estreme grazie al pannello Fast IPS con risoluzione 2K QHD (2560x1440). Il monitor si posiziona come una scelta cruciale per gli appassionati di eSport e i professionisti creativi, combinando una frequenza di aggiornamento di 300Hz e un tempo di risposta di 1ms con un'eccezionale fedeltà cromatica
Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Realizzato da Lenovo e installato presso il Cineca di Casalecchio di Reno, Pitagora offre circa 44 PFlop/s di potenza di calcolo ed è dedicato alla simulazione della fisica del plasma e allo studio dei materiali avanzati per la fusione, integrandosi nell’ecosistema del Tecnopolo di Bologna come infrastruttura strategica finanziata da EUROfusion e gestita in collaborazione con ENEA
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Rullo di lavaggio dei pavimenti abbinato a un potente motore da 28.000 Pa e a bracci esterni che si estendono: queste, e molte altre, le caratteristiche tecniche di Z60 Ultra Roller Complete, l'ultimo robot di Mova che pulisce secondo le nostre preferenze oppure lasciando far tutto alla ricca logica di intelligenza artificiale integrata
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 27-07-2009, 15:24   #1
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
[JAVA] Semplice parser di un file html

ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?
__________________
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 15:29   #2
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?
Se sei certo che attorno ai dati che ti servono hai tag ben identificabili.. puoi andare di espressioni regolari (se le sai usare) oppure prova a far le cose semplici usando banali funzioni su stringhe.
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 15:36   #3
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
si..ho sempre il tag <br> , provo a vedere come funzionano in java le espressioni regolari ( so cosa sono ).
Grazie
__________________
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 15:39   #4
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
si..ho sempre il tag <br> , provo a vedere come funzionano in java le espressioni regolari ( so cosa sono ).
Grazie


occhio al classico problema che devi escapare due volte il backslash
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 19:20   #5
^TiGeRShArK^
Senior Member
 
L'Avatar di ^TiGeRShArK^
 
Iscritto dal: Jul 2002
Città: Reggio Calabria -> London
Messaggi: 12112
se le pagine sono xhtml puoi anche usare uno degli n parser xml a disposizione, come jdom ad esempio....
__________________
^TiGeRShArK^ è offline   Rispondi citando il messaggio o parte di esso
Old 27-07-2009, 20:47   #6
zulutown
Senior Member
 
Iscritto dal: Jul 2009
Messaggi: 1161
Quote:
Originariamente inviato da ^TiGeRShArK^ Guarda i messaggi
se le pagine sono xhtml puoi anche usare uno degli n parser xml a disposizione, come jdom ad esempio....
sì.. ma è difficile trovare pagine che rispettano perfettamente apertura/chiusura dei tag ecc
__________________
Web2.0 Guides And Tutorials SLR: Canon 6D ZOOM: Canon EF 24-105mm f/4L IS USM FISSI: - Canon EF 28mm f/1.8 USM - Canon EF 40mm f/2.8 STM - Canon EF 50mm f/1.4 USM - Canon EF 100mm f/2 USM - Canon EF 200mm f/2.8L USM II ALTRO: Canon 430 EX II
zulutown è offline   Rispondi citando il messaggio o parte di esso
Old 28-07-2009, 00:24   #7
Wall4c3
Junior Member
 
Iscritto dal: Aug 2006
Messaggi: 18
ciao, è una semplice pagina html , rispetta quello scheletro perchè sono io a generarla
ho risolto cosi
Codice:
public static String[] parser(String pHtml) {
Pattern p = Pattern.compile("<body>+.*|\\t* +</body>");
Matcher m = p.matcher(pHtml);
String line="";
String app="";
while (m.find()) {
     app = m.group();
     line+=app;
}

String[] pageSplit = line.split("<br>");

return pageSplit;
}
a funzionare funziona anche se si può fare di meglio penso(sicuramente)...nel vettore pageSplit ho i dati che mi interessano..anche se la prima e l ultima stringa sono rispettivamente <body> e </body><html> Non considerandole va bene il risultato. Se avete proposte migliori sono ben accette
Grazie.
__________________

Ultima modifica di Wall4c3 : 28-07-2009 alle 00:27.
Wall4c3 è offline   Rispondi citando il messaggio o parte di esso
Old 28-07-2009, 10:22   #8
:.Blizzard.:
Senior Member
 
L'Avatar di :.Blizzard.:
 
Iscritto dal: Jan 2006
Città: Perugia - San Benedetto del Tronto
Messaggi: 348
Quote:
Originariamente inviato da Wall4c3 Guarda i messaggi
ciao a tutti!
Mi serviva un aiuto..devo realizzare un semplice parser html. le pagine html sono del tipo

<html>
<head> </head>
<body>

<br> Nome1
<br> Nome2
etc.
</body>
</html>

a me serviva fare un parser in modo tale da restituire Nome1 , Nome2 etc.
qualcuno ha qualche idea?

Hai provato con la classe String Tokenizer? A me è tornata molto utile quando ho fatto un programma per disegnare funzioni.

http://java.sun.com/j2se/1.4.2/docs/...Tokenizer.html
:.Blizzard.: è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


KTC H27E6 a 300Hz e 1ms: come i rivali ma a metà prezzo KTC H27E6 a 300Hz e 1ms: come i rivali ma a met&...
Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare Cineca inaugura Pitagora, il supercomputer Lenov...
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA Mova Z60 Ultra Roller Complete: pulisce bene gra...
Renault Twingo E-Tech Electric: che prezzo! Renault Twingo E-Tech Electric: che prezzo!
Il cuore digitale di F1 a Biggin Hill: l'infrastruttura Lenovo dietro la produzione media Il cuore digitale di F1 a Biggin Hill: l'infrast...
Siemens e NVIDIA uniscono le forze: arri...
Ricarica veloce e durata batteria: miti ...
Le "navi volanti" di Candela a...
Bambini su misura? Il caso della startup...
Iliad porta le SIM Express in edicola: r...
Offerte Amazon sui TV Mini LED Hisense 2...
Il silenzio digitale che fa male: come i...
Il responsabile del programma Cybertruck...
Domanda alle stelle per SSD e RAM: in Gi...
Zuckerberg vuole eliminare tutte le mala...
Otto suicidi, un solo chatbot: si moltip...
'Windows fa schifo' perché ha dim...
Tesla aggiorna il camion Semi, e sposta ...
Come funziona la carta Klarna: tre livel...
I Funko Pop potrebbero sparire per sempr...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 16:32.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v