Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Realizzato da Lenovo e installato presso il Cineca di Casalecchio di Reno, Pitagora offre circa 44 PFlop/s di potenza di calcolo ed è dedicato alla simulazione della fisica del plasma e allo studio dei materiali avanzati per la fusione, integrandosi nell’ecosistema del Tecnopolo di Bologna come infrastruttura strategica finanziata da EUROfusion e gestita in collaborazione con ENEA
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Rullo di lavaggio dei pavimenti abbinato a un potente motore da 28.000 Pa e a bracci esterni che si estendono: queste, e molte altre, le caratteristiche tecniche di Z60 Ultra Roller Complete, l'ultimo robot di Mova che pulisce secondo le nostre preferenze oppure lasciando far tutto alla ricca logica di intelligenza artificiale integrata
Renault Twingo E-Tech Electric: che prezzo!
Renault Twingo E-Tech Electric: che prezzo!
Renault annuncia la nuova vettura compatta del segmento A, che strizza l'occhio alla tradizione del modello abbinandovi una motorizzazione completamente elettrica e caratteristiche ideali per i tragitti urbani. Renault Twingo E-Tech Electric punta su abitabilità, per una lunghezza di meno di 3,8 metri, abbinata a un prezzo di lancio senza incentivi di 20.000€
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 04-07-2010, 00:15   #1
fak3
Senior Member
 
L'Avatar di fak3
 
Iscritto dal: Jan 2008
Città: Bologna
Messaggi: 1095
[Java] Estrazione testo contenuto in tag da file XML

Salve, avrei bisogno di un consiglio per un piccolo programma che devo realizzare. Devo prendere in input un file XML che quindi conterrà i suoi vari tag, tipo <autore>, <versione>... il tag che mi interessa, che contiene del normalissimo testo, punteggiatura inclusa, è <body>. Devo estrarre il testo contenuto in body e restituire in output un conteggio della frequenza con cui si ripete ogni singola parola del testo.
Ho già scritto del codice che mi permette, dato in input un semplice file di testo, di contare le frequenze delle parole (con HashTable è stato molto semplice), ma il mio problema viene nel trattare questo file XML per estrarre il testo contenuto in body... non so nemmeno da dove iniziare.
Come avrete capito con Java non ho molta esperienza, spero abbiate qualche buon consiglio per me. Grazie.
__________________
Ho avuto il piacere di fare affari con Johnny O\', kinderboy, Sacro Gemini, SUPER_USER, lanma, ilcalmo, stetti8five, crespo80 (x2), System Shock, Sinclair63, kaetan, ellebielle, speedy29, .DeepRed., Sawato Onizuka, daeron666, spl, BugoA7X, h.war, kamoscio, zac79x, Zeratul, C4nino e blumare.

Ultima modifica di fak3 : 04-07-2010 alle 00:24.
fak3 è offline   Rispondi citando il messaggio o parte di esso
Old 04-07-2010, 02:10   #2
nalsk
Member
 
L'Avatar di nalsk
 
Iscritto dal: Jun 2009
Messaggi: 38
Java fornisce assieme alla JDK degli strumenti in grado di operare in modo efficace sui file XML, la risposta alle tue domande si chiama JAXB tramite questo package dovrai eseguire un unmarshalling.

Il package di jaxb è javax.xml.bind

Una possibile implementazione sarebbe:

- Inizializzare un oggetto di classe JAXBContext tramite il metodo newInstance();

- Inizializzare un oggetto di classe Unmarshaller tramite il metodo dell'oggetto JAXBContext createUnmarshaller();

- Inizializzare un oggetto di classe JAXBElement tipizzato all'oggetto che vuoi leggere (es. String) ed invocare il metodo unmarshall(); sull'oggetto Unmarshaller precedentemente istanziato indicandogli il file di input tramite un costruttore StreamSource("file.xml"); e dandogli come secondo argomento il campo "class" dell'oggetto che dev'essere letto.

- Infine recuperarti l'oggetto che volevi leggere dall'oggetto JAXBElement tramite il metodo .getValue();

Scusa la spiegazione complicata ma sono un pò assonnato.. è molto più semplice di quanto sembra.. ti scrivo un piccolo codice di esempio:

Codice:
JAXBContext jaxbc = JAXBContext.newInstance("mio.package.programma");

Unmarshaller unmarsh = jaxbc.createUnmarshaller();

JAXBElement<String> element = unmarsh.unmarshal(new StreamSource("file.xml"), String.class);

String output = element.getValue();
IMPORTANTE: nel tuo caso ovviamente non dovrai utilizzare un oggetto String ma un oggetto di classe creata da te che sia compatibile con la struttura del file xml.

Spero di essere stato almeno un pochino d'aiuto..in ogni caso dai uno sguardo alla documentazione java
nalsk è offline   Rispondi citando il messaggio o parte di esso
Old 04-07-2010, 02:29   #3
fak3
Senior Member
 
L'Avatar di fak3
 
Iscritto dal: Jan 2008
Città: Bologna
Messaggi: 1095
Ti ringrazio tantissimo, alla fine stavo tentando di seguire degli esempi con DOM ma capendoci veramente poco, questo package invece mi sembra arrivi dritto al punto. Vado a studiarmelo e grazie ancora.
__________________
Ho avuto il piacere di fare affari con Johnny O\', kinderboy, Sacro Gemini, SUPER_USER, lanma, ilcalmo, stetti8five, crespo80 (x2), System Shock, Sinclair63, kaetan, ellebielle, speedy29, .DeepRed., Sawato Onizuka, daeron666, spl, BugoA7X, h.war, kamoscio, zac79x, Zeratul, C4nino e blumare.
fak3 è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare Cineca inaugura Pitagora, il supercomputer Lenov...
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA Mova Z60 Ultra Roller Complete: pulisce bene gra...
Renault Twingo E-Tech Electric: che prezzo! Renault Twingo E-Tech Electric: che prezzo!
Il cuore digitale di F1 a Biggin Hill: l'infrastruttura Lenovo dietro la produzione media Il cuore digitale di F1 a Biggin Hill: l'infrast...
DJI Osmo Mobile 8: lo stabilizzatore per smartphone con tracking multiplo e asta telescopica DJI Osmo Mobile 8: lo stabilizzatore per smartph...
Nasce l'albo degli influencer 'rilevanti...
Il Digital Networks Act è stato r...
ASUS ROG ha lanciato due nuovi monitor d...
I nuovi iPhone 18 Pro potrebbero present...
Una parte dei Galaxy S26 avrà chi...
Amazon permetterà agli autori ind...
Il caso Zuckerberg a Palo Alto: una scuo...
Texas contro Roblox: il procuratore gene...
Offerte auto da urlo su Amazon: da CarPl...
Windows 11 26H1 in arrivo fra pochi mesi...
Un Black Friday continuo a rilascio lent...
Redmi Pad Pro da 12,1" 2560x2600 pi...
Tesla Roadster rinviata (di nuovo): ora ...
Il nuovo TV premium 2025 Samsung OLED 4K...
Ecco una TV QLED da 55'' che costa 303€:...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 20:36.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v