Torna indietro   Hardware Upgrade Forum > Software > Programmazione

AWS re:Invent 2025: inizia l'era dell'AI-as-a-Service con al centro gli agenti
AWS re:Invent 2025: inizia l'era dell'AI-as-a-Service con al centro gli agenti
A re:Invent 2025, AWS mostra un’evoluzione profonda della propria strategia: l’IA diventa una piattaforma di servizi sempre più pronta all’uso, con agenti e modelli preconfigurati che accelerano lo sviluppo, mentre il cloud resta la base imprescindibile per governare dati, complessità e lock-in in uno scenario sempre più orientato all’hybrid cloud
Cos'è la bolla dell'IA e perché se ne parla
Cos'è la bolla dell'IA e perché se ne parla
Si parla molto ultimamente di "bolla dell'intelligenza artificiale", ma non è sempre chiaro perché: l'IA è una tecnologia molto promettente e che ha già cambiato molte cose dentro e fuori le aziende, ma ci sono enormi aspettative che stanno gonfiando a dismisura i valori delle azioni e distorcendo il mercato. Il che, com'è facile intuire, può portare a una ripetizione della "bolla dotcom", e forse anche di quella dei mutui subprime. Vediamo perché
BOOX Palma 2 Pro in prova: l'e-reader diventa a colori, e davvero tascabile
BOOX Palma 2 Pro in prova: l'e-reader diventa a colori, e davvero tascabile
BOOX Palma 2 Pro è l'ultima evoluzione della gamma Palma. Ma di cosa si tratta? In breve è un dispositivo e-ink da 6,13 pollici che sfida le convenzioni con un display Kaleido 3 a colori, supporto per stilo InkSense Plus, connettività 5G solo dati e alimentato dal sistema operativo Android 15. Con queste caratteristica si configura come qualcosa in più di un semplice e-reader
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 26-02-2013, 21:12   #1
Tecnomiky
Member
 
L'Avatar di Tecnomiky
 
Iscritto dal: Jan 2009
Messaggi: 137
[JAVA] Espressioni regolari stile xml

Sto creando un programma per gestire gli ebook, per gestirli creo un file txt con il nome dell'ebook.

Il file dove contenere qualcosa del genere:

Codice:
<title>Mio libro</title><year>2012</year><home>Mia casa</home>
che espressione regolare dovrei usare per recuperare il contenuto tra <title></title> o tra <year></year>.

Ringrazio tutte le persone che mi aiuteranno.
__________________
My web site
michelegiorgio.eu
Tecnomiky è offline   Rispondi citando il messaggio o parte di esso
Old 26-02-2013, 21:22   #2
The_ouroboros
Senior Member
 
L'Avatar di The_ouroboros
 
Iscritto dal: May 2007
Città: Milano
Messaggi: 7103
cerca qualche lib gia pronta.
Estrarre da tag con sole regex è pericoloso..
__________________
Apple Watch Ultra + iPhone 15 Pro Max + Rog Ally + Legion Go
The_ouroboros è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 05:23   #3
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Scusa la fretta, ma oggi l'impianto sta facendo i capricci e devo fare una modifica molto pesante.
Per questo motivo, la regex che ti propongo l'ho provata solo usando vim, non Java:

Codice:
\(<title>\)\([^<]*\)\(<\/title>\)
In questa regex do' per scontato che il simbolo "<" non possa comparire nel titolo. Mi sembra ragionevole, in quanto se realmente comparisse dovrebbe essere codificata, per esempio, con &lt;

Questa regex cerca le stringhe in formato <title>...</title> e suddivide la stringa trovata in 3 gruppi: il primo gruppo conterra' <title>, il secondo il titolo ed il terzo </title>

Per quanto ne so, Java puo' manipolare i gruppi (non l'ho mai provato, pero'), basta guardare qui:
http://docs.oracle.com/javase/tutori...ex/groups.html

Puoi quindi estrarre i dati dal secondo gruppo
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 09:36   #4
Tecnomiky
Member
 
L'Avatar di Tecnomiky
 
Iscritto dal: Jan 2009
Messaggi: 137
Ho provato il codice di sottovento ma non funziona, comunque lo ringrazio per l'aiuto.
__________________
My web site
michelegiorgio.eu

Ultima modifica di Tecnomiky : 27-02-2013 alle 09:43.
Tecnomiky è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 10:30   #5
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da Tecnomiky Guarda i messaggi
Ho provato il codice di sottovento ma non funziona, comunque lo ringrazio per l'aiuto.
Va aggiustata, ovviamente. In particolare i backslash.
Se non hai fretta lo posso fare stasera, quando torno a casa
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 13:29   #6
The_ouroboros
Senior Member
 
L'Avatar di The_ouroboros
 
Iscritto dal: May 2007
Città: Milano
Messaggi: 7103
Parsing XML with REGEX in Java
__________________
Apple Watch Ultra + iPhone 15 Pro Max + Rog Ally + Legion Go
The_ouroboros è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 13:37   #7
Vincenzo1968
Bannato
 
Iscritto dal: Mar 2008
Città: Villabate(PA)
Messaggi: 2515
Che casino 'ste regexp in Java!

Secondo me è meglio scriversi un bel pushdown automaton ad hoc.

Il codice viene un po' più lungo ma più leggibile, ma più efficiente.
Vincenzo1968 è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 13:56   #8
The_ouroboros
Senior Member
 
L'Avatar di The_ouroboros
 
Iscritto dal: May 2007
Città: Milano
Messaggi: 7103
non tantissimo.
Il fatto è che solo in Perl sono una parte del linguaggio.
Cmq anche il link consiglia di usare librerie apposite.
Il parsing xml è insidioso con regex
__________________
Apple Watch Ultra + iPhone 15 Pro Max + Rog Ally + Legion Go
The_ouroboros è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 13:58   #9
VICIUS
Senior Member
 
L'Avatar di VICIUS
 
Iscritto dal: Oct 2001
Messaggi: 11471
Quote:
Originariamente inviato da Tecnomiky Guarda i messaggi
Ho provato il codice di sottovento ma non funziona, comunque lo ringrazio per l'aiuto.
Prova questo. Dovrebbe andare:
Codice:
import java.util.regex.Pattern;
import java.util.regex.Matcher;

public class Main {

    public static void main(String[] args) {
        String xml = "questa è la stringa xml con <title>Titolo</title> dentro";

        Pattern TITLE = Pattern.compile("<title>([^<]+)</title>");

        Matcher matcher = TITLE.matcher(xml);
        while (matcher.find()) {
            System.out.println("Titolo: " + matcher.group(1));
        }
    }
}
Ho tolto le parentesi attorno a <title> e </title> perché se non si deve catturare il testo o raggruppare non serve metterle. Poi ho sostituito il * con un + così cattura solo tag che hanno testo al loro interno.
VICIUS è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 14:09   #10
Vincenzo1968
Bannato
 
Iscritto dal: Mar 2008
Città: Villabate(PA)
Messaggi: 2515
Praticamente bisognerà confrontare i tempi della soluzione proposta da Vicius col mio pushdown automaton.

Secondo me vince l'automa:

http://swtch.com/~rsc/regexp/regexp1.html

Naturalmente il confronto andrà fatto su un file di grosse dimensioni(o su tantissimi file di piccole-medie dimensioni).

Ne verrà fuori una sorta di mini-contest.
Vincenzo1968 è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 14:11   #11
Tecnomiky
Member
 
L'Avatar di Tecnomiky
 
Iscritto dal: Jan 2009
Messaggi: 137
Ho provato ma mi esce questo
Codice:
<title>Mio libro</title>
e la stringa contiene questo:
Codice:
<title>Mio libro</title><year>2012</year><home>Mia casa</home>
__________________
My web site
michelegiorgio.eu
Tecnomiky è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 14:28   #12
VICIUS
Senior Member
 
L'Avatar di VICIUS
 
Iscritto dal: Oct 2001
Messaggi: 11471
Quote:
Originariamente inviato da Tecnomiky Guarda i messaggi
Ho provato ma mi esce questo
Codice:
<title>Mio libro</title>
Se hai usato il codice che ho postato è impossibile che ritorni la stringa completa. Il capturing group è attorno al solo contenuto. NON può ritornarti anche i tag.

Posta il codice completo che hai usato e poi vediamo cosa hai sbagliato.
VICIUS è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 14:39   #13
Vincenzo1968
Bannato
 
Iscritto dal: Mar 2008
Città: Villabate(PA)
Messaggi: 2515
http://expat.sourceforge.net/

http://www.xml.com/pub/a/1999/09/expat/index.html
Vincenzo1968 è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 14:45   #14
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da VICIUS Guarda i messaggi
Ho tolto le parentesi attorno a <title> e </title> perché se non si deve catturare il testo o raggruppare non serve metterle. Poi ho sostituito il * con un + così cattura solo tag che hanno testo al loro interno.
Si, sono un ragazzo ridondante
Cmq sono d'accordo, la regex deve funzionare cosi' com'e'.

@Tecnomiky - hai copiato correttamente il codice? Sembra che ti sia dimenticato di mettere l'1 nell'istruzione

Codice:
System.out.println("Titolo: " + matcher.group(1));
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 14:45   #15
Tecnomiky
Member
 
L'Avatar di Tecnomiky
 
Iscritto dal: Jan 2009
Messaggi: 137
Non avevo aggiunto l' 1 dentro alla parentesi del matcher.group
__________________
My web site
michelegiorgio.eu
Tecnomiky è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 14:50   #16
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da Vincenzo1968 Guarda i messaggi
Praticamente bisognerà confrontare i tempi della soluzione proposta da Vicius col mio pushdown automaton.

Secondo me vince l'automa:

http://swtch.com/~rsc/regexp/regexp1.html

Naturalmente il confronto andrà fatto su un file di grosse dimensioni(o su tantissimi file di piccole-medie dimensioni).

Ne verrà fuori una sorta di mini-contest.
Una regexpr praticamente E' la specifica di un automa!
Dunque, per fare un confronto dovresti scrivere un software che PRIMA accetti in ingresso un automa qualunque, specificato nel modo che vuoi tu, e poi ne confronti i tempi. Cosi' puoi vedere quanto le prestazioni dipendono dall'implementazione e non da restrizioni che hai imposto da una parte e non dall'altra
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 14:56   #17
Tecnomiky
Member
 
L'Avatar di Tecnomiky
 
Iscritto dal: Jan 2009
Messaggi: 137
Comunque ho risolto grazie all'aiuto di sottovento. Si può chiudere
__________________
My web site
michelegiorgio.eu
Tecnomiky è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 16:10   #18
Vincenzo1968
Bannato
 
Iscritto dal: Mar 2008
Città: Villabate(PA)
Messaggi: 2515
Quote:
Originariamente inviato da sottovento Guarda i messaggi
Una regexpr praticamente E' la specifica di un automa!
Dunque, per fare un confronto dovresti scrivere un software che PRIMA accetti in ingresso un automa qualunque, specificato nel modo che vuoi tu, e poi ne confronti i tempi. Cosi' puoi vedere quanto le prestazioni dipendono dall'implementazione e non da restrizioni che hai imposto da una parte e non dall'altra
Si ma spesso sono implementate in maniera non ottimale. Vedi articolo postato

Io dico che con una implementazione ad hoc, senza dunque dover creare al volo l'automa per una generica regexp, il programma(in Java stesso, non in C) sarebbe più efficiente.

Vincenzo1968 è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 16:11   #19
Vincenzo1968
Bannato
 
Iscritto dal: Mar 2008
Città: Villabate(PA)
Messaggi: 2515
Quote:
Originariamente inviato da Tecnomiky Guarda i messaggi
Comunque ho risolto grazie all'aiuto di sottovento. Si può chiudere
Ah ok.
Vincenzo1968 è offline   Rispondi citando il messaggio o parte di esso
Old 27-02-2013, 16:41   #20
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da Vincenzo1968 Guarda i messaggi
Si ma spesso sono implementate in maniera non ottimale. Vedi articolo postato

Io dico che con una implementazione ad hoc, senza dunque dover creare al volo l'automa per una generica regexp, il programma(in Java stesso, non in C) sarebbe più efficiente.

Ho capito di non aver capito: se voglio cercare una determinata stringa data in ingresso dall'utente, e tale stringa e' una regexp, cosa proponi di fare?
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


AWS re:Invent 2025: inizia l'era dell'AI-as-a-Service con al centro gli agenti AWS re:Invent 2025: inizia l'era dell'AI-as-a-Se...
Cos'è la bolla dell'IA e perché se ne parla Cos'è la bolla dell'IA e perché se...
BOOX Palma 2 Pro in prova: l'e-reader diventa a colori, e davvero tascabile BOOX Palma 2 Pro in prova: l'e-reader diventa a ...
FRITZ!Repeater 1700 estende la rete super-veloce Wi-Fi 7 FRITZ!Repeater 1700 estende la rete super-veloce...
Fondazione Chips-IT, l'Italia alla riscossa nei chip. Il piano e la partnership EssilorLuxottica Fondazione Chips-IT, l'Italia alla riscossa nei ...
E se fosse l'UE a far scoppiare la bolla...
Non solo sport: su DAZN arrivano i canal...
Apple e Samsung dominano la Top 10 degli...
Ring Intercom Audio costa solo 24€ e sta...
4 portatili tuttofare in super sconto: s...
Amazfit Active 2 a 74,99€ è imper...
10 anni di DirectX 12: Microsoft festegg...
Bose QuietComfort Ultra (2ª Gen) scendon...
Malware su un traghetto italiano: indagi...
Virtualizzazione: arriva Nutanix with Fl...
Apple applica commissioni ancora troppo ...
AGCOM: il colpo di grazia al telemarketi...
Bari punta sull'elettrico: arrivano 42 a...
Prezzi in salita di 200 dollari in 6 ann...
Google introduce CC: l'AI che riassume l...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 08:53.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v