Torna indietro   Hardware Upgrade Forum > Software > Programmazione

FUJIFILM X-T30 III, la nuova mirrorless compatta
FUJIFILM X-T30 III, la nuova mirrorless compatta
FUJIFILM X-T30 III è la nuvoa fotocamera mirrorless pensata per chi si avvicina alla fotografia e ricerca una soluzione leggera e compatta, da avere sempre a disposizione ma che non porti a rinunce quanto a controllo dell'immagine.
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati
Da Las Vegas, la visione di Larry Ellison e la concretezza di Clay Magouyrk definiscono la nuova traiettoria di Oracle: portare l’intelligenza artificiale ai dati, non i dati all’intelligenza, costruendo un’infrastruttura cloud e applicativa in cui gli agenti IA diventano parte integrante dei processi aziendali, fino al cuore delle imprese europee
Micron e millisecondi: la piattaforma ServiceNow guida l'infrastruttura IT di Aston Martin F1
Micron e millisecondi: la piattaforma ServiceNow guida l'infrastruttura IT di Aston Martin F1
Dalla precisione estrema dei componenti alla gestione digitale dei processi: come la piattaforma ServiceNow consente ad Aston Martin Aramco Formula One Team di ottimizzare risorse IT e flussi operativi in un ambiente dove ogni millesimo di secondo conta
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 12-01-2015, 20:32   #1
sharkkk
Member
 
L'Avatar di sharkkk
 
Iscritto dal: Oct 2013
Messaggi: 158
ESPRESSIONI REGOLARI - info

Sto cercando di estrapolare dei dati tramite query in un database "speciale" e per filtrare i dati devo per forza usare delle espressioni regolari.

Se voglio cercare Roma attualmente con (\\W|^)Rome(\\W|$) mi trova cose come: Basilica_dei_Santi_Apostoli_(Rome), Egeria_(Rome), ..., e poi finalmente Rome.

Il problema è che mi trova molte cose che non voglio come Basilica_dei_Santi_Apostoli_(Rome) e mi trova Rome al 200esimo posto, mentre Basilica è il primo risultato.

Come posso fare per trovare Rome per primo tramite espressione regolare?
sharkkk è offline   Rispondi citando il messaggio o parte di esso
Old 12-01-2015, 22:01   #2
wingman87
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2776
Concettualmente mi sembra sbagliato quello che vuoi fare. Vorresti ordinare i risultati della ricerca ma lo vuoi fare con un linguaggio fatto per filtrare. Ordinare != Filtrare
Non puoi post-processare i risultati ordinandoli ad esempio per lunghezza?
Oppure il metodo che usi per interrogare questo database "speciale" non offre qualcosa per specificare in qualche modo l'ordinamento?
wingman87 è online   Rispondi citando il messaggio o parte di esso
Old 12-01-2015, 22:19   #3
sharkkk
Member
 
L'Avatar di sharkkk
 
Iscritto dal: Oct 2013
Messaggi: 158
Quote:
Originariamente inviato da wingman87 Guarda i messaggi
Concettualmente mi sembra sbagliato quello che vuoi fare. Vorresti ordinare i risultati della ricerca ma lo vuoi fare con un linguaggio fatto per filtrare. Ordinare != Filtrare
Non puoi post-processare i risultati ordinandoli ad esempio per lunghezza?
Oppure il metodo che usi per interrogare questo database "speciale" non offre qualcosa per specificare in qualche modo l'ordinamento?
è un 3store, sul quale vengono fatte query SPARQL del tipo:
Codice:
		SELECT DISTINCT *
		FROM <http://dbpedia.org>
		where {
		[]  foaf:isPrimaryTopicOf ?wikiID.
		FILTER (regex(?wikiID, "(\W|^)''' + AJAX_data + '''(\W|$)")) . 
			}
		ORDER BY ?wikiID
		limit 50
in questo caso specifico vengono presi tutti gli uri di wikipedia che contengono all'interno la stringa cercata (AJAX_data).
Pero se cercassi Roma, troverei non solo l'uri di wikipedia di Roma, ma tutti quelli che hanno all'interno la parola Roma, e Roma stessa sarebbe presente dopo tanti risultati.
sharkkk è offline   Rispondi citando il messaggio o parte di esso
Old 13-01-2015, 09:13   #4
wingman87
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2776
Molto interessante questo progetto! Comunque riguardo alla tua domanda: non puoi modificare il resto della query? Solo la regex?
wingman87 è online   Rispondi citando il messaggio o parte di esso
Old 13-01-2015, 11:33   #5
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da sharkkk Guarda i messaggi
Sto cercando di estrapolare dei dati tramite query in un database "speciale" e per filtrare i dati devo per forza usare delle espressioni regolari.

Se voglio cercare Roma attualmente con (\\W|^)Rome(\\W|$) mi trova cose come: Basilica_dei_Santi_Apostoli_(Rome), Egeria_(Rome), ..., e poi finalmente Rome.

Il problema è che mi trova molte cose che non voglio come Basilica_dei_Santi_Apostoli_(Rome) e mi trova Rome al 200esimo posto, mentre Basilica è il primo risultato.

Come posso fare per trovare Rome per primo tramite espressione regolare?
Hai provato a rimuovere ^ e $ dall'espressione regolare, i.e.
\\WRome\\W ?
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 13-01-2015, 15:55   #6
Daniels118
Senior Member
 
L'Avatar di Daniels118
 
Iscritto dal: Jan 2014
Messaggi: 852
Non conosco questo particolare linguaggio, ma l'espressione "\W" mi suggerisce qualcosa come "word", nel senso di parola intera. I caratteri ^ e $ vengono generalmente utilizzati per indicare l'inizio e fine di una stringa.
Io proverei "^Rome$".
Daniels118 è offline   Rispondi citando il messaggio o parte di esso
Old 13-01-2015, 16:21   #7
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da Daniels118 Guarda i messaggi
Non conosco questo particolare linguaggio, ma l'espressione "\W" mi suggerisce qualcosa come "word", nel senso di parola intera. I caratteri ^ e $ vengono generalmente utilizzati per indicare l'inizio e fine di una stringa.
Io proverei "^Rome$".
Veramente e' il contrario: \W indica ogni carattere che NON appartiene ad una parola. Quello che ti suggerisce "word" e' \w
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 13-01-2015, 16:38   #8
Daniels118
Senior Member
 
L'Avatar di Daniels118
 
Iscritto dal: Jan 2014
Messaggi: 852
Quindi si dovrebbe leggere: qualunque carattere che non appartiene ad una parola, seguito da "Rome", seguito da qualunque carattere che non appartiene ad una parola.
Da cui le corrispondenze con sequenze come "Egeria_(Rome)", mentre per la corrispondenza esatta ci pensano |^ e |$.
Quindi perché "\\WRome\\W" dovrebbe selezionare solo "Rome"? Mi sembrava che la richiesta fosse proprio quella di trovare solo la corrispondenza esatta, o sbaglio?
Daniels118 è offline   Rispondi citando il messaggio o parte di esso
Old 13-01-2015, 18:34   #9
wingman87
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2776
Quote:
Originariamente inviato da Daniels118 Guarda i messaggi
Non conosco questo particolare linguaggio, ma l'espressione "\W" mi suggerisce qualcosa come "word", nel senso di parola intera. I caratteri ^ e $ vengono generalmente utilizzati per indicare l'inizio e fine di una stringa.


Io proverei "^Rome$".


Sì se vuole solo una corrispondenza esatta sarebbe giusto così, io ho dato per scontato che volesse mantenere tutte le corrispondenze.
wingman87 è online   Rispondi citando il messaggio o parte di esso
Old 14-01-2015, 05:35   #10
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da wingman87 Guarda i messaggi
Sì se vuole solo una corrispondenza esatta sarebbe giusto così, io ho dato per scontato che volesse mantenere tutte le corrispondenze.
Beh, se vuole la corrispondenza esatta basterebbe
Codice:
Pattern p = Pattern.compile("Rome");
Matcher m = p.matcher(<la stringa da verificare>);
boolean result = Matcher.matches()
quindi senza nemmeno ^ e $

Sospetto che voglia qualcosa di diverso, che magari non e' stato specificato per brevita'
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2015, 06:41   #11
wingman87
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2776
Non mi sembra, se non metti ^ e $ il match può avvenire in qualunque punto della stringa. Per esempio troverebbe anche Romeo
wingman87 è online   Rispondi citando il messaggio o parte di esso
Old 14-01-2015, 08:38   #12
Daniels118
Senior Member
 
L'Avatar di Daniels118
 
Iscritto dal: Jan 2014
Messaggi: 852
Nel caso di più risultati, se si potesse mettere una funzione nella clausola order by - per esempio strlen - si potrebbe ottenere un ordinamento conveniente.
Daniels118 è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2015, 10:38   #13
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da wingman87 Guarda i messaggi
Non mi sembra, se non metti ^ e $ il match può avvenire in qualunque punto della stringa. Per esempio troverebbe anche Romeo
No, il matches() e' sull'intera stringa
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
Old 14-01-2015, 12:24   #14
wingman87
Senior Member
 
Iscritto dal: Nov 2005
Messaggi: 2776
Quote:
Originariamente inviato da sottovento Guarda i messaggi
No, il matches() e' sull'intera stringa
Hai ragione, però non credo che nella query faccia il matching in quel modo altrimenti \WRome\W non farebbe il match con "Basilica_dei_Santi_Apostoli_(Rome)"
wingman87 è online   Rispondi citando il messaggio o parte di esso
Old 15-01-2015, 05:36   #15
sottovento
Senior Member
 
L'Avatar di sottovento
 
Iscritto dal: Nov 2005
Città: Texas
Messaggi: 1722
Quote:
Originariamente inviato da wingman87 Guarda i messaggi
Hai ragione, però non credo che nella query faccia il matching in quel modo altrimenti \WRome\W non farebbe il match con "Basilica_dei_Santi_Apostoli_(Rome)"
A meno che non stia usando una libreria dedicata, immagino che davvero stia facendo il matching usando il Matcher, probabilmente utilizzando il grouping.
Sono d'accordo con te che non sta utilizzando il metodo matches() ma se il suo scopo e' quello di trovare il match esatto lo potrebbe fare, visto che ce l'ha a disposizione
__________________
In God we trust; all others bring data
sottovento è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


FUJIFILM X-T30 III, la nuova mirrorless compatta FUJIFILM X-T30 III, la nuova mirrorless compatta
Oracle AI World 2025: l'IA cambia tutto, a partire dai dati Oracle AI World 2025: l'IA cambia tutto, a parti...
Micron e millisecondi: la piattaforma ServiceNow guida l'infrastruttura IT di Aston Martin F1 Micron e millisecondi: la piattaforma ServiceNow...
ASUS GeForce RTX 5080 Noctua OC Edition: una custom fenomenale, ma anche enorme ASUS GeForce RTX 5080 Noctua OC Edition: una cus...
Dreame Aqua10 Ultra Roller, la pulizia di casa con un rullo Dreame Aqua10 Ultra Roller, la pulizia di casa c...
Tesla sotto indagine per la modalit&agra...
EOLO attiva la rete FWA 5G fino a 1 Gbps...
Nasce GOG Patrons: donazioni volontarie ...
Scope elettriche ai minimi: con doppio ...
Galaxy S25 Edge 5G a 639€ su Amazon: tit...
MacBook Pro M5: il teardown rivela picco...
Samsung Odyssey G30D oggi costa 87,5€, v...
4 smartphone 8/256GB a basso prezzo: rea...
Von der Leyen spiega RESourceEU: l'Europ...
YouTube, smantellata la "Ghost Netw...
Ferrari F76: la prima hypercar NFT segna...
Am9080, sono passati 50 anni dal primo p...
Inquinamento record a Nuova Delhi: il go...
Il Giappone e il 'fetish' per i dischi o...
AMD presenterà il Ryzen 5 7500X3D...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 10:45.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v