Torna indietro   Hardware Upgrade Forum > Software > Programmazione

PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu
PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu
Il modello "build to order" di PCSpecialist permette di selezionare una struttura base per un sistema, personalizzandolo in base alle specifiche esigenze con una notevole flessibilità di scelta tra i componenti. Il modello Lafité 14 AI AMD è un classico notebook clamshell compatto e potente, capace di assicurare una elevata autonomia di funzionamento anche lontano dalla presa di corrente
Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto
Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto
Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine, arricchita da una simmetria interna curata nei minimi dettagli. Il sistema Glyph si evolve, riducendosi nelle dimensioni ma aumentando l'utilità quotidiana grazie a nuove funzioni software integrate e notifiche visive. Ecco tutti i dettagli nella recensione completa
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale
Nelle ultime settimane abbiamo provato la Corsair Vanguard Air 99 Wireless, una tastiera tecnicamente da gaming, ma che in realtà offre un ampio ventaglio di possibilità anche al di fuori delle sessioni di gioco. Flessibilità e funzionalità sono le parole d'ordine di una periferica che si rivolge a chi cerca un prodotto capace di adattarsi a ogni esigenza e ogni piattaforma
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 06-11-2009, 17:08   #1
pmonte
Junior Member
 
Iscritto dal: Nov 2009
Messaggi: 9
[generico] Isolare indirizzo (postale/fisico) da stringa

Il mio obiettivo è quello di estrapolare un indirizzo NON formattato (dunque: "Via mazzini, 20100 Milano" ma anche "v. mazzini / milano MI" o "zona parioli roma") da un testo. Roba da niente.

Qualcuno sa darmi qualche indicazione di partenza?

Ipotizzare di farlo solo con delle regex mi pare impossibile. Ho un DB con tutti i comuni, provincie, cap d'Italia ma zone e via sono fuori discussione.

Stavo ipotizzando di passare il testo al setaccio e controllare se appare il nome di un comune giusto per fare un primo passo ma già mi pare piuttosto dispendioso in termini di cpu. Non penso che una mega regex con "milano|roma|genova|e altri 8000! comuni" sia una buona mossa.
Non posso neanche però fare un ciclo e prendere parola per parola il testo e confrontarla con 8000 stringhe!

Qualcuno sa darmi qualche suggerimento?
pmonte è offline   Rispondi citando il messaggio o parte di esso
Old 06-11-2009, 17:19   #2
Oceans11
Senior Member
 
L'Avatar di Oceans11
 
Iscritto dal: Sep 2005
Città: Torino
Messaggi: 606
Ed invece regex!!!!!!
__________________
"Se proprio dovete piratare un prodotto, preferiamo che sia il nostro piuttosto che quello di qualcun altro." [Jeff Raikes]
"Pirating software? Choose Microsoft!"
Oceans11 è offline   Rispondi citando il messaggio o parte di esso
Old 06-11-2009, 17:24   #3
yorkeiser
Senior Member
 
L'Avatar di yorkeiser
 
Iscritto dal: Jul 2006
Città: Tristram
Messaggi: 517
Il problema non è certo di semplicissima soluzione. Provo a butta giù qualche idea, ma il tutto andrebbe raffinato un bel po'.
Per i comuni, potresti fare il precaricamento dei comuni che hai sul db in un array e ordinarlo, così sblocchi la possibilità di poter fare delle ricerche binarie (complessità log2(n) dove n=numero di comuni). In questo modo puoi evitare di fare gozziliardi di chiamate al db.
Il problema è che, anche una volta isolata la singola parola all'interno della stringa, potresti avere un nome di comune all'interno dell'indirizzo (ad esempio, via Milano). Quindi dovresti preventivamente fare anche un precaricamento dei vari toponimi (via, viale, piazza etc etc) e controllare che il nome del comune non sia preceduto da una di queste paroline magiche (non risolveresti comunque il caso di indirizzi tipo viale Pincopallino da Certosa).
Per i cap invece è abbastanza semplice, basta controllare sul formato a 5 cifre (e al limite cercarlo su una tabella di cap per ottenere la conferma dell'esistenza). L'indirizzo in sè, incrociando le dita, dovrebbe essere quello che resta della stringa. Ripeto, è solo qualche idea buttata lì, non avendo un formato standard la cosa è piuttosto complicata.
__________________
Il sole è giallo
yorkeiser è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


PC Specialist Lafité 14 AI AMD: assemblato come vuoi tu PC Specialist Lafité 14 AI AMD: assemblat...
Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Recensione Nothing Phone 4(a): sempre iconico ma...
Corsair Vanguard Air 99 Wireless: non si era mai vista una tastiera gaming così professionale Corsair Vanguard Air 99 Wireless: non si era mai...
Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lav...
Recensione Samsung Galaxy S26 Ultra: finalmente qualcosa di nuovo Recensione Samsung Galaxy S26 Ultra: finalmente ...
12 MW e oltre 20.000 pannelli: Stellanti...
Sono bastate solo 5 ore per insegnare a ...
Fastweb + Vodafone e TIM: un accordo per...
Scaleway apre una nuova cloud region a M...
Il PC non dà accesso al disco C:/...
Attenzione alle app IPTV: nascondono Per...
Controller Xbox in offerta su Amazon: co...
vivo X300 Pro 5G a 1.199€ su Amazon: il ...
"Portraits of Italians": la ca...
Roborock Qrevo Curv 2 Pro crolla di prez...
Uber ha trovato il partner per i robotax...
Sony pronta a dire addio al marchio PSN:...
ARCTIC Senza AI 370: il PC 'sotto la scr...
Corsair 3200D, il mid-tower sotto i 100€...
Esiste un SSD NVMe M.2 2280 da 16 TB, ma...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 00:23.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2026, Jelsoft Enterprises Ltd.
Served by www3v