Torna indietro   Hardware Upgrade Forum > Software > Programmazione

Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Realizzato da Lenovo e installato presso il Cineca di Casalecchio di Reno, Pitagora offre circa 44 PFlop/s di potenza di calcolo ed è dedicato alla simulazione della fisica del plasma e allo studio dei materiali avanzati per la fusione, integrandosi nell’ecosistema del Tecnopolo di Bologna come infrastruttura strategica finanziata da EUROfusion e gestita in collaborazione con ENEA
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Rullo di lavaggio dei pavimenti abbinato a un potente motore da 28.000 Pa e a bracci esterni che si estendono: queste, e molte altre, le caratteristiche tecniche di Z60 Ultra Roller Complete, l'ultimo robot di Mova che pulisce secondo le nostre preferenze oppure lasciando far tutto alla ricca logica di intelligenza artificiale integrata
Renault Twingo E-Tech Electric: che prezzo!
Renault Twingo E-Tech Electric: che prezzo!
Renault annuncia la nuova vettura compatta del segmento A, che strizza l'occhio alla tradizione del modello abbinandovi una motorizzazione completamente elettrica e caratteristiche ideali per i tragitti urbani. Renault Twingo E-Tech Electric punta su abitabilità, per una lunghezza di meno di 3,8 metri, abbinata a un prezzo di lancio senza incentivi di 20.000€
Tutti gli articoli Tutte le news

Vai al Forum
Rispondi
 
Strumenti
Old 06-11-2009, 17:08   #1
pmonte
Junior Member
 
Iscritto dal: Nov 2009
Messaggi: 9
[generico] Isolare indirizzo (postale/fisico) da stringa

Il mio obiettivo è quello di estrapolare un indirizzo NON formattato (dunque: "Via mazzini, 20100 Milano" ma anche "v. mazzini / milano MI" o "zona parioli roma") da un testo. Roba da niente.

Qualcuno sa darmi qualche indicazione di partenza?

Ipotizzare di farlo solo con delle regex mi pare impossibile. Ho un DB con tutti i comuni, provincie, cap d'Italia ma zone e via sono fuori discussione.

Stavo ipotizzando di passare il testo al setaccio e controllare se appare il nome di un comune giusto per fare un primo passo ma già mi pare piuttosto dispendioso in termini di cpu. Non penso che una mega regex con "milano|roma|genova|e altri 8000! comuni" sia una buona mossa.
Non posso neanche però fare un ciclo e prendere parola per parola il testo e confrontarla con 8000 stringhe!

Qualcuno sa darmi qualche suggerimento?
pmonte è offline   Rispondi citando il messaggio o parte di esso
Old 06-11-2009, 17:19   #2
Oceans11
Senior Member
 
L'Avatar di Oceans11
 
Iscritto dal: Sep 2005
Città: Torino
Messaggi: 606
Ed invece regex!!!!!!
__________________
"Se proprio dovete piratare un prodotto, preferiamo che sia il nostro piuttosto che quello di qualcun altro." [Jeff Raikes]
"Pirating software? Choose Microsoft!"
Oceans11 è offline   Rispondi citando il messaggio o parte di esso
Old 06-11-2009, 17:24   #3
yorkeiser
Senior Member
 
L'Avatar di yorkeiser
 
Iscritto dal: Jul 2006
Città: Tristram
Messaggi: 517
Il problema non è certo di semplicissima soluzione. Provo a butta giù qualche idea, ma il tutto andrebbe raffinato un bel po'.
Per i comuni, potresti fare il precaricamento dei comuni che hai sul db in un array e ordinarlo, così sblocchi la possibilità di poter fare delle ricerche binarie (complessità log2(n) dove n=numero di comuni). In questo modo puoi evitare di fare gozziliardi di chiamate al db.
Il problema è che, anche una volta isolata la singola parola all'interno della stringa, potresti avere un nome di comune all'interno dell'indirizzo (ad esempio, via Milano). Quindi dovresti preventivamente fare anche un precaricamento dei vari toponimi (via, viale, piazza etc etc) e controllare che il nome del comune non sia preceduto da una di queste paroline magiche (non risolveresti comunque il caso di indirizzi tipo viale Pincopallino da Certosa).
Per i cap invece è abbastanza semplice, basta controllare sul formato a 5 cifre (e al limite cercarlo su una tabella di cap per ottenere la conferma dell'esistenza). L'indirizzo in sè, incrociando le dita, dovrebbe essere quello che resta della stringa. Ripeto, è solo qualche idea buttata lì, non avendo un formato standard la cosa è piuttosto complicata.
__________________
Il sole è giallo
yorkeiser è offline   Rispondi citando il messaggio o parte di esso
 Rispondi


Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare Cineca inaugura Pitagora, il supercomputer Lenov...
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA Mova Z60 Ultra Roller Complete: pulisce bene gra...
Renault Twingo E-Tech Electric: che prezzo! Renault Twingo E-Tech Electric: che prezzo!
Il cuore digitale di F1 a Biggin Hill: l'infrastruttura Lenovo dietro la produzione media Il cuore digitale di F1 a Biggin Hill: l'infrast...
DJI Osmo Mobile 8: lo stabilizzatore per smartphone con tracking multiplo e asta telescopica DJI Osmo Mobile 8: lo stabilizzatore per smartph...
Lo compri una volta, lo giochi dove vuoi...
Qiantinuum annuncia Helios, "il com...
Samsung Galaxy S26 Ultra: una sola novit...
Google prepara Gemini 3 Pro e Nano Banan...
TVS non è solo moto e scooter: ec...
Alexa+ arriva su BMW: gli automobilisti ...
Gemini Deep Research arriva su Google Fi...
Rinvii a catena, Marvel 1943: Rise of Hy...
Xiaomi inaugura uno spazio dedicato ai f...
Rilasciate le specifiche di Bluetooth 6....
L'obiettivo che mette tutto a fuoco: la ...
Meta avrebbe raccolto fino al 10% dei ri...
NVIDIA DGX Spark e videogiochi? Una pess...
Serie Oppo Reno15 confermata: arriva il ...
UPDF 2025: l'editor PDF che fa (quasi) t...
Chromium
GPU-Z
OCCT
LibreOffice Portable
Opera One Portable
Opera One 106
CCleaner Portable
CCleaner Standard
Cpu-Z
Driver NVIDIA GeForce 546.65 WHQL
SmartFTP
Trillian
Google Chrome Portable
Google Chrome 120
VirtualBox
Tutti gli articoli Tutte le news Tutti i download

Strumenti

Regole
Non Puoi aprire nuove discussioni
Non Puoi rispondere ai messaggi
Non Puoi allegare file
Non Puoi modificare i tuoi messaggi

Il codice vB è On
Le Faccine sono On
Il codice [IMG] è On
Il codice HTML è Off
Vai al Forum


Tutti gli orari sono GMT +1. Ora sono le: 23:10.


Powered by vBulletin® Version 3.6.4
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Served by www3v