|
|||||||
|
|
|
![]() |
|
|
Strumenti |
|
|
#1 |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
[C/C++] Espressioni regolari
ciao,
sto sviluppando un progetto che tira in ballo l'acquisizione di alcuni dati da file; questi però devono essere formati in un certo modo come ad esempio potrebbe essero un indirizzo IP 192.168.1.100 oppure dati in ingresso del tipo A0.3, B10.5 e così via. Come effettuo un controllo del genere? Mi sonon venute in mente le espressioni regolari ma non so nulla a riguardo. grazie |
|
|
|
|
|
#2 | |
|
Senior Member
Iscritto dal: May 2001
Messaggi: 12862
|
Quote:
I dati possono cambiare, ma il formato è comune? Ad esempio, se usi un formato CSV: Codice:
file 1, nome, cognome, telefono 2, nome, cognome, telefono .. Codice:
integer text(30) text(30) text(12) Dunque se il formato è comune puoi creare una piccola applicazione in cui passi eventualmente dall'esterno cosa rappresentano quei dati. |
|
|
|
|
|
|
#3 |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
ciao,
è un comune file ASCII ma ad esempio un utente potrebbe scrivere erroneamente un indirizzo IP errato I92.168.1.298 Quindi, una I in luodo di 1 e un valore 298 che fuoriesce dal campo di indirizzamento degli indirizzi IP Le espressioi regolari mi sembravano una valida soluzione in quanto stabilita una regola poi deve essere verificata. Sto usando Borland C++ Builder e pensavo che fossero implementate. |
|
|
|
|
|
#4 | |
|
Senior Member
Iscritto dal: May 2001
Messaggi: 12862
|
Quote:
Secondo me se sai che sono indirizzi IP ti conviene dividere la stringa in tokens (separati da punto), convertire in numero e controllare che siano nel range corretto. |
|
|
|
|
|
|
#5 | |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
Quote:
Non ne ho la più pallida idea di come vengono sviluppati |
|
|
|
|
|
|
#6 | |
|
Senior Member
Iscritto dal: May 2001
Messaggi: 12862
|
Quote:
Prova a svilupparlo su carta l'automa, ti accorgerai presto che è un po' un casino perché devi tenere conto di molte cose (se vuoi fare una cosa fatta bene). Ad esempio devi gestire cosa accade se leggi un 2 come prima cifra di un gruppo: Inizio con 2 -> leggo un numero compreso tra 0..4 -> dopo posso leggere 0..9 Inizio con 2 -> leggo 5 -> dopo posso leggere 0..5 Inizio con 2 -> leggo un numero compreso tra 6..9 -> dopo devo per forza leggere un punto Devi tenere conto che non puoi iniziare una sequenza con uno 0, ovvero, se leggi uno 0 all'inizio devi per forza di cose leggere un punto. Se ho fatto bene i conti hai almeno 8 stati diversi. |
|
|
|
|
|
|
#7 | |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
Quote:
però è molto interessante Ma verrebbe una serie di: if(carattere == numero) allora accetta e cifre++; // incrementa il contatore delle cifre lette if(carattere == '.' AND cifre == 0) allora NON accetta if(carattere == '.' AND cifre >= 1) allora accetta e così via |
|
|
|
|
|
|
#8 |
|
Senior Member
Iscritto dal: Oct 2001
Messaggi: 11471
|
Se ti serve una regex per validare un indirizzo ip puoi usare questa:
Codice:
\b([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\b |
|
|
|
|
|
#9 | |
|
Senior Member
Iscritto dal: May 2001
Messaggi: 12862
|
Quote:
Preferisco una soluzione più elegante, ad esempio usando una struttura del tipo: Codice:
typedef struct _stato
{
struct _stato* Next[255]; /* tabella di transizione: 255 caratteri possibili */
} stato;
Codice:
stato Stato[10];
void InitStati( )
{
/* inizializza tutti i Next[i] a NULL (si può anche inizializzare ad uno stato dummy) */
/* inizializza stati */
/* ESEMPIO */
Stato[0].Next['c'] = &( Stato[1] );
}
Codice:
bool Parse( string Input )
{
stato* Current = &( Stato[0] ); /* Stato iniziale */
for (char Ch in Input)
{
Current = Current->Next[Ch];
if ( Current == NULL )
return false; /* si può evitare questo if usando uno stato dummy */
}
return ( Current == &( Stato[1] ) ); /* se sono nello stato finale (1) ritorna true */
}
Il tutto senza catene di IF orrende Certamente consumi più memoria, in quanto ogni stato ha un array di 255 puntatori (se vuoi contemplare tutti i possibili input ASCII). Volendo essere più puristi puoi usare uno stato dummy (che ovviamente non può essere finale) che cicla su se stesso qualunque sia il carattere in input. La differenza in questo caso è che la funzione Parse non termina subito se trova un carattere non valido, ma si legge tutta l'intera stringa. Una soluzione analoga potrebbe essere quella di usare una matrice con gli indici degli stati. Se all'interno dello stato devi fare molte cose, potrebbe essere conveniente fare diverse funzioni per ciascuno degli stati, e usare i puntatori a funzione per eseguire di volta in volta lo stato corrente (ergo la funzione specifica dello stato corrente). Sicuramente quest'ultima soluzione rende di gran lunga più leggibile il codice, piuttosto che usare una lunga sfilza di if-else o di switch-case. |
|
|
|
|
|
|
#10 |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
peccato aver visto solo a livello teorico gli automi. La tua tesi si basava sugli automi a stati ?
|
|
|
|
|
|
#11 |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
parlando in termini di open source non sarebbe male se gli utenti postassero codice perfettamente funzionante da mettere a disposizione per chi programma, una cosa del tipo:
verifica dell'indirizzo IP dato come input - ambiente Borland C++ Builder Codice:
void __fastcall TForm1::Button1Click(TObject *Sender)
{
char *token;
char *line = "192.168.0.32";
char *search = ".";
short nm=0;
token = strtok(line, search);
if(StrToInt(token) >= 0 && StrToInt(token) <= 255)
{
Memo1->Lines->Add(token);
nm++;
}
else
{
Memo1->Lines->Add("ERRORE");
Memo1->Lines->Add(token);
nm++;
}
while( (token = strtok(NULL, search)) != NULL)
{
if(StrToInt(token) >= 0 && StrToInt(token) <= 255)
{
Memo1->Lines->Add(token);
nm++;
}
else
{
Memo1->Lines->Add("ERRORE");
Memo1->Lines->Add(token);
nm++;
}
}
if(nm < 4 || nm > 4) Memo1->Lines->Add("Formato indirizzo IP errato!!!");
}
|
|
|
|
|
|
#12 | |
|
Senior Member
Iscritto dal: Oct 2007
Città: Padova
Messaggi: 4131
|
Quella funzione però non fa i controlli che ha indicato WarDuck nel messaggio #6...
@EDIT: Quote:
Ripeto: non fa i controlli che ha indicato WarDuck nel messaggio #6...
__________________
As long as you are basically literate in programming, you should be able to express any logical relationship you understand. If you don’t understand a logical relationship, you can use the attempt to program it as a means to learn about it. (Chris Crawford) Ultima modifica di banryu79 : 22-11-2011 alle 09:37. |
|
|
|
|
|
|
#13 |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
|
|
|
|
|
|
#14 |
|
Member
Iscritto dal: May 2009
Messaggi: 186
|
Per validare l'indirizzo IP non serve scomodare le espressioni regolari, basta sfruttare qualche funzione Win32, per esempio:
Codice:
char *line = "192.168.0.32";
if (inet_addr(line) == INADDR_NONE)
{
// IP errato
}
else
{
// IP OK
}
|
|
|
|
|
|
#15 | |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
Quote:
Però quello dell'IP era solo la punta dell'icberg. Devo controllare anche dati del tipo A10.7, SL170 P10.7, PB20 etc... |
|
|
|
|
|
|
#16 |
|
Member
Iscritto dal: May 2009
Messaggi: 186
|
Sì, ho letto, ma come ho già scritto, questi sono formati piuttosto semplici da parsare. Se poi ce ne sono anche di più complicati per cui tanto vale usare le RegEx per tutto, io questo non lo so...
|
|
|
|
|
|
#17 |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
si, in effetti ne ho molti di più e di diverso formato, per tale motivo ho pensato alle espressioni regolari
|
|
|
|
|
|
#18 | |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
Quote:
|
|
|
|
|
|
|
#19 |
|
Senior Member
Iscritto dal: Oct 2001
Messaggi: 11471
|
In genere l'alternanza è ordinata quindi esegue i test nell'ordine in cui sono scritti. Non fa alto che cercare questo (0-199|200-249|250-255) ripetuto 4 volte.
|
|
|
|
|
|
#20 | |
|
Senior Member
Iscritto dal: Apr 2001
Città: Milano
Messaggi: 3736
|
Quote:
E' da un pò che cerco ma le informazioni sono abbastanza confuse, forse cerco nei posti sbagliati. Poi stranamenete non trovo codice C già pronto da studiare che legga quelle espressioni. |
|
|
|
|
|
| Strumenti | |
|
|
Tutti gli orari sono GMT +1. Ora sono le: 20:17.




















