PDA

View Full Version : [C++]Programma controllo ortografia


TheBestNapoli
29-04-2011, 20:32
Salve a tutti, devo sviluppare un programma di controllo ortografico. In pratica il programma prevede un array di stringhe di caratteri da memorizzare ad esempio su un file che può essere considerato un dizionario.
Il programma deve permettere all'utente di digitare una parola, che poi ricerca nel dizionario. Se la parola è presente nel dizionario, il programma deve visualizzare "L'ortografia della parola è corretta"; altrimenti deve visualizzare "L'ortografia della parola non è corretta".
Il programma, quindi, dovrebbe cercare altre parole nel dizionario che potrebbero essere la parola che l'utente desiderava digitare.
Per esempio se l'utente voleva digitare "polizia", ma commette un errore nella digitazione è possibile provare tutte le possibili sostituzioni con le lettere adiacenti per vedere se la parola esiste nel dizionario; quindi il programma deve controllare tutte le sostituzioni come "oplizia", "ploizia", "poilzia", "polziia", "poliiza" e "polizai". Quando viene trovata una nuova parola che è presente nel dizionario, essa deve essere visualizzata in un messaggio del tipo: "Intendevi digitare "polizia"?".
Spero di aver inteso l'esercizio; ora per quanto riguarda la soluzione io ho già creato il file con all'interno il dizionario e, con una funzione di lettura da file, l'ho memorizzato in un array di stringhe; ho anche implementato una funzione booleana per il controllo sulla validità della stringa inserita da tastiera.
Ora per quanto riguarda la seconda parte del programma come potrei proseguire?
Grazie mille a tutti.

TheBestNapoli
02-05-2011, 20:05
Qualcuno può suggerirmi qualcosa?

Tommo
02-05-2011, 21:21
Beh, a seconda di quello che vuoi fare il problema può essere abbastanza semplice o "molto" difficile, con molto inteso come "ancora non c'è riuscito nessuno" :D

Se ti accontenti di qualcosa che corregge gli errori più banali e frequenti, e a volte gli scappa qualche falso positivo, un approccio con dizionario come quello che hai immaginato va più che bene.
Per controllare la somiglianza di una stringa all'altra, potresti usare un hash per sapere quali lettere contiene, e poi una roba tipo la Distanza di Levenshtein (http://en.wikipedia.org/wiki/Levenshtein_distance) per capire quanto la disposizione è simile ad un'altra.

TheBestNapoli
04-05-2011, 22:02
Grazie per aver risposto. In realtà non devo addentrarmi in situazioni intricate (anche perchè non saprei come uscirne :D ); devo fare al più due metodi di verifica delle stringhe... uno ad esempio che scambia tutte le possibili coppie di lettere adiacenti all'interno della parola, e l'altro ad esempio che controlla le doppie all'interno della parola.
In realtà mi interessa molto il tuo discorso sulla Distanza di Levenshtein, ma non ne ho mai sentito parlare e credo sia anche ad un livello più alto di quello della programmazione che sto studiando.
Come potrei quindi procedere con il primo approccio? Grazie ancora :D