PDA

View Full Version : Estrapolare argomenti da un testo...


Edde
08-06-2011, 15:56
Salve :)

Dovrò tra un po' di tempo realizzare un prototipo che risolva il seguente problema:

- Ho, da una parte, delle notizie certe.
Hanno un titolo, un orario, dei riferimenti geografici, un contenuto, un livello di gravità.
Qualcosa di stringato, tipo le news dell'ansa per intenderci

- Dall'altra ho del testo estrapolato da notiziari radio.
Le notizie sono quelle prodotte al punto 1. Ma chiaramente, essendo "parlate", sono anche molto più libere e meno strutturate.
Per dire, ho l'orario in cui vengono pronunciate... ma non quello in cui la notizia era stata emessa dalla fonte.
Non ho riferimenti geografici "certi", ma dovrei estrapolarli dal testo...

L'applicazione dovrebbe:

- Riuscire, nella maniera più automatizzata possibile, a far fare scopa tra le notizie di partenza e quelle emesse alla radio.
Considerate, e questo è forse il problema più grosso, che la radio racconterà una serie di notizie una dopo l'altra...
Nei 5 minuti di notiziario flash, il tizio racconterà una dopo l'altra 20 notizie diverse... ed io avrò il testo, senza alcuna suddivisione in paragrafi o argomenti, di questo notiziario come input da lavorare.
Il primo problema è quindi quello di riuscire ad individuare e separare, nella massa di queste parole, tutte le varie notizie che le compongono.

Pensiamo ad esempio del notiziario "Onda verde". In quei pochi minuti ci viene detto di un incidente sulla tangeziale est di Roma, di un rallentamento per lavori sullo snodo firenze sud direzione milano... e via di questo passo.
L'applicazione parte da quest'unico blocco di testo, e dovrebbe individuare le diverse notizie che lo compongono..

- Una volta fatto questo, farne per certi versi il confronto del contenuto... per verificare la qualità del servizio radiofonico (hanno comunicato tutte le notizie? perlomeno quelle importanti? lo hanno fatto correttamente, oppure hanno dimenticato/omesso qualcosa? sono stati tempestivi, o mi hanno dato la notizia 12 ore dopo rispetto a quando era stata emessa?)

Sto cominciando a ragionarci un po' sopra, e vedere in giro se trovo qualcosa da cui prendere ispirazione o qualche prodotto open che possa fare in parte al caso mio...

Ma potrebbe essere interessante parlarne un po'... idee, pensate geniali? :D

Devo realizzarlo in java, ma non è un problema di linguaggio... ora come ora si tratta essenzialmente di pensarci a livello logico.

Grazie :p