PDA

View Full Version : Riconoscimento vocale: esiste?


kappa85
15-05-2006, 22:54
Ciao a tutti, la richiesta è un pò strana :)

Volevo sapere se esiste un programma che è capace di prendere un file audio mp3 ed estrapolarne il testo... un pò come l'OCR ma per l'audio... sarebbe utile per le conferenze, le lezioni... esiste?

BTS
16-05-2006, 11:57
Non credo. :(
La digitalizzazione della voce viene fatta da un circuito che si chiama vocoder. Esso estrapola dalla voce la componente fondamentale che si chiama "pitch". Il programma che vorresti dovrebbe filtrare il pitch dalla musica e quindi cancellare le componenti musicali con frequenze uguali alla voce, ma senza attenuare quest'ultima. :read:
Si potrebbe fare se tu avessi a disposizione la canzone senza testo, basterebbe sottrarla alla versione completa e poi eseguire un programma di traduzione voce-parole.
E chi dispone delle traccie non cantate?

kappa85
16-05-2006, 12:24
Non credo. :(
La digitalizzazione della voce viene fatta da un circuito che si chiama vocoder. Esso estrapola dalla voce la componente fondamentale che si chiama "pitch". Il programma che vorresti dovrebbe filtrare il pitch dalla musica e quindi cancellare le componenti musicali con frequenze uguali alla voce, ma senza attenuare quest'ultima. :read:
Si potrebbe fare se tu avessi a disposizione la canzone senza testo, basterebbe sottrarla alla versione completa e poi eseguire un programma di traduzione voce-parole.
E chi dispone delle traccie non cantate?
Attenzione io non parlo di file audio musicali, ma solo contenenti voce, tipo la registrazione di una conferenza... così si può?

BTS
16-05-2006, 16:47
mmh, snavigacchiando non ho trovato nulla di definitivo... o comunque solo progetti ed in inglese

merut82
16-05-2006, 17:54
Attenzione io non parlo di file audio musicali, ma solo contenenti voce, tipo la registrazione di una conferenza... così si può?
Dragon Naturally Speaking 8 permette di farlo.
Gli si da un file .wav e lui lo trascrive.

evl
16-05-2006, 18:01
Dragon Naturally Speaking 8 permette di farlo.
Gli si da un file .wav e lui lo trascrive.


esatto (anche se non è il massimo)