Google: speech-to-text per l'indicizzazione dei video

Il nuovo servizio Google Election Video Search proposto dal colosso di Mountain View sfrutta la tecnologia speech-to-text per meglio indicizzare i video presenti nel canale politico di YouTube
di Fabio Gozzo pubblicata il 16 Luglio 2008, alle 13:34 nel canale WebLo scorso Lunedì i ricercatori di Google Research hanno presentato attraverso il blog della compagnia un nuovo servizio chiamato Google Election Video Search. Il nuovo "gadget", che consente di ricercare video inerenti alle ultime elezioni politiche negli Stati Uniti, di per sé non è poi cosi interessante, tuttavia si basa su tecnologie innovative che promettono di rivoluzionare le ricerche e il sistema di indicizzazione di file audio e video.
Il nuovo servizio proposto dal colosso di Mountain View utilizza infatti una tecnologia proprietaria "speech-to-text" che permette di riconoscere il parlato nei video presenti sul canale politico di YouTube. Grazie all'impiego di questa tecnologia è possibile ricercare i video non solo in base al titolo e alla descrizione, ma anche in base al contenuto.
Il servizio inoltre indica anche in quale punto del video viene pronunciata la frase ricercata, consentendo all'utente di saltare direttamente alla parte che gli interessa. Per ora il servizio non offre grado di accuratezza del 100% e, come abbiamo già detto, è limitato unicamente al canale politico di YouTube.
Il riconoscimento vocale è un problema ancora non del tutto risolto e richiede un notevole utilizzo di risorse. Il lavoro da svolgere per affinare gli algoritmi e migliorarne l'efficienza e l'accuratezza è ancora lungo, tuttavia il nuovo servizio di Google pare essere sulla buona strada.
Fonte: Google Blog
20 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoPraticamente è come se avessero realizzato la parte scritta del video/musica? Tranne per le tecnologie utilizzate non mi sembra tutta questa novità. Cmq la vedo ancora lung"hissima" la strada prima che l'identificazione vocale possa diventare "comoda" da sfruttare.
No, ma il non udente può leggere quello che Google riconosce.
Bhe ma se trasforma l'audio in testo potrebbe leggere il testo di un video come dei sottotitoli...
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".