Il riconoscimento vocale di Microsoft raggiunge l'affidabilità di un essere umano

Il riconoscimento vocale di Microsoft raggiunge l'affidabilità di un essere umano

Gli algoritmi di riconoscimento vocale di Microsoft hanno raggiunto il livello di capacità dell'uomo, ma non basta. In futuro si cercherà di superare il risultato ed arrivare ben oltre

di pubblicata il , alle 07:01 nel canale Scienza e tecnologia
Microsoft
 

Resta aggiornato sulle ultime offerte

Ricevi comodamente via email le segnalazioni della redazione di Hardware Upgrade sui prodotti tecnologici in offerta più interessanti per te

Quando invii il modulo, controlla la tua inbox per confermare l'iscrizione.
Leggi la Privacy Policy per maggiori informazioni sulla gestione dei dati personali

20 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
JeanPi20 Ottobre 2016, 18:38 #11

CHE COSA?

In inglese sicuramente, ma in Ita quando? MMMMMMMMM
coccos8420 Ottobre 2016, 21:49 #12
In italiano Cortana mi permette di avviare diversi programmi e fare diverse ricerche senza usare la tastiera. Anche l'invio di messaggi a voce funziona molto bene.

Il vero problema che trovo è che di solito non puoi metterti a parlare al computer o al cellulare...
davide311220 Ottobre 2016, 23:14 #13

Secondo me...

E continueremo a scrivere con la tastiera... ve lo immaginate un ufficio di 10 persone che dettano?
O vi siete mai chiesti perchè la messagistica vocale (o anche SIRI) siano utilizzatti a livelli ben al di sotto di quelli stimati (o sperati)?
Perchè di solito non ci piace far sapere a chi ci sta intorno qeullo che abbiamo da dire a chi pare a noi... o sbaglio?
cataflic21 Ottobre 2016, 08:41 #14
Originariamente inviato da: davide3112
E continueremo a scrivere con la tastiera... ve lo immaginate un ufficio di 10 persone che dettano?
O vi siete mai chiesti perchè la messagistica vocale (o anche SIRI) siano utilizzatti a livelli ben al di sotto di quelli stimati (o sperati)?
Perchè di solito non ci piace far sapere a chi ci sta intorno qeullo che abbiamo da dire a chi pare a noi... o sbaglio?


E infatti....l'uso è limitato a situazioni dove non si può usare le mani.
lkjhgf21 Ottobre 2016, 13:14 #15
devo scrivere dei lunghi testi in word e vorrei usare Cortana.E' ora possibile,l'ultima mi dicevano che non era disponibile per l'ita
lkjhgf21 Ottobre 2016, 13:16 #16
la mia sopra era una domanda.Ho dimenticato il punto interrogativo
giovanni6926 Ottobre 2016, 11:45 #17
Originariamente inviato da: calabar
....

La dettatura vocale invece, con un buon software, fa un ottimo lavoro. Provalo se non ci credi. ....cut....
Un amico che lavora in Nuance mi ha spiegato che software di questo tipo sono un compromesso tra resa e "taglio" di funzionalità per rimanere entro i limiti delle macchine su cui devono girare. .....

Nel Dragon che ho visto io occorreva leggere una paginetta per fare l' "addestramento". Roba di pochi minuti, e ti dirò che non lavorava male neppure senza il training. In questo modo si adattava al singolo utente, quindi la diversità nel modo di parlare veniva comunque ben gestita. ....cut...


E' possibile dare in pasto a Nuance Dragon un file video con audio (ovviamente previo training) per ottenerne dei captions, cioè la trascrizione della traduzione realizzatad disposta in basso al video come se fossero dei sottotitoli? Oppure cosa suggerite?
calabar26 Ottobre 2016, 21:10 #18
Che io ricordi, era possibile. Ma forse dipendeva dalla versione del programma.
Si trattava comunque di un prodotto vecchio, ora le cose potrebbero essere cambiate.
giovanni6927 Ottobre 2016, 00:25 #19
ok scrivo a Nuance se il tuo amico non è reperibile per un consulto sul tema preciso
grazie.
recoil27 Ottobre 2016, 08:58 #20
Originariamente inviato da: calabar
E lo traduce in modo pessimo. Questo perchè non "capisce" il testo, anche se se lo trova scritto.

La dettatura vocale invece, con un buon software, fa un ottimo lavoro. Provalo se non ci credi. C'erano anche dei video dimostrativi, e il bello è che funzionava così davvero, come mostrato nei video.

E sto parlando di un software di quasi 10 anni fa, oggi è sicuramente migliorato, anche perchè le risorse computazionali sono molto superiori.
Un amico che lavora in Nuance mi ha spiegato che software di questo tipo sono un compromesso tra resa e "taglio" di funzionalità per rimanere entro i limiti delle macchine su cui devono girare.
Per questo oggi la l'analisi vocale nelle funzionalità di dettature degli smartphone è essenzialmente fatta remoto (anche se in alcuni casi è delegata a DPS appositi, mi pare che il primo Moto X sia stato il precursore di questa possibilità.

Nel Dragon che ho visto io occorreva leggere una paginetta per fare l' "addestramento". Roba di pochi minuti, e ti dirò che non lavorava male neppure senza il training. In questo modo si adattava al singolo utente, quindi la diversità nel modo di parlare veniva comunque ben gestita.

Fidati, siamo molto più lontani da una buona traduzione che da una buona comprensione del testo (sintattica) sotto dettatura vocale.


l'esempio ce l'ho quotidianamente con Siri
le parole le becca quasi sempre perfettamente tranne quando sono nel traffico o nel rumore di una stanza, ma se ho le cuffie e porto il microfono vicino alla bocca risolvo
poi non è detto che capisca il significato di quelle parole e ogni tanto se ne esce con la ricerca internet dei vocaboli che ho pronunciato

la traduzione, voce a parte, non è perfetta anche quando fai copia e incolla di un testo quindi capire la fonetica è solo una delle variabili in gioco

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^