Gli occhiali sonar della Cornell University: ecco come funzionano i comandi vocali "silenziosi"

Con microfoni ed altoparlanti, gli occhiali sviluppati da un ricercatore della Cornell University riescono a rilevare i movimenti delle labbra senza che sia necessario pronunciare comandi ad alta voce

di Andrea Bai pubblicata il 07 Aprile 2023, alle 14:11 nel canale Scienza e tecnologia

Un ricercatore della Cornell University ha sviluppato un particolare tipo di "occhiali sonar" che sono capaci di ascoltare l'utente senza che questo effettivamente debba pronunciare parole ad alta voce, e in questo modo recepire comandi per controllare dispositivi elettronici.

Il particolare dispositivo, chiamato EchoSpeech, si basa su microfoni e altoparlanti al contrario di altre tecnologie di riconoscimento vocale "silenzioso" che fanno uso di fotocamere. Il sistema richiederebbe, secondo gli sviluppatori, pochi minuti di semplice addestramento per l'apprendimento dei modelli vocali di un utente.

A questo punto il sistema è in grado di inviare e ricevere onde sonore tramite il viso dell'utente, e di rilevare i movimenti della bocca che vengono interpretati da un algoritmo di deep learning che analizza in tempo reale i profili di eco. I ricercatori sostengono di aver raggiunto una precisione del 95% nel riconoscere fino a 31 comandi non vocali interpretando i movimenti delle labbra e della bocca.

L'elaborazione dei dati viene demandata allo smartphone, così che il dispositivo possa restare di piccole dimensioni e assicurare un'autonomia operativa relativamente estesa. Il prototipo fin qui realizzato è dotato di una batteria che offre un'autonomia di circa 10 ore.

Per quanto vi possano essere delle ovvie possibilità di impiego nella vita di tutti i giorni, quale sistema per impartire comandi ad un telefono o ad un computer mantenendo libere le mani e senza dover pronunciare frasi ad alta voce, questo dispositivo potrebbe in realtà rappresentare una base di sviluppo per realizzare un ausilio per coloro i quali sono affetti da qualche genere di diasbilità del linguaggio: il rilevamento dei movimenti della bocca potrebbe essere sfruttato per innescare il funzionamento di un sintetizzatore vocale.

A questo punto si potrebbe immaginare che anche questo progetto di ricerca, come molti altri, vada dimenticato o resti intrappolato all'interno di un laboratorio universitario. Forse, per questo progetto, il futuro potrebbe riservare qualche fortuna maggiore: il team dello Smart Computer Interfaces for Future Interactions (SciFi) Lab della Cornell University ha infatti già dato il via a sondare il terreno per una possibile commercializzazione della tecnologia sfruttando un programma di finanziamento dell'università.

I ricercatori intanto stanno esplorando la possibilità di impiegare lo stesso principio per rilevare i movimenti del viso, degli occhi e della parte superiore del corpo, immaginando come gli occhiali potranno in futuro rappresentare un'importante piattaforma di personal computing.

I migliori sconti su Amazon oggi

Lenovo, Notebook Portatile, Display 15,6" Full HD, Intel Core i5-13420H, Ram 24 GB DDR4, 1000 GB SSD NVMe, Pc Portatile Windows 11 Pro

499.00€ Compra ora

-43%

Amazfit GTR 3, 46 mm, Smartwatch Orologio Intelligente Alexa Integrato, 150 modalità di Allenamento con GPS, AMOLED, Monitor del Sonno, 5 ATM Impermeabile, Durata Batteria di 21 Giorni, SpO2

149.90 85.03€ Compra ora

-14%

ECOVACS GOAT G1-800 robot tagliaerba 800mq senza filo perimetrale, Rasaerba robot con mappatura automatica, posizionamento Banda Ultra Larga+Vision+GPS, gestione di 16 zone, pendenza fino al 45%

699.00 599.00€ Compra ora

Toyota sarebbe a lavoro su una piattaforma dedicata agli EV?

Tesla Master Plan 3: ecco come la matematica salverà il mondo

gioffry8107 Aprile 2023, 18:57 #1

Questi occhiali li ha anche Marzullo

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Sharkoon VK4 ARGB

Nintendo Switch 2

Fujifilm X-E5 con Fujinon XF23mm F2.8: una X100VI ma con ottica intercambiabile

2025 Nikon Comedy Wildlife Awards: i primi scatti del concorso

Nintendo Switch 2

MSI Prestige 13 AI e i portatili business al Computex

Ryzen Threadripper 9980X e 9970X alla prova: AMD Zen 5 al massimo livello AMD ha aggiornato l'offerta di CPU HEDT con i Ryzen Threadripper 9000 basati su architettura Zen 5. In questo articolo vediamo come si comportano i modelli con 64...

BOOX Note Air4 C è uno spettacolo: il tablet E Ink con Android per lettura e scrittura BOOX Note Air4 C rappresenta l'ultima incarnazione della categoria dei tablet E Ink a colori di Onyx, e combina le prestazioni di un dispositivo Android con l'ottima...

The Edge of Fate è Destiny 2.5. E questo è un problema Bungie riesce a costruire una delle campagne più coinvolgenti della serie e introduce cambiamenti profondi al sistema di gioco, tra nuove stat e tier dell’equipaggiamento....

Fujifilm X-E5: la Fuji X che tutti gli appassionati volevano Dopo il fascino un po’ elitario della GFX100RF e le polemiche intorno a x Half, la nuova Fujifilm X-E5 riporta tutti d’accordo: una mirrorless compatta, leggera,...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

HPE Discover 2025: tra agenti intelligenti, infrastruttura AI-native e un futuro ibrido Edge9 ha seguito da vicino HPE Discover 2025 con accesso esclusivo a keynote e interviste. Dalla Sphere di Las Vegas, la visione di un’infrastruttura AI-native e...

Nuova Ford Capri elettrica, la super prova: in viaggio, in città e in autostrada Dopo diverse prove, da poche ore al volante, fino a un'intera settimana come prima auto, possiamo riportarvi tutti i dettagli e le impressioni sulla Ford Capri elettrica...

Roborock Saros Z70: un braccio meccanico per fare ordine in casa Dotato di tutte le ultime innovazioni in tema di aspirazione della polvere e pulizia dei pavimenti di casa, Roborock Saros Z70 integra un braccio meccanico che promette...

Gli occhiali sonar della Cornell University: ecco come funzionano i comandi vocali "silenziosi"

Lenovo, Notebook Portatile, Display 15,6" Full HD, Intel Core i5-13420H, Ram 24 GB DDR4, 1000 GB SSD NVMe, Pc Portatile Windows 11 Pro

Amazfit GTR 3, 46 mm, Smartwatch Orologio Intelligente Alexa Integrato, 150 modalità di Allenamento con GPS, AMOLED, Monitor del Sonno, 5 ATM Impermeabile, Durata Batteria di 21 Giorni, SpO2

ECOVACS GOAT G1-800 robot tagliaerba 800mq senza filo perimetrale, Rasaerba robot con mappatura automatica, posizionamento Banda Ultra Larga+Vision+GPS, gestione di 16 zone, pendenza fino al 45%

1 Commenti