I ricercatori del GrapheneX-UTS Human-centric Artificial Intelligence Centre della University of Technology Sydney (UTS) hanno sviluppato un sistema non invasivo e portatile che può decodificare i pensieri e trasformarli in testo.

La tecnologia potrebbe permettere alle persone che non sono in grado di parlare a causa di malattie o infortuni, inclusi ictus o paralisi, di comunicare con il mondo esterno. Allo stesso tempo, potrebbe avere altre applicazioni, tra cui permettere a umani e macchine di interagire, consentendo per esempio a una persona di gestire un braccio robotico o un robot vero e proprio.

La ricerca è stata condotta dal professor CT Lin, direttore del GrapheneX-UTS HAI Centre, insieme a Yiqun Duan e dal dottorando Jinzhou Zhou della Facoltà di Ingegneria e IT dell'UTS.

Nello studio i partecipanti leggevano in silenzio righe di testo mentre indossavano una cuffia che registrava l'attività elettrica del cervello tramite il cuoio capelluto usando un elettroencefalogramma (EEG).

L'onda EEG è stata poi segmentata in unità distinte per catturare caratteristiche e modelli specifici del cervello umano grazie a un modello di intelligenza artificiale chiamato DeWave sviluppato degli stessi ricercatori. DeWave è in grado di tradurre i segnali EEG in parole e frasi imparando da grandi quantità di dati EEG. In questo modo i 29 partecipanti allo studio sono riusciti a produrre frasi, visualizzate a schermo, senza proferire parola, solo pensandole. Lo si può vedere nel seguente video:

"Questa ricerca rappresenta uno sforzo pionieristico nella traduzione delle onde EEG grezze direttamente in linguaggio, segnando un passo avanti significativo nel settore", ha affermato il professor Lin.

"È il primo a incorporare tecniche di codifica discreta nel processo di traduzione dal cervello al testo, introducendo un approccio innovativo alla decodifica neurale. L'integrazione con grandi modelli linguistici sta aprendo nuove frontiere anche nelle neuroscienze e nell'intelligenza artificiale", ha aggiunto.

La soluzione sviluppata dai ricercatori sfida tecnologie come la scansione con macchinari MRI - grandi, costosi e non usabili nella vita quotidiana - e quelle che prevedono impianti cerebrali come Neuralink di Elon Musk.

A detta degli studiosi, questi metodi faticano anche a trasformare i segnali cerebrali in segmenti a livello di parola senza appoggiarsi a ulteriori aiuti come il tracciamento oculare. La loro tecnologia, invece, può essere utilizzata con o senza tracciamento oculare.

Nonostante captare le onde EEG tramite una cuffia restituisca un segnale più rumoroso, i ricercatori sono riusciti a ottenere prestazioni di tutto rispetto, superando i parametri di riferimento precedenti.

"Il modello è più abile nell'associare i verbi che i sostantivi. Tuttavia, quando si tratta di sostantivi, abbiamo notato una tendenza verso coppie di sinonimi piuttosto che verso traduzioni precise, come 'l'uomo' invece di 'l'autore'", ha spiegato Duan.

"Pensiamo che ciò sia dovuto al fatto che quando il cervello elabora queste parole, quelle semanticamente simili potrebbero produrre modelli di onde cerebrali analoghi. Nonostante le sfide, il nostro modello produce risultati significativi, allineando le parole chiave e formando strutture di frasi simili", ha affermato.

Il punteggio di accuratezza della traduzione è attualmente intorno al 40% su BLEU-1. Il punteggio BLEU è un numero compreso tra zero e uno che misura la somiglianza del testo tradotto automaticamente con un insieme di traduzioni di riferimento di alta qualità.

I ricercatori sperano di migliorare la tecnologia per arrivare a un livello paragonabile ai tradizionali programmi di traduzione linguistica o di riconoscimento vocale, più vicini al 90%.