Meta lancia MMS, un'IA per riconoscere oltre 4.000 lingue parlate. Ed è open source

Meta lancia MMS, un'IA per riconoscere oltre 4.000 lingue parlate. Ed è open source

Meta ha annunciato il lancio di un modello di intelligenza artificiale che è in grado di identificare oltre 4.000 lingue. L'azienda afferma che intende usare l'IA per contribuire a rallentare il declino nel numero di lingue parlate nel mondo

di pubblicata il , alle 09:01 nel canale Web
Meta
 

Meta ha annunciato il lancio di un nuovo modello di intelligenza artificiale per l’identificazione, la trascrizione e la lettura (text to speech) di oltre 4.000 lingue, ovvero “40 volte in più di qualunque tecnologia precedente nota", secondo gli autori. Come fatto degno di nota, il modello e il suo codice sorgente sono resi disponibili con una licenza open source.

Meta lancia un modello di IA per preservare la varietà linguistica

Non sono solo le specie animali e vegetali ad andare incontro a una rapida estinzione. Sono infatti sempre più le lingue che cessano di esistere nel mondo, con una riduzione netta nel numero di lingue parlate e una conseguente perdita di pluralità e di differenza. Il fenomeno è iniziato con la nascita degli Stati moderni e ha subito una brusca accelerazione con il diffondersi dei mezzi di comunicazione di massa come radio e televisione nel secolo scorso; Internet non ha fatto altro che accelerare ulteriormente il fenomeno e dare ancora maggiore rilevanza a poche lingue egemoni (l’inglese su tutte).

La morte di sempre più lingue è causata da fattori diversi: spesso le lingue morenti sono percepite come di minor prestigio, ad esempio perché usate da fasce inferiori della popolazione (è il caso, ad esempio, di molte lingue locali italiane, molte delle quali sono già considerabili estinte di fatto); in altri casi sono attivamente represse per scopi politici, ad esempio perché simbolo di un’identità in contrasto con quella nazionale; ci sono poi lingue che non vengono usate dalle nuove generazioni che preferiscono, invece, lingue di più ampia diffusione per via del loro uso su Internet (è quanto sta lentamente accadendo, ad esempio, con il catalano). Ci sono molti altri motivi, tra i quali un altro vale la pena menzionare: l’assenza di supporto nei sistemi tecnologici.

Proprio quest’ultimo aspetto è quello su cui vorrebbe intervenire Meta con il suo modello di IA MMS, abbreviazione di “Massively Multingual System” (“sistema massicciamente multilingue”). Si tratta di un modello di IA che consente di identificare più di 4.000 lingue; tra queste, per oltre 1.100 sono disponibili il riconoscimento e la sintesi vocale.

L’addestramento dei modelli di IA non è, per molti versi, differente da quello richiesto per insegnare alle persone una nuova lingua: è necessaria un’esposizione alla lingua significativa, cosicché l’IA possa imparare a riconoscerla. Dal momento che per molte lingue non esistono grandi librerie di registrazioni, gli esperti di Facebook hanno fatto ricorso alle registrazioni di testi religiosi, e in particolare della Bibbia, che sono disponibili in moltissime lingue e le cui traduzioni sono da tempo oggetto di studio. In questo modo il modello ha ottenuto un’esposizione media di 32 ore per ciascuna lingua.

L’azienda afferma che nonostante si tratti di letture a carattere religioso eseguite per lo più da uomini, ciò non ha prodotto un bias (ovvero un’influenza, ma anche una distorsione) verso l’ambito religioso né verso i parlanti maschili.

Ulteriori informazioni sono disponibili sul blog di Facebook.

1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
andbad26 Maggio 2023, 10:27 #1
Combinate un buon motore di traduzione tramite IA, apparati smart con microfono (occhiali, auricolari, ecc...), la sintetizzazione vocale e il voice cloning: ecco a voi il traduttore universale di Star Trek.

By(t)e

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^