Microsoft sfida i giganti dell'IA con MAI-1, un nuovo LLM sviluppato interamente in casa

Microsoft sfida i giganti dell'IA con MAI-1, un nuovo LLM sviluppato interamente in casa

Microsoft sta sviluppando un modello linguistico di grandi dimensioni chiamato MAI-1 con la direzione dell'ex responsabile dell'IA di Google, Mustafa Suleyman. MAI-1 potrebbe potenzialmente rivaleggiare con i modelli più avanzati di OpenAI, Google e Anthropic.

di pubblicata il , alle 11:31 nel canale Web
Microsoft
 

Microsoft sta dimostrando la sua determinazione a competere ai massimi livelli con i giganti del settore dell'IA, sviluppando un proprio modello linguistico di grandi dimensioni con elevate potenzialità. Il nuovo LLM si chiama MAI-1 e potrebbe sfidare i modelli più evoluti di OpenAI, Google e Anthropic.

Secondo quanto riporta The Information, il progetto è guidato da Mustafa Suleyman, l'ex leader dell'intelligenza artificiale di Google che ha recentemente ricoperto il ruolo di CEO nella startup Inflection, prima che Microsoft acquisisse gran parte del suo personale e della sua proprietà intellettuale per 650 milioni di dollari a marzo.

Microsoft sta lavorando su MAI-1, nuovo LLM per implementazioni in cloud

MAI-1 sarà un modello linguistico di grandi dimensioni (LLM) completamente nuovo, secondo quanto hanno dichiarato due dipendenti Microsoft rimasti anonimi, ma con familiarità con il progetto. Con circa 500 miliardi di parametri, sarà significativamente più grande dei precedenti modelli open source di Microsoft (ad esempio Phi-3), richiedendo una potenza di calcolo e dati di addestramento superiori.

Le dimensioni di MAI-1 lo collocano in diretta competizione con l'attuale GPT-4 di OpenAI, che si dice abbia oltre 1 trilione di parametri, e ben al di sopra dei modelli di Meta, ad esempio. Questo potenziale potrebbe consentire a Microsoft di competere con i player più importanti del settore nel fornire esperienze di intelligenza artificiale generativa avanzate con un proprio modello linguistico.

Lo sviluppo di MAI-1 suggerisce un duplice approccio all'IA all'interno di Microsoft, concentrandosi sia su piccoli modelli linguistici eseguiti localmente per dispositivi mobili che su modelli più grandi e all'avanguardia basati sul cloud. Evidenzia inoltre la volontà di esplorare lo sviluppo dell'IA in modo indipendente da OpenAI, la cui tecnologia attualmente alimenta le funzionalità di intelligenza artificiale generative di Copilot, l'assistente di Microsoft utilizzato in svariate piattaforme.

Sebbene lo scopo esatto di MAI-1 non sia stato ancora determinato dall'azienda, il suo uso ideale dipenderà dalle sue prestazioni. Per addestrare il modello, Microsoft ha sfruttato un ampio cluster di server con GPU NVIDIA e compilato dati di addestramento da varie fonti, tra cui testo generato da GPT-4 e dati internet pubblici. Secondo le voci, inoltre, Microsoft potrebbe mostrare MAI-1 in anteprima già alla sua conferenza Build per sviluppatori alla fine di questo mese.

1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
supertigrotto07 Maggio 2024, 13:51 #1
Per fortuna lo hanno chiamato mai 1 perché se lo chiamavano mai Ale ( artificial language experimental) potevano far fare 4 risate anche a noi

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^