Microsoft sfida i giganti dell'IA con MAI-1, un nuovo LLM sviluppato interamente in casa
Microsoft sta sviluppando un modello linguistico di grandi dimensioni chiamato MAI-1 con la direzione dell'ex responsabile dell'IA di Google, Mustafa Suleyman. MAI-1 potrebbe potenzialmente rivaleggiare con i modelli più avanzati di OpenAI, Google e Anthropic.
di Nino Grasso pubblicata il 07 Maggio 2024, alle 11:31 nel canale WebMicrosoft
Microsoft sta dimostrando la sua determinazione a competere ai massimi livelli con i giganti del settore dell'IA, sviluppando un proprio modello linguistico di grandi dimensioni con elevate potenzialità. Il nuovo LLM si chiama MAI-1 e potrebbe sfidare i modelli più evoluti di OpenAI, Google e Anthropic.
Secondo quanto riporta The Information, il progetto è guidato da Mustafa Suleyman, l'ex leader dell'intelligenza artificiale di Google che ha recentemente ricoperto il ruolo di CEO nella startup Inflection, prima che Microsoft acquisisse gran parte del suo personale e della sua proprietà intellettuale per 650 milioni di dollari a marzo.
Microsoft sta lavorando su MAI-1, nuovo LLM per implementazioni in cloud
MAI-1 sarà un modello linguistico di grandi dimensioni (LLM) completamente nuovo, secondo quanto hanno dichiarato due dipendenti Microsoft rimasti anonimi, ma con familiarità con il progetto. Con circa 500 miliardi di parametri, sarà significativamente più grande dei precedenti modelli open source di Microsoft (ad esempio Phi-3), richiedendo una potenza di calcolo e dati di addestramento superiori.
Le dimensioni di MAI-1 lo collocano in diretta competizione con l'attuale GPT-4 di OpenAI, che si dice abbia oltre 1 trilione di parametri, e ben al di sopra dei modelli di Meta, ad esempio. Questo potenziale potrebbe consentire a Microsoft di competere con i player più importanti del settore nel fornire esperienze di intelligenza artificiale generativa avanzate con un proprio modello linguistico.
Lo sviluppo di MAI-1 suggerisce un duplice approccio all'IA all'interno di Microsoft, concentrandosi sia su piccoli modelli linguistici eseguiti localmente per dispositivi mobili che su modelli più grandi e all'avanguardia basati sul cloud. Evidenzia inoltre la volontà di esplorare lo sviluppo dell'IA in modo indipendente da OpenAI, la cui tecnologia attualmente alimenta le funzionalità di intelligenza artificiale generative di Copilot, l'assistente di Microsoft utilizzato in svariate piattaforme.
Sebbene lo scopo esatto di MAI-1 non sia stato ancora determinato dall'azienda, il suo uso ideale dipenderà dalle sue prestazioni. Per addestrare il modello, Microsoft ha sfruttato un ampio cluster di server con GPU NVIDIA e compilato dati di addestramento da varie fonti, tra cui testo generato da GPT-4 e dati internet pubblici. Secondo le voci, inoltre, Microsoft potrebbe mostrare MAI-1 in anteprima già alla sua conferenza Build per sviluppatori alla fine di questo mese.
1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".