Meta svela Llama 3.1 405B, il suo nuovo modello IA di frontiera che sfida GPT-4o e Claude 3.5 Sonnet

Meta svela Llama 3.1 405B, il suo nuovo modello IA di frontiera che sfida GPT-4o e Claude 3.5 Sonnet

Mark Zuckerberg ha presentato la gamma di modelli Llama 3.1, aperti e disponibili pubblicamente. Llama 3.1 include versioni aggiornate dei modelli 8B e 70B, e introduce anche Llama 3.1 405B, il modello di base open più grande e potente.

di pubblicata il , alle 08:01 nel canale Web
Meta
 

Non è passato molto tempo dall'introduzione di Llman 3, ed ecco che Meta rilancia con Llama 3.1 e, più precisamente, Llama 3.1 405B, il modello open source più grande e potente di tutti. Secondo la società guidata da Mark Zuckerberg, Llama 3.1 405B è il primo modello disponibile apertamente in grado di competere con i migliori modelli di intelligenza artificiale per quanto riguarda le capacità all'avanguardia in termini di conoscenza generale, governabilità, matematica, utilizzo di strumenti e traduzione multilingue.

"Crediamo che l'ultima generazione di Llama darà il via a nuove applicazioni e paradigmi di modellazione, tra cui la generazione di dati sintetici per consentire il miglioramento e l'addestramento di modelli più piccoli, nonché la distillazione dei modelli, una capacità che non è mai stata raggiunta su questa scala in open source".

Non solo il modello 405B, Meta ha introdotto anche versioni aggiornate di quelli 8B e 70B. "Sono multilingue e hanno una finestra di contesto significativamente maggiore di 128K, l'uso di strumenti all'avanguardia e capacità di ragionamento complessivamente più forti. Ciò consente ai nostri modelli più recenti di supportare casi d'uso avanzati, come la sintesi di testi lunghi, gli agenti conversazionali multilingue e gli assistenti di codifica. Abbiamo anche apportato modifiche alla nostra licenza, consentendo agli sviluppatori di utilizzare i risultati dei modelli Llama, compreso il 405B, per migliorare altri modelli".

I modelli sono disponibili per la comunità per il download su llama.meta.com e Hugging Face.

Llama 3.1 sfida la concorrenza di Google, OpenAI e Anthropic

Meta ha valutato le prestazioni di Llama 3.1 su oltre 150 dataset di prova che coprono un'ampia gamma di lingue. Inoltre, ha eseguito valutazioni umane approfondite per confrontare Llama 3.1 con modelli concorrenti in scenari reali. "La nostra valutazione sperimentale", si legge nel post sul blog, "indica che il nostro modello di punta è competitivo con i principali modelli di base in una serie di compiti, tra cui GPT-4, GPT-4o e Claude 3.5 Sonnet. Inoltre, i nostri modelli più piccoli sono competitivi con i modelli chiusi e aperti che hanno un numero simile di parametri".

Clicca per ingrandire

Per addestrare Llama 3.1 405B su oltre 15 trilioni di token, Meta ha ottimizzato in modo significativo l'intero stack di addestramento e spinto l'addestramento del modello su oltre 16 mila GPU H100, rendendo il 405B "il primo modello Llama addestrato su questa scala".

Clicca per ingrandire

Infine, Meta ha annunciato di aver ampliato l'accesso a Meta AI - l'assistente presente nelle app e dispositivi della società - e introducendo nuove funzionalità. Meta AI è ora disponibile in 22 Paesi, con le novità di oggi in Argentina, Cile, Colombia, Ecuador, Messico, Perù e Camerun.

Clicca per ingrandire

È inoltre possibile interagire con Meta AI su WhatsApp, Instagram, Messenger e Facebook in nuove lingue: francese, tedesco, hindi, hindi-romanizzato, italiano, portoghese e spagnolo e altre ancora in arrivo. Ulteriori informazioni le trovate in questo post.

3 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
bio8224 Luglio 2024, 08:58 #1
c'è pure l'italiano come lingua ma risulta non accessibile dall'italia... idee di quando lo sarà?

bio
marcram24 Luglio 2024, 09:24 #2
... Llama 3.1 405B, il modello open source più grande e potente di tutti...

Ancora, Llama NON è open-source solo perché lo dice Meta...

Innanzitutto non si può parlare di "source", perché in un modello AI non si parla di codice, ma di "pesi". Qualcuno infatti ha cominciato a parlare di "open-weight".
Si è iniziato a creare la definizione di "open-source AI", che prevede i dati di training siano accessibili, cosa che invece Meta non fa.
Poi, la sua licenza non è accettata dall'OSI, perché discrimina su chi ne fa uso.

Quindi, è come se dicessimo che i miei guidano auto elettriche da 50 anni, solo perché hanno una batteria e un alternatore...
Unrue24 Luglio 2024, 13:59 #3
Per addestrare Llama 3.1 405B su oltre 15 trilioni di token, Meta ha ottimizzato in modo significativo l'intero stack di addestramento e spinto l'addestramento del modello su oltre 16 mila GPU H100, rendendo il 405B "il primo modello Llama addestrato su questa scala".


Me cojoni

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^