Phi-3 Mini, il modello IA di Microsoft che può funzionare sugli smartphone

Phi-3 Mini, il modello IA di Microsoft che può funzionare sugli smartphone

Microsoft ha introdotto un nuovo modello IA leggero chiamato Phi-3 Mini da 3,8 miliardi di parametri: in seguito arriveranno Phi-3 Small da 7 miliardi e Phi-3 Medium da 14 miliardi. L'obiettivo è trasportare l'intelligenza artificiale dal cloud ai dispositivi finali.

di pubblicata il , alle 20:01 nel canale Web
Microsoft
 

Si chiama Phi-3 Mini il nuovo modello AI "leggero" messo a punto da Microsoft, capace di funzionare su smartphone o altri piccoli dispositivi. Phi-3 Mini è stato addestrato con 3,8 miliardi di parametri su un set di dati più piccolo rispetto ai modelli linguistici di grandi dimensioni come GPT-4.

Phi-3 Mini è disponibile su Azure, Hugging Face e Ollama, ma in futuro arriveranno anche Phi-3 Small (7 miliardi di parametri) e Phi-3 Medium (14 miliardi). I parametri indicano quante istruzioni complesse un modello è in grado di comprendere.

Il numero 3 lascia chiaramente intendere che il modello abbia avuto dei precursori e, infatti, Microsoft aveva rilasciato Phi-2 a dicembre: secondo l'azienda, Phi-3 offre prestazioni migliori e può fornire risposte vicine a quelle di un modello 10 volte più grande. La casa di Redmond ritiene che Phi-3 Mini abbia capacità simili a un LLM come GPT-3.5, "solo in un fattore di forma più piccolo".

Anche i concorrenti di Microsoft hanno creato modelli più piccoli, la maggior parte dei quali mira ad assolvere compiti più semplici come il riepilogo dei documenti o l'assistenza al coding. Ad esempio, Gemma 2B e 7B di Google sono adatti alla creazione di semplici chatbot e svolgere lavori linguistici.

Claude 3 Haiku di Anthropic può leggere documenti di ricerca con grafici e riassumerli rapidamente, mentre Llama 3 8B di Meta, recentemente rilasciato, può essere utilizzato per alcuni chatbot e per assistenza al coding.

Secondo Eric Boyd, corporate vice president di Microsoft Azure AI Platform, gli sviluppatori hanno addestrato Phi-3 ispirandosi al modo in cui i bambini imparano dalle favole della buonanotte, ovvero mediante parole e frasi dalla struttura più semplice che parlano di argomenti di ampio respiro. "Non ci sono abbastanza libri per bambini in circolazione, quindi abbiamo preso un elenco di oltre 3.000 parole e abbiamo chiesto a un LLM di creare 'libri per bambini' per addestrare Phi", afferma Boyd.

Phi-3 è il frutto di ciò che hanno imparato dalle iterazioni precedenti. Con Phi-1 Microsoft si è concentrata sul coding, mentre con Phi-2 sul ragionamento: Phi-3 è migliore sia nel coding e che nel ragionamento. Secondo NVIDIA, il modello è stato addestrato su 3,3 trilioni di token in soli 7 giorni con 512 GPU NVIDIA H100 Tensor Core.

Sebbene la famiglia di modelli Phi-3 abbia alcune conoscenze generali, non può competere con GPT-4 o un altro LLM: c'è una grande differenza nel tipo di risposte che si possono ottenere da un LLM addestrato sull'intera rete Internet rispetto a un modello più piccolo come Phi-3.

Ciò, però, non significa che Phi-3 non possa trovare un suo spazio: spesso modelli più piccoli come Phi-3 funzionano meglio per applicazioni d'uso aziendali con dataset ridotti. Inoltre, dato che questi modelli usano meno potenza di calcolo, sono spesso molto più convenienti, soprattutto per quelle aziende che non possono permettersi di avere LLM in cloud.

2 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
djfix1324 Aprile 2024, 10:25 #1
devo ancora capire come usare una IA di coding su uno smartphone
Slater9129 Aprile 2024, 13:28 #2
Originariamente inviato da: djfix13
devo ancora capire come usare una IA di coding su uno smartphone


In questo caso, non si tratta di un modello specifico per la scrittura di codice, ma di un modello generalista (che è in grado di scrivere anche codice...) pensato per essere poi "completato" con altri dati, ad esempio quelli di un'azienda.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^