Phi-3 Mini, il modello IA di Microsoft che può funzionare sugli smartphone
Microsoft ha introdotto un nuovo modello IA leggero chiamato Phi-3 Mini da 3,8 miliardi di parametri: in seguito arriveranno Phi-3 Small da 7 miliardi e Phi-3 Medium da 14 miliardi. L'obiettivo è trasportare l'intelligenza artificiale dal cloud ai dispositivi finali.
di Manolo De Agostini pubblicata il 23 Aprile 2024, alle 20:01 nel canale WebMicrosoft
Si chiama Phi-3 Mini il nuovo modello AI "leggero" messo a punto da Microsoft, capace di funzionare su smartphone o altri piccoli dispositivi. Phi-3 Mini è stato addestrato con 3,8 miliardi di parametri su un set di dati più piccolo rispetto ai modelli linguistici di grandi dimensioni come GPT-4.
Phi-3 Mini è disponibile su Azure, Hugging Face e Ollama, ma in futuro arriveranno anche Phi-3 Small (7 miliardi di parametri) e Phi-3 Medium (14 miliardi). I parametri indicano quante istruzioni complesse un modello è in grado di comprendere.
Il numero 3 lascia chiaramente intendere che il modello abbia avuto dei precursori e, infatti, Microsoft aveva rilasciato Phi-2 a dicembre: secondo l'azienda, Phi-3 offre prestazioni migliori e può fornire risposte vicine a quelle di un modello 10 volte più grande. La casa di Redmond ritiene che Phi-3 Mini abbia capacità simili a un LLM come GPT-3.5, "solo in un fattore di forma più piccolo".
Anche i concorrenti di Microsoft hanno creato modelli più piccoli, la maggior parte dei quali mira ad assolvere compiti più semplici come il riepilogo dei documenti o l'assistenza al coding. Ad esempio, Gemma 2B e 7B di Google sono adatti alla creazione di semplici chatbot e svolgere lavori linguistici.
Claude 3 Haiku di Anthropic può leggere documenti di ricerca con grafici e riassumerli rapidamente, mentre Llama 3 8B di Meta, recentemente rilasciato, può essere utilizzato per alcuni chatbot e per assistenza al coding.
Secondo Eric Boyd, corporate vice president di Microsoft Azure AI Platform, gli sviluppatori hanno addestrato Phi-3 ispirandosi al modo in cui i bambini imparano dalle favole della buonanotte, ovvero mediante parole e frasi dalla struttura più semplice che parlano di argomenti di ampio respiro. "Non ci sono abbastanza libri per bambini in circolazione, quindi abbiamo preso un elenco di oltre 3.000 parole e abbiamo chiesto a un LLM di creare 'libri per bambini' per addestrare Phi", afferma Boyd.
Phi-3 è il frutto di ciò che hanno imparato dalle iterazioni precedenti. Con Phi-1 Microsoft si è concentrata sul coding, mentre con Phi-2 sul ragionamento: Phi-3 è migliore sia nel coding e che nel ragionamento. Secondo NVIDIA, il modello è stato addestrato su 3,3 trilioni di token in soli 7 giorni con 512 GPU NVIDIA H100 Tensor Core.
Sebbene la famiglia di modelli Phi-3 abbia alcune conoscenze generali, non può competere con GPT-4 o un altro LLM: c'è una grande differenza nel tipo di risposte che si possono ottenere da un LLM addestrato sull'intera rete Internet rispetto a un modello più piccolo come Phi-3.
Ciò, però, non significa che Phi-3 non possa trovare un suo spazio: spesso modelli più piccoli come Phi-3 funzionano meglio per applicazioni d'uso aziendali con dataset ridotti. Inoltre, dato che questi modelli usano meno potenza di calcolo, sono spesso molto più convenienti, soprattutto per quelle aziende che non possono permettersi di avere LLM in cloud.










Cineca inaugura Pitagora, il supercomputer Lenovo per la ricerca sulla fusione nucleare
Mova Z60 Ultra Roller Complete: pulisce bene grazie anche all'IA
Renault Twingo E-Tech Electric: che prezzo!
Nasce l'albo degli influencer 'rilevanti' in Italia: AGCOM ha aperto le iscrizioni
Il Digital Networks Act è stato rimandato: troppi aspetti ancora da chiarire
ASUS ROG ha lanciato due nuovi monitor da gaming con pannello Tandem OLED da 27 pollici
I nuovi iPhone 18 Pro potrebbero presentare un design inedito (per Apple)
Una parte dei Galaxy S26 avrà chip Exynos: la conferma arriva da Qualcomm
Amazon permetterà agli autori indipendenti di tradurre i libri con l'AI: arriva Kindle Translate
Il caso Zuckerberg a Palo Alto: una scuola privata non autorizzata e un quartiere in rivolta
Texas contro Roblox: il procuratore generale avvia una causa per la sicurezza dei minori
Offerte auto da urlo su Amazon: da CarPlay e Android wireless al compressore Xiaomi, gli accessori top che stanno andando a ruba
Windows 11 26H1 in arrivo fra pochi mesi: cos'è Bromine e come cambierà l'OS di Microsoft
Un Black Friday continuo a rilascio lento: ecco le novità su Amazon, insieme alle migliori offerte già attive
Redmi Pad Pro da 12,1" 2560x2600 pixel, Snapdragon 7, 10.000mAh, tablet imperdibile a 219,90€
Tesla Roadster rinviata (di nuovo): ora potrebbe non essere nemmeno un'auto
Il nuovo TV premium 2025 Samsung OLED 4K da 55" crolla su Amazon: 779€ sono veramente pochi









2 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoIn questo caso, non si tratta di un modello specifico per la scrittura di codice, ma di un modello generalista (che è in grado di scrivere anche codice...) pensato per essere poi "completato" con altri dati, ad esempio quelli di un'azienda.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".