Microsoft lancia un mini modello AI 10 volte più veloce: così cambia tutto per il mobile e l'edge
Si chiama Phi-4-mini-flash-reasoning ed è il nuovo modello AI di Microsoft pensato per dispositivi compatti: più rapido, efficiente e preciso anche su hardware limitato. Tutto merito della nuova architettura SambaY
di Rosario Grasso pubblicata il 11 Luglio 2025, alle 10:46 nel canale TelefoniaMicrosoft
Microsoft ha annunciato Phi-4-mini-flash-reasoning, un nuovo modello linguistico compatto che promette di rivoluzionare le applicazioni AI locali in esecuzione su smartphone, dispositivi edge e sistemi embedded. L'obiettivo è chiaro: offrire capacità di ragionamento avanzate senza dipendere dal cloud.
Il modello è basato su una nuova architettura denominata SambaY, che introduce un sistema di Gated Memory Unit (GMU) per lo scambio efficiente di informazioni tra le varie parti del modello. Questo consente una gestione ottimizzata del contesto anche in conversazioni lunghe o input complessi.
Phi-4-mini-flash-reasoning si distingue per un throughput fino a 10 volte superiore rispetto agli altri modelli Phi, con una latenza ridotta da 2 a 3 volte. In pratica, è in grado di generare risposte o completare task con maggiore rapidità, pur funzionando su dispositivi meno potenti.
Le prestazioni lo rendono adatto a scenari in cui velocità e privacy sono essenziali. Può essere integrato in assistenti locali, strumenti di tutoraggio interattivo, app educative e sistemi di valutazione automatica con logiche adattive. Il supporto al ragionamento matematico e strutturato lo rende particolarmente indicato per ambienti scolastici e simulazioni leggere.
L'esecuzione locale evita inoltre che i dati vengano inviati a server remoti con l'obiettivo di rafforzare la riservatezza delle informazioni trattate. Questa caratteristica diventa cruciale per applicazioni sensibili, come quelle in ambito medico o educativo, dove l'AI può operare senza condivisione esterna dei dati.
Phi-4-mini-flash-reasoning è già disponibile su Azure AI Foundry, NVIDIA API Catalog e Hugging Face. Apre così la porta a una nuova generazione di applicazioni AI ad alte prestazioni ma a basso impatto hardware.










HONOR Magic 8 Pro: ecco il primo TOP del 2026! La recensione
Insta360 Link 2 Pro e 2C Pro: le webcam 4K che ti seguono, anche con gimbal integrata
La nave elettrica più grande mai progettata è finalmente realtà: iniziati i test in acqua
Spusu lancia il Wi-Fi Calling: come funziona il VoWiFi e quanto costa
Questo robot impara a muovere le labbra semplicemente guardandoti
iPhone 17 annienta la concorrenza in Cina: da solo vende il doppio di tutti i competitor locali
La nuova Xiaomi SU7 batte un record: 4.264 km percorsi in 24 ore (comprese le ricariche)
È possibile copiare i qubit: dei ricercatori scoprono come fare il backup dei dati quantistici
BYD alza ulteriormente l'asticella: batterie garantite per almeno 250.000 km
Il nuovo razzo spaziale riutilizzabile cinese Lunga Marcia 12B è quasi pronto al debutto
L'ex leader di Assassin's Creed porta Ubisoft in tribunale e chiede un risarcimento: non si sono lasciati bene
Il razzo spaziale NASA SLS e la capsula Orion per la missione Artemis II sono al pad di lancio per gli ultimi test
Samsung Galaxy S26 Ultra: quattro colorazioni in arrivo, la versione arancione non ci sarà
AWS investe 1,2 miliardi in Italia. Coinvolte 35 imprese per rafforzare l'ecosistema di data center lombardo
La navicella cinese Shenzhou-20 con il finestrino danneggiato da un detrito è rientrata correttamente
I piani Business ed Education di Google Workspace ottengono Flow: video generati da AI da testo e immagini








0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".