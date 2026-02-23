Otto rilasci in sette giorni non sono rumore, sono un segnale. LIA diventa commodity, i chatbot diventano agenti, i costi precipitano. Intanto i laboratori cinesi guadagnano terreno con numeri e strategie difficili da ignorare

Chi sono e su cosa ci faccio qui? Mi chiamo Luciano Ballerano, ho passato 18 anni in NVIDIA, prima nel Marketing, poi nelle Pubbliche Relazioni e infine a occuparmi di contenuti e formazione per i partner in tutta Europa. Ho visto la rivoluzione dellIA nascere dallinterno. Oggi provo a scrivere libri sullimpatto dellIA su tutti noi, costruisco prodotti AI senza saper programmare (si chiama vibe coding, ed è una storia che vi racconterò), e con questa rubrica settimanale voglio fare una cosa sola: aiutarvi a capire cosa sta succedendo davvero con lIA generativa, senza lhype di chi vende e senza il cinismo di chi nega.

Sette giorni. Otto modelli di intelligenza artificiale rilasciati da sette aziende. Se qualcuno si stava ancora chiedendo se il ritmo dell'innovazione nell'IA stesse rallentando, febbraio 2026 ha fornito una risposta piuttosto chiara.

Partiamo dai fatti. Il 12 febbraio MiniMax, startup cinese di Shanghai, ha rilasciato M2.5. Il 16 febbraio Alibaba ha presentato Qwen 3.5, il suo modello di punta. Lo stesso giorno, Ant Group ha annunciato due modelli: uno generalista da mille miliardi di parametri e uno specializzato nel ragionamento matematico. Il 17 febbraio è stato il turno di Anthropic con Claude Sonnet 4.6 e di xAI con Grok 4.2. Il 19 febbraio Google ha chiuso la settimana con Gemini 3.1 Pro. E in mezzo, ZhipuAI ha presentato GLM-5, addestrato interamente su chip cinesi Huawei Ascend.

I parametri, per chi non ha familiarità col termine, sono i valori numerici che il modello ha appreso durante l'addestramento: più ce ne sono, più il sistema è capace di riconoscere schemi complessi nel linguaggio. Sono tanti numeri. Proviamo a capire cosa significano.

La fascia media che diventa fascia alta

Il dato più significativo arriva probabilmente da Anthropic. Claude Sonnet 4.6 è un modello di fascia media. Eppure nelle valutazioni degli utenti viene preferito al 70% rispetto al Sonnet 4.5 che lo precede, e al 59% rispetto a Claude Opus 4.5, che fino a pochi mesi fa era il modello più potente dell'azienda. Tradotto: prestazioni da prima della classe al prezzo di un modello intermedio.

Google risponde con Gemini 3.1 Pro. Nei test di ragionamento logico su problemi mai visti prima, il punteggio è più che raddoppiato rispetto alla versione precedente: dal 31% al 77%. Nei confronti diretti con altri modelli, votati da utenti reali, è il primo a superare una soglia che nessuno aveva raggiunto. E il prezzo? Invariato.

Grok 4.2 di xAI, l'azienda di Elon Musk, arriva in versione di prova pubblica con un approccio diverso: quattro moduli specializzati che ragionano in parallelo e sintetizzano le risposte. Musk lo definisce capace di "apprendimento rapido", con miglioramenti settimanali basati sulle segnalazioni degli utenti. Un modello che continua a migliorare dopo il rilascio, in pratica.

Questi numeri vanno presi con le pinze, come sempre. I test standardizzati misurano prestazioni specifiche in condizioni controllate, non necessariamente l'utilità pratica di un modello nel lavoro quotidiano. Ma la direzione è inequivocabile: il livello di prestazioni che un anno fa richiedeva il modello più potente e costoso disponibile, oggi si ottiene con modelli che costano un quinto. O un ventesimo.

L'onda cinese

Il vero segnale di questo febbraio, però, arriva dalla Cina. Cinque laboratori hanno rilasciato modelli di prima fascia in dieci giorni, a ridosso del Capodanno Lunare. Non è un caso: è una dimostrazione di forza coordinata.

Qwen 3.5 di Alibaba è il più ambizioso del lotto. Ha 397 miliardi di parametri totali, ma ne usa solo 17 alla volta grazie a un'architettura che attiva solo le parti del modello necessarie per ogni richiesta, risparmiando enormi quantità di energia e potenza di calcolo. Gestisce testo, immagini e video, supporta 201 lingue, e costa il 60% in meno rispetto ai concorrenti americani. Sui test standardizzati dichiara prestazioni alla pari con i modelli di punta di OpenAI, Anthropic e Google. La famiglia Qwen era già la più usata tra i modelli aperti nel 2025.

MiniMax M2.5 gioca una partita diversa: punta tutto sull'efficienza. Costa circa un ventesimo rispetto al modello più potente di Anthropic, ma nei test di programmazione ottiene risultati quasi identici. MiniMax dichiara che il 30% delle attività nella propria azienda viene già completato da M2.5, e l'80% del nuovo codice è generato dal modello.

Ant Group ha rilasciato un modello da mille miliardi di parametri che nei test di matematica raggiunge i risultati dei migliori sistemi al mondo, ma usando un terzo delle risorse di calcolo. Il secondo modello, specializzato nel ragionamento matematico, ha ottenuto punteggi da medaglia d'oro alle Olimpiadi Internazionali di Matematica 2025. Entrambi sono rilasciati con licenza aperta: chiunque può scaricarli, studiarli e usarli.

GLM-5 di ZhipuAI merita un discorso a parte. È un modello da 744 miliardi di parametri addestrato su un cluster di 100.000 chip Huawei Ascend. Interamente. Nessun chip NVIDIA, nessun hardware americano. Solo un anno fa, addestrare un modello di questa scala su hardware domestico cinese sarebbe sembrato impraticabile. Le restrizioni americane all'esportazione di chip avanzati, evidentemente, stanno perdendo efficacia.

Cosa cambia per chi li usa

Per gli utenti finali, questa proliferazione di modelli ha risvolti positivi concreti. Le prestazioni che fino a pochi mesi fa erano accessibili solo con abbonamenti a pagamento stanno diventando gratuite o quasi. Claude Sonnet 4.6 è già il modello predefinito per tutti gli utenti di claude.ai. Gemini 3.1 Pro è disponibile nell'app Gemini. La competizione sta comprimendo i prezzi verso il basso a una velocità senza precedenti.

C'è però un rovescio della medaglia. La scelta è diventata travolgente. Quale modello usare per cosa? I test standardizzati non aiutano quanto dovrebbero, perché ogni laboratorio seleziona quelli su cui eccelle. Le prestazioni su un problema matematico non predicono la qualità di una traduzione o di un riassunto. E il modello migliore per un certo compito potrebbe non essere disponibile nello strumento che usi abitualmente.

C'è poi la questione della sicurezza. Con modelli rilasciati ogni settimana, quanto tempo viene dedicato a verificare che non producano contenuti dannosi o inaffidabili? La risposta varia enormemente tra i diversi laboratori, e non sempre nella direzione giusta.

Cosa cambia per chi sviluppa

Per chi costruisce prodotti e servizi basati sull'IA, il panorama è sia entusiasmante sia complicante. I costi di utilizzo in caduta libera rendono fattibili applicazioni che sei mesi fa sarebbero state economicamente insostenibili. L'abbondanza di modelli aperti - quelli il cui codice è disponibile a tutti - permette di personalizzarli per esigenze specifiche e di farli funzionare sui propri server, riducendo la dipendenza da un singolo fornitore.

Ma la complessità operativa è cresciuta. Gestire le connessioni con servizi diversi, valutare quale modello funziona meglio per quale compito, mantenere il passo con rilasci che si susseguono ogni settimana: è diventato un lavoro a tempo pieno. Stanno emergendo sistemi automatici che smistano ogni richiesta verso il modello più adatto. Non perché siano eleganti, ma perché sono necessari.

Il dato forse più rivelatore: sulle piattaforme che aggregano l'accesso a decine di modelli, quelli cinesi stanno guadagnando quote di mercato significative. Questo non vuol dire che siano migliori in assoluto, ma sicuramente il loro rapporto qualità-prezzo è diventato troppo vantaggioso per essere ignorato.

Dove porta questa accelerazione

Tre tendenze emergono con chiarezza.

La prima: l'intelligenza artificiale sta diventando una commodity, un bene sempre più accessibile e intercambiabile. Quello che costava 75 dollari per milione di operazioni quattro mesi fa oggi ne costa 15 o meno. La traiettoria è quella classica della tecnologia: da risorsa scarsa e costosa a servizio alla portata di tutti. Non ci siamo ancora, ma la direzione è quella.

La seconda: i modelli non servono più solo a rispondere alle domande. Tutti quelli rilasciati questa settimana enfatizzano la capacità di eseguire compiti in autonomia: usare strumenti, navigare il web, scrivere e testare codice. La conversazione con un chatbot sta cedendo il passo all'automazione. Il passaggio dal "chiedere" al "delegare" è in corso.

La terza: esistono ormai due ecosistemi di IA separati. Uno americano - Anthropic, Google, OpenAI, xAI - e uno cinese - Alibaba, ZhipuAI, MiniMax, Ant Group. Si influenzano a vicenda, competono sugli stessi test, ma operano su infrastrutture hardware diverse e con regole diverse. Il caso di GLM-5, addestrato su hardware interamente cinese, suggerisce che questa separazione potrebbe approfondirsi.

C'è una domanda di fondo che vale la pena farsi: questa velocità di rilascio è sostenibile? E soprattutto, è utile? Modelli che si succedono ogni settimana lasciano poco tempo per la valutazione approfondita, per la scoperta di limiti e rischi, per l'integrazione reale nei flussi di lavoro.

La risposta, per ora, è che il treno non rallenta. Chi lavora con questi strumenti, o chi ne è semplicemente curioso, farebbe bene a non distrarsi troppo a lungo. Magari niente di veramente rivoluzionario, ma l'accumulo di miglioramenti incrementali, settimana dopo settimana, sta cambiando il panorama più rapidamente di quanto la maggior parte delle persone riesca a percepire.