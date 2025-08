OpenAI ha rilasciato i nuovi modelli gpt-oss-120b e gpt-oss-20b, che segnano il ritorno ai modelli open-weight dopo GPT-2 del 2019. Questi modelli sono scaricabili, gestibili direttamente su hardware privato e completamente open sotto licenza Apache 2.0, permettendo così agli sviluppatori di personalizzarli e adattarli a casi d’uso specifici. I due modelli sono pensati per esigenze diverse: la versione gpt-oss-20b è indirizzata agli utenti consumer e può girare su una macchina con almeno 16GB di memoria, mentre la gpt-oss-120b è pensata per workstation o server dotati di GPU con almeno 80GB di memoria ed è in grado di funzionare su una singola Nvidia H100, garantendo così accessibilità anche per chi ha elevate esigenze computazionali.

Architettura Mixture-of-Experts e chain of thought personalizzabile

Entrambi i modelli sfruttano una architettura Mixture-of-Experts (MoE), che consente di ridurre i parametri realmente attivi a ogni token, ottimizzando l’efficienza senza sacrificare le prestazioni. In particolare, gpt-oss-20b dispone di 21 miliardi di parametri totali, ma solo 3,6 miliardi sono attivi per token grazie a MoE; gpt-oss-120b raggiunge 117 miliardi di parametri totali, con 5,1 miliardi attivi per token. Entrambi supportano una finestra di contesto di 128.000 token, ideale per processi complessi e input di grandi dimensioni.

Un'altra caratteristica distintiva è il chain of thought (CoT) configurabile, che permette di impostare la "profondità" del ragionamento del modello direttamente nel prompt: livelli bassi garantiscono velocità e basso consumo di risorse, quelli alti una qualità di output superiore, a fronte di una maggiore latenza e richiesta computazionale.

Prestazioni, benchmark e limitazioni rispetto ai modelli proprietari

OpenAI sottolinea come le prestazioni dei nuovi modelli siano prossime a quelle delle versioni cloud proprietarie: gpt-oss-120b si avvicina al livello di o4-mini, mentre la versione più piccola, gpt-oss-20b, è vicina a o3-mini. I benchmark rilasciati dalla compagnia evidenziano risultati solidi in compiti di ragionamento, coding e utilizzo di strumenti, con percentuali di accuratezza elevate su test come AIME 2024 e MMLU, e una performance vicina ai modelli più avanzati in matematica e programmazione. Nei test di conoscenza generale i modelli proprietari OpenAI e concorrenti come Gemini Deep Think di Google mantengono ancora un vantaggio considerevole.

Nonostante la mancanza della multimodalità (i modelli sono solo testuali) e alcune altre limitazioni tecniche, OpenAI specifica che l’intento non è sostituire le proprie soluzioni cloud, ma offrire nuovi strumenti per chi necessita di controllo locale, latenza ridotta e maggiore privacy.

Come dicevamo, i modelli sono rilasciati con licenza Apache 2.0, consentendo una messa a punto e un eventuale utilizzo commerciale senza restrizioni di brevetto. OpenAI ribadisce l’attenzione alla sicurezza e all'affidabilità, dichiarando che anche in scenari "worst case" di tuning malevolo i modelli non hanno superato soglie di pericolosità elevate, grazie a una gerarchia di istruzioni e sistemi di alignment deliberati.

I nuovi modelli sono disponibili su HuggingFace, mentre su GitHub è presente la documentazione e invece direttamente da OpenAI sarà possibile effettuare una prova grazie a versioni stock messe liberamente a disposizione. Ulteriori dettagli nella model card dedicata e nel post sul blog ufficiale della compagnia.