Alibaba lancia Qwen3, un nuovo modello linguistico aperto con capacità di ragionamento ibrido

Alibaba lancia Qwen3, un nuovo modello linguistico aperto con capacità di ragionamento ibrido

Alibaba presenta Qwen3, una nuova generazione di modelli linguistici open-source che introduce la capacità di passare tra modalità diverse per gestire compiti complessi o risposte rapide

di pubblicata il , alle 11:31 nel canale Web
Alibaba
 

Alibaba ha annunciato il lancio globale di Qwen3, il più recente sviluppo nella sua serie di modelli linguistici open-source. La novità introduce una funzionalità inedita: la capacità di operare in due modalità distinte, una dedicata a compiti complessi e l’altra a interazioni fluide e veloci. Questo aggiornamento rappresenta un progresso importante per gli sviluppatori che cercano strumenti flessibili e performanti per progetti che vanno dagli assistenti digitali ai sistemi autonomi.

La gamma Qwen3 include sei modelli densi e due architetture MoE (Mixture-of-Experts). Tutti i modelli sono ora scaricabili gratuitamente e pronti all’uso su dispositivi mobili, occhiali intelligenti, veicoli autonomi e applicazioni robotiche. Un modello denso è una rete in cui ogni neurone è collegato a tutti quelli del livello successivo. Questo permette al modello di imparare relazioni complesse, ma richiede più memoria e calcoli. Le architetture MoE (Mixture-of-Experts), invece, sono modelli di deep learning in cui, invece di attivare tutti i neuroni o tutti i moduli durante l’elaborazione, si attiva solo una piccola parte specializzata del modello (chiamata expert) per ogni input.

Qwen3

Una delle novità principali di Qwen3 è il cosiddetto Hybrid Reasoning, ovvero un sistema in grado di alternare due approcci: uno focalizzato sul ragionamento profondo – adatto a compiti come soluzione di problemi matematici, programmazione e deduzione logica – e un altro pensato per fornire risposte rapide e dirette. Per chi utilizza l’API, è possibile regolare fino a 38.000 token di elaborazione, in modo da poter bilanciare potenza di calcolo e velocità.

Tra le altre caratteristiche spiccano il supporto a 119 lingue e dialetti, una maggiore capacità di lavorare in contesti agent-based grazie al Model Context Protocol (MCP) e alla chiamata nativa di funzioni esterne, e miglioramenti nel dialogo multi-turno e nella scrittura creativa.

I dati su cui è stato addestrato Qwen3 superano i 36 trilioni di token, il doppio del predecessore Qwen2.5. Questo ha permesso di ottenere risultati eccellenti nei principali benchmark del settore: AIME25 (ragionamento matematico), LiveCodeBench (programmazione), BFCL (funzioni complesse) e Arena-Hard (risposta a istruzioni dettagliate).

Il modello è già disponibile per il download. L’accesso tramite API sarà presto attivo sulla piattaforma Model Studio di Alibaba. Inoltre, Qwen3 alimenta Quark, l’applicazione principale dell’azienda per l’assistenza intelligente.

Dalla sua introduzione, la famiglia Qwen ha raggiunto oltre 300 milioni di download in tutto il mondo. Gli sviluppatori hanno creato più di 100 mila modelli derivati su Hugging Face e collocato Qwen tra le serie di modelli open-source più diffuse a livello internazionale.

1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
davide44530 Aprile 2025, 06:37 #1
Avendo testato qwen 2.5 é un ottimo modello, ma con il problema noto e tracciato che ogni tanto decide di buttare fuori risposte in cinese. Quindi archiviato fino ad ora.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^