Qualcomm entra nei datacenter: annunciati gli acceleratori AI200 e AI250 per l'inferenza generativa

Qualcomm entra nel mercato dei datacenter con gli acceleratori AI200 e AI250, soluzioni rack-scale pensate per l'inferenza di modelli generativi. Basate sull'architettura NPU Hexagon, con 768 GB di memoria per scheda e tecnologia Near Memory Computing, promettono prestazioni elevate a basso TCO per sfidare NVIDIA e AMD.

di Manolo De Agostini pubblicata il 28 Ottobre 2025, alle 06:01 nel canale Server e Workstation
Qualcomm

Qualcomm ha annunciato ufficialmente AI200 e AI250, due acceleratori per datacenter che segnano l'ingresso dell'azienda statunitense nel mercato dell'inferenza AI su scala rack. Si tratta di sistemi completi, progettati per l'esecuzione di modelli generativi e multimodali di grandi dimensioni, con l'obiettivo di offrire prestazioni elevate a costi di gestione contenuti (TCO).

L'iniziativa rappresenta un cambio di passo per Qualcomm, da sempre concentrata su chip per dispositivi mobili e connettività wireless, salvo un passato tentativo andato a vuoto di entrare nell'arena delle CPU server con la linea CentriQ.

Ora l'azienda punta al segmento in più rapida crescita dell'intera industria tecnologica: quello delle infrastrutture per l'intelligenza artificiale. Secondo stime McKinsey, infatti, entro il 2030 saranno investiti oltre 6,7 trilioni di dollari in datacenter, con la maggior parte delle risorse destinate a sistemi basati su chip AI.

Entrambe le soluzioni si basano su versioni evolute delle NPU Hexagon, unità di elaborazione neurale già impiegate nei SoC Snapdragon, ma in questo caso scalate per carichi di lavoro da datacenter. Le nuove varianti includono acceleratori scalar, vector e tensor in configurazione 12+8+1, supportano formati di precisione ridotta come INT2, INT4, INT8 e FP8, tecniche di inferencing micro-tile per ridurre il traffico di memoria e funzionalità di virtualizzazione e crittografia dei modelli per garantire sicurezza nelle implementazioni enterprise.

A differenza delle soluzioni di NVIDIA e AMD, orientate anche al training, Qualcomm ha scelto di concentrarsi esclusivamente sull'inferenza, cioè sull'esecuzione di modelli già addestrati, ambito che rappresenta la parte più intensiva e ricorrente nei flussi di lavoro generativi. Qualcosa che, anche Intel, punta a fare nei prossimi anni.

L'AI200, in arrivo nel 2026, sarà la prima soluzione a debuttare e offrirà 768 GB di memoria LPDDR5. Il sistema rack che la vedrà protagonista offrirà scalabilità orizzontale tramite Ethernet e verticale via PCIe, mentre la dissipazione termica sarà gestita con raffreddamento a liquido diretto. Il consumo complessivo dichiarato per un rack completo è stimato in 160 kW.

L'anno successivo, nel 2027, debutterà AI250, evoluzione diretta del modello precedente, che introdurrà una nuova architettura di calcolo "near-memory". Questa tecnologia promette un aumento di oltre 10 volte della larghezza di banda effettiva della memoria e una significativa riduzione dei consumi, consentendo un utilizzo disaggregato e più efficiente delle risorse di calcolo e memoria tra le diverse schede del rack.

Oltre all'hardware, Qualcomm ha sviluppato una piattaforma software end-to-end di livello hyperscaler, pensata per semplificare l'integrazione e la gestione dei modelli AI. Il pacchetto, compatibile con PyTorch, ONNX, vLLM, LangChain e CrewAI, consente il deployment con un clic di modelli pre-addestrati, anche tramite librerie come la Efficient Transformers Library. L'azienda promette inoltre il pieno supporto al confidential computing e alla gestione centralizzata dei workload attraverso Qualcomm AI Inference Suite.

Con il lancio di AI200 e AI250, Qualcomm conferma una roadmap annuale di prodotti per datacenter, segno dell'impegno a lungo termine nel settore. L'azienda sta inoltre lavorando su CPU proprietarie, che potrebbero debuttare intorno al 2028, mentre per questi primi sistemi è previsto l'impiego di chip Arm o x86 di terze parti.

I migliori sconti su Amazon oggi

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

29.49€ Compra ora

-21%

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

329.00 259.00€ Compra ora

-21%

Amazfit Bip 5, 46 mm, Smartwatch, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

44.38€ Compra ora

Amazon prepara il più grande licenziamento della sua storia: fino a 30.000 posti a rischio

Lux e Discovery, AMD e il Dipartimento dell'Energia USA uniscono le forze per due nuovi supercomputer AI

supertigrotto28 Ottobre 2025, 13:32 #1

Praticamente hanno usato parte della tecnologia per smartphone e la hanno scalata,un po' come Intel con i core due duo post netburst

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

ASUS ROG CROSSHAIR X870E GLACIAL

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

Qualcomm entra nei datacenter: annunciati gli acceleratori AI200 e AI250 per l'inferenza generativa

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

Amazfit Bip 5, 46 mm, Smartwatch, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

1 Commenti