AMD Ryzen AI Max+: ora anche gli LLM da 128 miliardi di parametri girano in locale
I driver Adrenalin Edition in versione 25.8.1 WHQL abilitano il supporto a LLM fino a 128 miliardi di parametri su Windows. Grazie a Ryzen AI Max+ 395 con 128 GB di RAM, è ora possibile eseguire localmente modelli con 128 miliardi di parametri in locale. Tutto merito di Variable Graphics Memory.
di Manolo De Agostini pubblicata il 30 Luglio 2025, alle 06:01 nel canale ProcessoriIntelligenza ArtificialeRyzenAMD
AMD ha annunciato un importante aggiornamento per la piattaforma Ryzen AI Max+, che estende le capacità dei PC Windows nel campo dell'intelligenza artificiale locale. Con l'introduzione dei nuovi driver Adrenalin Edition 25.8.1 WHQL, il processore Ryzen AI Max+ 395 abbinato a 128 GB di RAM può ora eseguire localmente modelli linguistici di grandi dimensioni (LLM) fino a 128 miliardi di parametri, un traguardo precedentemente riservato solo all'hardware da datacenter.

La novità principale risiede nell'estensione della Variable Graphics Memory (VGM), di cui ci eravamo occupati dal punto di vista gaming, una funzione presente nel BIOS della serie Ryzen AI 300 che permette di riassegnare porzioni della RAM di sistema come memoria grafica dedicata. Nella configurazione Ryzen AI Max+ 395 da 128 GB, fino a 96 GB possono essere allocati alla GPU integrata, rendendo possibile l'esecuzione di modelli estremamente esigenti in termini di memoria, tramite l'implementazione Vulkan di llama.cpp.

Tra i modelli supportati figura Meta Llama 4 Scout 109B, una versione avanzata con architettura Mixture-of-Experts (MoE): attiva solo 17 miliardi di parametri per ogni inferenza, ma necessita di mantenere tutti i 109B in memoria. Nonostante l'imponenza del modello, l'output risulta reattivo, con velocità di generazione fino a 15 token al secondo, rendendolo adatto anche per l'uso in mobilità.
L'integrazione con LM Studio consente di sfruttare un'ampia gamma di modelli LLM, da configurazioni leggere da 1B fino a soluzioni avanzate come Mistral Large. L'utente può regolare liberamente i livelli di quantizzazione (fino a 16 bit) per ottimizzare il compromesso tra qualità e prestazioni.

Un altro elemento tecnico cruciale è la lunghezza del contesto supportata: mentre molti strumenti si fermano a 4.096 token, la nuova piattaforma AMD consente fino a 256.000 token di contesto attivo (con Flash Attention e KV Cache in Q8), aprendo la porta a casi d'uso sofisticati come i workflow agentici.
Questi scenari includono applicazioni MCP (multi-call prompting) come la consultazione di documenti SEC o la sintesi di paper scientifici provenienti da database come arXiv. In questi casi, il numero di token può facilmente superare i 20.000, rendendo indispensabile una gestione avanzata del contesto in memoria.

AMD sottolinea che l'esecuzione locale di modelli così avanzati, precedentemente possibile solo in cloud o in ambienti server, rappresenta un salto qualitativo per la privacy, la reattività e l'autonomia degli strumenti AI. Inoltre, la piattaforma Ryzen AI Max+ è progettata per essere compatibile con un crescente ecosistema di agenti AI locali, potenzialmente in grado di gestire strumenti e workflow complessi in autonomia.
Tra i dispositivi dotati di Ryzen AI Max+ 395 (128 GB) troviamo:
- ASUS ROG Flow Z13
- Corsair AI Workstation 300
- Framework Desktop
- HP ZBook Ultra G1a
- HP Z2 Mini G1a










Plaud NotePin S, il registratore IA si fa indossabile (ma è facile da perdere)
Redmi Watch 6 in prova: lo smartwatch con ampio display da 2000 nit a meno di 100 euro
Mad Catz M.M.O. 7+: lo stesso DNA del R.A.T. 8+ ADV, ma con molti più pulsanti
Guild Wars 3 è ufficiale: ArenaNet annuncia il nuovo MMORPG, beta prevista nel 2027
I giocatori voltano le spalle a Linux? La crescita tra gli utenti di Steam si è fermata
Instagram Plus arriva in Italia: cosa include e quanto costa il servizio
XBOX: la nuova CEO non ha ancora le idee chiare su esclusive e giochi first party
Intel non ha intenzione di abbandonare il mercato delle schede video per PC
La AI Mode sarà attiva di default su Chrome? Google smentisce ma una build di test anticipa novità
Marvel's Wolverine non sarà un open world ma adotterà uno stile più lineare
Star Wars Zero Company esce ad agosto: nel trailer appare Anakin Skywalker
Bonus Decoder: fino al 70% di sconto con la nuova agevolazione, ecco come funzionerà
Virtua Fighter è tornato e non è il gioco che ti aspettavi: ecco cosa cambia davvero
Il ritorno di Fumito Ueda, autore di Shadow of the Colossus: Gen Atlas si mostra in un trailer
Cooler Master svela GPU Shield, la nuova tecnologia protegge il connettore 12V-2x6 delle schede video
Samsung Galaxy S27 Pro: sarà lui il vero best seller? Compatto, chip 'Elite' e la batteria dell'Ultra
Così Google ha ottimizzato Chrome per raggiungere nuovi record nei test









3 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoI comportamenti della Nvidia con gli utenti merita la damnatio memoriae....
E infatti da 23 anni non la considero nemmeno.
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".