Mac come supercomputer AI: con macOS Tahoe 26.2 arriva il clustering su Thunderbolt 5

Mac come supercomputer AI: con macOS Tahoe 26.2 arriva il clustering su Thunderbolt 5

Con macOS Tahoe 26.2, i Mac possono essere collegati via Thunderbolt 5 fino a 80 Gb/s per creare cluster a bassa latenza e consumi contenuti, per consentire l'esecuzione in locale di modelli AI, anche di grandi dimensioni, conservando privacy e controllo dei dati

di pubblicata il , alle 09:41 nel canale Apple
ApplemacOS
 

Apple introdurrà in macOS Tahoe 26.2 una nuova funzione a bassa latenza che consente di collegare più Mac tramite Thunderbolt 5 e farli lavorare come un unico sistema, aprendo la strada alla possibilità di realizzare cluster locali per eseguire modelli AI, anche di grandi dimensioni, a consumi ridotti.

La nuova modalità, che sarà inserita nella prossima Major Release di macOS Tahoe, permetterà di aggregare più Mac con un collegamento a bassa latenza e banda fino a 80 Gb/s, superando i limiti dei precedenti esperimenti con connessioni Thunderbolt più lente o penalizzati dagli hub a 10 Gb/s.

La funzione sarà disponibile, stando alle informazioni correnti, su Mac Studio, Mac mini M4 Pro e MacBook Pro M4 Pro/Max compatibili con Thunderbolt 5, creando una piattaforma modulare che non richiede hardware specializzato oltre a cavi Thunderbolt 5 standard. L'attuale MacBook Pro con chip M5 disponibile oggi supporta solo Thunderbolt 4 e non può sfruttare il nuovo collegamento di cluster. Questa soluzione consente potenzialmente la creazione di "mini supercomputer" AI locali, sfruttando la memoria unificata e i bassi consumi, tipici dei SoC Apple Silicon, per poter eseguire modelli di grandi dimensioni in una rete locale.

Apple sta inoltre abilitando in macOS Tahoe 26.2 l’accesso completo del progetto open source MLX agli acceleratori neurali basati su GPU del chip M5, un passo che promette forti accelerazioni in inferenza, ma che, in assenza di Thunderbolt 5 sul primo modello M5, limita per ora le opzioni di clustering su tale macchina.

L'integrazione punta però a ridurre tempi di prefill e migliorare la velocità di generazione token, offrendo un percorso di scalabilità che combina singolo nodo M5 ottimizzato e cluster Thunderbolt 5 su macchine compatibili per modelli sempre più ampi.

In generale si tratta di un approccio che si propone di favorire la realizzazione di ambienti di sviluppo e ricerca orientati alla privacy e al controllo dei dati, dando modo di eseguire in locale modelli di fascia altissima con consumi contenuti e una gestione della memoria unificata coerente tra i nodi.

1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
demon7726 Novembre 2025, 10:26 #1
Mi pare una gran bella pensata questa.
Mi stupisce anche un po' il fatto che sia Apple a proporla perchè è una cosa "fuori dal suo stile" se così si può dire.

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^