AWS e Cerebras uniscono le forze: nuova architettura per accelerare l'inferenza AI nel cloud

AWS e Cerebras collaboreranno per portare nel cloud una nuova infrastruttura di inferenza AI basata su architettura disaggregata. Il sistema combinerà chip Trainium per l'elaborazione dei prompt e sistemi CS-3 per la generazione dei token. Obiettivo? Altissime prestazioni.

di Manolo De Agostini pubblicata il 15 Marzo 2026, alle 15:01 nel canale Mercato
Cerebras Amazon Web Services AWS

Amazon Web Services ha annunciato una collaborazione con Cerebras Systems per sviluppare una nuova infrastruttura destinata ad accelerare l'inferenza dei modelli di intelligenza artificiale generativa nel cloud. La soluzione sarà integrata nella piattaforma Amazon Bedrock e sfrutterà una combinazione di processori Trainium sviluppati da Amazon e sistemi CS-3 basati sulla tecnologia wafer-scale di Cerebras.

L'obiettivo dichiarato è affrontare uno dei principali colli di bottiglia dell'AI moderna: la velocità con cui i modelli linguistici di grandi dimensioni riescono a generare risposte durante l'esecuzione, soprattutto in applicazioni interattive come assistenti di programmazione, chatbot avanzati o sistemi agentici.

Secondo AWS, la piattaforma sarà distribuita nei dat center dell'azienda e resa disponibile nei prossimi mesi attraverso Bedrock, mentre un'offerta commerciale più ampia basata su questa architettura è prevista nel corso della seconda metà del 2026.

Il progetto si basa su un approccio definito "inference disaggregation", che separa il processo di inferenza in due fasi distinte: Prefill, ovvero l'elaborazione del prompt inviato dall'utente e la preparazione del contesto per il modello

Le due operazioni presentano caratteristiche computazionali differenti. Il prefill è altamente parallelizzabile e richiede notevole potenza di calcolo, ma una banda di memoria moderata. Il decode, invece, è intrinsecamente seriale e dipende fortemente dalla larghezza di banda della memoria, perché ogni token deve essere generato uno dopo l'altro.

In molti casi proprio il decode rappresenta la parte più lenta dell'inferenza, soprattutto nei modelli di ragionamento che generano sequenze più lunghe mentre elaborano una risposta.

Per questo AWS e Cerebras hanno scelto di ottimizzare separatamente le due fasi: i processori Trainium si occupano del prefill, mentre i sistemi Cerebras CS-3 gestiscono la generazione dei token. Il collegamento tra le due componenti avviene tramite Elastic Fabric Adapter (EFA), una tecnologia di networking ad alta velocità utilizzata nei cluster HPC di AWS.

Tra i partner che hanno annunciato l'uso della piattaforma figurano Anthropic, che ha scelto AWS come principale infrastruttura per il training dei propri modelli, e OpenAI, che prevede di utilizzare capacità Trainium per supportare carichi di lavoro legati ai modelli di frontiera.

Dal lato Cerebras, il sistema CS-3 utilizza la tecnologia Wafer Scale Engine, un approccio che consiste nel realizzare un singolo chip di dimensioni simili a un wafer, per l'appunto. Questo design punta a ridurre la latenza nella comunicazione interna e a offrire una banda di memoria molto elevata, caratteristiche particolarmente utili durante la generazione sequenziale dei token.

Secondo l'azienda, il sistema può offrire una banda di memoria di gran lunga superiore a quella delle GPU tradizionali, elemento che diventa sempre più rilevante con l'aumento dei modelli di ragionamento e delle applicazioni agentiche.

AWS sostiene che la combinazione tra Trainium e CS-3 possa offrire prestazioni di inferenza fino a un ordine di grandezza superiore rispetto alle soluzioni attuali in alcuni scenari. Il vantaggio dovrebbe emergere soprattutto nelle applicazioni che richiedono interazioni rapide e iterative con l'utente, come gli strumenti di sviluppo software assistiti dall'AI.

AWS diventa il primo hyperscaler ad adottare ufficialmente la tecnologia Cerebras all'interno della propria infrastruttura cloud. Per Cerebras, che sta preparando un'IPO, la partnership con il principale provider di cloud computing rappresenta un'opportunità significativa per ampliare la diffusione della propria architettura e competere più direttamente con le soluzioni basate su GPU.

I migliori sconti su Amazon oggi

-21%

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

329.00 259.00€ Compra ora

-21%

ECOVACS DEEBOT T50 PRO OMNI Gen2 Robot Aspirapolvere Lavapavimenti, (Migliorato da T30 PRO), 21000 Pa, Spazzola Laterale Estensibile e Lavapavimenti, Aggiunta Automatica Soluzione Detergente

499.00€ Compra ora

-21%

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

140.84€ Compra ora

Windows 11: accesso al drive C: bloccato su alcuni portatili Samsung

Sole e pioggia insieme: il nuovo pannello ibrido che genera elettricità anche nelle giornate peggiori

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

ASUS ROG CROSSHAIR X870E GLACIAL

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

AWS e Cerebras uniscono le forze: nuova architettura per accelerare l'inferenza AI nel cloud

TCL 43T6C 43'' QLED TV 4K HDR, Fire TV (Smart tv con Dolby Vision e Atmos, HDR10+, Premi e Chiedi ad Alexa)

ECOVACS DEEBOT T50 PRO OMNI Gen2 Robot Aspirapolvere Lavapavimenti, (Migliorato da T30 PRO), 21000 Pa, Spazzola Laterale Estensibile e Lavapavimenti, Aggiunta Automatica Soluzione Detergente

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

0 Commenti