Il MIT ha scoperto il trucco per rendere i modelli AI più veloci del 200%

Un team del Massachusetts Institute of Technology ha sviluppato TLT, un sistema che sfrutta il tempo di calcolo inutilizzato durante il reinforcement learning per accelerare l'addestramento dei "reasoning LLM" fino al 210% senza perdita di accuratezza. La tecnica riduce costi ed energia migliorando l'efficienza complessiva del training.

di Manolo De Agostini pubblicata il 03 Marzo 2026, alle 07:01 nel canale Scienza e tecnologia

L'addestramento degli LLM con capacità di ragionamento rappresenta oggi una delle sfide più onerose in termini di calcolo ed energia. Questi modelli, progettati per scomporre problemi complessi in passaggi intermedi - non a caso si parla di catena di pensiero - richiedono cicli di apprendimento per rinforzo estremamente intensivi.

Un gruppo di ricercatori del Massachusetts Institute of Technology, in collaborazione con NVIDIA, ETH Zurich, MIT-IBM Watson AI Lab e University of Massachusetts Amherst, ha proposto una soluzione che punta a migliorare radicalmente l'efficienza del processo senza compromettere l'accuratezza dei modelli.

Nell'addestramento dei "reasoning LLM" tramite addestramento per rinforzo, il modello genera molteplici risposte candidate per ogni query (fase di rollout), riceve una ricompensa per la migliore e aggiorna i propri parametri di conseguenza. Questo ciclo viene ripetuto migliaia di volte.

Secondo i ricercatori, fino all'85% del tempo di esecuzione è assorbito proprio dalla generazione delle risposte, non dall'aggiornamento dei pesi del modello. Inoltre, l'architettura distribuita del training impone che tutti i processori coinvolti attendano il completamento delle risposte più lunghe prima di procedere allo step successivo. Di conseguenza, parte delle risorse di calcolo resta inutilizzata.

Per affrontare il problema, il team ha esteso il concetto di speculative decoding - che già aveva dimostrato i suoi vantaggi. La tecnica prevede l'impiego di un modello più piccolo - definito "drafter" - che anticipa le possibili uscite del modello principale. Quest'ultimo verifica in parallelo le previsioni, accettando quelle corrette e scartando le altre, con un'accelerazione rispetto alla generazione sequenziale.

Tuttavia, nei contesti di reinforcement learning tradizionali il modello principale viene aggiornato continuamente: un drafter statico diventerebbe rapidamente obsoleto. La soluzione proposta, denominata "Taming the Long Tail" (TLT), introduce un meccanismo adattivo su due livelli:

Adaptive drafter trainer: utilizza i processori inattivi per aggiornare dinamicamente il modello ausiliario, mantenendolo allineato al modello principale senza richiedere risorse aggiuntive
Adaptive rollout engine: regola automaticamente la configurazione dello speculative decoding in base al carico di lavoro e alle percentuali di accettazione delle previsioni

Il modello ausiliario è progettato per essere leggero e riutilizza componenti del processo di training del modello principale, massimizzando così l'efficienza.

TLT ha permesso di accelerare il training tra il 70% e il 210%, mantenendo invariata l'accuratezza finale dei modelli.

L'approccio non introduce overhead computazionale aggiuntivo, in quanto sfrutta esclusivamente il tempo di inattività già presente nell'infrastruttura di training. Questo aspetto potrebbe tradursi in una riduzione significativa dei costi operativi e dei consumi energetici, soprattutto in applicazioni critiche come la previsione di tendenze finanziarie o l'analisi dei rischi nelle reti elettriche.

I migliori sconti su Amazon oggi

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

140.84€ Compra ora

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

29.49€ Compra ora

Amazfit Bip 5, 46 mm, Smartwatch, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

44.38€ Compra ora

Ora su Amazon c'è un coupon che consente di risparmiare 100€ su tutti i nuovi Samsung Galaxy S26: ecco come fare

Le CPU Intel Arrow Lake-S Refresh sarebbero dietro l'angolo, la il Core Ultra 9 290K non ci sarà

supertigrotto03 Marzo 2026, 10:28 #1

Al mit fanno le cose più impensabili,credo stiano ancora lavorando sulla IA e i memristori,una accoppiata che potremmo avere in futuro

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.

tutti gli articoli »

tutte le news »

Multimedia
Gallerie
Video

Nuova Opel Astra Electric, stile rinnovato

Sony Alpha 7 V, la nuova velocista

Lucid Gravity Touring, nuovo allestimento più equilibrato

Jeu de Paume

Rilasciati nuovi video e immagini della seconda missione del razzo spaziale Blue Origin New Glenn

Formula E Gen4 - La monoposto

Wi-Fi 7 con il design di una vetta innevata: ecco il nuovo sistema mesh di Huawei HUAWEI WiFi Mesh X3 Pro Suite è probabilmente il router mesh più fotogenico che si possa acquistare oggi in Italia, ma dietro il guscio in acrilico trasparente e...

Recensione Nothing Phone 4(a): sempre iconico ma ora più concreto Nothing con il suo nuovo Phone 4(a) conferma la sua identità visiva puntando su una costruzione che nobilita il policarbonato. La trasparenza resta l'elemento cardine,...

Diablo II Resurrected: il nuovo DLC Reign of the Warlock Abbiamo provato per voi il nuovo DLC lanciato a sorpresa da Blizzard per Diablo II: Resurrected e quella che segue è una disamina dei nuovi contenuti che abbiamo...

DJI RS 5: stabilizzazione e tracking intelligente per ogni videomaker Analizziamo nel dettaglio DJI RS 5, l'ultimo arrivato della famiglia Ronin progettato per videomaker solisti e piccoli studi. Tra tracciamento intelligente migliorato...

Vi portiamo all'interno di uno dei più importanti centri di distribuzione Amazon in Italia MXP6 è uno dei più recenti investimenti di Amazon sul territorio italiano, per la realizzazione di un capannone da 60.000 metri quadri alle porte di Novara, a due...

Deep Tech Revolution: così Area Science Park apre i laboratori alle startup Siamo tornati nel parco tecnologico di Trieste per il kick-off del programma che mette a disposizione di cinque startup le infrastrutture di ricerca, dal sincrotrone...

Alpine A290 alla prova: un'auto bella che ti fa innamorare, con qualche limite Abbiamo guidato per diversi giorni la Alpine A290, la prima elettrica del nuovo corso della marca. Non è solo una Renault 5 sotto steroidi, ha una sua identità e...

Ecovacs DEEBOT T90 PRO OMNI: ora il rullo di lavaggio è ampio DEEBOT T90 PRO OMNI abbina un sistema di aspirazione basato su tecnologia BLAST ad un rullo di lavaggio dei pavimenti dalla larghezza elevata, capace di trattare...

Il MIT ha scoperto il trucco per rendere i modelli AI più veloci del 200%

LEFANT M330Pro Robot Aspirapolvere Lavapavimenti con Mappatura, Navigazione dToF, Zona vietata, Evitamento ostacoli PSD, Aspirazione 5000Pa, 150 minuti, Pulizia programmata, Alexa/APP/WiFi,Nero

FRITZ!Repeater 600 Edition International, Ripetitore - Wi-Fi extender fino a 600 Mbit/s (2,4 GHz), Mesh, Access Point, Interfaccia in italiano

Amazfit Bip 5, 46 mm, Smartwatch, Schermo grande, chiamate Bluetooth, Alexa, GPS, durata della batteria di 10 giorni, fitness tracker con frequenza cardiaca, monitoraggio dell'ossigeno nel sangue

1 Commenti