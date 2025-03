Figure ha sviluppato un sistema di apprendimento per rinforzo che permette a Figure 02 di camminare in modo più naturale rispetto al passato. La startup spiega come ci è riuscita e quali sono le sfide che ha dovuto affrontare.

Ponendo fine alla sua partnership con OpenAI, il CEO di Figure AI anticipò l'arrivo di grandi novità per il robot umanoide Figure 02 su cui l'azienda sta lavorando da tempo.

Nelle scorse ore, con un video, la startup ha presentato la nuova "camminata naturale" per il suo robot, pronto a dire addio alla "Biden Walk", un modo di dire forse poco elegante per indicare un'andatura "scattosa", innaturale, come quella mostrata alcune volte dall'ex presidente USA nella parte finale del suo mandato.

"Siamo entusiasti di presentare la nostra rete neurale end-to-end, addestrata con apprendimento per rinforzo (RL), per la locomozione umanoide", esordisce un post sul blog di Figure AI.

L'apprendimento per rinforzo consente al robot di imparare a camminare come un essere umano grazie a tentativi ed errori in un ambiente simulato. L'addestramento avviene interamente in una simulazione fisica ad alta fedeltà, dove migliaia di modelli virtuali del robot vengono esposti a condizioni variabili, come terreni diversi, cambiamenti nella dinamica degli attuatori e situazioni impreviste come scivolate o spinte esterne.

Grazie alla potenza delle GPU, questa simulazione è in grado di comprimere anni di esperienza in poche ore, permettendo di iterare rapidamente e migliorare continuamente le capacità motorie del robot.

Uno degli aspetti più critici dell'apprendimento automatico nei robot umanoidi è il cosiddetto "sim-to-real gap", ovvero la difficoltà di trasferire un modello addestrato in simulazione a un robot fisico senza perdita di efficacia.

Per superare questa sfida, Figure AI usa una combinazione costituita dalla "randomizzazione" dei parametri fisici all'interno della simulazione e il controllo della coppia ad alta frequenza nel robot reale. La randomizzazione permette alla rete neurale di adattarsi a un'ampia gamma di condizioni, aumentando la capacità del modello di generalizzare e funzionare senza bisogno di ulteriori interventi. Il controllo della coppia ad alta frequenza, invece, compensa eventuali discrepanze tra la simulazione e la realtà, garantendo movimenti precisi e stabili.

L'obiettivo di Figure non è solo insegnare a Figure 02 a camminare, ma farlo in un modo che sia il più possibile simile al movimento umano. Un problema comune nell'apprendimento per rinforzo è che il robot potrebbe sviluppare strategie di camminata efficienti ma non naturali.

Per evitare questo, il sistema di apprendimento viene guidato attraverso un insieme di traiettorie di riferimento basate sulla biomeccanica umana, premiando movimenti come il contatto iniziale con il tallone, il distacco della punta e la sincronizzazione del movimento delle braccia con le gambe. Questo approccio permette di ottenere un'andatura che non solo è efficiente e stabile, ma anche esteticamente e funzionalmente vicina a quella di un essere umano.

Un aspetto particolarmente promettente è la scalabilità del sistema: la stessa rete neurale viene utilizzata senza modifiche su un'intera flotta di robot, dimostrando la possibilità di estendere questa tecnologia a migliaia di unità senza bisogno di personalizzazioni individuali.