Google come Isaac Asimov: arriva la "Costituzione del robot"
DeepMind presenta una serie di novità per la realizzazione di robot che possano integrarsi nella vita quotidiana. La sicurezza è un aspetto fondamentale, e l'azienda di Mountain View si ispira anche alle tre leggi della robotica
di Andrea Bai pubblicata il 05 Gennaio 2024, alle 14:41 nel canale Scienza e tecnologiaIl team di robotica di Google DeepMind ha divulgato alcuni importanti aggiornamenti tecnologici che consentiranno di progredire verso la realizzazione di robot capaci di integrarsi con la vita quotidiana e che permetteranno loro di prendere decisioni più rapide e più efficaci. L'aspetto chiave di queste novità, una in particolare, è la volontà di garantire la sicurezza delle persone grazie ad una maggior consapevolezza e comprensione del contesto da parte dei robot e ad una serie di "regole di base" che Google chiama "Costituzione del robot".
AutoRT, modello di apprendimento e addestramento con una "Costituzione del robot"
La prima di queste novità è AutoRT, un sistema che sfrutta i modelli IA di grandi dimensioni i quali rappresentano un tassello fondamentale per la realizzazione di robot che siano capaci di comprendere obiettivi pratici tipicamente "umani". AutoRT combina modelli di grandi dimensioni come Large Language Model o Visual Language Model e un modello di controllo del robot (come i modelli RT-1 o RT-2 sviluppati da Google, che imparano nozioni sia dal web sia direttamente dai robot e traducono queste nozioni in istruzioni generalizzate per il controllo del robot) per realizzare un sistema capace di schierare e dirigere simultaneamente una serie di robot, dotati anche di videocamere e attuatori, che raccolgano dati di addestramento in nuovi ambienti. In questo modo per ciascun robot viene sfruttato un VLM per la comprensione dell'ambiente circostante e un LLM per gli eventuali compiti che il robot potrebbe essere chiamato a svolgere, come ad esempio "appoggia il caffè sulla scrivania".
I diversi ambienti di sperimentazione di Auto-RT
DeepMind ha condotto una estensiva fase di sperimentazione durata sette mesi, in cui il sistema si è mostrato capace di coordinare in maniera sicura fino a 20 robot contemporaneamente e fino a 52 robot unici in totale, in una varietà di scenari negli uffici della società, raccogliendo un set di dati diversificato composto da 77 mila prove robotiche in oltre 6600 attività uniche.
AutoRT è al momento un "semplice" sistema di raccolta dati, ma contemporaneamente è anche una prima dimostrazione di come i robot autonomi possano integrarsi nel mondo reale. Perché ciò possa avvenire su larga scala e nella quotidianità, è fondamentale che essi siano sviluppati in maniera responsabile e con una solida ricerca che ne dimostri la loro sicurezza una volta che si trovano a contatto con gli esseri umani.
Quando si parla di interazione tra l'uomo e il robot, gli appassionati di fantascienza non possono fare a meno di pensare alle tre leggi della robotica ideate da Isaac Asimov nei suoi racconti e nei romanzi che hanno come protagonisti i celebri robot positronici. Si tratta di tre enunciati che, nell'universo fantascientifico creato da Asimov, sono codificati nel "cervello positronico" dei robot e rappresentano le fondamenta del loro comportamento e delle loro interazioni con l'uomo:
- Un robot non può recar danno a un essere umano né può permettere che, a causa del suo mancato intervento, un essere umano riceva danno.
- Un robot deve obbedire agli ordini impartiti dagli esseri umani, purché tali ordini non vadano in contrasto alla Prima Legge.
- Un robot deve proteggere la propria esistenza, purché la salvaguardia di essa non contrasti con la Prima o con la Seconda Legge.
E' proprio ispirandosi (anche) a queste tre leggi che il team di robotica di Google Deep Mind ha pensato di creare una sorta di "Costituzione del robot", cioè una serie di istruzioni incentrate sulla sicurezza a cui AutoRT si deve attenere quando sceglie i compiti per i robot, come ad esempio il divieto di svolgere qualsiasi attività che coinvolgano direttamente esseri umani, animali, oggetti appuntiti o apparecchi elettrici. Sono presenti anche misure di sicurezza tratte dalla robotica "tradizionale", cioè quella già ampiamente diffusa e utilizzata nelle grandi aziende produttive, come ad esempio il blocco automatico dei robot qualora la forza sulle loro articolazioni superi un determinato valore. Nella sperimentazione condotta dal team di Google, inoltre, tutti i robot sono stati mantenuti in contatto visivo con un supervisore umano dotato di un interruttore di spegnimento.
SARA-RT, più efficienza per i modelli di controllo robotico
La seconda novità presentata dal team DeepMind è chiamata Self-Adaptive Robust Attention for Robotics Transformers, o SARA-RT, che rende più efficienti gli attuali modelli Robotics Transformer che Google utilizza nei più recenti sistemi di controllo robotico. L'impiego di SARA-RT ha mostrato un incremento della precisione del 10,6% e una maggior velocità del 14% rispetto ai modelli RT-2 dopo che è stato sottoposto ad una breve raccolta di immagini specifiche.
I modelli Transformer sono potenti ma richiedono una disponibilità di potenza computazionale che potrebbe rallentare il processo decisionale. Si tratta di modelli a complessità quadratica dove l'aumento degli input impone un aumento quadratico delle capacità computazionali: se l'input raddoppia, la capacità di calcolo deve aumentare di fattore quattro per mantenere le stesse prestazioni, il che può di fatto rallentare il processo decisionale.
Con SARA-RT i ricercatori DeepMind sono stati in grado di usare un nuovo metodo di messa a punto, battezzato "up-training", che riesce a convertire la complessità quadratica in complessità lineare, andando ad aumentare la velocità del modello originale preservando, al contempo, la qualità. I ricercatori ritengono che SARA-RT rappresenti il primo meccanismo di attenzione scalabile capace di fornire miglioramenti computazionali senza perdita di qualità, con la possibilità di essere applicato ad un'ampia varietà di modelli Transformer in maniera molto semplice e senza necessità di codice aggiuntivo.
RT-Trajectory, tracciati bidimensionali per apprendere compiti generalizzati
Infine i ricercatori DeepMind hanno presentato RT-Trajectory, un modello che aggiunge contorni visivi bidimensionali che descrivono i movimenti e le appendici del robot nei video di formazione. Il modello acquisisce ogni video in un set di dati di addestramento e vi sovrappone, ad esempio, la traiettoria del braccio robotico mentre esegue una determinata attività, come ad esempio la pulizia di un piano di lavoro che rappresenta un'attività intuitiva per un essere umano ma che un robot potrebbe tradurre in molti modi diversi.
Nella pratica tradizionale l'addestramento di un bracco robotico segue un approccio che mappa il linguaggio naturale astratto "pulire il tavolo" in una sequenza di movimenti specifici, cosa che rende difficile per i modelli andare a generalizzare compiti nuovi. I tracciati in sovraimpressione di RT-Trajectory rappresentano una serie di suggerimenti visivi pratici di basso livello utili al modello mentre apprende le politiche di controllo del robot. In altri termini, un modello come RT-Trajectory consente ai modelli RT di comprendere come eseguire le attività, interpretando i movimenti del robot contenuti nel video.
I ricercatori hanno testato RT-Trajectory su 41 compiti non presenti nei dati di addestramento riscontrando come un braccio robotico controllato da questo modello ha mostrato prestazioni più che doppie rispetto ai modelli RT esistenti, raggiungendo un tasso di successo nell'esecuzione del compito del 63%, rispetto al 29% di RT-2.b
Un'altra interessante capacità del modello RT-Trajectory, che può essere facilmente adattato a diverse piattaforme robotiche, è la possibilità di creare tracciati e traiettorie osservando un essere umano che compie l'azione desiderata, o addirittura da bozzetti e schizzi disegnati a mano.
Probabilmente ci vorrà ancora un po' di tempo prima di vedere nella vita
quotidiana robot in grado di compiere diverse attività che per l'uomo sono
banali, o magari dei veri e propri maggiordomi robotici. Ma ciò che Google
ha presentato in questi giorni possono a pieno titolo essere considerati
come dei tasselli fondamentali allo sviluppo e alla realizzazione di
sistemi robotici più complessi in grado di aiutare l'essere umano
nelle attività lavorative e personali.
0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoDevi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".