Google, l'intelligenza artificiale fa progressi con i videogiochi

DeepMind, la divisione di Google che si occupa dei progetti di ricerca nel settore dell'intelligenza artificiale, documenta i più recenti progressi compiuti nel tentativo di educare la macchina ad affrontare una partita al videogioco Montezuma's Revenge utilizzando algoritmi di machine learning.
di Salvatore Carrozzini pubblicata il 10 Giugno 2016, alle 08:01 nel canale SistemiConcetti come 'curiosità', 'motivazione', 'gratificazione', descrivono caratteristiche proprie della personalità umana, ma si adattano con maggior fatica ad un computer. I ricercatori impegnati nello settore dell'intelligenza artificiale, tuttavia, partono da tali concetti cercando di tradurli in algoritmi che possono guidare il comportamento della macchina. E' seguendo tale direzione che proseguono le ricerche del team DeepMind, la divisione di Google impegnata sul fronte dell'A.I.
I risultati di una ricerca recentemente pubblicati dal team DeepMind, individua proprio nei concetti di "motivazione intrinseca", da intendere come sinonimo di curiosità, e di "gratificazione" gli elementi che possono segnare la differenza tra algoritmi A.I. più o meno efficiente. Per testare la veridicità dell'affermazione, Google ha scelto un banco di prova che sarà noto ai videogiocatori con qualche anno sulle spalle, ovvero il videogioco Montezuma's Revenge di Atari.
La novità delle ultime ore non è tanto la sfida macchina-videogame - progetto di ricerca che va avanti da diversi mesi - quanto l'analisi di come, modellando il comportamento dell'agente A.I. per seguire uno schema di comportamento basato sull'esplorazione-acquisizione di bonus, l'efficienza dell'algoritmo aumenta. In sostanza, i ricercatori provano a replicare le dinamiche studiate dalle neuroscienze, in base alle quali il compimento di una determinata azione, determina nell'uomo la produzione di sostanze chimiche che generano la sensazione del piacere, della felicità e della gratificazione e che, come tale, l'uomo cerca di replicare, evitando, al tempo stesso, le azioni che generano sensazioni spiacevoli.
Nei due screenshot riportati di seguito, è possibile notare come, applicando il meccanismo che prevede l'assegnazione di un bonus a seguito dell'esecuzione delle azioni corrette - es. raggiungere una chiave, schivare un ostacolo, etc - cresce anche la capacità dell'agente A.I. di raggiungere nuove aree della mappa, mosso da una sorta di 'curiosità' e di 'voglia di esplorazione' indotta.
Il video riportato di seguito mostra i vari progressi compiuti con e senza l'applicazione del sistema appena descritto. Il risultato è sintetizzato in maniera efficace dai ricercatori:
Dopo 50 milioni di fotogrammi, l'agente che utilizza i bonus esplorazione ha visitato un totale di 15 stanze, mentre senza bonus l'agente ne ha visitate solo due
A scanso di equivoci, si ricorda che gli agenti A.I. impiegati nei test con i videogiochi sono molto diversi dai tradizionali bot che possono prendere il controllo del gioco. I primi hanno un accesso estremamente limitato alle informazioni di gioco - non conoscono in anticipo, ad esempio, la posizione dei nemici nemici e la struttura della mappa - agiscono, in altri termini, esattamente come farebbe un videogiocatore in carne ed ossa che affronta le sfide di livello in livello, basandosi esclusivamente su ciò che vede nella schermata e migliorando i risultati tentativo, dopo tentativo.
Il nuovo aggiornamento fornito dal team DeepMind su progressi compiuti nel settore dell'intelligenza artificiale apre scenari interessanti, anche se non è detto che le dinamiche descritte (sintetizzabili con il modello tentativo-fallimento-nuovo tentativo-successo-gratificazione) possano essere applicate a qualsiasi agente A.I. Se fallire in un videogioco prima di trovare il giusto modo per aggirare un ostacolo non costa nulla, diversa sarebbe la conclusione nel caso in cui, ad esempio, una vettura a guida autonoma, completamente controllata da algoritmi di intelligenza artificiale, operasse secondo gli stessi schemi.
5 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoè invece il contrario
"Se fallire in un videogioco prima di trovare il giusto modo per aggirare un ostacolo non costa nulla, diversa sarebbe la conclusione nel caso in cui, ad esempio, una vettura a guida autonoma, completamente controllata da algoritmi di intelligenza artificiale, operasse secondo gli stessi schemi."al contrario questa AI desidera evitare gli errori, se si innesta una base preprogrammata di errori da non commettere e per questo la si gratifica manterrà il controllo al meglio e sempre:
es:nell'algoritmo scriviamo che non deve prendere sotto i pedoni. la mettiamo in strada e ne evita 3; gli diamo in "premio" e lei sarà ben contenta di continuare ad evitare pedoni.
diciamo pure che la migliore AI per auto è ancora KITT, la macchina che prova dolore ad essere manomessa/distrutta è la base fondamentale per gestire il desiderio contrario proprio degli esseri viventi: "restare in vita".
Si ribellano a cosa? A noi che le progettiamo e costruiamo?
Meno stupidaggini sci-fi, e più scienza (che è ciò di cui l'articolo parla).
Integrarle a cosa? Non esiste un'intelligenza artificiale "quasi generale" integrata in un esoscheletro, di cosa stai parlando?
Sono 4 schemi in croce che fingono un comportamento.
Vero e falso.
Prendo questa citazione da Wikipedia, molto accurata:
Un'agente intelligente nei videogiochi fa esattamente questo: percepisce l'ambiente circostante e massimizza (o minimizza) il costo di determinate azioni, e sono "competitivi" o "cooperativi" in base alla meccanica di gioco che rendono automatica.
Con "sono 4 schemi in croce che fingono un comportamento" ti riferisci ad un Narrow AI.
L'articolo si riferisce ad un altro tipo di AI, che chiamerei "pseudo-AGI" (pseudo-Artificial General Intelligence), ovvero un agente intelligente che prende decisioni seguendo sempre la definizione di cui sopra, ma opera su modelli formali più generali (non si tratta dunque di "4 schemi in croce", tutt'altro).
Sono 4 schemi in croce che fingono un comportamento.
Prima di sparare, hai letto l'articolo? hai capito che si parla di una AI di nuova generazione che si sta mettendo alla prova con un videogioco e non di una AI di un qualsiasi videogioco?
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".