Deep 'Reinforcement Learning' sta insegnando ai robot nuove abilità più velocemente che mai

$config[ads_kvadrat] not found

Apprendimento rinforzato, il trading.. come andare in bicicletta!

Apprendimento rinforzato, il trading.. come andare in bicicletta!
Anonim

I robot stanno imparando come completare le attività in accelerati mondi virtuali, sviluppando abilità in poche ore che potrebbero altrimenti richiedere mesi. Apprendimento di rinforzo profondo simulato (o Deep RL) significa un'abilità che normalmente impiegherebbe 55 giorni per un A.I. imparare nel mondo reale richiede solo un giorno nell'aula iper accelerata.

"Ha il potenziale per rivoluzionare davvero quello che possiamo fare nel campo della robotica", ha dichiarato Raia Hadsell, ricercatore presso Google DeepMind, durante il Re-Work Deep Learning Summit di Londra. "Possiamo imparare le abilità a livello umano".

Può sembrare contro-intuitivo, poiché sicuramente l'intero punto dei robot è che i programmatori possono insegnare loro a fare le cose, giusto? Tuttavia, quando si progetta una macchina che funziona nel mondo reale, i robot necessitano di molti dati per capire come eseguire un'attività in una situazione non familiare. A.I. può utilizzare questi dati per "apprendere" un'abilità basata su tutte le istanze precedenti.

L'apprendimento di rinforzo profondo raccoglie i dati in un modo simile a come gli esseri umani imparano: un robot completerà ripetutamente un compito, come afferrare una palla, e registrerà i dati per creare un'immagine del modo migliore per afferrare una palla in una nuova situazione. Quando DeepMind ha utilizzato il modello nel 2013 per insegnare a un robot come padroneggiare i giochi Atari, semplicemente sedendolo davanti allo schermo e raccontandogli l'obiettivo finale, la comunità scientifica l'adorava.

Il problema è che ci vuole per sempre. Devi lanciare ripetutamente palline contro un robot o, nel caso Atari, lasciare il robot da solo nella sua camera da letto per un po '. Eseguendo una simulazione MuJoCo, combinata con una rete neurale progressiva, i formatori possono eseguire un programma che imita il robot, trasferisce i comportamenti appresi al robot e mappa i movimenti virtuali nel mondo reale.

"Possiamo eseguire questi simulatori tutto il giorno e tutta la notte", ha detto Hadsell.

I risultati parlano da soli. Questo robot, che ha ottenuto il diploma di cattura, ora può seguire le palle virtuali come se fossero reali, preparandolo per il grande giorno in cui viene chiesto di prendere una palla vera:

$config[ads_kvadrat] not found