Donate to arXiv

Title:Asynchronous Methods for Deep Reinforcement Learning

Authors:Volodymyr Mnih, Adrià Puigdomènech Badia, Mehdi Mirza, Alex Graves, Timothy P. Lillicrap, Tim Harley, David Silver, Koray Kavukcuoglu

Download PDF

Abstract: 深層強化学習のための概念的にシンプルで軽量なフレームワークを提案する。それは、深層神経ネットワークの制御の最適化のために非同期の勾配降下を使用するものである。 4つの標準的な強化学習アルゴリズムの非同期バージョンを提示し、並列アクター学習が学習の安定化効果を持つことを示し、4つの方法すべてがニューラルネットワークの制御をうまく学習できるようにする。 最も性能の良いアクタークリティックの非同期型は、GPUではなくマルチコアCPUで半分の時間で学習しながら、Atariドメインで現在の最先端を超えました。 さらに、非同期アクタークリティックが様々な連続運動制御問題や、視覚入力を用いたランダムな3次元迷路のナビゲーションという新しいタスクで成功することを示す。