Donate to arXiv
Title:Asynchronous Methods for Deep Reinforcement Learning
PDF letöltése
Összefoglaló: Egy koncepcionálisan egyszerű és könnyű keretrendszert javasolunk a mélyerősítéses tanuláshoz, amely aszinkron gradiens ereszkedést használ a mély neurális hálózatok vezérlőinek optimalizálására. Bemutatjuk négystandard megerősítő tanulási algoritmus aszinkron változatait, és megmutatjuk, hogy a párhuzamos megerősítő tanulók stabilizáló hatással vannak a képzésre, ami lehetővé teszi mind a négy módszer sikeres neurális hálózati vezérlők képzését. A legjobban teljesítő módszer, az actor-critic aszinkron változata, felülmúlja a jelenlegi csúcsteljesítményt az Atari tartományban, miközben a GPU helyett egyetlen többmagos CPU-n fele annyi idő alatt képezzük. Továbbá megmutatjuk, hogy az aszinkron actor-critic sikeres a folyamatos motorvezérlési problémák széles skáláján, valamint egy új feladatban, a véletlenszerű 3D labirintusok navigálásában vizuális bemenet segítségével.