Donera till arXiv
Titel:Asynkrona metoder för djup förstärkningsinlärning
Ladda ner PDF
Sammanfattning: Vi föreslår ett konceptuellt enkelt och lätt ramverk för djup förstärkningsinlärning som använder asynkron gradientavsättning för optimering av kontrollörer för djupa neurala nätverk. Vi presenterar asynkrona varianter av fyra standardalgoritmer för förstärkningsinlärning och visar att parallelactor-learners har en stabiliserande effekt på träningen, vilket gör det möjligt för alla fyra metoderna att framgångsrikt träna neurala nätverksstyrningar. Den bäst presterande metoden, en asynkron variant av actor-critic, överträffar den nuvarande toppnivån på Atari-domänen samtidigt som den tränar på halva tiden på en enda flerkärnig CPU i stället för en GPU. Dessutom visar vi att asynkron actor-critic lyckas med ett stort antal problem med kontinuerlig motorstyrning samt med en ny uppgift, nämligen att navigera i slumpmässiga 3D-labyrinter med hjälp av visuell input.