2018-10-29から1日間の記事一覧

2018-10-29

【DQfD】デモンストレーションから事前学習するDQNの論文を読む

スパースな報酬環境(たとえばMontezuma Revenge)での強化学習は学習が難しく，さまざまなアプローチがこころみられています．今回はデモンストレーションを用いることでこの問題に取り組んだ，論文(2017,Deepmind) [1704.03732] Deep Q-learning from Demons…

アンドロイドと電気羊とそれから...

Share the distilled Info

2018-10-29から1日間の記事一覧

【DQfD】デモンストレーションから事前学習するDQNの論文を読む