2018-01-01から1年間の記事一覧

複数の方策の混ざったexpertから複数方策を模倣学習するInfoGAIL論文の要約

[1703.08840] InfoGAIL: Interpretable Imitation Learning from Visual Demonstrations この論文のメインとしては深層模倣学習GAILの自動運転への応用であり 状態をpixelデータで受け取ること デモンストレーションの方策が単一でなく複数のモードが混ざっ…

【DQfD】デモンストレーションから事前学習するDQNの論文を読む

スパースな報酬環境(たとえばMontezuma Revenge)での強化学習は学習が難しく,さまざまなアプローチがこころみられています.今回はデモンストレーションを用いることでこの問題に取り組んだ,論文(2017,Deepmind) [1704.03732] Deep Q-learning from Demons…

ICLR2019 GAILのinteraction効率を高めたDACの論文を要約

ICLR2019の模倣学習Discriminator Actor-Critic(DAC)の論文を読む ICLR2019で強化学習といえばR2D2がもてはやされていますが.GAILの改良するアプローチの論文があったので読んだ際のメモとして書いてみる. Discriminator-Actor-Critic: Addressing Sample …