強化学習-逆強化学習
ICLR2019の模倣学習Discriminator Actor-Critic(DAC)の論文を読む ICLR2019で強化学習といえばR2D2がもてはやされていますが.GAILの改良するアプローチの論文があったので読んだ際のメモとして書いてみる. Discriminator-Actor-Critic: Addressing Sample …
ICLR2019の模倣学習Discriminator Actor-Critic(DAC)の論文を読む ICLR2019で強化学習といえばR2D2がもてはやされていますが.GAILの改良するアプローチの論文があったので読んだ際のメモとして書いてみる. Discriminator-Actor-Critic: Addressing Sample …