-
论文阅读——learning to navigate in complex environments
introduction
challenge
在部分可观察环境中使⽤RL来学会导航,存在以下困难:
1.奖励稀疏
2.对于环境中各种不同的动态元素,需要agent⽤不同⻓短的时间来记忆不同的东⻄:
a. 对于⽬标, one-shot
b.速度信号和视野中的障碍,短时记忆
c.环境中的不变的部分(边界,线索),⻓时记忆
在部分可观察环境中使⽤RL来学会导航,存在以下困难:
1.奖励稀疏
2.对于环境中各种不同的动态元素,需要agent⽤不同⻓短的时间来记忆不同的东⻄:
a. 对于⽬标, one-shot
b.速度信号和视野中的障碍,短时记忆
c.环境中的不变的部分(边界,线索),⻓时记忆