-
论文阅读——Experience-driven Networking: A Deep Reinforcement Learning based Approach
这篇文章将DRL用在了traffic engineering 上,作者不但实现了DDPG算法,而且针对traffic engineering 提出了两方面改进,并最后在随机和代表性的拓扑上进行实验
-
论文阅读——learning to navigate in complex environments
introduction
challenge
在部分可观察环境中使⽤RL来学会导航,存在以下困难:
1.奖励稀疏
2.对于环境中各种不同的动态元素,需要agent⽤不同⻓短的时间来记忆不同的东⻄:
a. 对于⽬标, one-shot
b.速度信号和视野中的障碍,短时记忆
c.环境中的不变的部分(边界,线索),⻓时记忆