一只番茄

归档: 2019/2

论文阅读——Experience-driven Networking: A Deep Reinforcement Learning based Approach

2019-02-25

这篇文章将DRL用在了traffic engineering 上，作者不但实现了DDPG算法，而且针对traffic engineering 提出了两方面改进，并最后在随机和代表性的拓扑上进行实验
论文阅读——learning to navigate in complex environments

2019-02-17

introduction
challenge
在部分可观察环境中使⽤RL来学会导航，存在以下困难：
1.奖励稀疏
2.对于环境中各种不同的动态元素，需要agent⽤不同⻓短的时间来记忆不同的东⻄：
a. 对于⽬标， one-shot
b.速度信号和视野中的障碍，短时记忆
c.环境中的不变的部分（边界，线索），⻓时记忆