归档: 2019/2


  1. 论文阅读——Experience-driven Networking: A Deep Reinforcement Learning based Approach

    这篇文章将DRL用在了traffic engineering 上,作者不但实现了DDPG算法,而且针对traffic engineering 提出了两方面改进,并最后在随机和代表性的拓扑上进行实验


  2. 论文阅读——learning to navigate in complex environments

    introduction

    challenge

    在部分可观察环境中使⽤RL来学会导航,存在以下困难:
    1.奖励稀疏
    2.对于环境中各种不同的动态元素,需要agent⽤不同⻓短的时间来记忆不同的东⻄:
    a. 对于⽬标, one-shot
    b.速度信号和视野中的障碍,短时记忆
    c.环境中的不变的部分(边界,线索),⻓时记忆