PDF下载
深度强化学习理论及其应用综述

万里鹏 兰旭光 张翰博 郑南宁

西安交通大学人工智能与机器人研究所

摘要: 一方面,随着深度强化学习理论和应用研究不断深入,其在游戏、机器人控制、对话系统、自动驾驶等领域发挥重要作用;另一方面,深度强化学习受到探索-利用困境、奖励稀疏、样本采集困难、稳定性较差等问题的限制,存在很多不足.面对这些问题,研究者们提出各种各样的解决方法,新的理论进一步推动深度强化学习的发展,在弥补缺陷的同时扩展强化学习的研究领域,延伸出模仿学习、分层强化学习、元学习等新的研究方向.文中从深度强化学习的理论、困难、应用及发展前景等方面对其进行探讨.
关键词: 深度强化学习;马尔科夫决策过程;探索-利用困境;稀疏奖励
DOI:
基金资助:
文章地址: