PDF下载

深度强化学习理论及其应用综述
万里鹏 兰旭光 张翰博 郑南宁
西安交通大学人工智能与机器人研究所
关键词: 深度强化学习;马尔科夫决策过程;探索-利用困境;稀疏奖励
DOI:
基金资助:
文章地址: