基于路径积分强化学习方法的蛇形机器人目标导向运动
摘要: 路径积分方法源于随机最优控制,是一种数值迭代方法,可求解连续非线性系统的最优控制问题,不依赖于系统模型,快速收敛.文中将基于路径积分强化学习的策略改善方法用于蛇形机器人的目标导向运动.使用路径积分强化学习方法学习蛇形机器人步态方程的参数,不仅可以在仿真环境下使蛇形机器人规避障碍到达目标点,利用仿真环境的先验知识也能在实际环境下快速完成相同的任务.实验结果验证方法的正确性.
关键词:
路径积分;强化学习;随机最优控制;蛇形机器人;目标导向;
路径积分;强化学习;随机最优控制;蛇形机器人;目标导向