当前位置：文档之家› 基于Matlab强化学习路径寻优机器人建模与仿真

基于Matlab强化学习路径寻优机器人建模与仿真

差分进化算法辨识机器人逆解基于Q-Learning机器人路径寻优
差分进化算法
• 算法思想：
适应度（fi）程序上的编程思路
1.求取当前粒子的变换矩阵 2.根据当前粒子进行正运动学计算得出对应的
位姿 3.计算当前粒子的位姿与期望位姿的误差 4.取误差的倒数（由此可见误差越小适应度fi
越大）
差分进化算法辨识效果
基于Q-learning机器人路径寻优
Q表及observation、action及一些编程想法
observation
0 1 2 3 4 5
Hale Waihona Puke opt-action (0,4) down (1,5) right (2,3) down (3,1) right (4,5) left
//
Action 上(right) 下(down) 左( left) 右(right)
Random_pro3演示视频
编号 1 2 3 4
寻优算法流程
寻优视频
Random_pro1:随机点在dot-2，其最优路径为 2-3-1-5
Random_pro2:随机点在dot-4，其最优路径为 4-1
Random_pro3:随机点在dot-3，其最优路径为 3-1-5
Random_pro1演示视频
Random_pro2演示视频

e商务文档

基于Matlab强化学习路径寻优机器人建模与仿真

相关文档推荐：