当前位置:文档之家› 基于卷积神经网络算法的机器人系统控制

基于卷积神经网络算法的机器人系统控制

第29卷㊀第4期长㊀春㊀大㊀学㊀学㊀报Vol.29㊀No.4㊀2019年4月JOURNALOFCHANGCHUNUNIVERSITYApr.2019㊀收稿日期:2018-01-20基金项目:安徽省科技厅项目(17030901033)作者简介:张松林(1981-)ꎬ男ꎬ安徽皖寿人ꎬ工程师ꎬ硕士ꎬ主要从事电子信息工程方面研究ꎮ基于卷积神经网络算法的机器人系统控制张松林(安徽信息工程学院信息系ꎬ安徽芜湖241000)摘㊀要:随着计算机技术的不断成熟和数据分析技术的不断完善ꎬ近年来突出机器深度学习功能的智能算法取得重大突破ꎮ其中以卷积神经网络为代表的技术ꎬ可根据不同的控制要求进行相应数据训练ꎬ从而提高系统的控制效果ꎬ在机器人控制㊁目标识别等领域得到广泛应用ꎮ随着机器人应用环境的复杂化ꎬ设计基于卷积神经网络机器人控制算法在非结构化环境中实现精准化物体抓取ꎬ建立一个完整的机器人自动抓取规划系统ꎮ关键词:机械臂ꎻ深度强化学习ꎻ策略搜索ꎻ卷积神经网络中图分类号:TP183㊀㊀文献标志码:A㊀㊀文章编号:1009-3907(2019)04-0014-04㊀㊀自20世纪中期开始ꎬ机器人系统逐步得到发展ꎮ从简单的机械结构到具有感知识别功能的智能机器人系统ꎬ已经在多个领域广泛应用ꎮ其中ꎬ物体抓取操作是机器人的重要功能ꎮ随着硬件技术的不断成熟ꎬ机器人系统通过传感器实现环境感知ꎬ并通过智能算法的设计来实现物体的任意抓取ꎮ由于机器人系统应用领域的复杂化ꎬ对机器人的控制算法提出了更高的要求ꎮ目前ꎬ工业机器人的抓取算法设计需要依赖预先建立好的物体抓取模型并整理为数据库ꎬ但对于在非结构化的环境中进行抓取的机器人来说ꎬ建立准确的数学模型难以实现ꎮ因此ꎬ要建立起能够对环境实时预测并快速整定的抓取规划算法ꎮ为优化这一问题ꎬ引入基于卷积神经网络的机器人规划算法ꎮ机器人通过传感器获取的环境信息ꎬ建立对应的抓取位姿映射关系ꎬ即通过环境模型库来存储机器人抓取经验ꎬ相比与传统的抓取控制算法而言ꎬ基于卷积神经网络的算法可以实现对未知物体的抓取经验迁移ꎮ1㊀机器人抓取模型设计机器人物体抓取可以视为机械臂对物体表面上一组接触点的施加力ꎬ以防止物体在外界扰动下发生运动ꎮ为提高机器人对物体抓取的控制性能ꎬ首先ꎬ需要建立机器人物体抓取的接触力数学模型[1]ꎮ图1㊀物体与末端执行器接触模型的坐标系关系1.1㊀机器人与物体之间的接触力当需要通过机器人的机械臂进行物体抓取时ꎬ机械臂的末端抓手会通过若干个接触点与物体进行关联ꎮ一般情况下ꎬ在接触点上定义坐标系ꎬ并沿3个不同维度设立坐标轴nl㊁pl㊁qlꎬ其中ꎬ接触点上切平面的单位法向量定义为nlꎬ而pl㊁ql为符合右手定则的在切平面相互垂直的两个单位向量ꎬ在接触点建立坐标系如图1所示ꎮ机器人的物体抓取定义为爪手与物体之间的运动ꎬ而接触面的形状以及爪手与物体之间的摩擦系数共同决定了该运动的性质ꎮ在物体的接触点上会提供一个单方向的约束[2]ꎬ以此防止物体向接触向量的方向偏移ꎮ机械臂爪手对物体施加的力和力矩可以表示为力旋量wiɪR6ꎬ如式(1)所示:wi=fiτiéëêêùûúú=ni(ci-p)ˑniéëêêùûúúꎬ(1)式中ꎬfiɪR3为机械臂在点ci点上的接触力(N)ꎻτiɪR3为机械臂在点ci点上的接触力矩(N/m)ꎮ由于接触力和接触力矩所处的维度不同ꎬ特引入参数ρ进行调整ꎬ因此得式(2):wi=fiτi/ρéëêêùûúúꎮ(2)通过引入参数ρ可使wi的所有成分都采取力单位ꎮ确定参数ρ的方法有两种ꎬ一种为质心与物体间任意一点最远的距离ꎬ使在所抓取的物体上施加最大力矩ꎻ另一种是将参数ρ定义为回转半径ꎬ但该方法计算较为复杂㊁用途不多ꎮ接触模型由两个接触面的几何形态和材料的特性决定ꎬ并能通过接触施加在物体上的力映射成为相对于物体的力旋量ꎮ一般情况下ꎬ定义了8种接触模型ꎬ其中最为常用的接触模型为有摩擦的点接触模型和无摩擦的点接触模型ꎮ点接触模型为刚性接触模型ꎬ即假定机械臂爪手与所抓物体都为刚体ꎬ且物体间的碰撞具有即时性和不连续性的特点ꎬ通过系统在平衡碰撞后动量变化可以推到出运动方程ꎮ在无摩擦的点接触模型中ꎬ接触力是沿着法向量方向作用在物体表面ꎬ而假定爪手与物体表面不变形ꎮ这两种模型主要应用于接触面小且接触面光滑的场景ꎮ1.2㊀建立抓取物体的卷积网络模型建立了机器人与物体之间的接触力模型g={xꎬyꎬdꎬθ}后ꎬ又设计了抓取物体的卷积网络模型ꎮ为提高机器人抓取物体的准确性ꎬ将传感器获得的深度图像作为卷积网络的输入ꎮ以全卷积的形式设计网络输出层ꎬ可以减少网络的训练参数ꎮ为提高网络底层数据的利用ꎬ本设计利用残差单元作为网络的基础ꎬ而对于网络的输出ꎬ进行了归一化的处理ꎮ卷积网络模型中需要处理的参数包括抓取概率㊁抓取角度㊁抓取宽度和抓取位置ꎬ其中ꎬ抓取概率需要先将传感器传出的图片进行二进制标记ꎬ再对相应区域内的值进行设置ꎮ机械手的抓取角度范围为在[-90ꎬ90]之间ꎬ且设置sin2θꎬcos2θ来确定抓取角度ꎮ为了保证卷积输出层的值不超过1ꎬ在求取抓取宽度时ꎬ要求深度相机二指夹持器间的最大宽度为50像素ꎮ1.3㊀基于主成分分析法的末端姿态调整为保证抓取物体的稳定性ꎬ机器手末端不应始终垂直于物体所处于的平面ꎮ这样有利于在抓取位置较高且圆形的物体时ꎬ在很多角度下都不能准确抓起物体ꎬ此时需要对物体末端的位置和姿态进行调整ꎬ再进行抓取ꎮ本设计基于主成分分析法进行末端姿态调整ꎮ首先ꎬ求取接触点处的法向量ꎬ将其作为末端姿态调整的一部分ꎬ具有计算精度高㊁计算速度快和计算时间复杂度低的特点ꎮ该方法的应用原理就是通过遍历ꎬ计算出距离目标点k个欧式距离最小的点ꎬ通过最小二乘法拟合出局部领域平面ꎬ再通过计算领域内的协方差得到去面特性ꎮ在确定一个表面的法线时ꎬ需要估计表面上的一个相切面的法线ꎬ就可以将末端姿态调整问题转化为一个基于最小二乘法的平面拟合估计问题ꎮ由于法线正负向问题无法确定ꎬ因此ꎬ通过主成分分析法计算出的表面法向量具有二义向ꎬ在特殊情况下无法实现对抓取点法向量一致性统一ꎮ本文定义一个法线方向ꎬ并将空间中的点vp作为法线的朝向ꎬ并满足:ni (vp-pi)>0ꎮ2㊀基于卷积神经网络的机械爪控制策略研究为保证机械爪物体抓取的实时性ꎬ需要在每个控制时刻将末端执行器与目标位置的图像作为卷积层的输入ꎮ由于卷积神经网络具有强大的图像处理功能ꎬ在策略搜索算法的监督下ꎬ通过训练过程调整网络权重与偏置ꎬ可获得执行器与目标之间的相对位置ꎮ由于机械臂的各关节信息无法通过图像实时获取ꎬ在搭建卷积神经网络策略时ꎬ将关节角和角速度作为神经网络连接层进行输入ꎮ基于卷积神经网络的机械爪控制结构如图2所示ꎮ2.1㊀卷积神经网络结构设计在构建卷积神经网络视觉层时ꎬ为保证对图像中特征的及时重组ꎬ对输入图像进行处理后ꎬ在视觉层的最后加入一层全连接层ꎬ同时还可降低图像特征的维度ꎬ并对图像特征的数值进行缩放ꎬ使其与机械臂关节51第4期张松林:基于卷积神经网络算法的机器人系统控制61长㊀春㊀大㊀学㊀学㊀报㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀第29卷图2㊀基于卷积神经网络机器人控制框图状态的数值相近ꎮ电机控制层的输入为视觉层输出的图像特征和关节状态信息ꎬ通过两层全连接层对拟合策略搜索控制器ꎬ电机控制层后由卷积神经网络输出该时刻的关节控制量ꎮ在电机控制层设计过程中ꎬ若直接将特征图与关节状态信息进行组合ꎬ由于相机图像的特征数量过于庞大ꎬ会发生卷积神经网络控制策略无法收敛的问题ꎬ使关节状态信息被提取的特征被淹没ꎬ进而很难获取输入特征与关节控制量之间准确的映射关系ꎮ为解决上述问题ꎬ在进行卷积神经网络视觉层设计时ꎬ增加一个全连接层ꎮ该方法一方面可以有效降低电机控制层的输入维度ꎬ保证了关节状态信息不被淹没ꎻ另一方面ꎬ卷积层输出的特征图在经过全连接层后会下降ꎬ并与关节状态信息的数量上较为匹配ꎬ使卷积神经网络在随机梯度下降时能更好优化电机控制层的相关参数ꎮ2.2㊀卷积神经网络损失函数卷积神经网络的损失函数是评价网络输出结果优劣的重要指标ꎮ损失函数设计直接决定卷积神经网络各层权重与偏置的优化方向ꎬ进而影响卷积神经网络训练后的泛化能力ꎮ本设计中的损失函数ꎬ是为了保证在策略搜索算法监督下进行网络训练ꎬ既可以保证完成规定的放置任务ꎬ也对陌生物体抓取产生一定的是影响ꎮ在训练过程中ꎬ卷积神经网络算法能使受训的机械系统向提供监督的机械控制器方向进行规范ꎬ保证该系统的控制效果ꎬ使视觉层㊁电机控制层的优化具有较好的泛化能力ꎮ在进行卷积神经网络函数设计时ꎬ可以从相似度的KL散度项和L2正则化项两个方向同时展开ꎬ其中ꎬKL散度项主要反映卷积神经网络控制策略与机械臂控制器两者之间的相似程度ꎬ而L2正则化项的主要功能ꎬ是防止数据发生过度拟合的问题ꎮ在设计损失函数前ꎬ首先假定优化的神经网络处于多元高斯分布的情况下ꎬ实现与策略搜索算法后控制值输出的线性形式的多元高斯分布的均值处于相同区域ꎬ从而保证了KL散度可以准确描述卷积神经网络控制策略与机械臂控制器两者之间的相似程度ꎮ损失函数设计的第二部分是L2正则化项ꎬ其设计思路是使卷积神经网络的权重矩阵元素都处于较小ꎬ以避免数据发生过度拟合的问题ꎮ通过在实际数据中对权重衰减系数进行检验ꎬ最后将其取值为0.005ꎮ此外ꎬ分析所设计的损失函数后发现ꎬ由于协方差矩阵的迹项和对数项中都不包括卷积神经网络策略的实际输出数据ꎬ因此ꎬ在利用反向传播的方法求取损失函数时ꎬ输入梯度时以上协方差项不会影响到神经网络权重以及偏置的更新ꎬ在计算损失函数时可以对其进行忽略ꎮ基于上述的考虑ꎬ设计的卷积神经网络策略最终的损失函数为:lt=0.5(μp-μπθ)Tð-1p(μp-μπθ)+λðlW2ꎮ3.3㊀卷积神经网络训练方法训练卷积神经网络时ꎬ保证控制器控制效果的重要内容ꎬ是在正式训练开始前ꎬ对卷积神经网络的视觉层进行预训练ꎮ这样既可以在一定程度上缩短网络的训练时间ꎬ使神经网络各层的权重和偏置都能在正式训练之前得到较好的初始化ꎬ也能避免在训练过程中局部最优解的结果ꎮ本文选取迁移学习的方法ꎬ以实现对卷积神经网络的预训练ꎮ该方法可以有效简化卷积神经网络结构设计过程中的步骤和难度ꎮ在对卷积神经网络电机控制层进行训练时ꎬ需要对该层参数进行初始训练ꎬ避免在预训练后的正式训练时造成数据的大量丢失ꎮ本文采取端对端训练方法ꎬ使卷积神经网络可以满足机械手对于物体抓取的准确性和稳定性ꎬ并完成对初次探取物品放置位姿的适应性ꎮ在正式进行卷积神经网络策略设计过程中ꎬ需要设计有效的策略搜索监督算法来保证训练结果的准确性[3]ꎬ使得受训的卷积神经网络具有良好的泛化能力ꎮ考虑到上述的卷积神经网络策略训练要求ꎬ在进行正式训练和测试过程中ꎬ将物品的放置任务都限制在规定的正方形区域中ꎮ本实验设计了边长为38cm的正方形ꎬ从而避免进入到较大区域ꎮ一方面是考虑到卷积神经网络泛化能力提升的需求ꎻ另一方面是考虑对网络深度和采样位置以及数量的提升要求ꎮ该方法经过试验验证后发现ꎬ它有效优化了卷积神经网络策略的训练时间以及对神经网络参数调整时间ꎬ机器人在进行物品放置过程中对面积的要求也具有较好的适应性能ꎮ在卷积神经网络策略正式训练过程中ꎬ电机控制层参数的差异会导致卷积神经网络在训练的初始阶段因参数梯度过大ꎬ使卷积神经网络的各层权重与偏置都处于大幅度的更新状态ꎬ并引起卷积神经网络视觉层在参数更新过程中所挖掘的特征信息会大量丢失的问题ꎮ本文引入的视觉层参数的预训练以及电机控制层参数的初始化ꎬ就可以有效解决上述问题ꎮ在对卷积神经网络的电机控制层进行相应训练时ꎬ需要固定卷积神经网络视觉层的参数ꎬ并根据训练位置所获得的数据采样信息ꎬ基于随机梯度下降理论的方法ꎬ对卷积神经网络的电机控制层参数进行更新和迭代ꎮ3㊀结语传统的工业机器人的抓取算法设计ꎬ主要依赖预先建立起来的物体抓取模型并整理为数据库ꎮ对于仓储物流㊁家庭服务等非结构化的应用环境进行抓取的机器人来说ꎬ建立准确的数学模型难以实现ꎮ这就要求在控制器中建立一个能够对环境实时预测并快速整定的抓取规划算法ꎮ为解决该问题ꎬ本文设计了基于卷积神经网络的机器人规划算法ꎮ该方法是指实时采集机器人通过传感器获取的环境信息ꎬ建立对应的抓取位姿映射关系ꎬ即通过环境模型库来存储机器人抓取经验ꎬ与传统的抓取控制算法而言基于卷积神经网络的算法相比ꎬ这个方法可以实现对未知物体的抓取经验迁移ꎮ卷积神经网络的实用性主要依靠对网络的训练效果ꎬ而卷积神经网络又受到多种因素的直接影响ꎬ本文引入的视觉层参数的预训练以及电机控制层参数的预初始化ꎬ提高了卷积神经网络的控制效果ꎬ建立完整的机器人自动抓取规划系统ꎬ并通过实践ꎬ验证了自动抓取规划方法是可行的ꎮ参考文献:[1]㊀王鹏.导航机器人的地图构建和定位研究[D].天津:天津工业大学ꎬ2018.[2]㊀李传浩.基于卷积神经网络的机器人自动抓取规划研究[D].哈尔滨:哈尔滨工业大学ꎬ2018.[3]㊀沈一鸣.移动机器人的同时建图与定位研究[D].沈阳:沈阳工业大学ꎬ2018.责任编辑:程艳艳ARobotControlSystemBasedonConvolutionalNeuralNetworkAlgorithmZHANGSonglin(DepartmentofInformationEngineeringꎬAnhuiInstituteofInformationTechnologyꎬWuhu241000ꎬChina)Abstract:Withthedevelopmentofcomputertechnologyandtheimprovementofdataanalysistechnologyꎬgreatbreakthroughshavebeenmadeinrecentyearsinintelligentalgorithmsthatemphasizethedeeplearningfunctionofmachine.Convolutionalneuralnetworkasarepresentativetechnologycancarryoutcorrespondingdatatrainingac ̄cordingtodifferentcontrolrequirementsꎬsoastoimprovethecontroleffectofthesystemꎬwhichiswidelyusedinroboticcontrolꎬtargetrecognitionandotherfields.Withthecomplexityofrobotapplicationenvironmentꎬaconvolu ̄tionneuralnetwork-basedrobotcontrolalgorithmisdesignedtoachievepreciseobjectgraspinginunstructureden ̄vironmentꎬandacompleterobotautomaticgraspingplanningsystemisestablished.Keywords:manipulatorꎻdeepreinforcementlearningꎻstrategysearchꎻconvolutionalneuralnetwork71第4期张松林:基于卷积神经网络算法的机器人系统控制。

相关主题