基于触觉传感器和强化学习内在奖励的机械臂抓取方法
作者:
作者单位:

1.四川大学视觉合成图形图像技术国防重点学科实验室;2.四川大学空天科学与工程学院;3.四川大学计算机学院;4.四川大学 视觉合成图形图像技术国防重点学科实验室

作者简介:

通讯作者:

中图分类号:

TP242.6

基金项目:

国家自然科学基金重点项目(U20A20161)


The method for manipulator grasping based on tactile sensor and reinforcement learning intrinsic reward
Author:
Affiliation:

1.National Key Laboratory of Fundamental Science on Synthetic Vision, Sichuan University, Chengdu 610065, China;2.School of Aeronautics and Astronautics, Sichuan University;3.College of Computer Science, Sichuan University;4.National Key Laboratory of Fundamental Science on Synthetic Vision,Sichuan University;5.National key laboratory of fundamental science on synthetic vision,Sichuan University

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    触觉在机器人抓取过程中扮演着重要的角色,但在大多数强化学习任务中,触觉仅被用于拓展状态空间,其提供的位置和压力等信息很少被完全利用.针对该问题,同时受内在奖励机制启发,首先设计了一种“倒T”形传感器阵列布局;然后基于这种传感器阵列提出了新的内在激励方法,该方法根据机械臂末端与物体接触位置的不同,给予不同的重视程度,鼓励智能体以更有效的姿态来夹取物体;最后将该方法在仿真环境中进行测试,结果表明该方法在夹取椭球和圆球物体任务中收敛速度比最新的基准方法平均提高了约20%.

    Abstract:

    Although play an important role in the process of the robot grasping, haptics is only used to extend the state space, and the information provided by it such as position and pressure is rarely fully utilized in most reinforcement tasks. In order to solve the issues, inspired by the intrinsic reward mechanism, an intrinsic incentive method based on the “inverted T” array sensor is proposed. According to the position where the end effector of the robot touches the object, the method gives degrees of importance, and encourages the agent to achieve the goal with a more effective posture. Finally, the method was tested in the simulation environment, and the results showed that the speed of convergence of the method in the task gripping ellipsoid objects was about 20% faster than the latest benchmark method.

    参考文献
    相似文献
    引证文献
引用本文

引用本文格式: 宋相兵,季玉龙,俎文强,何扬,杨红雨. 基于触觉传感器和强化学习内在奖励的机械臂抓取方法[J]. 四川大学学报: 自然科学版, 2022, 59: 032003.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-11-03
  • 最后修改日期:2022-01-05
  • 录用日期:2022-01-12
  • 在线发布日期: 2022-05-30
  • 出版日期: