人形机器人系列(十一):再论“手眼脑”协同之三问三答

证券之星 2025-06-12 08:14:27
股市要闻 2025-06-12 08:14:27 阅读

  机械臂+灵巧手当前 能够完成哪些工作?

      机械臂和灵巧手的协同配合本质上是人形机器人的上肢能力体现。比起对复杂场景的操作要求,当前人形机器人上肢“手眼脑”协同已经可以实现一些简单的垂类场景的应用。目前国内如智元、海外如特斯拉的Optimus 均能较好的实现单一“手眼脑”协同动作。同时,在实现形式上,比起标准人形机器人方案,机械臂、灵巧手实现操作的形态可以更加灵活,比如瑞士LokiRobotics 通过轮式+单机械臂及夹爪的方式实现对日常保洁工作的覆盖。

      “手眼脑”协同对机器人上肢操作能力有哪些重要意义?

      以机器人抓取场景为例,抓取和操作物体是完成各种复杂任务的基础,目前实现稳定的抓取和操作仍然具有挑战。面对仅凭单一视觉、单一触觉可能导致抓取任务失败的困难,一个典型的手眼协同能通过视觉做好对灵巧手位置的判断、动作的规划及与物体交互策略判定,并能够根据手的传感器信息,判断力的大小方向是否合适,从而大幅提升定向抓取操作的成功率。而人形机器人的上肢操作功能核心为灵巧手的手眼协同,手眼协同的能力决定了人形机器人上肢能力上限。

      “手眼脑”协同有哪些瓶颈和难点?

      “手眼脑”协同主要包括手眼位置标定、基于图像抓取位姿估计网络模型、触觉感知力反馈调节等技术难点。手眼位置标定可以实时、精准跟踪末端执行器与被操作物体之间的空间距离和位置信息,根据机械臂与相机之间的装配方式,分为Eye-to-Hand 和Eye-in-Hand。早期手眼标定技术主要依靠矩阵关系(旋转矩阵和平移矩阵)描述机器人和相机之间的空间关系。随着计算机视觉和优化算法发展,基于图像处理和数学优化的手眼标定方法逐渐成为主流。

      机器人抓取检测技术是机器人领域中的重要研究方向之一,涉及到机器人在实际操作中获取最优抓取姿态和位置的能力。技术发展可分为传统的解析方法和基于深度学习的方法。传统解析方法受限于环境复杂性和泛化能力不足,往往需要复杂的模型和参数调整。深度学习的抓取技术通过深度神经网络对大量图像数据进行训练,从而学习抓取的正确位置和姿态,具有更好的泛化能力和适应性。基于抓取候选框和基于鲁棒性函数两类抓取策略均有落地,不同模型的设计对抓取结果的准确率也呈现较大差异,构成了手眼脑协同操作的核心难点。

      人形机器人大脑本质上是一个千亿级别参数量的多模态大模型,人形机器人感知和决策能力取决于多模态大模型的能力。大脑的作用主要是针对当前语义、文字的理解识别出任务目标,并结合输入的图像信息,在环境中识别出操作对象,观察特征。通过对视觉、文字的整合理解,大脑将做出合理的指令任务推导,并生成小脑的执行指令。目前人形机器人大脑仍有优化空间。

      投资建议

      当前人形机器人的下游应用已经不仅仅局限在制造本体、搬拿放捡等简单动作应用,而进一步聚焦在更加泛化的通用场景去落地实际需求,对大小脑等功能部件提出更多要求。未来国内人形机器人厂商要跑出应用落地,更要重点关注功能性部件的发展。建议重点关注在灵巧手本体制造+运控、机器人本体运控及提供人形机器人视觉解决方案的企业。

      风险提示

      1、人形机器人核心技术突破不及预期;

      2、人形机器人量产化落地不及预期。

声明:
  1. 风险提示:以上内容仅来自互联网,文中内容或观点仅作为原作者或者原网站的观点,不代表本站的任何立场,不构成与本站相关的任何投资建议。在作出任何投资决定前,投资者应根据自身情况考虑投资产品相关的风险因素,并于需要时咨询专业投资顾问意见。本站竭力但不能证实上述内容的真实性、准确性和原创性,对此本站不做任何保证和承诺。
  2. 本站认真尊重知识产权及您的合法权益,如发现本站内容或相关标识侵犯了您的权益,请您与我们联系删除。
最新发布
今日焦点