(来源:CAAI认知系统与信息处理专委会)
在机器人越来越深入日常生活的今天,如何让非专家用户也能快速教会机器人新技能,成为一个关键挑战。示教学习(Learning from Demonstration, LfD)提供了直观的解决方案——用户只需通过拖拽、遥操作或绘制轨迹等方式进行一次或数次演示,机器人便可习得行为。然而,绝大多数LfD方法存在一个根本性局限:习得的技能与演示时所使用的特定机器人深度绑定。当机器人平台的形态发生变化(例如连杆长度不同、关节轴线方向改变、关节限位或奇异构型分布不同),原来的行为策略往往会失效,必须重新编程或重新示教。
现有工作尝试通过任务抽象、迁移学习或事后安全过滤来克服这一问题,但这些方法或者需要大量数据和针对性微调,或者仅将运动学约束作为后处理补丁,难以从根本上保证安全性和泛化性。此外,当前广泛使用的7自由度冗余机器人虽然更为灵活,却因为同一个末端位姿对应无穷多组关节解,进一步增加了行为迁移的难度。
针对这一缺口,本文提出“运动学智能”的概念:不等同于利用物理本体吸收冲击的机械智能,而是将机器人的关节限位、奇异位形等运动学约束,以解析的方式前置嵌入到控制策略的架构中。这样,机器人从学习阶段起就“知道”哪些运动是可行的、边界在哪里,从而实现“只演示一次,即可在多台不同机器人上安全执行”的跨平台技能迁移。
一、具体方法
本文的方法体系建立在三个相互嵌套的技术支柱之上:机器人分类学、近约束控制策略以及冗余参数化降维。
1. 非尖点型3R机器人的拓扑‑微分分类
框架的基石是针对构成大多数工业机器人基础的非尖点型3R机械臂进行完整的约束结构分类。通过分析雅可比矩阵行列式在关节空间上生成的奇异曲线,根据曲线是否成环、是否自相交、以及具有何种水平/垂直转向点等拓扑‑微分特性,将所有非尖点型3R机器人划分为六种规范类型(Category I‑VI)。每一种类型对应于一种唯一的关节空间分区方式,决定了机器人在何处受限、受限边界的几何形状,以及可用的安全运动方向。
2. 轨迹循环:与类别绑定的近约束控制律
知道“边界长什么样”之后,还必须内置“沿着边界怎么走”的能力。本文提出轨迹循环混合控制策略。每一类机器人的奇异因子分支都存在一个或多个边界对齐方向。当由用户演示习得的名义轨迹即将冲出可行区域(触及奇异或关节限位)时,控制器不会强行穿出,而是切换至轨迹循环策略,引导机器人沿着边界表面滑动,直至绕过危险区域重新回到指向目标的无约束路径。这一策略解析地嵌入在控制律中,无需在线优化或人工干预。
3. 冗余机器人参数化:从7自由度到3R子链
针对7自由度腕部解耦型冗余机器人,其位置子链含有4个旋转关节。整个学习流程为:将用户演示轨迹建模为全局渐近稳定的动力学系统(经潜空间映射确保收敛),在关节空间按可行区域分片学习,并通过增量式工作空间到关节空间转移策略,利用新颖性度量筛选最具信息量的转移轨迹来扩展控制策略,从而用最少的演示实现最大程度的泛化。
二、实验
实验分别在仿真和真实机器人上进行,系统验证了框架的跨机器人迁移能力与安全性。
非冗余机器人迁移使用同一个用户演示,在分别属于类别I‑IV的四台不同3R机器人上生成了控制策略。结果显示,所有机器人都能产生平滑、与原始示教意图一致的轨迹,且全程未发生奇异或关节限位违反,无需任何重新示教或参数重调。
冗余机器人迁移在KUKA IIWA LWR和Neura Maira M两款商用7自由度机器人上进行了验证。通过选取不同的固定冗余角,观察到了多种行为模式:当选取的能够将起点和目标置于同一可行区时,机器人成功完成任务;当目标落在关节极限边界上时,系统能正确识别其不可行性并安全中止,避免了危险行为。
多任务与鲁棒性机器人执行了擦拭曲面、拾放操作和书写字母等多种技能。控制策略对时间和空间扰动表现出良好的鲁棒性——即使被推离原有轨迹,也能稳定收敛回目标。所有安全检查(连通性分析、违反检测、轨迹循环计算和速度指令生成)的运行时间均保持在极低水平,完全满足实时控制需求,且计算复杂度固定、可预测。
三、总结与展望
本文的核心贡献在于将运动学约束从后处理麻烦转变为控制器设计的内建特性,提出了一种全新的“运动学智能”范式。通过严密的拓扑‑微分分类,首次实现了对非尖点型机器人约束结构的全局解析描述,并建立起类别与控制律之间的一一对应关系。这使得机器人仅需极少量演示,即可将技能安全、稳定地迁移到形态各异的其他机器人上,大幅降低了跨平台部署的门槛,向着“教一次、处处用”的目标迈出了重要一步。
目前框架仍有明确的边界:它适用于腕部解耦、非尖点型的机器人构型,尚不能直接覆盖市面上许多尖点型机器人(如ABB GoFa、UR系列等)或非球形手腕设计。此外,由于重点在于运动学约束,与环境的动态碰撞规避尚未集成到统一的轨道循环架构中;对冗余度的利用也采用的是固定的准静态方式,尚未实现冗余角的在线动态优化。
作者指出,近期已有研究成功将尖点型机器人的关节空间进一步细分为“缩减可行区”,这为将本框架扩展至尖点型机器人提供了理论基础。未来的工作将致力于把碰撞边界也作为新的约束嵌入到轨迹循环框架中,并探索动态调节冗余角以兼顾任务优化与安全性。总体而言,这项工作为可迁移、可认证安全的机器人技能学习提供了坚实的理论和方法基础,其影响可望延伸至更广泛的机器人自主操作场景。
下一篇:没有了