news 2026/6/10 15:38:55

RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计

概述

机器人的双臂操纵对于装配操作、工具使用和物品运送等复杂的现实世界任务至关重要。然而,在真实世界环境中进行大规模数据收集在时间和成本方面都很困难,而且所学操纵策略的通用性也很有限。为了解决这个问题,本研究提出了一个名为 "RoboTwin 2.0 "的大规模、高多样性数据生成和基准测试框架。

RoboTwin 2.0 采用闭环方法,利用多模态语言模型 (MLLM) 自动生成机器人操作程序,然后通过模拟对其进行修改和增强。此外,该系统还在背景、照明、物体摆放和指令文本等五个方面引入了强大的领域随机化功能,从而显著提高了真实环境中视觉、物理和语言的多样性和鲁棒性。

该系统支持 731 种物体类型和 50 个双臂任务,并预先收集了 100,000 多个专用轨迹数据。实验表明,代码生成的准确性、对不同机械臂的适应性以及在真实环境中的通用能力都得到了提高,而且零误差。

建议采用的方法

RoboTwin 2.0 是自动生成高质量双臂机器人操纵数据的可扩展框架。该方法主要由三部分组成:i) 多模态代码生成代理;ii) 域随机化;iii) 机械臂特定自适应模块。

首先,MLLM 根据以自然语言编写的任务指令自动生成初始代码。这些代码在模拟环境中各执行十次,由视觉语言模型(VLM)分析操作日志和故障原因,该模型与视觉和语言相对应。在此基础上,对代码进行反复修改和持续改进,直到成功率超过 50%。

然后,领域随机化引入了物体摆放、背景纹理、照明、桌子高度和指令的多样性。这样,模型就能适应各种视觉和物理环境。

此外,为了适应五种不同类型的机器人(如弗兰卡、UR5),设计还包括为每个物体准备多种抓取候选方案,并根据机器人的自由度自适应生成抓取行为。

实验

在这项研究中,RoboTwin 2.0 的有效性从几个方面得到了验证。首先,将 10 项不同任务中自动生成代码的成功率与传统方法(RoboTwin 1.0)进行了比较,结果表明,通过使用视觉和语言信息反馈,自动生成代码的成功率有了显著提高,最高达到 71.3%。

接下来,我们测试了有无领域随机化在鲁棒性方面的差异,发现在 RoboTwin 2.0 上训练的模型,即使在未见过的环境中,成功率也提高了 20% 以上。在现实环境中对四项任务进行的零点验证也显示,在未知背景和杂乱场景下,成功率提高了 20% 以上。

此外,使用 RoboTwin 2.0 训练的模型在 RoboTwin 基准的 “硬设置”(杂乱环境)中成功率最高,这清楚地表明了 RoboTwin 与其他方法之间的差异。这些结果表明,RoboTwin 2.0 是一个多功能、实用的数据生成平台,可显著提高在真实世界环境中的通用能力。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 19:53:30

为什么没有统一协议,多智能体永远无法真正互操作?

最近,“多智能体协作”(Multi-Agent Systems, MAS)的概念被炒得火热。在 Demo 视频里,我们看到:销售 Agent 接单,自动指挥库存 Agent 查货,再调度物流 Agent 发货,最后由财务 Agent …

作者头像 李华
网站建设 2026/6/10 1:47:39

23、实例负载均衡流量管理指南

实例负载均衡流量管理指南 在负载均衡的管理过程中,我们需要掌握多种操作,包括对池、池成员、健康监视器和监听器的管理,以及如何构建一个完整的负载均衡器。下面将详细介绍相关的操作步骤和命令。 1. 池管理 1.1 列出所有池 在命令行界面(CLI)中,使用以下命令列出所…

作者头像 李华
网站建设 2026/6/9 17:59:56

8、使用 Linux 网桥构建虚拟网络基础设施

使用 Linux 网桥构建虚拟网络基础设施 在 OpenStack 云环境中构建网络资源之前,需要对网络插件进行定义和配置。ML2 插件提供了一个通用框架,允许多个驱动程序相互协作。下面将详细介绍如何在 controller01 和 compute01 主机上配置 Linux 网桥 ML2 驱动和代理。 1. 配置网…

作者头像 李华
网站建设 2026/6/10 15:35:30

16、网络安全与访问控制:从安全组到角色访问控制

网络安全与访问控制:从安全组到角色访问控制 1. 端口安全与允许地址对管理 端口安全是网络安全的重要组成部分。当端口安全扩展启用时,可以在创建或更新端口期间,通过相应设置 port_security_enabled 属性,来启用或禁用单个端口的端口安全。启用端口安全后,默认的反欺…

作者头像 李华
网站建设 2026/6/9 20:24:41

5步诊断法:彻底解决WSL环境中Open-Interpreter无法连接本地模型的难题

5步诊断法:彻底解决WSL环境中Open-Interpreter无法连接本地模型的难题 【免费下载链接】open-interpreter Open Interpreter 工具能够让大型语言模型在本地执行如Python、JavaScript、Shell等多种编程语言的代码。 项目地址: https://gitcode.com/GitHub_Trending…

作者头像 李华
网站建设 2026/6/10 13:05:14

NVIDIA DALI GPU数据预处理优化:7大实战策略提升深度学习训练效率

NVIDIA DALI GPU数据预处理优化:7大实战策略提升深度学习训练效率 【免费下载链接】DALI NVIDIA/DALI: DALI 是一个用于数据预处理和增强的 Python 库,可以用于图像,视频和音频数据的处理和增强,支持多种数据格式和平台&#xff0…

作者头像 李华