清华大学开源全球最大的双臂机器人智能模型RDT
文章导读
精准制作鸡尾酒?自主遛狗?清华新模型RDT改写机器人"小脑"认知!10月18日,清华AI团队重磅推出全球最大双臂机器人智能系统,不仅成功率达56%超同类模型,更首次融合Transformer架构与物理规则,让机器人应对未知挑战如臂使指。核心突破在于:通过多模态异构数据处理,构建了统一且符合物理规律的动作空间,使机械臂能零样本跨越未见物体与场景。目前代码训练集全开源,这项突破或将引爆新一代人机协作革命——当机器人开始理解并模仿人类操作背后的物理逻辑,我们距离"能干家务的钢铁助手"还有多远?
— 内容由好学术AI分析文章内容生成,仅供参考。
10月18日,清华大学人工智能研究院推出全球最大的双臂机器人操作任务扩散基础模型(Robotics Diffusion Transformer,RDT),赋予了机器人自主完成复杂操作的能力,例如精准制作鸡尾酒、控制机器狗完成遛弯任务等,平均成功率比当前最佳模型高出56%。RDT模型是目前运动控制水平最接近人类的机器人“小脑”之一。针对当前的双臂机器人模型泛化能力不足的问题,RDT使用可扩展的Transformer架构处理多模态输入数据的异质性,并构建了统一的物理可解释动作空间,以保证模型能够从不同机器人数据中学习共性的物理规律。在真实机器人上的实验表明,RDT在执行复杂、灵巧的任务方面显著优于现有方法,展现了对未见物体和场景的零样本泛化能力。目前,RDT的代码、模型及训练数据集已经开源,有助于推动和加速机器人研发和产业化进程。
© 版权声明
本文由分享者转载或发布,内容仅供学习和交流,版权归原文作者所有。如有侵权,请留言联系更正或删除。
相关文章
暂无评论...