清华大学开源全球最大的双臂机器人智能模型RDT

清华大学开源全球最大的双臂机器人智能模型RDT

1018日,清华大学人工智能研究院推出全球最大的双臂机器人操作任务扩散基础模型(Robotics Diffusion TransformerRDT),赋予了机器人自主完成复杂操作的能力,例如精准制作鸡尾酒、控制机器狗完成遛弯任务等,平均成功率比当前最佳模型高出56%RDT模型是目前运动控制水平最接近人类的机器人“小脑”之一。针对当前的双臂机器人模型泛化能力不足的问题,RDT使用可扩展的Transformer架构处理多模态输入数据的异质性,并构建了统一的物理可解释动作空间,以保证模型能够从不同机器人数据中学习共性的物理规律。在真实机器人上的实验表明,RDT在执行复杂、灵巧的任务方面显著优于现有方法,展现了对未见物体和场景的零样本泛化能力。目前,RDT的代码、模型及训练数据集已经开源,有助于推动和加速机器人研发和产业化进程。

© 版权声明

相关文章

学术会议云

暂无评论

none
暂无评论...