清华大学开源全球最大的双臂机器人智能模型RDT

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
2025年第四届算法、数据挖掘与信息技术国际会议(ADMIT 2025)
2025年第八届机器学习和自然语言处理国际会议(MLNLP 2025)
2025年第八届数据科学和信息技术国际会议(DSIT 2025)
2025年数据科学与智能系统国际会议(DSIS 2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重
文章导读
精准制作鸡尾酒?自主遛狗?清华新模型RDT改写机器人"小脑"认知!10月18日,清华AI团队重磅推出全球最大双臂机器人智能系统,不仅成功率达56%超同类模型,更首次融合Transformer架构与物理规则,让机器人应对未知挑战如臂使指。核心突破在于:通过多模态异构数据处理,构建了统一且符合物理规律的动作空间,使机械臂能零样本跨越未见物体与场景。目前代码训练集全开源,这项突破或将引爆新一代人机协作革命——当机器人开始理解并模仿人类操作背后的物理逻辑,我们距离"能干家务的钢铁助手"还有多远?
— 内容由好学术AI分析文章内容生成,仅供参考。

清华大学开源全球最大的双臂机器人智能模型RDT

1018日,清华大学人工智能研究院推出全球最大的双臂机器人操作任务扩散基础模型(Robotics Diffusion TransformerRDT),赋予了机器人自主完成复杂操作的能力,例如精准制作鸡尾酒、控制机器狗完成遛弯任务等,平均成功率比当前最佳模型高出56%RDT模型是目前运动控制水平最接近人类的机器人“小脑”之一。针对当前的双臂机器人模型泛化能力不足的问题,RDT使用可扩展的Transformer架构处理多模态输入数据的异质性,并构建了统一的物理可解释动作空间,以保证模型能够从不同机器人数据中学习共性的物理规律。在真实机器人上的实验表明,RDT在执行复杂、灵巧的任务方面显著优于现有方法,展现了对未见物体和场景的零样本泛化能力。目前,RDT的代码、模型及训练数据集已经开源,有助于推动和加速机器人研发和产业化进程。

© 版权声明
2025年第四届算法、数据挖掘与信息技术国际会议(ADMIT 2025)
2025年第八届机器学习和自然语言处理国际会议(MLNLP 2025)
2025年第八届数据科学和信息技术国际会议(DSIT 2025)
2025年数据科学与智能系统国际会议(DSIS 2025)
第二届大数据分析与人工智能应用学术会议(BDAIA2025)
2025年第四届先进的电子、电气和绿色能源国际会议 (AEEGE 2025)
2025年第二届亚太计算技术、通信和网络会议(CTCNet 2025)
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重

相关文章

查找最新学术会议,发表EI、SCI论文,上学术会议云
艾思科蓝 | 学术会议 | 学术期刊 | 论文辅导 | 论文编译 | 发表支持 | 论文查重

暂无评论

none
暂无评论...