智源开源3D生成模型See3D，只需单图即可生成3D场景

科研动态12个月前更新 0f6ec722422f273c

TKPaper-你的智能选刊助手

查找参加最新学术会议，发表EI、SCI论文，上学术会议云

热门国际学术会议推荐 | 出版检索稳定，快至7天录用

2026年电子, 通信与计算机科学国际会议（ICECCS 2026）

2026年智能机器人与控制技术国际会议（CIRCT 2026）

2026年传感器技术、自动化与智能制造国际会议（STAIM 2026）

文章导读

你是否想过，仅凭一张照片就能重建逼真的3D世界？智源AI研究院开源革命性模型See3D，实现了这一奇迹！通过学习1600万无标注互联网视频，模型利用视觉条件技术生成相机方向可控且几何一致的多视角图像，彻底摆脱传统相机参数依赖。这不仅颠覆了昂贵标注的需求，还高效掌握3D先验信息，支持零样本和开放世界的3D生成。更令人惊叹的是，无需微调即可执行3D编辑、表面重建等任务，应用潜力无限。模型、代码和Demo已全面开源，论文发布于arXiv，开发者可立即上手体验——立即探索，用单图开启你的3D创作革命！

— 内容由好学术AI分析文章内容生成，仅供参考。

智源开源3D生成模型See3D，只需单图即可生成3D场景

12月10日，北京智源人工智能研究院推出了首个利用大规模无标注的互联网视频学习的3D生成模型See3D，在学习了无标注的1600万个视频之后，重建出全新的3D世界，效果令人惊叹。See3D模型不依赖于传统的相机参数，而是采用视觉条件（visual condition）技术，仅通过视频中的视觉线索生成相机方向可控且几何一致的多视角图像。这种方法避免了昂贵的3D或相机标注的需求，能够高效地从互联网视频中学习3D先验信息。See3D不仅支持零样本和开放世界的3D生成，还无需微调即可执行3D编辑、表面重建等任务，展现出在多种3D创作应用中的广泛适用性。相关的模型、代码和Demo已经开源，研究论文已发表在arXiv预印本平台上。

© 版权声明

本文由分享者转载或发布，内容仅供学习和交流，版权归原文作者所有。如有侵权，请留言联系更正或删除。

TKPaper-你的智能选刊助手

热门国际学术会议推荐 | 多学科征稿、征稿主题广 | 免费主题匹配

2026年IEEE第三届先进机器人, 自动化工程与机器学习国际会议(ARAEML 2026)

2026年智能机器人与控制技术国际会议（CIRCT 2026）

2026年传感器技术、自动化与智能制造国际会议（STAIM 2026）

相关文章

华中科技大学郝兴杰课题组整合多人群多组学数据解析复杂疾病遗传结构并提升疾病风险预测性能

华中科技大学郝兴杰课题组整合多人群多组学数据解析复杂疾病遗传结构并提升疾病风险预测性能

1年前

03,0250

北京大学生命科学学院张研课题组揭示神经元中初级纤毛与轴突起始节的潜在关联

北京大学生命科学学院张研课题组揭示神经元中初级纤毛与轴突起始节的潜在关联

1年前

09570

北京大学电子学院胡又凡团队在无线传感领域研究中取得重要进展

北京大学电子学院胡又凡团队在无线传感领域研究中取得重要进展

2个月前

71,4430

研究揭示“神经—肌肉”跨组织通讯新机制

研究揭示“神经—肌肉”跨组织通讯新机制

2周前

24710

查找最新学术会议，发表EI、SCI论文，上学术会议云

热门国际学术会议推荐 | 立即查看超全会议列表

暂无评论

none

暂无评论...