智源开源3D生成模型See3D,只需单图即可生成3D场景

查找参加最新学术会议,发表EI、SCI论文,上学术会议云
第十届计算机技术与机械电气工程国际学术论坛(ISCME 2025)暨2025年泰山学术论坛-鲁东大学微纳传感器及系统专题论坛
2025年数据科学与智能系统国际会议(DSIS 2025)
文章导读
你是否想过,仅凭一张照片就能重建逼真的3D世界?智源AI研究院开源革命性模型See3D,实现了这一奇迹!通过学习1600万无标注互联网视频,模型利用视觉条件技术生成相机方向可控且几何一致的多视角图像,彻底摆脱传统相机参数依赖。这不仅颠覆了昂贵标注的需求,还高效掌握3D先验信息,支持零样本和开放世界的3D生成。更令人惊叹的是,无需微调即可执行3D编辑、表面重建等任务,应用潜力无限。模型、代码和Demo已全面开源,论文发布于arXiv,开发者可立即上手体验——立即探索,用单图开启你的3D创作革命!
— 内容由好学术AI分析文章内容生成,仅供参考。

智源开源3D生成模型See3D,只需单图即可生成3D场景

1210日,北京智源人工智能研究院推出了首个利用大规模无标注的互联网视频学习的3D生成模型See3D,在学习了无标注的1600万个视频之后,重建出全新的3D世界,效果令人惊叹。See3D模型不依赖于传统的相机参数,而是采用视觉条件(visual condition)技术,仅通过视频中的视觉线索生成相机方向可控且几何一致的多视角图像。这种方法避免了昂贵的3D或相机标注的需求,能够高效地从互联网视频中学习3D先验信息。See3D不仅支持零样本和开放世界的3D生成,还无需微调即可执行3D编辑、表面重建等任务,展现出在多种3D创作应用中的广泛适用性。相关的模型、代码和Demo已经开源,研究论文已发表在arXiv预印本平台上。

© 版权声明
第九届电气、机械与计算机工程国际学术会议(ICEMCE 2025)

相关文章

第四届能源与动力工程国际学术会议(EPE 2025)

暂无评论

none
暂无评论...