智源开源3D生成模型See3D,只需单图即可生成3D场景
文章导读
你是否想过,仅凭一张照片就能重建逼真的3D世界?智源AI研究院开源革命性模型See3D,实现了这一奇迹!通过学习1600万无标注互联网视频,模型利用视觉条件技术生成相机方向可控且几何一致的多视角图像,彻底摆脱传统相机参数依赖。这不仅颠覆了昂贵标注的需求,还高效掌握3D先验信息,支持零样本和开放世界的3D生成。更令人惊叹的是,无需微调即可执行3D编辑、表面重建等任务,应用潜力无限。模型、代码和Demo已全面开源,论文发布于arXiv,开发者可立即上手体验——立即探索,用单图开启你的3D创作革命!
— 内容由好学术AI分析文章内容生成,仅供参考。
12月10日,北京智源人工智能研究院推出了首个利用大规模无标注的互联网视频学习的3D生成模型See3D,在学习了无标注的1600万个视频之后,重建出全新的3D世界,效果令人惊叹。See3D模型不依赖于传统的相机参数,而是采用视觉条件(visual condition)技术,仅通过视频中的视觉线索生成相机方向可控且几何一致的多视角图像。这种方法避免了昂贵的3D或相机标注的需求,能够高效地从互联网视频中学习3D先验信息。See3D不仅支持零样本和开放世界的3D生成,还无需微调即可执行3D编辑、表面重建等任务,展现出在多种3D创作应用中的广泛适用性。相关的模型、代码和Demo已经开源,研究论文已发表在arXiv预印本平台上。
© 版权声明
本文由分享者转载或发布,内容仅供学习和交流,版权归原文作者所有。如有侵权,请留言联系更正或删除。
相关文章
暂无评论...