智源开源3D生成模型See3D,只需单图即可生成3D场景

智源开源3D生成模型See3D,只需单图即可生成3D场景

1210日,北京智源人工智能研究院推出了首个利用大规模无标注的互联网视频学习的3D生成模型See3D,在学习了无标注的1600万个视频之后,重建出全新的3D世界,效果令人惊叹。See3D模型不依赖于传统的相机参数,而是采用视觉条件(visual condition)技术,仅通过视频中的视觉线索生成相机方向可控且几何一致的多视角图像。这种方法避免了昂贵的3D或相机标注的需求,能够高效地从互联网视频中学习3D先验信息。See3D不仅支持零样本和开放世界的3D生成,还无需微调即可执行3D编辑、表面重建等任务,展现出在多种3D创作应用中的广泛适用性。相关的模型、代码和Demo已经开源,研究论文已发表在arXiv预印本平台上。

© 版权声明

相关文章

学术会议云

暂无评论

none
暂无评论...