mgm美高梅平台游戏IGCL实验室成员参加CVPR2025
2025年6月11日至6月15日,国际计算机视觉与模式识别会议(CVPR 2025)在美国田纳西州纳什维尔市召开。CVPR作为计算机视觉界的顶级学术会议,本次会议共收到13008篇投稿,经过严格评审,有2872篇文章被录用,录用率为22.07%。
![]() |
![]() |
![]() |
CVPR主会场
mgm美高梅平台游戏IGCL实验室发表的《TexGaussian: Generating High-quality PBR Material via Octree-based 3D Gaussian Splatting》被本届CVPR录用。
实验室硕士生熊伯君作海报展示
该论文提出了一种名为TexGaussian的高质量且高效的纹理材质生成方法,其能够对输入的没有颜色的三维物体以及一段文本描述,生成与文本描述相符的纹理及材质贴图。和以往的使用扩散模型进行纹理生成的方法不同,TexGaussian提出采用一种回归的方式来从输入三维物体的几何特征直接回归出纹理和材质,以达到更快的生成速度。为了在三维空间中更加有效地学习,TexGaussian采用了八叉树这一数据结构,通过稀疏体素的方式更高效地组织和维护三维信息。
为了解决三维点云不够紧凑且离散的特性,TexGaussian使用了三维高斯泼溅作为三维表达(3D Gaussian Splatting),其作为一种非常鲁棒的表达方式,构建了从三维空间到二维光栅化图像之间的桥梁,从而允许模型充分利用二维图像中丰富的像素信息来缓解生成结果的模糊性。具体而言,对于每个输入的三维物体,首先在其表面处采样密集的三维点云来构建对应的八叉树。在八叉树的每个叶子节点的中心位置,放置一个三维高斯球。然后,TexGaussian使用了基于八叉树卷积的3D U-Net来预测在八叉树每个叶子节点上的三维高斯球的参数。除了RGB 颜色信息,每个三维高斯球被额外拓展了两个参数,分别用于表示三维物体的粗糙度(roughness)和金属度(metallic)。通过这种三维表达,多视角的漫反射贴图(也就是物体自身的RGB 基色),粗糙度贴图以及金属度贴图就可以通过三维高斯泼溅的方式渲染出来。TexGaussian中使用的3D U-Net则通过计算预测出的多视角图像和其对应的真实图片之间的损失来进行监督和训练。
TexGaussian输出的带有纹理材质的三维模型可以在现代图形渲染引擎,如Blender中进行高真实感的渲染,进一步满足了增强现实(AR)和虚拟现实(VR)等领域的需求。该论文在多个学术界公开的3D物体数据集上进行了定性和定量的比较,实验结果显示,该方法相比于基线方法,具有更高的生成质量和更快的生成速度,无论是无条件的基色生成还是文本引导的PBR材质生成。另外论文中也通过严谨的消融实验证明了在TexGaussian中使用八叉树和三维高斯泼溅的重要性和必要性,进而为纹理材质生成这一领域提供了新的研究方向。
TexGaussian整体框架
通过参加CVPR 2025,学生们不仅了解了计算机视觉领域的前沿研究成果,还在与业内人士的互动中掌握了实践中的需求和挑战,为实验室成员带来了许多宝贵的灵感和思路。
上一篇 没有了