从22年横空出世、全球爆火的ChatGPT,到如今因为沉迷让人挽起裤腿而引发爆笑的穿搭博主,近几年来飞速发展的人工智能,似乎已经渗透进我们日常生活的点点滴滴。
相信有不少小方块也会和小魔方一样,平时碰到搞不懂的生活常识,或是遭遇苦闷的小烦恼,都会向AI提问或诉苦一番。
在之前的【魔方研究】栏目中,小魔方就AI音乐、全球首个语音指挥的FPS AI队友等话题采访过魔方的AI团队。
那么除了声音,AI是否在其他层面也影响着游戏的生产?今天,我们有幸邀请到腾讯混元3D基础生成模型的研发负责人黄经纬。来聊一聊AI在3D模型生成领域的发展,一起探讨下它会在不久的未来如何切实地影响游戏吧。
说起AI生成的3D建模效果,应该不少人会先想到前段时间小红书平台上爆火的Nano Banana AI手办,仅需要输入一张原型图和一段简单指令,就可以生成3D效果的手办图片和视频,尝试过把自己喜爱角色生成手办的小方块请在评论区和大家分享噢~
但实际上,AI并非一开始就能生成如此流畅和高精度的3D建模效果。让早期的AI生成3D建模,就像让一个尚未拥有视觉的孩童做手工,只能捏造出轮廓模糊的橡皮泥模型或是一堆如同散乱乐高积木般的点云。虽然能看出个大概形状,但根本没办法实际应用。
为了提高3D建模的AI生成精度,开发者们想了个聪明的“笨办法”:既然AI生成2D图片效果已经很过关,那不如让它从不同角度为同一个物体画几十张素描,然后再反向推导出它的三维形状。
就像通过一个人很多不同角度的照片,猜出他的立体长相一样。这个方法让生成的模型看起来自然多了,虽然看起来像那么回事,但效果不稳定,且几何结果十分模糊。
如何跳过2D生成,直接根据算法生成3D几何,就成了许多从业人员必须攻克的难题。随着技术的突破、算力的增加以及同行们越来越多的数据投入,这个问题最终得到了初步的解决,主流产品开始建立了自己专属的高质量3D数据库。
作为国内深耕这一领域的代表,腾讯混元3D的发展几乎就是AI在3D内容生成领域的成长日记,清晰地记录了这个技术如何一步步变得可用。
这个时期的混元3D就如同市场上其他产品一样,面临这3D生成三个十分困难的客观挑战:3D表达贵、数据量少、资源少。
采用“图生3D”的间接生成方案,依赖可微渲染与Transformer结构,虽然能够从单张图像快速输出基础的几何体,但生成结果粗糙、泛化弱,且严重受限于3D数据匮乏的问题。在尝试了一段时间后,混元3D团队渐渐意识到,仅靠从2D模型蒸馏或小规模重建,是难以突破质量瓶颈的。
受到其他开发者研究和成果的启发,混元3D转向原生3D生成路线,并开始尝试规模化训练。别怕资源贵,3D生成也得大力出奇迹!通过大量模型数据训练,AI终于能生成结构合理、具有基本细节的模型了,此时的混元3D已经可以稳定输出和竞品相当的结果。
经历了2.0的混元3D团队,虽然可以生成结构合理、具有基本细节的模型了,但团队在大批量生成时发现了新问题:AI生成时3D内容时,表面容易模糊或者脏乱,生成质量仍旧比较低。
此时混元团队做出了大胆的尝试:魔改2.0时期学习的3DShape2Vecset,通过一个小改动VoxSet。在仅仅两个半月中用了最小的代码调整,便在2025年4月底将混元3D生成模型推入了下一个阶段,实现了中等程度结构和细节的规整生成,一举确立了混元3D在竞品中较为领先的态势。
解决了生成质量的问题,混元3D团队发现当前还存在两个大问题,一个是智能补洞模型在分辨率超过512时使用起来很慢,另一个则是VoxSet重建高分辨率的模型能力上限差强人力。
而此时,Hitem3D的Sparc3D发布了下一个重要的特性——1536分辨率下使用另一种表办法——纯voxel表达,生成的3D效果会更精细,当然这也不可避免地带来了许多其他问题:无效/脏细节,破面,规整度下降等等。
因此,混元3D取长补短,改进了水密化处理,即解决了2.5版本分辨率不够的情况,又规避了纯voxel表达带来的其他问题,可以生成更好的几何(例如全身五官)。
当然,纯粹听黄老师的讲解,可能许多小方块同我一样有种回到高数课堂的迷茫感,我们不妨来亲自体验下它的效果吧!
而需要操作的东西也很少:只需要输入你要的效果提示词或者是上传参考图即可。
当然你还可以额外调整其他的参数,例如模型版本、模型面数、纹理效果等等……
可能有部分小方块会卡在“如何输入提示词”的问题上,不用担心,系统已经帮你写好了参考。
在确定完各种参数之后,大约排队等候几分钟就可以看到成果啦!看,小魔方轻轻松松就生成了近期的女明星猫咪开门。
而除了自行生成的效果,大家也可以在灵感广场上参考其他大神们的作品,并一键生成同款,话不多说我们直接上图!
另外,网站上还有3D世界模型和其他应用套件,相信能给许多创作者带来便利。
那么经历了这些这么多进化,现在的AI 3D生成技术,到底可以在游戏世界中发挥什么作用呢?
对开发者来说,它更像一个提高效率的好工具。基于AI生成内容的版权风险,和当前AI生成3D资产远未能达到行业标准的现状,目前AI生成的内容并没有被用在魔方的各款游戏中,其他厂商大多也是如此。
但因为AI可以轻松面对需要大批量生成粗模的情况,所以它在游戏研发中的一些特定场景下,有时候是个好助手。比如当项目组在考虑是否要加入一个新场景、新角色或新道具时,口头描述的画面往往不够具象,无法作为项目组其他成员想象实机效果的参考。
以往解决这个问题的方式,可能是找一些相似效果的图片来示意,而现在可以直接根据描述或者直接用图片生成3D模型,极大地缩短了方案制作和决策的时间。
也许未来,当AI可以完全达到游戏美术要求的高质量几何和纹理生成时,又或是AI生成内容的版权问题得到了进一步的规范,AI资产会被实际运用到游戏研发中,大家对这样的想象是怀抱期待还是保持质疑呢?
对游戏玩家来首,AI也许意味着自由度更高的未来。当AI 3D生产技术足够成熟时,玩家可以直接用它生成自己心仪的、定制化的游戏内容(如角色的不同服装、动作、武器、技能特效等等)。
搭配上强大的Mod工具,玩家甚至可以直接创造属于自己的游戏世界:不用再繁琐地一步步捏脸,而且直接生成自己想要的角色形象;在喜爱的游戏中直接创造包含新角色、新剧情、新地图等供自己和同好直接游玩的全新DLC……这些目前看似困难的功能,在AI的帮助下都有可能最终实现。
从模糊的马赛克到精致的高模,AI正在以我们看得见的速度学会“造物”。它的进化,无疑会给游戏开发者和游戏玩家带来不一样的未来:也许更快、也许更自由、也许更个性。
好了,今天的【魔方研究】就到这里,大家是否用AI工具亲自尝试了3D内容生产?体验如何,欢迎在评论区一起分享讨论~
评论区
共 条评论热门最新