这几年LLM(大语言模型)大爆发,大家都在讨论AI,也在不断地熟练应用着AI,人类似乎走到了AI爆发的奇点之前,AI开始与各行各业混搭,并影响着它们。而对于应用AI最前沿的游戏业来说自然是被影响最深的,但本文并不是想探讨AI在游戏制作过程中起的作用,而是想知道传统AI对游戏叙事有着怎么样的作用?LLM等又会对叙事产生什么样新的变化?
不少人想象着日后游戏中每个NPC(Agent)都会用上LLM,玩家们可以与他们自由地交谈,自由地互动,像是能AI生成角色的游戏《Arrowmancer》,如果搭上LLM,那是不是就是完全私人定制的游戏伴侣?如果D&D城主让LLM来当(如《AI Dungeon》),那是不是跑团更有想象力和乐趣,如果每一个开放世界的角色都有LLM,那么那虚拟大陆不是会更加真实?甚至说是以LLM为基础,使用生成对抗网络,让AI自行设计游戏关卡,那么就会有无数的关卡可以玩到。
对此,笔者还是有点点疑问:是否真的所有东西都需要上LLM或者类似的强大AI,这是日后颠覆性的趋势?抑或只是新的游戏赛道出现?最主要的还是, 我们游戏需要怎样的AI?
笔者试图、不知好歹地从这点出发,尝试慢慢反推探讨,或许能窥见答案之一二。
这个问题很大很广,从技术的角落来说,AI服务于项目需要,用状态机也好、行为树也罢,甚至神经网络训练等等,都是为了满足项目的需求,可能项目需要大量“够用”的Agent(AI的载体)作为布景板让玩家感受虚拟的真实,又或者仅仅需要一个“聪明”的Agent作为玩家对手,但当前笔者想详细讨论的并不是这个(而且笔者也非技术人员,无法深入讨论),而是想从另外非技术的角度,可以说几乎是感性的角度来思考: 我们需要怎么样的Agent,它拥有怎样的AI才能满足我们?
在此之前,先让我们稍微熟悉一下游戏AI吧。游戏AI中有着各种体系结构,可以从3个方面来进行讨论,分别是反应性、不确定性及作者控制:
反应性——指游戏Agent对于环境的反应的高低,高的反应性意味着Agent能感知环境,并以此选择合适的行为来回应,并且还能根据环境的变化来调整,但这点可能会跟作者控制产生矛盾。
不确定性——指游戏Agent的随机性,高的不确定性则是使得玩家对其难以预测,但同时又要符合Agent的随机行为是合理的,不能产生人工愚蠢。
作者控制——指设计师能否确保AI的调整、优化,能达到自己的期望。比如放弃控制AI,任由AI自主学习,那么要达到设计师的期望也是很困难的。
所以笔者以AI的反应性、不确定性和作者控制为标准,构想了3个大类,来把各种AI体系结构纳入其中。
脚本AI、有限状态机、行为树作为常用的AI,它们有着实现难度低,可快速上手的优点,但自然也有这扩展性差,智能度不足的缺点。总得来说它们是很依赖设计师、技术人员的不断调教,也是非常可控的AI,也就是说作者控制性很强的一类,这合不合适就分场合了。
注:以下每逢涉及具体AI的介绍内容,笔者都会用防剧透先盖盖,因为这些内容都与本文主要想探讨的主题无关,只是一种延伸阅读(而且很简单粗糙,因为自己也不熟!),以及笔者个人对这些知识的顺便回顾,对此无兴趣的读者可以跳过。
脚本AI (Scripted AI)是最直接、基础的AI形式,核心是为Agent预先写好一个行动剧本,Agent就会严格按照这个剧本来执行命令,不管遇到什么情况。比如预设一个市民要去上班,那么它执行时就会沿着预设路径走在上班路上,不管上班地点发生了械斗,甚至道路已经断开了(这样它就可能卡在路上)。
状态机 ,全称有限状态机(FSM),核心概念是管理Agent在不同状态间转换,它只有状态、转换与输入3个概念,例如待机状态,当满足转换条件后(如看见玩家进入视野),就切换到攻击状态等。
进阶的还有分层有限状态机(HFSM),其中每个独立的状态都是一个完整的状态机,把整个Agent行为按颗粒度来分,比如粗分为“生活”、“战斗”、“逃跑”,然后再往下细分,比如“逃跑”状态中也分暂时撤离危险地区,或者直接跑回总部等。
行为树 (Behavior Tree),指定是一种数据结构:由一个根节点和许多行为组成的树状结构。每个行为都是Agent要表现的独立动作、每个行为都有子行为,使得整个数据机构像树一样,然后会按逻辑(选择、按顺序或并行)逐一检查行为,再返回状态。
如一个简单的市民AI,他先检查自己是否不在战斗区内(若在则逃跑),然后检查是否到了要上班时间(若是则寻路到工作地点),都不是的时候,默认返回原地发呆,或循环播放待机动作。
行为树还有个优势是扩展性极强,可以与其他体系结构搭配使用,但行为树本身是没状态的,如果涉及某些Agent记忆行为时就有可能会表现很怪,如一个平民遇到玩家与怪物的械斗,他惊慌地逃离战斗点,但一脱离战斗,他的其他优先级高的行为又让他回去战斗区域,那么就可能产生反复来回的人工愚蠢。
“够用”的AI不一定只是放在人物身上,它放在任何地方、物件、位置甚至机能身上。就像笔者曾经参与过的一个项目,里面的角色没有任何智能逻辑,其逻辑都放在技能上——那是因为游戏有着大量技能,而且技能机制、数量还随着运营不断上涨,所以后续一些修改之类,都可以作为新的逻辑设置在新的机能上,让角色在使用该技能时,以其逻辑判断,教导角色该如何接近目标,以及攻击坐标置于何处等等……
虽说这种做法角色与角色之间基本没有配合互动,角色也不能因为敌我状态等等去进行策略改变,在某些情况下显得比较笨,但对于玩家来说,敌人此类行为的不完美刚好是他们可以利用的空间,至于自己托管的情况下,双方都一样笨,那也不失为是平等的。
在“够用”的AI开始不够用,需要一些更聪明,更能成长,更有大局观等等的AI时,此时单一的状态机、行为树可能比较吃力,所以需要更多的结构方案来挑选,比如有效用值方案、GOAP、HTN,乃至于N-gram算法、神经网络、遗传算法、强化学习(AlphaStar)、蒙特卡罗树搜索(AlphaGo)等等……
总而言之,它们都是开销高,但规划能力高、智能度高,甚至可以越来越强的AI类型。
效用值方案 (Utility),它的核心思想是把任何一个可能的行为,任何一种状态,都以统一的效用值来表达,然后再计算出当前最大效用值,以进行决策。
当然选择何种效用行为并非一定是以最大值来选择,这样会在相同情况下变得非常单调,可能选择的是会选出高效用值的N个行为,以后以权重方式去取其行为,这些表现出来会显得更加自然。
除此之外,每件事物的效用值也并非一成不变的,以《模拟人生》为例,饥饿时食物的效用值非常高,但随着饱腹度上升,对应的效用值就会下降,这是个迅速拉高有逐渐下降的曲线。又比如食物与娱乐的效用值大致相同,这样它们都可能会成为被筛选后的可选择行为之一,然而当角色就快饿死时,由于娱乐权重不低而被选择了去娱乐,这样就会表现得非常奇怪,此时又会以“分桶”方式,或者说双重效用去选择,即会把解决“饥饿”状态的行为全部分为一组(食物组),以其他行为不去考虑,那么就算在食物组中选择任何行为,那都是合理的,且不会单调雷同的,这些就是大致的效用值方案。
当然,也可以与其他方案配合,例如与布尔断定(Boolean predicate)结合应用,以上述《模拟人生》为例子,当发生危及模拟人生命的情况出现时,先以布尔断定判断,当前可以解决当前问题的行为全部通过,然后再从通过的行为中按效用值方案去应用。
GOAP(目标导向行动规划)、HTN(分层任务网络规划) ,两者属于规划类的AI,它们与控制类的(如状态机、行为树)区别很大,其中就有规划类AI决定了Agent是一种基于自主规划、决策的行为,策划无法细致地决定它们每一步做什么,或者何时该做怎么样的行为,可以说作者控制程度已经很低。
GOAP的工作形式是“逆向链式检索”,即从目的反推,先规划需要什么行动才能实现这个目标,然后得出需要满足怎样前提,才能执行刚刚所规划的行动,一直持续分析到初始状态。
HTN则是以初始状态以及要解决的问题作为最高层目标导向,然后进行任务分解,逐渐递归分解为可执行的原子动作。
使用GOAP的Agent,例如FPS中某个敌人为了杀死玩家,会把步骤分解为杀死玩家→已经拥有武器→已经拥有足够弹药→自身生命值足够→自身移动到可射击范围内→开始寻路……
而使用HTN的Agent,例如RTS中的电脑AI,它拥有最高层的任务(赢得胜利),然后拆解为次一级任务(发展经济、发展军事),再拆解更次级任务(发展经济→派遣工人挖矿/生产工人;发展军事→建立兵营/生产士兵)。
神经网络 ,可以把它想象成小型大脑模拟器,模仿大脑神经回路的核心功能,如下图,它一共分为4层,分别是输入层(6个节点)、两个隐藏层和输出层。而某一层的神经激活值,则是由其上一层的输入值,与选择本身的权重进行加总所得,当它传递到下一层时,又重复这个过程。
注:我们可以把它想象成一个管道系统,当把水倒进去后,通过不同大小的管道往下传递,大的管道(权重较高)自然可以获得更多的水通过。
而当往下传递时,遇到不合适的地方(比如赛车AI,遇到了会让自己减速的行为),则进行反向传播,从而修正权重。所以神经网络是一个学习的过程,比如要训练一个赛车AI,则定义好其所需要的输入(视野)与输出(方向、加速/减速),然后中间用随机数决定隐藏层的权重,制作出大量赛车AI,然后进行测试(适应性函数),不断地淘汰差的,保留好的,并且进行进一步复制好的网络,并进行突变,随机修改某些权重,如此反复训练,最终获得一个善于赛车的AI。
上述的各种体系,其实很多时都不是以单一情况出现,只要能让设计师的目的实现,怎样混用都是可以的。
注:简单介绍一下,《黑与白》是一款RTS游戏,玩家扮演上帝控制自己的势力以和平(白)或暴力(黑),去征服其他势力,而其中神兽系统是伴随玩家势力而生的巨大怪物,它不受玩家直接指挥,但受到玩家行为影响而改变。
它的AI模型被称为BDI模型,即信念(Belief)-欲望(Desire)-意图(Intention),来模拟神兽的学习与决策过程,其中包含的强化学习(RL)系统,通过拍打神兽(惩罚,如它随便吃人)、抚摸(奖励,如帮忙建筑)而改变其习性。并且它会观察村民们的劳作,从而习得更多的技能,如主动使用雨水,灌溉农作物等等……最终导致神兽成为随便吃人的怪物、混吃睡觉的大号宠物,或玩家得力的助手等,这种AI则是混合了决策树、感知网络及神经网络等多种技术。
顺带一提,当时《黑与白1》的首席AI程序员,正是获得过诺贝尔化学奖,后来创建了DeepMind的Demis Hassabis,他在最近一次采访中,系统地阐述了自己对人工智能、科学探索、现实世界的本质乃至人类社会未来走向的深入思考,其中关于游戏,他预言:
未来的游戏将由 AI 驱动,能够根据玩家的想象力动态生成内容和叙事,创造出“终极版的‘选择你自己的冒险’游戏”。想象一个可交互版本的 Veo,在未来五到十年内,技术将能创造出真正个性化、每次体验都独一无二的开放世界。
注:其中的Veo为Google最新的视频生成模型,可通过被动观察(观看海量 YouTube 视频)学习物理规律的能力。
尽管就连Demis Hassabis这样的大佬都认为未来的游戏是AI驱动的,然而这一天还没来临,所以AI是AI,游戏是游戏,在达到目的为前提下,性价比最佳的方法自然更受青睐。为了让玩家有挑战性,创造出强大的敌人,创造“聪明”的AI并不是唯一途径,更多时候游戏设计师会利用“作弊”去达到这一目的,就像是《人工智能如何玩游戏》作者朱利安·图吉利斯在书中提到的2个往事一般。
他在大学读博期间,为了研究AI发展,于是利用神经网络与强化学习开发出赛车AI,令其在一次次赛车中学习,变得更强,他并不满足于此,于是邀请世界各地的人一同创作AI,并让彼此在赛车中一决高低,从而推进AI赛手的进化。而首次比赛中就有一人的AI赛手在任意赛道中都表现完美,然而他只是用了最常用的A*搜索——这是一种寻路AI机制,然后以此调教出表现出色的AI赛手,这让希望推进AI进化的朱利安感到沮丧。
另外一件事就是他提到每次遇见一些游戏设计师,谈论应用高级AI时,对方都会婉拒,因为很多游戏都是在没准备强大AI的前提下制作的,对于游戏设计师来说,与其调教应用高难度的AI,还不如在NPC赛手赛车的最高速、转弯速度上稍微提升,这样更加可控与便捷。
除此之外,大家不妨也回忆一下各种游戏,特别是SLG类型的,为了弥补玩家与NPC在智力上的差距,一般都会允许NPC势力偷偷开挂,比如资源收入会更多、彼此侵略性会降低等。又诸如《合金装备》中的心理螳螂,设定上他会读取人类心灵,但实际上是读取玩家1号手柄的按键数据而立刻进行反应等等。
这些都是利用“作弊”手法,用简单的处理获得“聪明”AI的手段——当然,一定要用得优雅,否则玩家就会有一种被愚弄的感觉,席德梅尔在他自传里提到过,他在研发一款早期的RTS游戏时,尝试在战争迷雾外直接生成敌人部队以此增加难度,但这样做被愚弄的感觉很强烈,最终还是去掉了这个想法。
近年来随着LLM兴起,GPT老公老婆成为了可能,马斯克X上的黄毛双马尾电子女伴更是主打一个情感陪伴,这些是“聪明”AI更进一步的表达,它们轻松地通过图灵测试,似乎慢慢地掌握了人类最复杂的东西——“感情”,使其变为了更高级的AI:一个“感性”的AI。如果说这些都不算是“游戏”中的AI的话,那么由米哈游联合创始人之一,蔡浩宇创业公司推出的《星之低语》(Whispers from the Star)中的女主角Stella,便算是一个“感性”的游戏AI。
《星之低语》可能是一个类型非常新,目前还比较难定义的游戏类型,它有着Galgame一般主打情感、对话、交流,但内核又像是《生命线》那种文字冒险游戏,甚至还像是步行模拟器——只不过此时风景变成了人的对话。
《星之低语》中,依靠着LLM的处理,我们可以与Stella谈天说地,虽然因为游戏设置原因,她会不断地试图把你拉回主线上,然后用非常明显的方式去提示你说出提示词。多次重复游玩就可以知道,不管与她聊什么,她总会把话题拉回去,然后按顺序说出提示词,或者指定话题,所以在B站上有UP主可以“速通”《星之低语》——在每个场景把合适的提示词说出来,然后催促Stella去做,从而推进到下一段剧情,这种感觉挺像出示了关键物品的Galgame。
不过说回来,Stella算是一个有“感情”的AI吗?那绝对是,她会回应你每一句话,那并非从词库,而是基于LLM去处理,再配合上五官来表达情绪,足以以假乱真。《星之低语》所表达出来的一种游戏的可能性,可能会是代表着未来某种东西,就像是《人工智能如何玩游戏》最后一章所说:
学术界正在研究的AI方法与大多数游戏中采用的AI方法之间存在很大的鸿沟……与其他行业相比,游戏设计和开发并没有受到当前人工智能热潮的影响。
这在很大程度上是因为大多数游戏类型都建立在几十年前制定的设计蓝图上,当时还没有能够用于游戏硬件上的有效AI。因此,游戏在设计中没有给AI预留空间。为了改变这一点并利用现代AI技术,我们需要重新思考游戏设计,首先可以思考AI扮演的角色。
思考AI扮演的角色 ——笔者十分赞同这话,也是因此才有了最初的问题:我们需要一个怎么样的AI?是“够用”的,还是“聪明”的,甚至是“感性”的?
思考AI扮演的角色,笔者也在思考着这个问题,而显然这个问题的答案已经不在AI这层上,而是应该更往上一层去思考。
在现实中,由于各种客观原因,可能是性能消耗问题、可能是搭建与维护的复杂度,甚至是token的费用,导致我们不可能无脑地把所有NPC都用上“聪明”乃至于“感性”的AI,但如果我们去掉这些前提条件,我们有无尽的资源可以消耗,那么就该把AI全部上最高级的模式?
可能笔者经历、能力都不足以很具体、正确地解答这个问题,但是笔者还是尽力往这方面思考,并且觉得答案是“否”的。笔者认为大部分游戏都是需要叙事的(请不要用约翰·卡马克的名言来反驳我……),把玩家领入一个光怪陆离的世界让其沉迷其中,这是叙事的任务,那与戏剧所做事情也基本相同。那既然师出同门,是否可以用戏剧的角度来思考这个问题:什么样的角色需要什么样的AI去扮演?
在戏剧中,通常会把剧中的人物分为三大类型:核心人物、对立人物、次要人物,(或其他称呼,如概念人物、个性人物、类型人物等)而笔者也尝试简单地把它们类比为游戏中的某些角色:
核心人物——他是剧中中心,所有一切都围绕着他展开,他有着详细可信的人物弧光。换做在游戏中的话,这1号人物自然就是玩家本人了。
对立人物——他们代表着核心人物所追求目标的对立面,是迫使核心人物做出艰难选择后,揭示其深层性格的人,是对核心人物目标构成阻碍,制造冲突的角色。在游戏中很多时候是以BOSS去扮演,但有时候也可能是大自然,甚至是核心人物的内心(如恐怖游戏中的恐惧感)。
次要人物——他们是为了支持核心人物与对立人物而存在的,是为了帮助推动情节、提供信息、提供帮助,或通过与主要人物互动来揭示他们性格、弧光的。在游戏中是除核心人物与对立人物以外的一切人物,甚至是事件或物品来充当这一角色。
通常戏剧会以唯一(或极小数)核心人物+少数对立人物+大量次要人物,构成了所需要的所有角色,然而在这点上,笔者认为在游戏中,并非能简单地类比过去,在游戏中这三类人物的数量、重要性都完全不同。
其中可能是“游戏类型”影响着它们,让这三类人物的侧重点(并非单指数量)完全不同,所需要的智能AI也不尽相同。
这些对抗性为主的类型,玩家所需要是足够“聪明”的对立人物,通过艰辛挑战胜出,而享受那种尖锋对决的快感。即便是游戏为了降低门槛,或者匹配更多玩家,给出了不同的难度,然而这类型游戏的最主要目的还是玩家不断掌握更数量的技巧,去击败更强大的敌人。席德梅尔就曾描述过这种情况:
人类的大脑就是一台学习机器……它在工作时(学习时)是最快乐的。
为此,为了让对立人物强大起来,不管是堆资源建立舞台:帮它们打造酷炫的外表、宏大的背景、震撼的登场音乐等,还是尽量“聪明”的AI(甚至是会学习,越来越强大的AI)都不为过。
难道不是所有戏剧,或者游戏都在着重刻画核心人物吗?一般来说是,但笔者觉得有一些游戏类型更加着重,表现为无时无刻都在强调核心人物的成长、弧光,为此其他两类人物都可以减少存在感,譬如服务型网络游戏。
服务型网络游戏中每一名玩家都被极端引诱去关注自己:关注着角色的外表、角色的数值(成长)、角色的成就等等,就算是没有具体的“主角”,也扮演着收集角色的“隐形”主角,关注着自己的藏品……这些系统都在强调着自我这核心人物,相对来说其他类型人物重要程度就下降了,就如上述的对立人物,此刻也可以变得不需要太“聪明”,太厉害,不需要让玩家艰辛取胜后才能享受快乐,此时的快乐应该是核心人物自身成长的快乐,数值反馈的快乐,于是乎这部分AI智商就可以降下来。
这让笔者想起在十多年前参与过的一个SRPG项目情况——SRPG这类型可操控多名角色,不同角色使用技能顺序,最后落点等都需要计算,相对来说还是有点门槛。当时我们制作出来的战斗AI表现太好,比一般玩家都好,这就意味着不仅敌人的强大会给玩家挫败感,而且玩家用自动托管,表现也会比手动操作好得多,变相鼓励了自动挂机,这不是我们的目的。我们只好把AI降级,让它显得笨一点,再开放详细的自定义AI行为给到玩家,部分高玩就可以根据自己对游戏的理解把AI能力提升回去,这样也不浪费当初的研发。
当然,也不是说所有对立人物都必定变得不聪明,毕竟数值的反馈、老派BOSS的对决还是需要存在的,只不过可以以此划分,分为重收集、成长的中度游戏,以及更为硬核、老派的重度游戏。
笔者认为游戏上的次要人物是跟同门的戏剧中的次要人物,有着差异很大的地方:戏剧中很少存在着重刻画次要人物的情况,因为着重刻画了,就代表这个次要人物已经升格为对立人物,而当一部戏剧中出现过多的对立人物时,就会导致戏剧剧情分散、观众注意力也分散,而且在有限时间内也无法每一名人物都得到充分表达,最终剧情就流于表面。这是因为戏剧本身是一种作者控制很强的载体,观众只能跟随着作者预设好的步骤去了解戏剧中的世界、人物、故事,这一切都导致了次要人物不太能着重刻画,然而游戏却不一样。
游戏类型与戏剧类型都非常多样化,但两者区别却很大,因为戏剧类型再多,它也是属于作者控制很强作为前提,然而游戏却是连这个前提都可以否定,因此真正影响到游戏叙事的角度。
所以笔者武断地认为,是否着重刻画次要人物,不会影响到游戏的类型,但会影响到更上一层的叙事角度,所以次要人物需要什么样的AI来扮演,这个问题我们需要先放在一旁,因为解答的前提,是要弄清了下面这个问题。
笔者在写着重刻画对立人物、核心人物时,似乎得出了一点结论:那就是按游戏类型来刻画不同人物:比如格斗游戏,那就着重刻画对立人物,使用“聪明”的AI;比如服务型网络游戏,那就着重刻画核心人物,其他人物使用“够用”的AI。
然而往深想一点,这些结论却充满反例,所以也充满破绽。比方说格斗游戏的龙珠系列,从FC的龙珠,到最近的《龙珠战士Z》、《龙珠Z卡卡罗特》等,它都是一个带有主线剧情,但又有杂兵战的格斗游戏,此时对立人物就跟次要人物一样常见;再比如之前提到的服务型网络游戏中的硬核类型,诸如《魔兽世界》的副本BOSS,都需要大量玩家齐心协力地去应对,此刻又是对立人物的高光……
为什么会有如此之多的反例呢?或许用游戏类型作为着重刻画的前提是不合适的,它们只是刻板印象的好搭档,但随着现在的游戏混合类型情况越来越常见,出现这种“反例”频率高也就说得通了。所以什么前提才是决定了需要刻画什么样的人物,从而决定使用什么样的AI?
或许我们应该更往上一层去看,去探讨使用类型人物的初衷——叙事。
戏剧的叙事绝大部分都是作者性质的,而游戏则不然。游戏中作者控制强的叙事可以称之为脚本叙事(scripted narrative)或嵌入式叙事,就是最传统的,由制作者把控玩家大部分体验的手法。而与之相对的则是替代性传记(Alterbiography)或者说是涌现式叙事,它是一种玩家通过解读、整合游戏提供的叙事元素,为自身所扮演的角色构建出个人化的故事与历程,说得可能比较学术一点,所以笔者放了个较粗糙的对比图出来(这里是指最极端的嵌入式叙事与涌现式叙事)。
嵌入式叙事是游戏的属性,而涌现式叙事则是玩家体验的属性。
注:涌现式叙事并不代表是玩家游玩的体验,前者是狭义的,特指叙事感受与代入感等,后者则是广义的,包括叙事、系统、甚至声音、过场动画等一切反馈。
嵌入式叙事与涌现式叙事并非对立的关系,它们对于元故事(Meta-Narrative,理解为类似于背景,承托叙事的载体)都是至关重要,缺一不可,区别只是不同游戏所占的比例不同。笔者认为在传统的嵌入式叙事为主的游戏类型中,次要人物始终处于不太关注的地位,而当着重刻画核心人物或者对立人物时,即可以套用戏剧那一套,从而选出合适的AI去扮演。
但涌现式叙事比例很高的游戏却不适合了,因为在这种叙事下,玩家是自由的,他所遇到的任何一个角色,都可能成为他替代性传记中的好对手、好伙伴,所以我们不得不把所有次要人物都升格为对立人物一样,这样的话,相当于我们要把游戏中所有角色,甚至物品、自然、逻辑都当作一个不可忽略的因素来对待,玩家被嵌入式叙事聚焦的视野会放开,因此——涌现式叙事中的世界全暴露在聚光灯下,任何东西一旦不符合玩家的感觉:不“真实”、没有内在逻辑的自洽,这样这个世界就很容易崩溃了。
总得来说,笔者认为嵌入式叙事主要是玩家与设计师互动,而设计师是通过提线木偶(各种人物)来实现,所以这些木偶不需要太多变化与智慧。但随着涌现式叙事增多,玩家互动的对象也会从背后的设计师逐渐过渡到人物身上,玩家不再满足呆板、僵硬的人偶,想要越来越像真人的对手。
笔者就拿开放世界来举例吧,以下放了笔者非常主观定位的图:
图中的游戏,笔者认为从左到右是涌现式叙事比例不断增多,从而导致玩家与任意人物(Agent)互动时,所要求的AI也在提高。
比如经典的JRPG式开放世界:《勇者斗恶龙11s》、《异度神剑》之类,里面的角色基本就是脚本AI一类,他们是设计师的提线木偶,只需站在一个初次见面真实感足够的舞台(世界)上,说出作者精心设计的台词即可,一切都是为了作者叙事而服务。
随着慢慢增加涌现式叙事比例,玩家偶尔也想脱离设计者预设的道路,自由地四处看看,所以对人物AI的要求也在增加,比如《刺客信条》里面城市的居民,表现出来来往往即可,但到了《天国拯救》那里,居民就需要有自己作息表来表达“真实”,此时脚本AI已经不满足了,至少要状态机来完成。
而到了《荒野之息》、《中土世界》中,居民作息不是他们想要表达的重点,所以居民作息只用了较简单的循环表达;而此刻重点变成了战斗,因此战斗系统方面下了大功夫去打造,状态机AI也不再满足需求了。像是《中土世界》的复仇女神系统,就是集合了AI算法(行为树)与机器人学习(聚类),所以有着出色的表达,而且它还能反哺嵌入式叙事,是一种很难得的两种叙事动态互补的游戏。
到了几乎完全是涌现式叙事的《创世小玩家2》、《我的世界》里,情况却不同了:《创世小玩家2》里嵌入式叙事还是比较明显的,玩家需要与村民们一同完成叙事(生活、战斗、发展剧情),所以村民们的AI还是“聪明”的,是一种混合了效用值、行为树或HTN的AI系统。但到了《我的世界》里,玩家几乎不需要跟任何角色互动了,自己跟自己玩就好,所以Agent回到了最简单的脚本AI上,世界的一切都有玩家来把控。
随着涌现式叙事比例增加,所要求的不仅是Agent的AI提高,还是整个“世界”的可信度在提高,这里虽然已经与本文主题需求AI扮演的角色没什么联系,但笔者还是想继续延伸探讨一些,可以使得AI叙事时,让“世界”逻辑更加自洽的手段。
当游戏中强调涌现式叙事,希望游戏世界上有更多各式各样的角色,尽可量丰富时,如何生成、以及生成之后如何投入世界去运作,便成为了要重点解决的问题。
3.3.1 托辞生成 (Alibi Generation),是一种深思熟虑、前后一致的角色生成技术,它会让所有角色都拥有自己的身份,并按照身份对匹配合适的行为去执行,例如一名猎户,他会根据游戏中的时间决定自己去狩猎、用餐或消遣。然后每当玩家与其对话时,他便从猎人对话库里,挑出符合当前时间、地点的几句闲话以回应。
封装托辞角色 ——据点的固定居民可以事先设定这一切,甚至可以更详细地设定角色背景、性格等。比如上述的猎人,在它爱好中添加“喝酒”,那么它在消遣阶段选择行为中,就会认为去酒馆喝酒的效用值最高,而大概率执行,这些被设定好的托辞角色被称为“封装托辞角色”,逻辑简单、快捷,唯一不足是角色不太能复用,而且要足够多,才能保证世界的多样性。
MH算法托辞角色 ——一个据点总不能来来去去都是这些人,总要有些不速之客来盗窃,或者一些游人怀着巨款而来,此时以MH算法(一种涉及统计学与机器学习的算法,简单来说就是从一大堆条件中随机生成许多组合,然后筛选掉可信度低的,保留高的,再继续随机微调,并对比前后者可信得分,如此多次重复,慢慢炼成一个高度可信,无论从造型、身份、对白、行为都非常合理的随机角色为止)生成,就会生成出一个合乎当前环境的角色,例如在冬季据点,会随机一个穿着滑雪服,喜欢看日出,到这个据点暂住的游客。
3.3.2 海森伯格系统 (Heisen-burgh),当生成后托辞角色后,如何投入世界又是一门问题,如果我们拥有无上限的机能的话,当然可以让整个世界都生成角色,让它们运作起来,然而现实是有限制的,而且生成玩家感官以外的角色毫无意义。因此有一种方法追求以最小消耗,并且不穿帮的情况下投入角色,这一方法就被称之为海森伯格系统。
它是一种计算方式:先把游戏世界划分成不同区域,当玩家从当前区域通往下一区域时,开始计算出当前区域角色销毁、新区域角色生成的速度。随之便是玩家身后的区域逐渐沉寂,眼前的区域逐渐热闹,不同的角色开始从视野外生成并按照其托辞设定行动,并且计算好每个路口、商店可以容纳人数,使其在一段时间后出入的人数达到均衡,不会太冷清或太拥挤。
托辞生成与海森伯格系统的配合 ,就像一部经典的电影《楚门的世界》(先假设大家都看过),在楚门视野内,所有演员都卖力演出,而在他视野外,大家该休息的休息,该下班的下班,并不会白耗着。
而当楚门从家里出门,在上班的路上时,领居、同事(封装托辞角色)便慢慢刷出来,与他相遇,偶尔会有一些陌生面孔经过(MH算法随机托辞角色),他们或穿着T恤来度假,或穿着西装来谈生意,总是合情合理。
然而当楚门发现一点不妥,开着车乱闯,试图逃离桃源岛的时候,路人、车辆就一下子刷出来,堵住他的去路,让他感觉到非常不自然,这就是海森伯格系统没处理好,没让行人缓慢刷出,并自然地走进楚门的视野内。
不过说了那么多,当然也是会有更普通的方法存在,比如把场景NPC位置保存几份,每次随机刷出,只要确保刷出位置在玩家视野之外(甚至之内都行,用动效渐显)等等,这些方法实现起来更加简单,至于是否会给玩家带来不真实感,笔者认为重要的还是要看游戏侧重点是嵌入式叙事还是涌现式叙事。
3.3.3 复仇女神系统 (Nemesis System),《中土世界》系列的特色系统复仇女神系统,可以说是托辞生成优秀的例子,也同样是涌现式叙事反哺嵌入式叙事的最佳案例。它是贯穿于游戏中的一个大型系统,简单来说就是玩家会在游戏中遭遇各式各样的兽人,与它们发生战斗并产生一系列互动。
兽人内部是等级分明的,军衔高的兽人更强大、外表更恐怖,同时也会习得更高级职业、技能。而这个军衔除了生成时的初级状态外,它的升降完全是与玩家互动而产生的,也就是这些兽人的强弱,都是与玩家交互中发生,从而产生了涌现式叙事。
塔里昂(玩家)逃跑,下次遇到该兽人时,该兽人会出言嘲讽
塔里昂死亡,导致击杀的兽人(就算是无名小兵),也会得到晋升,下次遇到玩家时也会好好嘲讽一番
兽人逃跑,下次它会说出复仇的话
兽人死亡,有概率是假死,下次会以复仇者姿态出现,这些兽人是不能收服的了。
兽人被羞辱,会导致它军衔下降,从而有被收服机会,但也会导致发疯或者加弱点。
整个复仇女神系统还有更多更细致的设定,比如兽人假死时致命伤的位置,会影响它日后重生时外形的变化,比如不同性格的兽人与玩家互动也会不一样等等。这些变化很多,而且都是基于与玩家互动才出现,对于每一名玩家来说体验都是独一无二的。
就以笔者经历来说,过了那么多年笔者还记得里面一只职业为吟游诗人的兽人。它喜欢说怪话,又善于逃跑,笔者好不容易杀了他一次,哪知道他还假死复活,变得更强大,垃圾话也更多,搞得笔者十分无奈又难忘……
这种就是很私人的游戏叙事体验,而因为在《中土世界》故事中,塔里昂主线剧情是创建自己兽人大军,来与索伦对抗。因此与兽人的互动,那一切的涌现式叙事都可以被嵌入式叙事融入进去,也因此成了两者互通互补的最佳范例。
回到文章最开头的话题,这几年LLM的火爆也催生了众多AI游戏的尝试,这两天由铼三实验室发布的,针对目前市面AI驱动游戏、AI演出游戏的一份总结报告:《AI+游戏方向调研报告》(时间为5月份)更是引起人们的重视与关心,笔者也想借着这篇文章来阐述LLM对叙事产生的新的变化:
《星之低语》,这款上文已提到过,是笔者认为“聪明”AI的更进一步版本,或许就是以其为代表的“感性”AI,但目前这个“感性”AI并非完整体,它在预训练的帮助下,在LLM方面表现出色,也有了长期记忆的效果。然而《星之低语》说到底骨子里还是嵌入式叙事为主,与“感性”AI互动的涌现式叙事只流于表面,所以在嵌入式叙事没太下功夫的情况下(更复杂的系统,或更跌宕的剧情),《星之低语》的可玩性并不高,总得来说实验性质很明显。
《inZOI》 ,模拟人生类型游戏, 在本地部署了一个蒸馏过后的小语言模型 ,为里面的Agent提供行为逻辑。模拟人生类型可以说是涌现式叙事比例最重的那类游戏吧,所以如果AI能尽量强大,作为“感性”AI且支持LLM的话,那么潜力肯定很大。不过目前看来大家对inZOI吐槽是系统方面太弱,待解决这方面问题后,这类型游戏能发挥“感性”AI的潜力就很大了。
《Engram》(依格),这是文章里没提到的一款AI游戏,同样是由米哈游出来的,名叫丁盛豪创业所做的CRPG游戏,它的类型倾向是TRPG,即跑团一类,但传统AI作为DM可能会导致故事很散,于是Engram便尝试以一些作者控制手段去收紧,同时设置条件限制,这些条件之间可以存在各种并、或、非等关系,从而控制前后剧情的连贯性与减少不自然感。这些手段都与笔者先前空想过的一些AI应用手段很想,但更加具体、可行(游戏新知一篇访问《前米哈游大佬创业,做了一款AI驱动的CRPG》很值得一看)。
虽然说本文一直探讨的都是叙事与AI的关系,但游戏其实是总体艺术,系统、战斗、数值、音乐、动画、建模等等……都与叙事紧密联系且互相影响,所以本文一直假设这些作为前提的舞台都是扎实存在的,比如:RTS里聪明的电脑,也需要有平衡的种族;赛车游戏中聪明的赛手,也需要合理设计的赛道等等。
合适的AI与舞台互相成就,并且放大彼此效果,但如果舞台搭建得不够扎实,那么就算AI如何合适当前叙事、如何“聪明”且“感性”,那最终结果也不会太亮眼,甚至还会拖后脚。
所以结合舞台与叙事的关系,再回看《AI+游戏方向调研报告》,在报告中该作者体验了10款AI游戏后,得出了一个结论:
不论是「AI驱动玩法」还是「AI演出」,那些拥有良好阶段性/持续性关卡目标、但缺乏游戏总体主线的游戏,反而能在整体体验上展现出优势;相对而言,更偏向传统的非AI游戏玩法和框架的产品,在加入大模型之后则会更缺乏可玩性,亦或是使AI本身的作用成为鸡肋。同时,对于关注用户内容本身为主的产品,在AI驱动玩法下可能会有更大的潜力。
注(报告中摘取):一般被认为是那些由生成式大模型完全或部分定义游戏核心玩法的产品;同时,在本报告内,那些生成式大模型可能并不干扰游戏核心玩法本身,但会在游戏进程中实时生图、文、动画、音频等游戏演出资产的游戏,也被划为此品类中。为了方便后续分析,前者可以被称为「AI-driven gameplay(AI驱动玩法)」游戏,后者被称为「AI演出」游戏。
这正是某些AI游戏舞台不够扎实所导致,或许日后会存在一种游戏类型,其所需的舞台可以很简陋,像个土俵一样,上面有两个强大AI进行相扑表演即可满足玩家也未尝不可能,但至少当前这类型还是需要业界继续探索。
至此,笔者武断地认为自己似乎找到了自己心中疑问的答案——“游戏叙事需要什么样的AI”。笔者觉得这个问题的粗糙答案,或许如下:
我们可以根据游戏关于嵌入式叙事与涌现式叙事的倾向,来决定游戏中角色所属的人物身份:嵌入式叙事为主的游戏,重点刻画的是核心人物、对立人物;涌现式为主的游戏,则所有人物甚至舞台都要重点营造。
然后再在确定叙事角度、人物身份的两个前提之下,得知对应的人物应该由什么AI去扮:这个AI能力合适即可,不需要追求过分的高智商、高反应,这不仅仅是为了不浪费性能,同时也是因为不需要,正如席德梅尔说过:
玩家想要的不是一个完美无缺、智力超群的AI,而是一个能带来乐趣的对手。
最后的最后,在探讨本文主题的过程中,笔者学习了很多、也思考了很多,久违地渴望地吸收着陌生的知识,这些知识让笔者思绪禁不住地乱飞,想象了许多可能的应用场景:比如LLM不完全代替嵌入式叙事类游戏的AI,而作为性价比合适的某些具体角色的补充;比如LLM并非作为直接的输出,而是作为“裁判”式的中间切换器;比如利用LLM帮助托辞生成更加完善、灵活;比如复仇女神系统的反向应用等等,但碍于篇幅与主题,以及更多这些只是天马行空、不着边际的乱想,那就略过不提了。
在最后的最后,笔者也深感幸运地探讨了这个问题,因为在探讨中除了懂得更多,解开了更多困惑外,也抚平了一些焦虑感情。
去年米哈游的蔡浩宇曾经表示过:AI正在重塑行业格局,未来行业是有极少数精英与绝大部分业余爱好者组成,其他从业者都可以转行了(大意)。这番话给广大从业者都带来了不少焦虑情绪,生怕一不注意就会被时代抛开,然而今天同是米哈游的丁盛豪却劝我们:少焦虑一点,不要觉得AI明天就要掌管世界了,但自己还没跟上,AI确实在不停改变工作流,但好的内容永远有人消费,大家还是注重精进自己产品质量。
或许当下正是如此,在AI影响下的游戏行业中,玩家等待着AI、LLM对游戏的重大革命,而许多从业者包括笔者在内,一边怀着忐忑心情看着时代巨变,一边又为不断爆发的AI应用兴奋不已。
虽然笔者尝试过找其他话句来做最后的结语,然而怎么选,还是都比不上狄更斯那句名言如此之合适,尽管它已经被大家都用烂了:
这是一个最美好的时代,也是一个最糟糕的时代……
评论区
共 2 条评论热门最新