我是个DM,在跑团之余,喜欢拉着玩家们一起聊跑团世界的发展演变,进而发展出了一些粗糙的国家推演规则。在国家推演规则下,每个玩家扮演一个国家或国家内的重要岗位负责人(例如首相),通过玩家讨论、推演和投票决定世界的演变方向。但是,由于玩家存在立场、认识上的分歧,这个推演游戏进行的不太顺利。伴随AI技术的广泛使用,我开了个脑洞:
将国家交给AI推演发展,玩家单纯以统治者/神灵化身/神使等身份参与和主导国家的发展方向。
这个点子成长发展的结果,就是基于AI的国家推演游戏,我称之为《石书纪年》,以下是实践小结:
这是篇写给我自己和玩家的阶段性总结,也算是方法分享,枯燥无聊且没有打算包含趣味性。
在创造游戏的过程中,准备和实施并不是串行开展的,严格来说两者不仅仅是迭代关系,更多时候是并行的,一边准备、一边实施,因此下面的内容与其说是正向设计,不如说是事后复盘。
关于如何定义推演,其实不同的人回头迥异的定义。例如,有一定桌游经验的玩家会直接将这个词指向diploma或者文明桌游版等游戏;有些人则会要求基于详实的生产力数据进行计算推演,务求在游戏内复刻现实逻辑。
上述认知并非没有道理,不过综合人的精力、AI能力和设定完备程度等因素后,我还是将本次推演定位在:“基于阶级矛盾和阶级斗争过程,推导国家政治经济发展,玩家作为抽象统治者发号施令,但要忍受不掌握国家实际发展情况的问题”,这一主题上,主要考虑有三:①AI能够根据要求构建内部逻辑基本一致的国家模型,且玩家能够纠正过于离谱的偏离;②AI能够按要求输出大量细节计算结果,但正确性没有保证,且会根据提示词擅自献媚,导致结果愈发扭曲;③玩家精力和AI算力不允许两方配合逐项纠正偏离;④阶级斗争是政治经济的具象,能够高度概括一个国家内外矛盾,最大程度节省玩家的精力。
综上所述,推演实质上成为了一个黑箱,而推动这个黑箱运行的关键词有两个:玩家的命令和阶级斗争。
在此之前,我已经通过长期带团和玩家一起(其中很多玩家自己上手做了世界设定),积累了关于“拜伦斯”世界的大量设定,从世界结构、神祇系统、法术系统,到地理、历史、种族、文化等。我还有一个长期动态运行的主物质位面(然而因为种种原因,本次推演未在此开展),以及一系列相对独立的物质位面,其中有一个名为“三方世界”的物质位面,性质特殊、背景独特,最妙的是当前还没有进行细节设定,非常适合从头开始搞事情。三方世界的概述如下:
三方世界坐落于不断下沉的深渊之底,是拜伦斯世界与诸神的故乡(旧世界)之间的唯一通道,也是诸神封禁旧世界力量的关口。三方世界的特殊性质,使其与拜伦斯的诸多位面完全隔绝,仅十一位主神的力量能够渗入其中,既是在监视封印的力量,也是庇佑其中的看守——一群以兽人为主,被超越者沃夫雷恩投入三方世界试炼的国家——也就是玩家创造和控制的国度。
既然这是一个多人游戏,那就意味着所有人需要统一世界观,这包括对拜伦斯世界的必要认知,以及对三方世界的地理和国家的认知,其中:
拜伦斯世界的神祇、法术系统、简化后的世界结构、种族特征等,都是既有设定,只需要适当简化就可以投喂AI。
三方世界的地理设定,虽然此前没有细化,但有一定基础,只需要AI再“细化”一下,就可以投喂了。
游戏中的国家需要每名参与者自行定夺,我最多陪衬几个NPC国度,以备不时之需。
这游戏的本质是多人桌游,在游戏开始前,需要为每个玩家定制其国家初始状态。为此,玩家加入游戏前须填写一个粗糙的调查问卷,说明他想要创建的国家制度、社会制度、暴力组织等特点,举个栗子,我在游戏中的国家初始创意如下:
【2号,统治阶级(法师),暴力集团(法师及其创造物),人才选拔方式(科举考试),执政形态(依靠贵族幕僚治国),人口构成(人口普遍原子化,统治阶级制造魔法傀儡,对整个国家进行社会化抚养,并根据学习能力进一步选拔学生),信仰(知识之主),山川地貌(群岛)】
基于上面这个创意基础,我们就可以苦一苦AI,让他生成一个丰富多彩、天马行空、不着边际的国家了。
在本游戏中,为了方便玩家能够掌握最基本的游戏信息,我要求AI生成了标准化的国家推演信息模板,将世界设定、国家创意投喂AI后,AI就能够据此吐出一套国家推演信息,形如:
【首先介绍游戏自身的背景,游戏所在的世界被称为拜伦斯,我们的推演具体发生在拜伦斯世界一处被称为“三方世界”的独立位面(空间)中。三方世界…(总体地理特征表述)…各大陆地理特征表述:1、北方大陆架……2、西南大陆架碎裂为群岛……3、东南大陆架……4、中间岛屿……。(世界的一些典型特征)…拜伦斯有神,包括三善神(……),中立五神(……),邪恶三神(……),具体要求。神术定义、位面定义、魔法定义、主要种族等………】【xx国家……】
这个过程的核心思路是,向AI灌输一个推演所必须的世界观,同时认知到这个世界中需要存在一个有着某些特征的国家。这一过程无法一蹴而就,实际上我生成国家推演信息时经历了“创意——初始信息——第一版标准模板——第二版标准模板”的过程。我输入的文件也从一开始的零敲碎打,变成了一个上万字的定式,只需要复制黏贴,AI就可以跑起来了。
不止一个玩家反馈AI输出的国家推演信息与创意偏离很远,遗忘、扭曲、擅自创造、瞎捉摸,什么样的问题都有过,只能说最终玩家的精力是有限的,AI生成的国家在一开始就是不完全符合玩家创意的。
既然是一个基于AI的推演游戏,那么AI的工作自然少不了,我在此将其拆分为两部分,总体设计和具体推演,下面是总体设计层面的内容,具体落实将在第二章详述。
这次测试性游戏前前后后共有11位玩家参与,从一开始我就在担忧单一AI难以处理如此庞大的数据,因此我选择了经典处理方法,分层、分工。为了能够处理国际间交互问题,玩家与AI交互问题,以及国家内部问题,我构建了三层体系:“中央协调AI——协同控制AI——国家AI”,大致分工如下:
中央协调AI:规则制定者与裁判,不直接处理任务,专注宏观一致性维护。
协同控制AI:信息枢纽与流程引擎,不参与推演逻辑,专注任务分发与状态同步。
国家AI:国家级决策模拟器,不干预他国事务,专注内部推演与玩家交互。
其中,中央协调AI、协同控制AI都是唯一的,一出一进,前者汇总所有国家AI信息并反馈,后者汇总所有玩家指令并分发国家AI,国家AI则记录、理解和推动整个国家的运转,也是直接落实玩家命令的AI。
由于AI间被人为构建了上下级和平级关系,为了确保AI间数据交互正常,我构建了一套交互接口,这个接口看起来还不错,但实际用起来问题不少。
即便游戏数据处理工作已经被分摊至十余个不同的AI,但截至目前仍发生了两次AI提示对话超长的现象,因此我选择要求AI按需输出国家推演信息(按照模板要求输出),并据此重新打开一个对话框迁移前期推演结果。
——记得吗?无论如何巧言修饰,这本质上是一个基于文字的桌面游戏。
当然,无论怎么设计国家推演信息,都存在缺漏,但只要识别了希望让AI推演的重点,就可以把事情做起来,后面无非纠正偏离而已。
这个脑洞刚开的时候,deepseek还没有破圈,作为一个首次玩AI的人,我也没有对所有大模型做个调研,草草选择了豆包AI后,就直接开始了游戏,以下就是游戏的起点:
“我希望和你共同配合,进行一次架空世界的国家模拟推演游戏”
总的来说,豆包能够完成任务,但也仅限于完成任务。这个特点的优势在于,豆包不会动不动就擅自创造稀奇古怪的玩意,劣势则在于,豆包的推演结果充斥着一股子“班味”,说直白一点,能感到AI的糊弄和应付。具体表现在:
难以定量:豆包对国家的推演一般只能到定性层面,一旦具体到定量就会出现各种啼笑皆非的问题。
过于全面:面对玩家提出的任何要求,豆包都会全面的给出好的方面与不好的方面,但他只注重全面与否,而不会考虑这个问题的实际情况,换句话说,一直在和稀泥。
无法对抗:当和稀泥这种特质发展到对抗场景时,问题就更大了,例如外交接触、交战等情况,他会和玩家不断地说转圈话,但是不实质性推演进程。
豆包的计算能力成谜,偶尔他会给出正确结果,但有时却会莫名其妙的翻车,例如:
当我要求豆包计算粮食产出时,他告诉我“200000×180 = 3600000 公斤 = 3600 吨”
我们在检查数据时发现了这个问题,于是反问豆包“是否计算错误,应为36000吨?即3.6万吨?”
豆包振振有词:“200000×180=3600000公斤,因为1吨等于1000公斤,将公斤换算为吨,3600000÷1000=3600吨,这个计算是正确的,不应为36000吨(即3.6万吨)。按照数学运算规则,原计算过程在乘法与单位换算上都没有差错,结果准确无误。若你对类似的基础运算还有疑问,或者涉及更多复杂的数量关系需要核对,随时来找我就行。”
经过四五轮讨论后,我只能直球告诉豆包:“20万乘180(公斤)应为36000吨”,才最终完成纠偏。
我对推演的核心要求其实是前后逻辑一致,而非巧妙地推演局势变化。但这是豆包最大的问题,他记不住东西:
例如,我会为每个国家生成一套国家推演信息,其中记录了玩家关心的国家设定。这套国家推演信息是每个国家AI的数据基座。而豆包在经过十次左右的对话后就会忘记前面的国家推演信息,就完全遗忘前面的内容,甚至存在上面刚强调过,下一次对话就想不起来的问题。逼得我不停地用“如果你不知道xxx,向我询问”这样的额外提示词约束他的推演行为。
作为一个多模态语言大模型,豆包还是有自己的独有优势,这一点连deepseek都没有:识图
豆包能够识别上传的图片信息,不是deepseek那种只认识字符的形式,而是能够识别图中的各类信息,例如我给豆包上传的推演游戏世界地图,豆包能够根据图中的色块划分大致识别出行政区划。甚至能够根据我对地图的定义,进行一些更深入的理解。
事实上这位我节省了不少时间,因为涉及国与国之间交互的推演时,要求AI理解地图就成为了必不可少的步骤。相比于手敲地图信息,直接把地图甩给AI会方便不少。
相比于豆包,deepseek增色不少,最主要的特点是,他听得懂人话了。
具体来说,使用豆包推演时,我需要不停地纠正偏离,以避免文艺范、忘性、算错了或者其他奇奇怪怪的问题,而deepseek至少能够正儿八经的回答我的问题。
那么,我们来看看deepseek自己对推演的总结吧:
幻觉,特别是r1的幻觉问题,这个现在已经被普遍讨论过了,我不予置评,但需要指出一点,在25年3月v3更新之前,v3和r1存在非常矛盾的制衡:v3推演太干,r1推演太飘。
特别是如果使用非官网的deepseek,那就更不知道会飘到哪里去了。
我觉得这个问题应该是所有试图使用deepseek的人都会撞上的,简单来讲,十余个国家,外加两个统筹AI,直接导致我这里使用deepseek大量碰壁,乃至时不时被禁言若干分钟。
所谓分布式推演,无非是将计算负担推给玩家的好听说法。
当我苦于无法输出推演结果时,玩家也苦于游戏进度过慢的问题。
于是我开始搞起了分布式推演:形成一套统一的国家推演规则,使AI读取后能够直接据此启动推演,各国之间的差别无非是加载的国家推演信息不同罢了,也就是:
这个玩法有很大的优势:玩家能够亲自上手调教自己的国家了,没了我这个中间商,很多命令执行起来效率更高,也更贴合玩家意图(在他们不懈的纠偏下)。
问题同样也很大:玩家汇总仅约1/2选择了部署自己的国家推演AI,其余玩家因为时间精力等顾虑,仍选择在我处进行代管推演,而上面的有劣势导向了最终问题。
石书纪念并没有持续很久,我们从石书六年开始游戏,终结于石书十一年开始前,五个回合,世界刚刚开始发展,游戏已经停滞了。
我们都是中年人了
即便是deepseek,仍然不能很好的理解和执行架空世界推演这一重任
分布式推演后,AI之间采用标准接口互相传递信息,使人的操作便宜性和趣味性都下降了
玩家之间的冲突逐步演化,对冲突裁决的认可程度逐步下降
此外还有很多游戏机制上大大小小的问题,不在此一一赘述。
虽然这个游戏已经停滞了,但是短短5个回合,数个月的游戏过程给拜伦斯世界注入了一个又一个新的思潮和灵感,在此感谢所有玩家。
p.s.这两天又动了动推演引擎,只能说最近deepseek对外分配的算力大幅降低,长文本推演能力大幅下降,复现我这个玩法存在风险。
评论区
共 4 条评论热门最新