11月25日,马斯克更新推文,想要尝试AI人工智能能否在2026年击败英雄联盟最佳人类战队。马斯克表示:“让我们看看在遵守以下重要条件下,Grok5能否在2026年击败英雄联盟的最佳人类战队。”
本质上这则“邀约”是马斯克旗下AI Grok的广告:它既能算是人才招揽的纳贤公告,也算是对于各大英雄联盟战队的一种请战帖。
有意思的是,刚刚在今年夺得英雄联盟S15总决赛完成“三连冠”的韩国战队T1,回应马斯克组建AI英雄联盟战队动态:“我们准备好了,你呢?”
制作《英雄联盟》的拳头公司也给出了回应,联合创始人Marc Merrill回复马斯克说:“我们确实可以讨论一下。”这也表明拳头公司对此想法持开放态度。
消息自然引发了各方讨论,很多人都能想到的一个梗,是Faker多次夺冠后“这一冠,献给XX”的固定句式,但这一次“这一冠,献给全人类”好像不是简简单单一个梗而已。
在AI战队刷屏之前,马斯克的AI此前也引发过热议。他旗下人工智能公司xAI开发的人工智能聊天机器人Grok,推出了基于Grok 4大模型的“伴侣”功能。该功能旨在提供更具沉浸感和情感参与度的AI互动体验。
马斯克对这一功能十分重视,亲自下场为其摇旗呐喊,并在社交平台X上将这一消息置顶。对于Grok而言,“伴侣”功能的推出是其在AI竞争中寻求差异化、深化用户关系,并进一步拓展商业模式的重要举措。
这种AI女友的概念尽管并不新鲜,但是马斯克的号召力决定了这样的噱头总会成为焦点,不少网友借此机会称马斯克为“赛博岳父”,当然也有不少人对于其过于情色与暴力的倾向引起了广泛争议。
说回到本次AI战队的设想,马斯克透露,该AI战队将以模拟人类的方式进行比赛,它不会直接读取游戏数据接口,而是通过放置在显示器前的摄影机来“观看”比赛画面。
此外,AI的反应延迟和点击速度不能超越人类极限,这意味着Grok 5无法依靠超人反应速度取胜。这些限制旨在确保AI在与人类对手竞争时不会拥有不公平的优势,使得比赛结果更具说服力和可比性。
在马斯克的限制条件下,Grok 5想要赢下比赛则必须在认知层面和推理层面彻底进化——在这类需要灵活性的任务中,GPU(图形处理单元)要完胜TPU(张量处理单元)。
分析认为,如果最终是 “Grok 5控制人形机器人Optimus进行英雄联盟对局” ,那就是一个集大模型、机器人、视觉感知和运动控制于一体的复杂系统。
马斯克强调,Grok 5的设计目标是“只要读过游戏说明书,就能像人类一样通过实验学会玩任何游戏”。
事实上,让AI 挑战电竞游戏对于科技巨头们来说也能更快让自己的AI得到更充分的训练,因为这些电竞游戏每局比赛中碰到的状况都不一样,临场反应做出决策的时间也都很短,能更有效的训练AI 模型。
对马斯克而言,这次挑战远不止于游戏胜负,实际上是通向通用人工智能(AGI)的重要一步。Grok 5的目标是能够“仅通过阅读说明书和尝试就能玩任何游戏”。这种能力将标志着人工智能向更具通用性的方向迈出重要一步。
用直白的话说就是通过类似的训练让专科医生成长为全科医生,让AI模仿电竞职业选手,代入相似场景后超越人类的操作,无疑具备着十足的挑战性。
据了解,Grok 5目前仍在训练中,参数规模预计将达到6万亿,是Grok 4的两倍。如此庞大的模型将提供更强的推理能力和复杂任务处理能力。
英雄联盟显然不是唯一参与过AI与人竞技的电子游戏,OpenAI 还没有制作出ChatGPT 的时候,他们就曾和Valve 合作,挑战过Dota 2的冠军战队——这甚至算是OpenAI在公众面前的初印象。
2017年,OpenAI就找到了Valve 展开合作,开始开发能游玩《Dota 2》的AI 系统。它起初在2017 年的国际邀请赛上,以1对1单挑的方式,击败了《Dota 2》传奇选手Dendi 后展露头角,随后便致力于解决更为复杂的5对5团队协作难题,试图证明AI 在即时战略与团队配合上的能力。
更为游戏玩家熟知的事发生在2019年,“OpenAI Five”在Dota2中战胜了当年的冠军OG战队,而且是Bo3(三局两胜)轻松获胜:两局比赛加在一起,人类只推掉了AI两座外塔。最惨烈的第二局,人类直到最后击杀人头数还是个位数。
这场比赛中,AI展现了清奇的思路:出门装就选择两个大药,后续的装备也更倾向于买补给品,而不是提高自身属性。人类中单topson交大拿了“肉山”(一种中立资源),然后AI判断人类根本团不过,顶着buff硬把中拆了,一般来说,这显然超过了人类的理解和执行力。
这件事还被人津津乐道的一个点是,第二年OG在完成两连冠时所使用的大后期阵容,就被揣测“或许有从AI对战的失利中学到一些东西”。
但在当时,OpenAI的模型主要依赖于“微操”和“数据直读”。换句话说,当时的对局AI并非像人类一样看图,看的是底层数据,和马斯克如今提出的这个挑战不是一码事,难度也小了很多。
因为看底层数据就不会有感知的错误,也不存在看不到的信息和信息同步的问题,比如主动切屏获取信息是不需要的。
除了击败职业选手,OpenAI 当时也曾短暂开放「OpenAI Five Arena」提供全球玩家线上挑战,在为期4 天的测试中,AI 与人类进行了数千场对战,最终缴出了高达99.4% 的惊人胜率,为AI 在电子竞技领域的发展写下了重要的里程碑。
星际争霸也是如此,19年1月份DeepMind 对外宣布其游戏类人工智能 AlphaStar 在《星际争霸2》游戏战胜了两名人类职业玩家,录像显示这两个人都以 0-5 输给了 AlphaStar。
不过,部分人认为这场对抗对人类并不公平,因为录像中他们发现,AlphaStar 做出了很多超出极限的微操作,这意味着它能在同一时间维度内下达更多复杂指令。半年后DeepMind 团队又一次在《自然》杂志上发表了有关 AlphaStar 的新研究进展。他们表示,这位并没有实体的人工智能选手已经达到了天梯对战的“宗师”级别。
该段位在《星际争霸2》游戏中有着特殊含义,只有排名在前 200 位的玩家才能获得这个称号,同时也意味着 AlphaStar 超过了全球 99.8% 的人类选手。
“AlphaStar 只需要像一个正常人来玩游戏,而不是作为一名超人。”DeepMind 团队的一员奥里奥尔·维尼亚尔斯(Oriol Vinyals)接受《卫报》采访时说道。
同时,为了不再出现和上次比赛一样的“开挂”争议,这次 DeepMind 还对 AlphaStar 做了不少限制。
比如说,AlphaStar 会和人类选手拥有一样的视野,只能看到显示屏内的信息,而不会掌握整个地图的动向;同时它在操作上也不会超过人类玩家鼠标点按次数的极限值。
然而,哪怕是在这样的条件下,AlphaStar 仍然战胜了绝大部分《星际争霸2》玩家。按照 DeepMind 的说法,目前依旧有 0.2% 左右的人有机会在对战中战胜 AlphaStar,大概是 50-100 人左右。
尽管马斯克的战队还没有和T1真的来上一场交锋,但我们可以从AI之前打游戏的一些先例和双方的一些属性,来盘一盘AI这次的优势和劣势(当然主要还是限于《英雄联盟》)。
优势的一面很好理解,比如脚本级操作。举个简单的例子,一些LOL人气选手(如Uzi、TheShy等)以比较激进且极致的对线操作收获了大量粉丝,AI可以通过训练模拟甚至放大他们的巅峰状态,并且不会出现疲劳、走神引起的失误,主动接技能这种下饭操作自然也很难出现。
心态和情绪自然也是一大优势,强如Faker都需要比赛中不断冥想来进入到更好的竞技状态,反过来,因为心态崩了送走的局,电竞玩家可见得太多了;反过来,情绪稳定性是AI的显著优势之一,在高压比赛中,AI不会因紧张而失误。
虽然马斯克的挑战显然需要模拟五个人的操作,但AI的一致性依然能够超越任何默契的“地球人组合”,AI能够做到五个“人”齐心协力,配合亲密无间——众所周知,哪怕是冠军T1,今年也有Doran选手想点子差点送了的场面。
还有一点当然是英雄池问题,众所周知的是今年的英雄联盟赛事规则迎来大改,BO5中采用了无畏征召模式即全局BP,一名英雄比赛中只能被选出来1次,这就大大考验战队选手的英雄池深厚程度和战队战术的丰富程度。
今年S15总决赛T1一大重要的翻盘原因,就是这种模式下,T1选手的英雄池相比KT更为深厚,KT的部分选手在赢了两局后,缺少再能拿的英雄和战术打法,就难以限制T1的后续BP。
而AI不存在人类打英雄联盟的英雄熟练度问题,人人都是“英雄海”,不受个人偏好或熟练度限制。
当然也不是说,这场潜在的比赛,“人类”就毫无胜算可言,创造性游戏是人类选手的第一道防线,人类在游戏中展现的灵感和创造力可能是AI难以复制的。比如S赛的T1和曾经巅峰IG的各种“不科学团战”。S15中,引发热议的T1打野Oner生死局(与AL战队的Bo5第五局)前还在看英雄技能这样的未知操作,或许AI也难以预判。
适应能力也是人类选手的强项,职业选手能够快速适应游戏版本变化,而AI可能需要重新训练才能适应重大更新。
在电竞之前,AI与人类的博弈最引发的竞技场自然是围棋赛场。
围棋AI“阿尔法狗”(AlphaGo)的知名度,超过了很多知名围棋选手,它由位于伦敦的谷歌子公司DeepMind Technologies开发。
2016年3月,AlphaGo在五局比赛中击败李世石,这是计算机程序首次在无让子的情况下击败九段职业棋手。虽然AlphaGo在第四局输给了李世石,但李世石在最后一局认输,最终AlphaGo以4比1的总比分获胜。为了表彰这场胜利,韩国围棋协会授予AlphaGo荣誉九段。
值得一提的是李世石在第四局依靠“神之一手”上演了让Alphago“宕机”的好戏,选择72断黑棋的断点,白棋78,凌空一挖;远在中国演播室观战的古力九段看到这步棋的时候,大声惊呼,“神之一手啊”!AlphaGo随后的行棋有些仓促和凌乱,显得有些不知所措,李世石借此机会攻城略地,逆转了局面,最终中盘拿下本局比赛。
李世石也成为唯一一位在 AlphaGo 全部 74 局正式比赛中战胜过它的人类棋手。
2017年5月23日至27日,在浙江桐乡乌镇的互联网国际会展中心,举办了一场举世瞩目的围棋比赛。其中,5月23、25和27日,柯洁与AlphaGo的三番棋令人关注。对弈一方为世界排名第一的围棋九段柯洁,而另一方为Google DeepMind的AlphaGo,由黄士杰代为落子。
其结果是代表人工智能的AlphaGo三比零完胜柯洁。此次比赛的胜者将有150万美金的奖励,柯洁虽然落败,但仍然有30万美元的出场费。
第一局,柯洁执黑先行,于289手败北,赛后数子,AlphaGo虽然胜了1/4子,但整个棋局柯洁毫无机会。
第二局,柯洁执白,于155手中盘投子认输。虽然这局他惨败,但事后通过DeepMind的分析,柯洁在前期有着几乎完美的布局。
第三局,柯洁继续执白,在209手向AlphaGo“举棋投降”。三盘皆败的柯洁泪洒疆场,表示“对手太完美,自己毫无希望取胜”。
赛后,中国围棋协会授予AlphaGo职业围棋九段,而聂卫平表示,它“至少20段”。DeepMind更是宣布AlphaGo将“彻底退出江湖”告别围棋舞台,转战其他实用领域。
其实对于柯洁的失败,可能是一场注定徒劳的尝试。因为本身从技术层面来说,李世石面对的狗和柯洁面对的狗完全无法同日而语。
当年输掉这场对局后,柯洁也上演了一段著名发言:“能和AlphaGo比赛,对我的意义超出以前所有比赛。今天的棋,我本以为能下得好些,没想到布局就走出我自己都无法原谅的恶手,导致无法挽回,连坚持下去都很难。AlphaGo实在太完美,没有任何缺陷,没有心态波动。所以我很责怪自己,没有下得更好一些。”
“我自己可能做的不好,昨晚也没睡好,很紧张,最后一局能用什么办法对付AlphaGo,其实都是庸人自扰。其实下棋是很快乐的,我以后下棋也应该更快乐,让大家感觉到围棋的魅力。离开胜负也感受不到围棋的快乐,可能我和人下棋才能感受到。
“AlphaGo对我而言没有任何失误,所以我也特别痛苦,之前说这是我与人工智能的最后三盘棋,这是一个正确的决定。”
柯洁自己都坦言:“我感到浑身都在颤抖,真的,寒冷地颤抖。我再也控制不住情绪,赶紧冲出对局室,找到一个无人的角落里哭了起来。因为即将到来的3:0,这样的结局对我来说实在是太绝望了。”
有意思的是,AI的出现某种程度上改变了围棋的训练方式:在AI围棋时代来临后,大家都开始模仿AI的下法,这导致如今的柯洁有些“道心破碎”。
但另一方面,其实也不怪柯洁有这样的变化,毕竟和AI下棋在大多数情况下还是“越下越无聊”的,毕竟与人斗才是这类竞技最核心的乐趣之一,当你面对庞大、精确、没有情感的数字生命时,迷茫甚至恐惧都会成为常见的情绪。
战胜过AlphaGo一次的李世石也坦言:“2016年,我被AlphaGo搞得焦头烂额。但是2017年,我已经开始倾向于隐退。首先,我的集中力大不如前。我开始有点怕围棋了。AI的出现,更是让人感到绝望。就算现在我发疯般努力,再次成为世界围棋第一人,恐怕还是会完败在AI手下。更何况,我已经不再是第一人。”
当然与围棋相比,AI在电竞层面的博弈还是会有所区别,《英雄联盟》、《刀塔2》这类电子游戏对人工智能是完全不一样的局面,毕竟棋类是标准的“完全信息博弈”:棋盘是固定的,所有棋子位置对双方都是完全可见的。
而以《英雄联盟》为例,电竞的对局典型的“不完全信息博弈”:在“战争迷雾”下己方看不到敌方位置,对方策略和意图必须靠推断,因此有大量随机性与不可预知行为。
另外,《英雄联盟》的对局是实时制的:决策和操作是连续的,每秒钟都有新的局势变化,还涉及手速、走位、技能预判。同时,5人需要有团队配合和战术沟通——更接近现实世界的复杂度。
从技术角度来说,马斯克此次的人机大战在搞噱头的同时,确实对于AI未来的迭代和技术创新提出了更高的要求,未来的技术生产力进步也很有可能会因为这样的人机大战得到宝贵的训练和实战经验。
另一方面,AI战队与人类战队的对抗可以作为一个噱头去挑战。但电竞赛事之所以有自己独特的魅力,除开精彩的操作之外,更重要的是关注那些鲜活集体和个体背后的故事和成长。比如前文提到的T1战队,Faker的老而弥坚,Oner现学英雄技能的意想不到,Doran“事业运”爆表的故事,都是无法复制的经历。
如果像围棋一样,未来也迈入AI时代,大家都遵照AI的打法和思路去主导游戏,甚至其他传统体育项目也变成这样的画风,这或许也会是一个比较可怕的变化:竞技项目的不可预测性和故事线都要大打折扣,当灵机一动和天才想法屈从于算法和概率,那将来“道心破碎”的或许不只是柯洁一人了。
评论区
共 条评论热门最新