2025年12月1日,字节跳动豆包团队发布豆包手机助手技术预览版。
据官方介绍,豆包手机助手,是在豆包App 的基础上,和手机厂商在操作系统层面合作的 AI 助手软件。
随后,相关的讨论和试验也随之而来,对游戏尤其是手游玩家而言,大家普遍关心的一个问题是: 它能帮我玩游戏、尤其是完成让我从一些“重复劳动”的部分中解放出来吗?
这篇不长的文章并不尝试解决这个问题,而是月初简单探索之后,得到的一些体验分享。
需要首先澄清一个普遍误解:目前并不存在名为“豆包手机”的硬件产品。字节跳动豆包团队发布的“豆包手机助手技术预览版”,是一款与努比亚在操作系统层面深度合作的产品。
在此前字节跳动在已多次否认自研手机硬件的传闻,而这次发布的技术预览版的正式代号为Nubia M153,明确指向了合作方为努比亚。
在当前的手机行业业态中,手机厂商早已不是单纯的硬件销售商,而是硬件与综合软件服务的集合体。软件服务和用户数据已成为手机厂商的核心竞争力之一。
但当我实际体验这款设备时发现,除了基础的系统架构外,努比亚的元素几乎被完全覆盖——几乎所有关键的用户数据和交互信息,都被豆包所接管。
也是基于这个原因和大家的一般习惯,下文均将Nubia M153称为“豆包手机”。
与普通手机最大的差异在于,豆包手机助手将大模型与系统软件进行了深度融合。在授权相关权限后,用户可以通过自然语言与豆包交互,完成复杂操作。
像是官方演示的“点外卖”场景:从识别需求、比价、下单到支付,整个流程无需用户手动切换多个应用。这种跨应用的长逻辑处理能力,正是传统AI助手难以企及的。
跨应用的长逻辑并非通过简单的屏幕截图实现。截图识别的效率太低,无法满足实时交互需求。实际上,豆包直接在GPU缓存区与安卓底层接口进行直接读取,实现了对系统运行状态的实时感知。
大模型的推理过程并不在本地设备进行,而是通过云端AI完成,本地设备仅接收执行命令。
随后就是月初被大家热烈讨论的事情:豆包手机助手上线不到一天,便遭遇了来自"旧世界霸主"的联合围剿。
首先是微信——不知道是既有的风控策略在起作用还是微信团队的快速反应,使用豆包手机操作微信的用户遭遇了暂时“封号”,微信的多项功能被限制。
紧接着,支付宝也对豆包手机的操作进行了围堵。这些超级APP的激烈反应并非偶然:在AI Agent的新范式中,超级APP自然不会轻易交出控制权,而会选择抵抗,直到他们自己的AI产品成熟。如果全盘接受第三方AI介入,这些超级APP将沦为单纯的API接口,失去自己的核心价值。
安全问题同样不容忽视。在豆包手机的 GUI Agent模式下,手机相关数据全部通过云端处理,虽然在移动互联网时代用户隐私本就脆弱,但将全部信息交由云端AI获取,无疑加剧了这一风险。
而在游戏场景下,我实际体验了《明日方舟》《崩坏:星穹铁道》和《鸣潮》等多款作品——前者代表操作相对简单一些的2D游戏,后两者则是操作相对复杂一些的3D开放世界游戏(战斗分别是回合制和即时制)。
结论是,至少目前为止,豆包手机“替我玩游戏”的能力并不理想。 由于豆包并未针对游戏进行特化训练,它无法理解像是《明日方舟》中的专业术语:“基建”是什么?在哪里“进行剿灭”?塔防游戏的基本规则是什么?但当我逐步教它游戏逻辑和一些专有名词的意思时,它能够通过画面读取完成游戏进程。
更值得关注的是其视觉认知能力。豆包手机不仅能理解文字,还能识别画面元素的变化。例如,当操作某个按钮导致画面拉近或视角改变时,它能正确识别这种变化。在《鸣潮》中,当我告知移动方式是左下角的摇杆时,豆包能够操作摇杆控制人物移动,并正确理解摇杆移动带来的人物距离关系变化。
然而,当前版本存在一个致命缺陷:豆包只有一根“手指”,无法实现多点触控。要知道,即便是最基础的FPS游戏也需要至少三根手指同时操作,更复杂的3D游戏对操作精度要求更高。这一限制使得豆包目前无法胜任大多数主流3D手游。
尽管当前体验仍有诸多不足,但豆包给我们带来了AI 帮你玩手机游戏的效果前瞻:AI具备长逻辑处理能力,能够认知新内容,并执行玩家指令。
剩下的问题主要是细化和优化——针对特定游戏进行专门训练,增加多点触控支持等。有人或许会说这就是MAA(明日方舟小助手),但MAA的问题在于其通用性不足,一个游戏的适配方案往往无法迁移到其他游戏,且版本更新后需要重新适配更新。
字节跳动内部还有另一个专注于大模型玩游戏的团队,他们训练的模型Lumine是一个能够在3D开放世界中实时感知、推理和行动的通用AI智能体。同样首次游玩手游主线时,效率已接近人类水平。
传统游戏生态中,开发者通过代码定义规则,玩家在规则框架内创造体验。当AI助手具备跨应用分析能力,它实际上在重构整个体验路径。这对游戏行业的影响将是颠覆性的:许多游戏通过日常任务设计维持玩家粘性,如果AI能够代劳这些重复性工作,整个设计逻辑将崩塌;MMO游戏中"通马桶"式的副本刷取也将被AI替代。
游戏设计的变化将引发连锁反应,具体影响虽难以预测,但游戏设计的改变很大程度上已是定数。
面对系统级AI的崛起,消费电子行业正在寻找平衡点。
基于GUI(图形用户界面)画面读取的AI Agent面临巨大阻力——超级APP的封锁、隐私担忧、技术限制等都成为发展障碍。更可行的路径可能是“Agent to Agent”模式:让不同供应商、不同框架构建的AI代理能够相互通信,在保障安全的前提下交换信息,协同完成跨平台复杂任务。GUI Agent则可能作为兜底方案存在。
在游戏领域,这种转变将带来深远影响。短期内,AI不会取代游戏,但会重新定义玩家与游戏的关系。最实用的功能可能并非炫酷的自动通关,而是基础性的辅助:自动识别游戏内英文术语并翻译,为非英语用户提供便利;在长时间游玩时智能提醒休息;识别游戏画面中的关键信息(如低血量、任务完成提示),提供及时提醒。
从行业层面看,碰撞与妥协将成为主旋律。手机厂商、超级APP、游戏开发者和AI公司之间的权力博弈将持续。AI对游戏行业的影响将超越技术层面,触及设计哲学的核心。
重要的是:游戏设计师需要重新思考: 当AI能够处理重复性任务,游戏的核心价值应该是什么?是更复杂的策略深度,还是更丰富的情感体验?当玩家不再为日常任务所困,他们是否会更专注于游戏的叙事和社交层面?
作为一名玩家来说,我更认同有变化就是好事。游戏画面技术一直在精进,而玩法本身却鲜有进步。当AI能够替我完成所有的基础操作时,我真正享受的,究竟是游戏本身,还是克服困难的过程?这个问题的答案,可能只有新的游戏形态设计来临时,才能够真正回答了。
评论区
共 条评论热门最新