本文有AI辅助。
与常见的融资方法不同,DeepSeek采用了业内少见的融资结构,旨在保证创始团队保留对DeepSeek绝对控制权的同时,尽可能募集大量外部投资。这也是DeepSeek首次打破过往“零融资”的承诺,启动并完成了这次外部融资程序。
行业各方已经对这次融资背后的目标解释得非常清晰:扩大AI基础建设,并为DeepSeek未来的研究和发展铺路。随着AI推理、Agent Harness等新技术日渐成熟并进入竞争白热化阶段,DeepSeek需要更多弹药和资源为之后的创新做好充分准备;这其中,Agent Harness是最为重要的发展方向。
但之所以为什么是Agent Harness,这稍微有点复杂,笔者需要展开来讲。
不论豆包、通义/千问、还是DeepSeek自身,过去推出的这些大模型APP,本质上仍旧是一个“问答式信息检索器”,只不过它们能做的要比搜索引擎多得多。如何处理这些搜索结果,仍要由人类自己去完成。
但在2025年最后几个月,Claudbot,也就是OpenClaw的出现,几乎彻底改写了大语言模型的工作方式,将其从单纯的“高级搜索引擎”升级为了能够参与各领域组织生产和管理的数字化工具——或者说,在商用领域展现了这种可能。而这种在基础设施端(也就是大模型端,而不是依赖OpenClaw在用户端)进行的大模型的管理和编排技术,就被称作Agent Harness。
如同云计算发展至今的演变过程一样,一旦我们进入了Agent Harness时代,我们就拥有了一套可复现、可复制、可稳定操作流程、可定制化,更可以在原有基础上进行升级迭代,而非从零开始构建的商业化AI工具,真正用于组织、机构、企业甚至公共治理领域。
但和云计算,以及过往的其他技术不同的是,Agent Harness的研究和推进将不再简单地由传统的企业和政策制定者驱动,而是由整个AI社区,甚至整个人类社会进行驱动。它不像大模型训练那样主要依赖算力和数据,而是依赖集体智慧、真实场景验证和持续共创。这是该技术与以往最大的不同,也是对部分大模型供应商最具挑战性的部分;与此同时,这也是AI厂商最有可能翻车的部分。
在此之前,容我先详细解释一下为什么Agent Harness需要极大范围的社会参与,以及它为什么对Agent Harness而言非常重要。
Agent Harness的核心任务:Harness工程(Harness Engineering),涵盖了工具接口、执行环境、上下文管理、规划验证循环、安全治理等众多复杂组件,高度耦合且场景特异性强。因此,它本质上是一项高度复杂、跨领域、迭代极快的“系统工程”。不同领域(如编码、企业自动化、多模态)的需求差异巨大,单靠少数公司或实验室无法完成。
并且,由于Harness工程属于“控制论调节器”(Cybernetic Governor),是通过真实失败案例迭代的“转向循环”(Steering Loop),而非一次性设计。这意味着单个团队、组织和企业难以覆盖千行百业的海量场景。
在这种状况之下,只有社区的积极参与才能极大加速Agent Harness的进步。通过开源项目、基准测试和集体知识共享,开发者们贡献各种模式、模板、Skills和失败案例分析,可以让Agent Harness的优化效果远超单纯升级模型。企业生产中的漂移、安全和长时一致性问题,也只有通过广泛部署和社区讨论才能被快速发现解决。这种集体实验和反馈闭环,能够形成强大的复利效应,推动整个领域从只能开发出“炫技Demo”迈向真正的生产级应用。
由于Agent Harness更像是AI领域的“操作系统”,其安全治理、基础设施集成和标准化工作都需要跨界协作。类似Linux或Web标准的发展路径,社区共建能避免碎片化,实现互操作性和包容性创新。未来,积极参与Agent Harness社区将成为AI从业者的核心竞争力,共同把Agent技术推向成熟。
说的更直白一点,如果DeepSeek想要大力发展Agent Harness,就必须要与社会各界积极合作,了解他们所处的行业,发现组织和企业面临的难题和通点,并在提供解决方案之后仍然与各行各业保持积极互动,帮助组织、企业和DeepSeek自身优化迭代相关工具以及Agent Harness体系本身,持续性地为社会各界提供优质的、可互动的,可持续迭代的Agent Harness体验。
如果你经常玩抽卡二游或者持续在线服务型游戏(Live Service Games,或者GaaS)的话,是不是对这套说辞非常眼熟?那就对了。尽管其中一个是商业工具,另一个是游戏,但Agent Harness的发展和运营方略和当今中国大陆市场原生的抽卡二游,以及持续在线服务型游戏的运营策略有相当多的相似之处。
那至于为什么提到《洛克王国:世界》这款游戏,就要聊一聊上个月《洛克王国:世界》由于运营失误导致的重大舆情事件了。
给不玩游戏的读者朋友们先介绍一下,《洛克王国:世界》是一款主打“探索、收集、对战”的精灵大世界游戏。玩家可以在游戏中无缝探索3D开放世界,捕捉400多只精灵并骑乘它们来游历整个环境。游戏的对抗部分采用了不考验操作的回合制模式,利用属性克制和策略达成胜利。
和国内主流的服务型游戏一样,《洛克王国:世界》采用了“本体免费,道具和角色外观收费”的盈利模式,玩家可以不花一分钱玩这个游戏,就像免费用那些AI工具一样。目前该游戏处于持续运营的状态,大约每2个月会推出一个全新赛季,持续更新新地图、新精灵和专属活动。游戏支持手机与PC多端互通,可随时随地体验不断丰富的游戏世界。
目前,这一类游戏除自身素质决定游戏热度之外,运营周期期间是否能够最大限度地服务好各个消费层级、不同游戏平台的玩家群体,也是衡量游戏品质的关键甚至核心标准。如果游戏出现重大运营事故,玩家社区便会通过各种发生渠道进行回应,甚至引发舆情。《洛克王国:世界》在2026年5月21日引发的重大舆情就是玩家群体对于运营方服务态度变化的一次重大表态。
此次争议的导火索源于:官方在未提前公示的情况下,对部分游戏内容进行了修改(社区称之为“暗改”),其中包括女角色战败动作的调整,进而引发了社区内关于性别议题的讨论。不仅如此,玩家还发现游戏内存在大量未公告的数值调整、美术资源变动以及旧版Bug重现等问题。由于前期沟通不足,社区内迅速发酵出关于“项目组被替换”、“空降新团队”等猜测,导致玩家信任度下降,游戏评分与口碑出现明显下滑,引发重大舆情风波。
官方在5月24日作出回应。主策划发布公开信,明确否认“团队换血”等传言,承认问题均出自原团队。官方将此次事故归因为版本管理失误、开发进度过快导致测试流程压缩,以及部分历史遗留问题未能妥善合并。针对这些问题,官方承诺将优化未来的版本公示流程,避免类似情况再次发生,并推出了包括回退争议改动、提前上线动作自定义功能、开发养成回溯机制等一系列整改方案。
在补偿与后续处理方面,官方通过游戏内邮件向玩家发放了包含高价值道具在内的补偿方案,并在随后的更新中逐步修复了各项问题。目前,社区评价已出现明显好转,游戏版本环境也已恢复稳定,官方也已公布了S3赛季的更新计划。整体而言,此次事件暴露出《洛克王国:世界》在长线运营与玩家沟通机制上的短板,但官方的后续应对也为修复玩家信任提供了基础。
如果你既玩游戏也关注AI的话, 相信这眼熟的一幕或许会让你想起GPT-5刚上线时引发的舆情事件。尽管那时候还是大模型App出现的问题,但其实类似的运营风波在Agent Harness时代只多不少,甚至还会跳过舆情发酵,直接损害企业利益。
2026年3月,开源社区DataTalks.Club的开发者使用Claude Code帮助代码基建迁移/清理临时资源。由于AI Agent错误加载/替换了相关文件,然后执行了破坏式命令,导致该公司的整个生产基础设施,包括约两年半的课程数据(约200万行学生作业、项目、排行榜)被擦除。若没有AWS的快照系统进行数据恢复,这种由于Agent错误自动化操作导致的损失非同小可。
无独有偶。2026年4月,汽车租赁企业PocketOS采用的AI Agent在自主处理生产环境凭证不匹配问题时,由于通过关键接口执行了删除命令,导致了该企业SaaS平台的生产数据库及备份全部丢失,客户近期预订记录也受到了影响。而这一过程仅耗时9秒。
接连发生的“删库”事件暴露出人类进入AI Agent时代以来最需要解决的首要问题:Harness的工程能力。就像那些刚上线不久,或者第一赛季热度和营收非常好的服务型游戏那样,可能是由于开发商确实是新手,又或是对于游戏运营有着不一样的想法时,就很容易让游戏暴露出重大问题,进而导致负面舆论甚至伤害到玩家和用户本身。
笔者想要阐述这样一个现象,或者说现实:进入2026年,不论是Agent Harness体系,还是服务型游戏,都是开发商、运营商和用户集思广益,共同创造出来的产品。并且,尽管Agent Harness和服务型游戏的最终目的都是服务客户,但实际上这些产品确实是在推入市场之后,通过收集和分析客户反馈来进行持续迭代的。也就是说,满足用户参与,并提供积极反馈,同样是这些Agent Harness和服务型游戏等产品不可或缺的组成部分。
可能对于一部分决策者而言,用户参与创造,并根据用户反馈实现产品迭代是某种“天方夜谭”,甚至是一种“不可理喻”的行为,因为这会导致所谓的“技术和机密外泄”或数据安全问题。但实际上,不论是核心技术还是所谓的数据都已经被云计算与数据中心体系抽象出来,并利用软件进行了重新定义和区分。只要通过常规手段有意识地进行规划、区分和隔离,让更多的人参与到产品的共创中来,永远是利远大于弊的。
因此,在当下积极拥抱共创体系,积极拥抱客户的声音,让他们确实感知到服务方的有效反馈,并感知到产品的切实变化,通过沟通、改进和迭代提升产品体验,才能将产品做得更好,才能让企业竞争力变强,企业护城河也能变得更深。
那么,DeepSeek一直以来给人的印象都是“专业、可靠、有深度,Token价格极具竞争力”。但由于Agent Harness的复杂性和极高的协作规模和难度,会不会让DeepSeek在维持这种专业性的方面遭遇挑战?DeepSeek会不会出现上述像是《洛克王国:世界》或PocketOS同样的“暗改”或“删库”事件,进而引发重大负面舆情甚至伤害企业的真实利益?在舆情之后,DeepSeek有没有能力快速修复行业和用户信任?
评论区
共 条评论热门最新