在全面转向Vibe Coding的这几个月里,我似乎都快忘记了和人工智障对话的痛苦。然后,最近正好有个需求要大量地与AI对话来完成一些设定。这使得在经过最近这几个月爆发式的Vibe Coding工程博客的洗礼后的认知得以重新审视AI在知识领域的问题。
于是就有了这次对话。我不确定这是否有价值,但至少看上去挺靠谱的。所以拿出来跟大伙分享,希望大家多多提建议!
因为聊天记录原文有点太长了,所以本文是让AI将记录总结后生成的文章。以下是正文:
当你让一个 AI 阅读三篇观点相左的文章,请它综合判断时,它会怎么做?
答案是:它通常会对每篇文章分别做一番串行分析,然后输出一段"看起来综合了各方观点"的流畅文字。但这不是真正的整合——这只是把多个来源的表面说法拼贴在了一起。
为什么会这样?因为大语言模型的本质是"给定上文,输出最可能的下一步 token"。它倾向于处理"送上门来"的信息,而不是主动从多个源头检索、比对、整合。这是一个被忽视的结构性特征,而非可以通过更好的提示词解决的工程问题。
这引出了一个更根本的问题:人与 AI 在知识工作中的真实分工应当是什么?
一种流行观点认为,AI 是强大的知识库,人类只需学会正确地"提问"即可。这种观点假设 AI 像人类研究员一样,知道自己何时需要外部检索、何时需要交叉验证。
人类研究员面对复杂问题时,会主动从多个信息源获取材料,比对不同来源的说法,形成综合判断。这是一种由目标驱动的主动行为。
AI 的运作机制截然不同。LLM 的生成模式决定了它倾向于处理"送上门来"的信息。即使上下文窗口足够长,模型仍然缺乏主动发起多源检索与比对的动机结构——因为它的优化目标是语言流畅性,不是事实准确性。
更根本的问题在于:AI 无法感知自己在"知道什么"这件事上的盲区。
举一个熟悉的例子。当 AI 处理一个翻译任务时,它会自动将问题框定在"语言之间的转换"这一框架内。一个有经验的人类译者则会考虑:语境需要哪些背景知识?目标语言的文化暗射是什么?法律文本需要哪种精确性?这种跨学科的知识动员能力,是 AI 系统性缺失的。
人类研究员(正常认知状态): 接触新任务 → 评估知识缺口 → 有针对性地检索学习 → 形成论点
大语言模型: 接收问题 → 立刻产出语言流畅的论点 → 论据是事后追加甚至缺失的
LLM 的优化目标是语言流畅性,而非事实准确性。这解释了为什么 AI 能构造出逻辑完美但前提错误的推理链——因为在语言层面上,这种推理完全站得住脚。
一个看似合理的解决思路是:让 AI 标注自己输出的置信度,从而为人提供判断依据。
这个方案忽视了一个核心事实:置信度标注的可靠性来自元认知能力——即"知道自己不知道什么"的能力。AI 恰恰缺失这种能力。因此,AI 给出的置信度,本质上是在给一个自己无法验证的东西打分——与其说是信息,不如说是噪音。
上述三个局限放在一起,导向一个看起来合理的推论:如果 AI 存在这些问题,而人类不存在这些问题,那么人类似乎具有某种结构性的优势——人可以从系统外部审视系统,用更全面的视角做判断。
这个推论本身存在一个盲点:它假设人类可以"跳出"自己的认知架构来做审视。但人的认知同样依赖于一个无法被软件层反向修改的底层——无论是神经元结构、身体体验还是已有的知识体系。一旦形成判断,这个判断就成为后续思维的"锚点",使人倾向于用新证据强化已有结论,而非真正转化立场来审视自己。这是认知结构的固有限制,不是性格问题。
这意味着:"人在系统外部,可以作为 AI 的裁判"这个假设是站不住脚的。 人也是在"系统内部"运行的。
关键在于:这不是"有限 vs. 无限"的区别,而是两种不同类型的有限性。
视角固化——人一旦形成判断,这个判断就成为后续思维的"锚点"。确认偏见的根源不是性格问题,而是认知结构的固有限制。加上社会性压力:一旦公开表达了某个立场,人就倾向于维护它。
生成与审查的解耦。 AI 的"生成"和"审查"是两个可以相对解耦的过程。当 AI 生成了一段文字后,"审查这段文字"是另一个独立运行的过程——它不需要"保护"已生成的结论,不受社会性压力影响,也没有维护"自我形象"的动机。
需要澄清的是:AI 的审查并非完全"无立场"。AI 的"审查模式"本身是从训练数据中学到的语言模式,其中隐含着训练数据中的偏见。但关键在于:AI 的审查过程不存在"立场保护机制"——它不会因为已经表达了某个结论,就倾向于拒绝与之矛盾的信息。人的审视则受到立场保护机制的约束。这是两者之间的不对称。
传统人机协作框架倾向于把人的角色定位为"裁判"或"验证者"——等 AI 输出后,再由人判断对错。这个定位的问题有两层:
第一,它假设人在系统外部,可以作为客观的裁判。但我们已经论证过,这个假设不成立。
第二,即使人愿意扮演裁判的角色,人的"判断"本身也受制于视角固化——人会倾向于用新证据强化已有的结论,难以真正转化立场来做审视。
人生活在现实世界中,日常行为不断接收来自现实世界的反馈——预测会得到验证或否定,决定会产生可观察的后果。这种持续的现实反馈,是 AI 完全没有的。这意味着,尽管人的判断也有盲区,但这些盲区和 AI 的盲区不是同类的。
人不是"裁判",而是"桥梁管理员"——维护 AI 与现实世界之间通道的角色。具体而言:人在输入侧确保信息源的可靠性,在输出侧把 AI 的输出转化为现实世界的反馈入口,并通过这个通道把现实世界的验证信息注入 AI 的推理过程。
这不是认知层面的合作,而是工程层面的接口设计。人负责设计的不是规则,而是AI 与现实之间的接口结构。
判断结论是否和现实相符
决定接受还是拒绝某个分析方向
提供 AI 自身无法产生的体感反馈
对自己刚生成的输出做无立场的审视
识别可能的盲区和遗漏
提供多种解读角度供人选择
这不是"补短板",而是让两种不同类型的有限性形成互补。
现实层 ←→ 人(通道维护者)←→ AI ←→ 符号空间
没有裁判。 人不是 AI 的裁判,AI 也不是人的工具。整个系统的驱动力来自现实世界的反馈,而不是某一方对另一方的控制。
局限被容纳而非被隐藏。 AI 的局限(缺乏现实锚定)不会导致它产出失控的结论,因为每一个关键节点都经过人的现实锚定;人的局限(视角固化)不会导致整个系统陷入死胡同,因为 AI 的视角转换能力不断提供新的审视角度。两种局限分别在对的时间、对的环节发挥作用,而不是相互放大——这正是双螺旋结构的含义。
具体而言,人机协作分为五个步骤循环往复,直到人做出最终决策:
人作为"信息守门人":确保 AI 处理的信息源可靠
AI 执行核心分析:快速探索解空间,产出初步结论
AI 执行置信度检查:对自己的输出进行无立场保护的审视
人阅读结论与报告:判断哪些与现实经验相符,哪些需要查证
人的判断反馈给 AI:调整分析方向
代码世界有客观的"通过/失败"信号:测试能跑通,linter 不报错,安全扫描通过。这些信号不需要人来判断——它们是结构性的、可重复验证的。
但在知识领域,"对错"的标准远没有这么清晰。一个论点是真是假,往往不能被直接测量,只能被追溯到其背后的证据和推理过程。
标准一:外部权威知识的锚定。 论据必须追溯到具体可验证的信息源。当没有外部知识锚定时,AI 必须明确标注"本结论缺乏可验证的外部知识支撑"。这个标准之所以必要,是因为它直接回应了 AI"知识预测缺失"的局限性——如果 AI 无法自主判断自己是否需要外部知识,那就强制要求它交代论据的来源。
标准二:完备性检查。 要求 AI 回答:从完备性角度分析,我做了哪些检查?遗漏了哪些可能的视角、反驳点或相关领域?这个标准之所以必要,是因为 AI 的单线程困境意味着它倾向于沿着已激活的路径生成,而不完备性检查强制它停下来,覆盖它原本不会主动考虑的领域。
这两个标准之所以有效,在于:不要求 AI 回答"对不对",只要求它交代"怎么来的"和"缺了什么"。评估过程因此从主观判断变成信息追溯——用户看到论据来源和覆盖范围后,自行决定是否接受结论。
置信度检查报告不是让 AI 回答"你觉得这个结论多可靠"(AI 无法回答),而是要求 AI 的输出必须包含以下结构化字段:
【论据来源】
- 信息源A:[描述](可验证性:高/中/低)
- 信息源B:[描述](可验证性:高/中/低)
- 未覆盖的相关信息源:[描述]
【完备性检查】
- 已检查的视角/维度:[列表]
- 未检查的潜在视角:[列表]
- 可能的反驳点:[列表]
【结论摘要】
- 核心判断:
- 主要支撑:
- 主要不确定性:
用户阅读后自行决定是否接受结论,并决定是否需要补充其他视角或外部知识。
置信度检查报告的价值,不在于让 AI "知道自己不知道什么"——这做不到。它的价值在于利用 AI 的结构性优势,执行一种人无法做到的无立场审视:
人执行审视时,判断会受立场锚点的影响——人会无意识地保护自己已输出的结论。这是认知结构的局限,无法通过努力完全消除。
AI 执行审视时,它只是在执行另一个从训练数据中学到的语言模式("审查模式")。这与人类有意识的审议完全不同——AI 并不真正理解它正在审查的内容。关键的不对称在于:即使 AI 的审视缺乏真正的理解,它的过程仍然不受立场保护机制的约束。置信度检查报告正是利用了这个不对称:强制 AI 在输出后进入"审查模式",产出结构化的审视结果。
置信度检查报告的价值不是来自 AI 的理解力,而是来自 AI 审查过程的结构性特征——无立场审视。
本文必须承认,上述框架存在若干尚未解决的内在矛盾。
触发器的递归困境。 外部知识的检索触发依赖人的领域专业知识。人对领域越了解,越能设计精准的触发规则;领域新手甚至无法判断在何处应当引入外部校验。这意味着人机协作架构的有效性存在一个前提假设:人必须对处理领域有足够的理解。
规则库学习的过拟合风险。 积累失败模式形成规则库的方向,可能面临维度诅咒:规则库在特定领域内有效,但随膨胀对新情况的泛化能力反而下降。
AI 视角转换的局限性。 AI 的自我审视本质上是语言层面的操作,而非真正的元认知。它能描述自己的输出,但不能触及产生这个输出的底层机制——它不知道自己"为什么会这么想"。这是否可以被改进,还是结构性的瓶颈,目前无法定论。
本文的核心发现是:人与 AI 的认知局限不是"有限 vs. 无限",而是两种不同类型的有限性——人的局限在于视角固化(有立场保护机制但有现实锚定),AI 的局限在于无立场保护机制但缺乏现实锚定。
人 = 现实锚定 + 立场固化的应对者
AI = 假设生成 + 无立场审视的执行者
在这个结构里,AI 的无立场审视弥补人的立场固化,人的现实锚定弥补 AI 的无根性。置信度检查报告把 AI 的审视结果结构化地呈现,人的最终判断把现实世界的反馈注入整个系统。
这不是一个等级结构,而是一个双通道结构。驱动力来自现实世界,而非任何一方对另一方的控制。AI 的局限不会导致它产出失控的结论,因为每一个关键节点都经过人的现实锚定;人的局限不会导致系统陷入死胡同,因为 AI 的视角转换能力不断提供新的审视角度。两种局限并存,但各自在关键节点发挥作用,而不是相互放大。
元认知的缺失——即"不知道自己不知道什么"——是人机协作架构中真正的瓶颈。这不是可以用更多规则解决的工程问题,而是形式系统内在不完备性在知识层面的映射。我们能做的是设计更好的接口结构,让这个不可消除的瓶颈不至于成为人机协作的阻碍。
评论区
共 1 条评论热门最新