我们其实一直在被蒸馏

本文系用户投稿，不代表机核网观点

最近，同事.skill走红：用 AI 把一个人的工作方式、说话习惯，封装成可调用的 Skill。
虽说它目前是个玩具，却揭示了一条人类社会的暗线：提取经验 → 形成规则 → 规模复制 → 从人身上剥离，进入系统。
换言之，我们其实一直在被蒸馏。过去被抽走的是手艺，这次轮到了脑子甚至人格。
我们就看三个阶段，看我们如何一步步蒸馏自己。
狄德罗的《百科全书》：手艺蒸馏
18 世纪的《百科全书》，是人类历史上第一次大规模、系统性的知识蒸馏工程。
在 21 年的编纂过程中，这部巨著收录了 7 万余篇文章和近 3000 幅插图，将丝绸编织、玻璃吹制、钟表制造等手艺，逐步拆解为可视化的操作流程。

在此之前，这些技艺极度依赖师徒口传。狄德罗等人走访工坊，将工匠们的经验与直觉转写为文字与插图，形成可传播的知识体系。
当然，这种记录仍有局限。许多依赖身体经验的判断难以捕捉，比如必须通过金属切割的颜色、气味和声音来判断加工进度。
但不可逆转的是，从这个时候开始，人类谈手艺的词，确实从手感，转向了规则。
工业革命：经验蒸馏
泰勒唯一最佳方法
如果说《百科全书》提取的是工匠的知识，那么泰勒做得更直接：他要解决的问题，是知识掌握在工人手中。
19 世纪末，泰勒在米德瓦尔钢铁公司发现，工人会刻意放慢节奏，以避免被提高工作量。
于是，他带着秒表进入车间，记录每一个动作：拆解劳动、测量时间、剔除多余步骤，再组合成一套标准流程，也就是所谓的唯一最佳方法。变化由此发生：工人不再决定如何工作，标准替他们决定。

但这只是开始。
福特Model T
1913 年，福特给出了更彻底的答案：Model T 移动装配线。泰勒测量的是一个人能做多少，福特测量的是一条线能走多快。

84 个步骤，每人只做一步，多数岗位一两天即可上手。效率提升的同时，工作变得机械且难以忍受，工人不断流失。
福特的应对也很直接：将日薪提高到 5 美元，同时设立社会学部，对工人的私生活进行审查。家庭整洁、婚姻状况、银行存款、是否酗酒，都会影响是否能拿到这笔钱。

大模型：人格蒸馏
到了大模型时代，这个过程走到了更深一层。被蒸馏的，不再是动作、流程，而是判断力本身。
在这个阶段，出现了一种新兴行业：数据标注。它们作为中间层，将人类能力转化为训练数据。
但他们雇佣的人呈现出一种两极分化。

顶端人才蒸馏
顶端，是主动构建标准的人类精英：数学家、律师、分析师。他们的任务可不是答题那么简单，而是编写评分标准，把原本依赖经验的判断，拆解为可执行的规则。
甚至，戏剧演员也被纳入其中。因为他们掌握那些无法写进 SOP 的能力：在同情、讽刺和幽默之间瞬时理解。

数据工人蒸馏
而在底端，是无数个像 Anna[1]这样被榨取直觉的数据工人。
Anna 是一位在德克萨斯找工作的普通女性。她的工作，是整天与一个聊天机器人对话：输入提示，系统给出两个回答。
问题不在于选哪个好，而是很多时候，这两个答案都荒谬且错误。她不能跳过，只能选一个「没那么差」的，还要写下解释。如果两个都太糟，她就得自己写一个标准答案，给 AI 当示例。
她喜欢聊科幻、数学悖论、电视剧。但聊久了，她开始不知道还能说什么。
她被蒸馏的，是对好对话的判断力。一次次选择，被汇成人类反馈数据，再用来训练新的模型，让它学会模仿人的品味。
这套机制叫作来自人类反馈的强化学习（RLHF）：
ChatGPT 看起来像人 → 因为它在模仿一个奖励模型 → 那个奖励模型在模仿标注员的判断 → 那些标注员在给一个模仿人类的 AI 打分 → 那个 AI 是在人类写作上训练的。
我们正在经历一场巨大的蒸馏套娃。

结语
历史上每一轮蒸馏，都给被蒸馏者留了一些退路。
工匠可以对狄德罗三缄其口；铸造工可以拒绝泰勒的秒表，哪怕代价是被开除。但这一轮不同：知识提取已经无声息地嵌入了钉钉、飞书、Slack、文档，客户记录等。
我们当然知道这些东西无关痛痒， 因为我们更在意那些拐角处的闲谈，无法被写进文档的判断，只在人与人之间才能发生的东西才有价值。
但回头看这段蒸馏史，会发现一件讽刺的事：不是我们变得更容易被蒸馏，而是蒸馏本身，一直在把工作重塑成更标准、更流程化的形态：SOP、KPI、汇报模板。
在这套系统里，我们还剩多少空间，去做那些真正难以被蒸馏的事？
本文首发语言学公众号「言辞之间」。
参考资料[1] 
Dzieza, Josh. "AI Is a Lot of Work." The Verge, 21 June 2023, https://www.theverge.com/features/23764584/ai-artificial-intelligence-data-notation-labor-scale-surge-remotasks-openai-chatbots