最近, 同事.skill 走红:用 AI 把一个人的工作方式、说话习惯,封装成可调用的 Skill。
虽说它目前是个玩具,却揭示了一条人类社会的暗线: 提取经验 → 形成规则 → 规模复制 → 从人身上剥离,进入系统。
换言之,我们其实一直在被蒸馏。过去被抽走的是手艺,这次轮到了脑子甚至人格。
18 世纪的《百科全书》,是人类历史上第一次大规模、系统性的知识蒸馏工程。
在 21 年的编纂过程中,这部巨著收录了 7 万余篇文章和近 3000 幅插图,将丝绸编织、玻璃吹制、钟表制造等手艺,逐步拆解为可视化的操作流程。
在此之前,这些技艺极度依赖师徒口传。狄德罗等人走访工坊,将工匠们的经验与直觉转写为文字与插图,形成可传播的知识体系。
当然,这种记录仍有局限。许多依赖身体经验的判断难以捕捉,比如必须通过金属切割的颜色、气味和声音来判断加工进度。
但不可逆转的是,从这个时候开始,人类谈手艺的词,确实从手感,转向了规则。
如果说《百科全书》提取的是工匠的知识,那么泰勒做得更直接:他要解决的问题,是知识掌握在工人手中。
19 世纪末,泰勒在米德瓦尔钢铁公司发现,工人会刻意放慢节奏,以避免被提高工作量。
于是,他带着秒表进入车间,记录每一个动作:拆解劳动、测量时间、剔除多余步骤,再组合成一套标准流程,也就是所谓的唯一最佳方法。变化由此发生:工人不再决定如何工作,标准替他们决定。
1913 年,福特给出了更彻底的答案:Model T 移动装配线。泰勒测量的是 一个人能做多少 ,福特测量的是 一条线能走多快 。
84 个步骤,每人只做一步,多数岗位一两天即可上手。效率提升的同时,工作变得机械且难以忍受,工人不断流失。
福特的应对也很直接:将日薪提高到 5 美元,同时设立社会学部,对工人的私生活进行审查。家庭整洁、婚姻状况、银行存款、是否酗酒,都会影响是否能拿到这笔钱。
到了大模型时代,这个过程走到了更深一层。被蒸馏的,不再是动作、流程,而是判断力本身。
在这个阶段,出现了一种新兴行业:数据标注。它们作为中间层,将人类能力转化为训练数据。
顶端,是主动构建标准的人类精英:数学家、律师、分析师。他们的任务可不是答题那么简单,而是编写评分标准,把原本依赖经验的判断,拆解为可执行的规则。
甚至,戏剧演员也被纳入其中。因为他们掌握那些无法写进 SOP 的能力:在同情、讽刺和幽默之间瞬时理解。
而在底端,是无数个像 Anna [1] 这样被榨取直觉的数据工人。
Anna 是一位在德克萨斯找工作的普通女性。她的工作,是整天与一个聊天机器人对话:输入提示,系统给出两个回答。
问题不在于选哪个好,而是很多时候,这两个答案都荒谬且错误。她不能跳过,只能选一个「没那么差」的,还要写下解释。如果两个都太糟,她就得自己写一个标准答案,给 AI 当示例。
她喜欢聊科幻、数学悖论、电视剧。但聊久了,她开始不知道还能说什么。
她被蒸馏的,是对好对话的判断力。一次次选择,被汇成人类反馈数据,再用来训练新的模型,让它学会模仿人的品味。
ChatGPT 看起来像人 → 因为它在模仿一个奖励模型 → 那个奖励模型在模仿标注员的判断 → 那些标注员在给一个模仿人类的 AI 打分 → 那个 AI 是在人类写作上训练的。
工匠可以对狄德罗三缄其口;铸造工可以拒绝泰勒的秒表,哪怕代价是被开除。但这一轮不同:知识提取已经无声息地嵌入了钉钉、飞书、Slack、文档,客户记录等。
我们当然知道这些东西无关痛痒, 因为我们更在意那些拐角处的闲谈,无法被写进文档的判断,只在人与人之间才能发生的东西才有价值。
但回头看这段蒸馏史,会发现一件讽刺的事:不是我们变得更容易被蒸馏, 而是蒸馏本身,一直在把工作重塑成更标准、更流程化的形态:SOP、KPI、汇报模板。
在这套系统里,我们还剩多少空间,去做那些真正难以被蒸馏的事?
Dzieza, Josh. "AI Is a Lot of Work." The Verge, 21 June 2023, https://www.theverge.com/features/23764584/ai-artificial-intelligence-data-notation-labor-scale-surge-remotasks-openai-chatbots
评论区
共 1 条评论热门最新