← 返回《人类 x AI》

第33章 如何训练 AI 协作方式

人类 x AI

前一章讲的是: **如何更好地使用 AI。** 那一章讲的是一些通用原则: • 先想清问题 • 给足上下文 • 让 AI 做它擅长的 • 关键判断自己做 • 重要内容要复核 这些都很重要。 但如果再往前走一步, 会出现一个更有价值的问题: **AI 能不能越来越懂你?** 答案是: 可以。 但不是自动发生的。 这件事很关键。 因为很多人使用 AI, 停留在一次性关系里。 今天问一个问题, 明天再问一个问题。 每次都像重新开始。 每次都要重新解释背景、目标、口味、标准。 这种方式当然也能用。 但它很难进入更高质量的协作。 真正高水平的人类 × AI 协作, 不是永远停留在“临时调用”。 而是慢慢发展成一种更稳定的合作方式。 这一章要讲的,就是这个问题: **如何训练 AI 的协作方式。** 注意,这里说的不是“训练模型参数”那种技术训练。 也不是讲复杂工程。 这一章讲的是更实用的东西: **如何让 AI 越来越理解你的目标、偏好、标准和工作方式。** --- AI 不是天然懂你 这句话必须先立住。 很多人一开始用 AI, 会有两种相反的误解。 一种误解是低估。 觉得 AI 永远只是一个冷冰冰工具, 不可能越来越贴合自己。 另一种误解是高估。 觉得 AI 好像很快就会自动懂自己, 不用特别整理和表达。 这两种看法都不对。 更准确的理解是: **AI 有可能越来越贴近你, 但前提是你得让它有东西可学。** 什么意思? 它不会凭空知道: - 你真正重视什么 - 你最讨厌什么风格 - 你做判断时最在乎哪些变量 - 你喜欢怎样推进问题 - 你不接受什么样的答案 - 你到底是要快,还是要稳,还是要深 这些东西,如果你不持续表达、不持续校正, 它就只能给你一个平均化版本。 所以,协作训练的第一前提不是 AI 多聪明。 而是: **你有没有把自己说清楚。** --- 训练协作方式,本质上是在减少重复解释成本 为什么要训练 AI 协作方式? 因为重复解释很贵。 每次都重新说明: - 我的目标是什么 - 我不想要什么 - 我喜欢什么风格 - 这个任务的标准是什么 - 哪些边界不能碰 - 哪些输出对我没用 会耗掉很多时间和精力。 而一旦协作方式慢慢稳定, 很多东西就不必每次从零开始。 也就是说, 训练 AI 协作方式的一个非常现实的价值是: **减少重复解释成本。** 这听起来不宏大。 但非常重要。 因为很多高质量合作, 本来就不是因为每次都重新认识彼此。 而是因为: 双方对目标、风格、节奏、标准,越来越熟。 AI 协作也是一样。 --- 第一,先训练目标理解 一切协作,最先要对齐的不是风格。 而是目标。 因为目标不清, 后面越努力,偏得越远。 所以训练 AI 协作方式的第一步, 不是先教它怎么说话。 而是先让它越来越明白: • 你到底在做什么 • 你为什么做这件事 • 你最重视的结果是什么 • 什么是表面完成,什么是真正完成 • 这件事最不能偏离的地方是什么 举例说, 同样是写一篇文章, 目标可能完全不同: • 是为了宣传 • 是为了说服 • 是为了记录 • 是为了教学 • 是为了帮自己想清楚 如果目标不同, 协作方式就完全不同。 所以,训练协作方式的第一步是: 先让 AI 稳定理解你的目标类型。 不是只知道你“要一篇文章”, 而是知道: **这篇文章在你的系统里,到底承担什么角色。** --- 第二,训练偏好,而不只是训练任务 很多人使用 AI, 只训练任务层面。 例如: - 帮我总结 - 帮我改写 - 帮我分析 - 帮我列框架 这当然有用。 但还不够。 因为真正拉开协作质量差距的, 往往不是任务本身。 而是偏好。 比如: • 你喜欢短句还是长句 • 你喜欢冷静还是热闹 • 你喜欢先讲机制还是先讲例子 • 你喜欢收束得紧一点还是留一点空间 • 你讨厌空话、套话、工具味,还是能接受一些 • 你要的是思想书气质,还是操作手册气质 这些东西,如果不训练, AI 的输出就很容易停留在“能用,但不贴”。 而一旦偏好逐步稳定, 输出质量会明显提升。 所以,训练协作方式, 不只是训练它“做什么”。 还包括训练它: **怎么做才更像你真正要的。** --- 第三,训练标准,而不是只训练结果 这也是很关键的一层。 很多人用 AI, 只会说: • 这个可以 • 这个不行 • 这个重写一下 这当然能慢慢改。 但速度很慢。 更有效的方式是, 把标准说出来。 例如: - 这里太空 - 这里太像 PPT - 这里结构对了,但语气太硬 - 这里信息多了,但文章散了 - 这里有道理,但不像我的书 - 这里太像工具教程,不像认知书 - 这里不够冷静 - 这里偏离了核心问题 这类反馈为什么重要? 因为它不只是告诉 AI“对/错”。 而是在告诉它: **你判断对错的标准是什么。** 而一旦标准被反复表达, 协作会越来越稳。 所以训练协作方式, 本质上也在训练: 你的评价标准,能不能被清楚传递出去。 --- 第四,训练固定工作流 长期协作最有价值的一点, 不是某一次回答特别惊艳。 而是慢慢形成稳定工作流。 什么叫工作流? 就是一类事情, 你们总是按某个顺序配合。 例如写作时,固定流程可能是: • 先定核心问题 • 再定结构 • 再出初稿 • 再压缩 • 再校正风格 • 最后自己拍板 研究时,固定流程可能是: • 先收材料 • 再分主题 • 再列变量 • 再找反方 • 再扫风险 • 最后自己判断 学习时,固定流程可能是: • 先搭地图 • 再解释卡点 • 再整理结构 • 再做检验 • 再复盘输出 这些流程一旦稳定, 协作效率会大幅上升。 因为 AI 不只是知道“做什么”, 还开始知道: **这类任务通常应该怎么推进。** 所以,训练协作方式,很重要的一层是: **把反复有效的流程固定下来。** --- 第五,持续校正,而不是指望一次到位 这一条特别重要。 很多人以为训练 AI 协作方式, 就是一次说清楚,后面就永远顺了。 不是。 协作训练本质上是一个持续校正过程。 因为: - 任务会变 - 目标会变 - 你自己的偏好也会变 - AI 的理解也可能漂移 - 有时它贴近了,有时又跑偏了 所以,更现实的做法不是追求一次到位。 而是形成一个习惯: 持续校正。 也就是: - 好的地方点出来 - 不对的地方讲清楚 - 偏了就拉回来 - 新要求出现就及时更新 - 有效模式就固定下来 这种来回,本身就是协作成熟的一部分。 真正稳定的合作, 从来不是没有偏差。 而是: **偏了之后,能很快被拉回正确轨道。** --- 第六,最好把关键偏好外部化 这一点非常实用。 如果某些偏好和标准对你长期都重要, 最好不要只放在脑子里。 因为一旦只放在脑子里, 你就得不断重复表达。 更好的做法是: 把关键偏好外部化。 比如写成: - 原则 - 提醒版 - 协作说明 - 风格约束 - 固定目录 - 评价标准 - 常见错误清单 这样做的好处很大。 因为它把原本隐性的协作经验, 变成了显性的协作资产。 一旦外部化, AI 更容易学, 你自己也更容易保持稳定。 所以,长期协作质量高的人, 往往不是“临场说得特别厉害”。 而是: **已经把很多关键偏好和标准,提前沉淀成了可复用的结构。** --- 第七,训练 AI 的过程,其实也在训练你自己 这一点很有意思,也很重要。 很多人以为“训练 AI 协作方式”, 只是让 AI 更懂自己。 其实不止。 在这个过程中, 你自己也会被迫变得更清楚。 因为你得不断回答这些问题: • 我到底要什么? • 我到底讨厌什么? • 我真正重视的标准是什么? • 我最需要 AI 帮我接住的是哪一段? • 哪些事情我必须自己保留? • 什么样的输出,才算真正对我有价值? 这些问题如果不训练 AI, 你自己未必会系统地回答。 但一旦长期协作, 你会被逼着越来越清楚。 所以,从更深一层看: **训练 AI 协作方式,不只是让 AI 更懂你。 也是让你更懂你自己。** 这一点非常值钱。 --- 所以,如何训练 AI 协作方式 可以把这一章压缩成一个清楚的总结。 训练 AI 协作方式,关键不是技术玄学。 而是持续做这几件事: • 让 AI 越来越理解你的目标 • 让 AI 越来越贴近你的偏好 • 把你的评价标准说清楚 • 固定反复有效的工作流 • 持续校正,而不追求一次到位 • 把关键偏好和原则外部化 • 在训练 AI 的同时,也训练自己更清楚 所以,真正高质量的 AI 协作, 不是碰运气碰到一次好回答。 而是: **通过持续表达、持续校正、持续沉淀,慢慢形成一套越来越懂你的协作系统。** --- 一句话结论 **训练 AI 协作方式,不是让 AI 神秘地“变懂你”,而是通过持续表达目标、偏好、标准和工作流,让协作从一次性调用,变成越来越稳定的长期系统。**