上一篇 《接近 10 年没写代码了,被 Claude Opus 4.5 拉了回来》 我聊了「Claude 永动机」,那篇结尾留了一个没答的问题:下一代的组织会长什么样。

这阵子答案越来越清楚。组织的最小单元,从过去的一支团队变成 1 个人 + 一支 Agent 团队,我把它叫做 1+N。但 1+N 只是个壳,真要答的是,作为这个 1,你自己留下什么,那一支 N 又接走什么。

每个人都能问自己同一个问题:工作里那不可替代的 20% 是什么?另外 80% 怎么交给 AI?同一家公司、同样的活,想清楚的人 1 小时干完,没想清楚的还在花一整天。

那 20% 长在哪

机器越便宜,机器干不了的活越贵。这是 Baumol 成本病。一边压价,一边推高另一边。

具体哪些事 AI 短期内做不了?我目前看到五件。

1. 判断力:5 条路,挑哪条走?

判断力是关于方向的:要做什么、不做什么。AI 能帮你列选项、算账、推演,但拍板那一下它替不了。判断错方向,AI 会用极快速度把错事执行到底,错判一次的代价比以前大得多。

2. 品味:100 个版本里,哪一个感觉对?

品味是关于质感的:文案的语气、视觉的留白、交互的"顺不顺",没标准答案,只有"对劲"或"不对劲"。AI 能一次写一百个能跑的版本,里面有那个味儿的永远只是少数。

3. 在场感:这一刻,必须本人到。

客户要感觉到对面坐的是个活人。会犹豫、会停顿、会脱口说错话。一个眼神、一句临时改口,是这场会面里才长出来的,没法预录、没法模拟。哪怕第一次见的客户也吃这个:签下来那一下,靠的是"我相信现在坐在我对面这个人"。做线下大单谈判的销售,未来很难被替掉。AI 能把找客户、跟进、写方案这些事大半接走,但拍板那一下不在 ppt 里,在房间里。

4. 关系性劳动:这张脸、这份信任,只有我能兑现。

和某个客户十年的交情、和某个供应商一桌酒的渊源、跟一个媒体人一起熬过的项目,这些都是几年甚至十几年攒出来的账,单次不可复制。

很多新合作能不能落下来,根本不是看方案多好。是对方记得"你这个人过去帮我扛过什么"、"你说话算不算数"、"你介绍的人靠不靠谱"。基于这份 credit,对方才愿意把下一单、下下一单也交给你。这层信用是 AI 没法替你新开一份户头的:可以代笔写消息,但兑不了"这个人是这个人"。

5. 稀缺手艺:顶级寿司、顶级木工、顶级理疗、顶级看护。

几十年才能练出来的手感,AI 没法替你压缩。AI 抹平的活越多,没被抹平的这层人,价格反而越往上飘。

这五件事的共同点:都得一个具体的人。你的 20%,往这些方向长。

一个公式

把这 5 件事组合一下:

个人价值 = (关系 + 手艺) × (判断 + 品味 + 在场)

左边是存量:几年甚至几十年攒出来的。关系靠你过去帮人扛过什么,手艺靠你练了多久。AI 没法替你攒。

右边是流量:每次出场你能不能拿出来。判断是按下"就用这个"那一下,品味是从一堆里挑出对的那个,在场是让对方感觉到一个活人。

两边是乘法关系,缺一边都不行。光有累积、不出场,credit 慢慢就被忘了;光有临场、没沉淀,每次都从零开始。

不同岗位侧重不一样:

  • ToB 销售 / BD:关系 × 在场 × 判断 × 品味
  • 顶级运营 / 编辑:品味 × 判断
  • 投资人:判断 × 关系
  • 顶级匠人 / 医生:手艺 × 判断

但问题都一样。你不可替代的那 20% 是什么?AI 怎么吃掉另外的 80%?

看三个把 20% 想清楚了的人

光说太抽象,三个具体的。

一个做 ToB 大客户的销售:过去大半时间花在杂事上,拉客户档案、整理会议纪要、写定制方案、推 CRM 进度。现在这些全交给 Agent 跑:对话自动结构化进 CRM、AI 基于客户上下文出方案初稿、下一步动作清单自动生成。

但 AI 出的初稿不是拿出去就能签的。方向得她判断(这家客户真正要的是什么,哪一刀该砍、哪一段不能让),写出来什么样得她改(同样的内容,写成什么调子客户才会买,是品味的事)。AI 干完 80% 的执行类工作,最后那 20% 还是她。

省出来的时间她全花在客户现场:KA 内部关键会议、签约前飞过去吃饭、客户出问题第一时间到。她说:"AI 把我从'整理客户'里捞出来了,让我有时间真'对'客户。"

她的 20% = 关系 × 在场 × 判断 × 品味:客户的信任是 5-10 年攒下来的(关系),关键节点必须本人到(在场),方案的方向她拍板(判断),AI 初稿改到能签的版本(品味)。80% 是 CRM、整理、初稿。

一个做了 10 年的资深设计师:以前一个品牌项目要 3 周出 30 张视觉草图。现在 AI 一晚出 200 张,他第二天来挑、改、合。但挑这 200 张才是真正的工作。哪张味道对、哪张飘、哪张细节没立住,新人和他挑出来完全不一样。他说:"新人在 200 张里挑得出 5 张能用的,我能挑出 30 张。AI 出得越多,挑这件事越是真功夫。" 他的 20% = 品味 × 手艺:10 年看东西练出来的眼睛(品味),加上把素材合成成可用方案的手感(手艺)。80% 是出草图。

一个做了 15 年的架构师:6 周独立做完一个 SaaS,过去这种事得 3-4 人团队 2-3 个月。架构他来定,写代码、跑测试、改 bug 全是 Claude Code / Codex 这种 agent 在做。

难点不是让 AI 写代码(这件事它早会了),是让 AI 稳定地按你的规范写。架构约束、测试要求、命名风格、错误处理,全得固化进 CLAUDE.md 和 skill 里,每次跑都让 agent 按这套来。写完一段先让另一个 agent 跑测试、跑静态检查,过了才进 main。他原话是:"我 80% 的时间在调它的纪律,让它不漂移。系统设计能力反而变强了,因为我必须想清楚什么是约束、AI 写出来的哪里不对。"

他的 20% = 手艺 × 判断:15 年磨出来的系统设计手感(手艺),加上定下来什么是不能动的约束、判断 AI 写的东西对不对(判断)。80% 是 AI 在写。

三个人的 20% 落在公式不同的位置,但都把自己那一块挑得很清楚,剩下的全交给 AI。差别不在用了多少 AI,在有没有先想清楚自己那 20%。

那 80% 怎么交给 AI

我在公司内部讲过很多次,把它拆成三层:工具、工作流、Agent。这三层有顺序。跳过第一层直接搞第三层,会悬空。

工具层:把 AI 嵌进每天的工作里

不是"有空练练",是每天必用。

一个简单自查:一天用 AI 不到 10 次,多半是你的工作流还没重构,AI 只在旧工作流的边缘"偶尔用一下"。

我自己粗略数过:一天 AI 交互 100+ 次起步。Claude Code 几条线同时在跑:客户问题、解决方案、战略思考、产品 demo、写文章、自动化小工具,一边 review 一边丢新任务。

每件事的默认动作都是先让 AI 过一道:需求文档先 summarize、对外汇报先列三个角度、团队方案先找漏洞、不熟的领域先扒一遍 landscape。"先让 AI 过一道"已经是肌肉记忆。

工具层不熟,谈不上后面两层。

工作流层:把重复的事变成可复用的流

工具用熟之后,开始问自己一个问题:这件事我做过几次?

做过 3 次的应该 SOP 化,做过 5 次的应该被 AI 工作流接管。

举两个我自己的例子。

/create-feishu-doc:让 Claude 帮我写飞书文档是每天好几次的事,会议纪要、客户分析、产品想法、代码 README。但 Claude 自己写不到飞书里:飞书的写入接口要 OAuth 认证,要走我的身份。我装了 lark-cli(飞书官方命令行)做认证桥梁,每次都手动告诉 Claude 怎么调 lark-cli 创建文档、塞内容、设权限、放到指定文件夹。这套流程重复了几十次,索性写成 skill。现在我说一句"存到飞书",它自己走 lark-cli,10 秒后给我返回链接。

read-wechat:我经常把读到的好公众号文章丢给 AI,让它吸收、延展我的思考、基于内容做点新东西。但各家 AI 直接读公众号链接都读不了,微信对外部抓取有反爬,返回的全是"环境异常"页。我反复跟 Claude 解释怎么绕过,几十次之后索性把"用微信内置浏览器的身份去抓"这套流程写成 skill。现在我丢一个 mp.weixin.qq.com 链接过去,它自己就把正文扒回来,接着做我让它做的事。

练到这一层的标志:手里有几套跑顺的流程,写得清楚到别人能直接拿去用。

Agent 层:构建你的 AI 员工

这是最难的一层。差距也会从这里拉开。

不是"工作流",是一个能自主跑、能调用工具、能持续运行的 AI Agent。每天都在跑。这就是 1+N 里"N"真正长出来的样子。

我自己跑 1+N 的工作站:claude-code-web

跑到 5-10 条 agent 同时在线之后,Claude Code 官方那三个 client(Desktop、VSCode 插件、CLI)都开始不够用:多 session 切换、跨设备访问、跨 client 汇总都各有缺角。

我自己重做了一个 web 版,叫 claude-code-web。思路不是替代这三个,是把它们汇成一个 hub。

每天都在用的能力:

  • 跨 client 汇总 + 远程接管:VSCode 插件、CLI、Desktop 跑出来的 session 全汇到这一个 web,搜索、查看、resume 都在一个地方。看到哪条想接着干,一键复制 claude --resume 命令,粘到任何 terminal 都能继续
  • VSCode + Claude Code 配合做编辑:改文件、改代码我在 VSCode 里跑 Claude Code 插件,session 直接写到本地 jsonl。VSCode 干 driving + 编辑,ccw 这边自动汇总同一份 session 做 reading 和跨端查看,分工清楚
  • 会话管理 + TODO 标签:100+ session 一眼看清哪条在跑,可搜索、切换、重命名。没干完的打 TODO 标签,自己知道哪些活还挂着没收尾,第二天打开 ccw 一眼看到所有挂着的,一条条接着推
  • markdown 真渲染 + tool 折叠:不用在 terminal 里被一长串 stdout 淹掉,要看 tool_use / tool_result 再点开
  • 图片直接渲染:CLI 显示 [Image #21] 占位符那种我看着难受,web 端粘 PPT / 截图 / PDF 直接出缩略图,点击全屏
  • 云端 + 多端同步:云服务器跑一份,本地 Mac 跑一份,Tailscale 内网 + Syncthing 同步 claude-space。出门用 iPad / 手机登 Tailscale 接着干上一条 session

不同场景用不同能力:

  • 云端跑长任务:研究、大量代码改、数据处理这种跑半天的活,扔云端跑,本机不卡
  • 网页随时干预:跑着的任务在 web 上一眼看到进度,跑歪了打断、到关键点 review、给指令继续,不用守着 terminal
  • 手机远程管理:出门 iPad / 手机走 Tailscale 进,看进度、停 / 重启 / 派新任务都能干,回家再接着深度 review
  • 本地深度参与:战略思考、写文章这种我得深度卷入的,本地 Mac 多 session 并行,markdown 渲染读着舒服
  • 设计 deck / 看图改:图片粘进去就渲染,对着图给 Claude 改
  • TODO 自我管理:今天没收尾的 session 打个 TODO 标签,第二天 ccw 一打开就看到所有挂着的活,一条条接着推下去,不会忘

核心理念:terminal 适合 driving,web 适合 reading 和控制。多个 client 走同一份 jsonl,互不替代。

claude-code-web 主界面:左侧 100+ 会话列表可搜索切换、可按 TODO 筛出未收尾的活,中间是 Claude 用 markdown 渲染的工作输出,图片粘进去就出缩略图,顶栏显示 cwd、权限 mode、会话状态

VSCode + Claude Code 配合做编辑:左侧文件树是博客 repo,中间是当前编辑的这篇文章,右侧 Claude Code 在帮我做事(建图片目录、检查文件名)。VSCode 干 driving 和编辑,session 同步到 ccw 那边汇总查看

让团队也建他们自己的:句子互动 Hackathon

我和我的合伙人在句子互动内部推了一个 Hackathon,名字就叫"每个人,构建你的 AI 员工"。规则只有三条:

  • 必须解决你自己真实的工作痛点。 不接受玩具 Demo。要能在明天上班就真实使用的东西。
  • 必须基于 Agent,不是简单问答。 要能调工具、有工作流、能自主跑通至少一个完整任务。句子秒懂优先,也可以用 Dify、Cursor。
  • Demo 必须 Live,不接受录屏。 现场让评委提问,Agent 当场跑。

评分四个维度:实用性(明天能不能真用上)、创造性、可复用性、演示完整度。各 25 分。

最好的 AI 员工,来自你最讨厌干的那件活。

写在最后

回到开头那个问题:下一代组织会长什么样。

我现在的答案是:组织的最小单元,从"一支团队"变成"1 个人 + 一支 Agent 团队"。在这个 1+N 单元里,"1" 留给自己不可替代的 20%:判断、品味、在场、关系、手艺。"N" 接走 80% 的执行类工作。

句子互动做的 AI Agent 产品,就是帮客户用 AI 武装组织。自己都不会用,凭什么相信产品能帮客户用? 所以我对团队的要求很简单:这件事我们必须自己先跑通。「Claude 永动机」这一栏,我会继续记我跑过的实验。

读到这的你也可以一起:把判断、品味、在场、关系、手艺这五件 AI 替不了的事往深里练,把重复的、可流程化的活持续交给 AI。两件事得一起做,停一边,另一边也撑不住。

写在 2026 年 5 月。