做 Agent 工作台，最难的不是让 Agent 更自动

我最近在做一个 Agent 协作工作台，不是写代码用的，是客服用的。

场景是这样的：一个销售主管，带一组 Agent 并行跟进 200 个客户。以前主管亲自回每一条消息，现在 Agent 处理掉 90%，主管只看被路由上来的那 10%。

老工作台是为"亲自回消息的销售"设计的。现在角色变了，工作台也得跟着变。

但真正开始设计才发现，难点不在"让 Agent 更自动"。那个可以靠置信度阈值解决，85% 以上自动发，以下路由给人。真正难的是：路由上来之后，给人看什么。

信息至少要分四层

我做到一半，发现界面上给主管的信息混在一块，全堆在会话区里。主管看完一个对话，自己都说不清"这个我是基于事实判断的，还是基于 Agent 的推测"。

把信息分了四层之后，清楚很多：

事实：Agent 发了哪条消息、客户回了什么、话术编号是哪个、置信度的数值变化。这些是已经发生的，没有歧义。

观察：某次对话里看到的现象，没有结论。"客户第三轮还在问价格"——这是观察，不代表客户一定要讲价，也不代表 Agent 答对了。

假设：Agent 当前的推断，但还没验证。"置信度从 92% 跌到 58%，判定为价格异议升级"——这是模型推理出来的，可能对，也可能错。

决策：已经定下的取舍，后续不能轻易动。比如"训练这条话术，当前组的 5 个 Agent 今天就全部生效"——这个不可撤销，不是"试一下"。

混在一起最怕的不是信息太多，是主管分不清哪些是 Agent 在猜、哪些是已经发生的。

主管看到界面上写"这个客户对价格敏感"，下意识当成既成事实去决策。但那只是 Agent 的推断——基于三轮问价这一个信号。

如果界面没区分，主管就一直在 Agent 的世界观里做决策，而不是在真实数据上。错的不是 Agent，是信息呈现的方式。

事实类信息放 Agent 工作日志：按时间线，每一步 Agent 做了什么，用动词描述已发生的动作。

观察类信息放在消息气泡旁边：Agent 注意到了什么，带原始数据来源（"第 3 轮出现价格关键词"），不给结论。

假设类信息用置信度进度条和路由原因显示：明确标注这是模型推断，信号是什么，权重怎么算的。不说"客户对价格敏感"，说"置信度 58%，触发 R-032 价格异议规则"。

决策类信息要让人感到分量。Teach 模式（训练话术）上线前要清楚显示影响范围："当前组全部 5 个 Agent，预计每日覆盖 X 次"，确认按钮做得重一点，不能误触。

想了很久，我现在的判断是两种情况：

一种是 Agent 自己不确定。置信度低于阈值，Agent 不该硬猜，应该把球踢回来。

另一种是决策本身不可逆。哪怕 Agent 很有把握，但接管高价值客户、发布全集群生效的话术，这类事还是要人过一遍。不是觉得 Agent 会错，是因为错了没有回头路。

这两条的分界线不是置信度，是后果。

我最开始把 Agent 工作台理解成"自动化程度更高的工具"。做到一半才意识到，它其实是一套信息界面——主管透过它观察 Agent 在做什么、基于这些信息做判断。

Agent 越自动，人接触到的每一条信息就越关键。信息质量差，主管会花大量时间纠错，而不是在做真正的决策。

Agent 协作工作台的核心，不是 Agent，是那个人拿到了什么、以及他凭什么相信那是真实的。