我最近在做一个 Agent 协作工作台,不是写代码用的,是客服用的。
场景是这样的:一个销售主管,带一组 Agent 并行跟进 200 个客户。以前主管亲自回每一条消息,现在 Agent 处理掉 90%,主管只看被路由上来的那 10%。
老工作台是为"亲自回消息的销售"设计的。现在角色变了,工作台也得跟着变。
但真正开始设计才发现,难点不在"让 Agent 更自动"。那个可以靠置信度阈值解决,85% 以上自动发,以下路由给人。真正难的是:路由上来之后,给人看什么。
信息至少要分四层
我做到一半,发现界面上给主管的信息混在一块,全堆在会话区里。主管看完一个对话,自己都说不清"这个我是基于事实判断的,还是基于 Agent 的推测"。
把信息分了四层之后,清楚很多:
事实:Agent 发了哪条消息、客户回了什么、话术编号是哪个、置信度的数值变化。这些是已经发生的,没有歧义。
观察:某次对话里看到的现象,没有结论。"客户第三轮还在问价格"——这是观察,不代表客户一定要讲价,也不代表 Agent 答对了。
假设:Agent 当前的推断,但还没验证。"置信度从 92% 跌到 58%,判定为价格异议升级"——这是模型推理出来的,可能对,也可能错。
决策:已经定下的取舍,后续不能轻易动。比如"训练这条话术,当前组的 5 个 Agent 今天就全部生效"——这个不可撤销,不是"试一下"。
最危险的是把假设写成事实
混在一起最怕的不是信息太多,是主管分不清哪些是 Agent 在猜、哪些是已经发生的。
主管看到界面上写"这个客户对价格敏感",下意识当成既成事实去决策。但那只是 Agent 的推断——基于三轮问价这一个信号。
如果界面没区分,主管就一直在 Agent 的世界观里做决策,而不是在真实数据上。错的不是 Agent,是信息呈现的方式。
对应到设计
事实类信息放 Agent 工作日志:按时间线,每一步 Agent 做了什么,用动词描述已发生的动作。
观察类信息放在消息气泡旁边:Agent 注意到了什么,带原始数据来源("第 3 轮出现价格关键词"),不给结论。
假设类信息用置信度进度条和路由原因显示:明确标注这是模型推断,信号是什么,权重怎么算的。不说"客户对价格敏感",说"置信度 58%,触发 R-032 价格异议规则"。
决策类信息要让人感到分量。Teach 模式(训练话术)上线前要清楚显示影响范围:"当前组全部 5 个 Agent,预计每日覆盖 X 次",确认按钮做得重一点,不能误触。
什么时候路由给人
想了很久,我现在的判断是两种情况:
一种是 Agent 自己不确定。置信度低于阈值,Agent 不该硬猜,应该把球踢回来。
另一种是决策本身不可逆。哪怕 Agent 很有把握,但接管高价值客户、发布全集群生效的话术,这类事还是要人过一遍。不是觉得 Agent 会错,是因为错了没有回头路。
这两条的分界线不是置信度,是后果。
做了一半才真正理解"协作"
我最开始把 Agent 工作台理解成"自动化程度更高的工具"。做到一半才意识到,它其实是一套信息界面——主管透过它观察 Agent 在做什么、基于这些信息做判断。
Agent 越自动,人接触到的每一条信息就越关键。信息质量差,主管会花大量时间纠错,而不是在做真正的决策。
Agent 协作工作台的核心,不是 Agent,是那个人拿到了什么、以及他凭什么相信那是真实的。
评论