这是 2020 年 4 月在微软在线技术峰会(Microsoft Online Tech Forum)的专访整理。原文转载自 PreAngel,最早发布在 Wechaty Blog。
看点
- 最贴心、完善的程序员成长路径
- 一款智能对话机器人从 0 到 1 的搭建历程
- 全球人工智能技术的实践落地情况

1. 自我介绍
大家好,我是李佳芮,句子互动的联合创始人 & CEO。句子互动围绕微信生态为客户提供智能营销和销售服务,帮助企业引流并实现转化,客户覆盖教育、保险、大健康等多个领域。公司获得 PreAngel、Plug and Play、Y Combinator、TSVC 和阿尔法公社多家中美机构投资,曾入选百度 AI 加速器、Facebook 大陆首期加速器。
我是一个连续创业者,过去 7 年一直基于微信生态为企业提供智能营销服务。同时,我也是微软人工智能最有价值专家(AI MVP),是 GitHub 上超过 7000 Stars 的开源项目 Wechaty 的联合作者。在做 Wechaty 的过程中,我创建并管理了一个覆盖全球的微信聊天机器人开发者社区,仅在 GitHub 上就有超过 500 个开源项目是基于 Wechaty 构建的,其中不乏超过 1000 Star 的优质项目。可以说在 Github 上,Node 开发者中想做微信机器人的,几乎没有不知道 Wechaty 的。今年随着 Contributor 队伍越来越壮大,Wechaty 陆续开始支持 Go、Python 和 Java,欢迎广大开发者使用并参与贡献。
除此之外,今年我出版了一本书——《Chatbot 从 0 到 1:对话式交互设计实践指南》,刚刚在京东上架。这本书基于我过去服务企业的经验以及和 Chatbot 开发者的交流,讲述如何从 0 到 1 搭建一个聊天机器人。其中有一段也提到了 2018 年我们团队和陆奇博士交流 Chatbot 和小冰相关内容,他对我们的激励,他还为本书写了序。
作为微软的 AI MVP 以及 Wechaty 的社区发起人,创业之初我们就和微软有非常密切的合作。微软给了社区和我们公司非常多的支持,包括非常棒的技术底层服务、云资源支持以及市场层面的支持。可以说我们公司的发展和社区的发展离不开微软。
2. 我用的微软相关技术
Chatbot 的智能程度取决于它能够理解的意图和实体的数量与复杂度,因此高效开发语义理解模型是智能对话中非常重要的一环。对创业公司来说,专门去开发语义理解模块性价比非常低——搭建这样的系统需要长年累月的积累和海量数据,有这种能力的工程师非常少且非常贵,海量数据对创业公司又几乎不可能。
微软的认知服务,比如 QnAMaker 和 LUIS,非常好地解决了这个问题。它专门帮助非自然语言处理专业的开发者解决 NLU 这个开发瓶颈:开发者可以轻松创建和维护高质量的语义理解模型,并能无缝对接到智能应用中,这一切都是基于云的 API 服务完成的。开发的过程中,你只要持续对系统训练,也就是喂给系统相关的语料就够了。
而 Azure Machine Learning 是微软在公有云 Azure 上推出的、基于 Web 使用的机器学习服务,可以帮助企业快速构建和部署机器学习模型。开发者不需要掌握特别多的算法基础,也不需要读海量论文,就可以直接享受微软算法工程师的成果。甚至使用官方支持的无代码设计器,可以帮助企业快速搭建机器学习模型,极大提高开发效率。
最近新冠疫情席卷全球,微软为美国疾病控制与预防中心(CDC)构建了一个 Chatbot,用的就是上面这些技术。这个 Chatbot 可以指导用户进行自我评估,通过自然对话的方式引导客户初步判断自己是否感染新冠,并在需要的时候联系其他医疗资源和相关专业人士。除此之外,微软还向客户提供了多个 COVID-19 模板,开发者可以对模板进行修改,帮助企业和开发者快速自建各类新冠相关的 Chatbot——这样除了 CDC 之外,任何企业和开发者都可以通过微软的云服务,快速使用医疗 Chatbot。
3. 我和 Wechaty 与 Chatbot 的渊源
做 Wechaty 社区、做 Wechaty 开源项目,有一个非常有意思的背景——做开源项目是因为我喜欢跳舞。
2016 年的时候,我和几个一起跳舞的小伙伴做了一个舞蹈社区,叫做舞哩,在线录制 200 多期舞蹈教学视频,在 b 站、优酷、美拍、腾讯视频、YouTube 等都有我们的舞蹈专辑,全网播放 2000 多万。我在视频上留了微信公众号二维码,然后在公众号上放了一个我的舞蹈小号微信号二维码。当我有了非常多的粉丝以后,我面临一个问题:如何更好地管理我的粉丝。我仔细研究了下,发现核心要解决三个问题:
- 如何能自动把他们邀请到我的舞蹈微信群;
- 粉丝经常会问相似的问题,比如某只舞蹈的教学视频在哪里——虽然我已经在公众号写得非常清楚,并且还搭建了一个网页帮助用户搜索视频,但他们还是不厌其烦地问我的微信小号——这些问题应该能被自动化回复;
- 我想找到社区最活跃的用户,让他做我们的大区管理员和群管理员。我判别活跃的标准也非常简单,就是他在群里发言的多少。显然我不可能手动去统计每个人说话的数量。
基于上面这三个核心需求,我参与到了 Wechaty 非常早期的开源项目中,并成为 Wechaty 的联合作者。这样我就可以花费非常少的精力运营我的社群,大部分操作都能自动化做了——比如自动通过好友请求、自动拉好友入群、自动找群内最活跃的人,并且用几条常用的问答训练了一个舞蹈问答机器人,可以快速回答舞蹈的问题。
结合多年基于微信生态为企业做运营的经验,我忽然意识到:随着用户越来越习惯通过微信交流,他们更习惯于在聊天对话中直接获取服务。这是一个交互方式演进的变化,也是随着技术升级,信息服务下一阶段的必经之路。我认为 Wechaty 不应该只解决我自己社区的问题,还应该为更多企业赋能,帮助他们更好地管理自己的用户。因为那个时候我有比较多的种子企业用户,所以我用这个产品问了几个之前服务的企业,他们都觉得非常棒并表明了非常强烈的需求——这就成了我这次创业的开端。
后来随着开发者越来越多,我创建了 Wechaty 的开发者社群,用我自己写的微信机器人管理这些微信开发者,就像当时管理舞蹈粉丝一样。相关的内容我写过一篇博客,有兴趣的可以看下:https://wechaty.github.io/2016/12/10/try-to-write-wexinrobot。
之所以选择 Chatbot,是因为我认为这里面有一个巨大的机会。回顾技术发展的历史,最大的几次浪潮出现,基本都伴随着一个规律:新的技术整合带来全新的人机交互方式,大量商业应用在此基础上应运而生。其实人类的需求一直都没有变化,只是交互变得越来越便捷了。人机交互的方式,2000 年之前以鼠标键盘为主,逐步过渡到 2010 年以手指触摸为主的移动 App。每一次交互的变革,都引发了互联网的浪潮和移动互联网的浪潮。今天,随着人工智能技术催生的自然语言处理技术和底层硬件愈发成熟,人机交互的方式会逐渐变为以自然对话为主,比如智能音箱、手机助手等——交互方式的变革一定会带来新一轮的革命。这也是我为什么非常看好 Chatbot 的原因。
实际上,无论是我每次管理社区时用一个 bot 回答用户的问题,还是今天我公司提供的智能营销 SaaS 工具——主动提示销售应该怎么和用户沟通、并在聊天记录中抽取关键信息对用户进行自动化标签管理——都是 Chatbot 爆发的前夕,基本都还集中在 B 端应用比较多。我认为真正的 Chatbot 革命还没有完全到来。当它能直接为海量 C 端用户服务、并且能提供符合用户预期的服务的时候,过去的成百上千个 App 会逐渐演化成未来的成百上千个 Chatbot——各大企业的局面会非常不一样,也会非常有意思。我期待着那一天的到来。
4. 如何从 0 到 1 搭建 Chatbot
在这里,我为大家推荐我的新书《Chatbot 从 0 到 1:对话式交互设计实践指南》,全书共分五个部分:
- 从人工智能的发展带动对话式交互引出 Chatbot 的应用场景及其分类;
- 从需求分析、流程设计、数据处理、对话脚本撰写、系统搭建几个角度切入;
- 对话任务测评、平台渠道集成、运营反馈,对 Chatbot 的整个生命周期进行详细分析;
- 通过案例分析,对 Chatbot 进行实践;
- 总结目前对话式交互的局限性,并展望基于人工智能发展 Chatbot 的机会。
这本书适合希望从事 Chatbot 行业的读者阅读,尤其是正在考虑将业务切入 Chatbot 领域的决策者,即将或正在从事 Chatbot 专业工作的产品经理和项目经理,以及希望了解 Chatbot 领域工作流程的开发人员。
写这本书的原因之一,是随着我创建公司、持续为企业提供自动化营销,并通过信息增量辅助销售、提高销售转化率和运营留存率,我在持续和服务的企业以及从业者交流的过程中发现:大部分人对 Chatbot 有一个很大的误区——他们认为 Chatbot 是一个黑科技,等同于算法和论文。这是不对的。我在书里主要想推出的理念是:Chatbot 是一个产品问题,不是一个算法问题。我前面也介绍了,过去成百上千个 App 会逐渐演化成未来的成百上千个 Chatbot。在今天的视角看,搭建 App 其实是一个产品问题,不是你会 C# 或者 Java 这么单纯的技术问题。
这本书的第四部分案例分析,就是通过微软认知服务的 LUIS 来做的实操。LUIS 的开发流程更像是一个教学过程:开发者是老师,LUIS App 是学生。老师通过不停地告知学生正确的文本解析结果来完成教学。一个好的教学过程是一个"训练 + 实践"的闭环——标注一定量的起始数据;训练得到语义理解模型;对模型进行必要的测试;发布模型并应用到真实用户场景;甄选应用日志中的语句;继续标注并更新模型。这个过程周而复始,通过不停地迭代开发、不停地改善理解模型,使其越来越接近人类的理解能力。总结一下,四步分别是:数据标注、模型训练、模型发布、主动学习。
我认为作为开发者,一定要学会站在巨人的肩膀上做事情,而不是自己死磕成为一个巨人。搭建一个 Chatbot 是比较复杂的事情,算法非常重要,但依然只是搭建 Chatbot 的八个环节中的一个环节。还有很多其他的环节,比如对话脚本撰写、运营反馈等,这些几乎决定了一个 Chatbot 的成败。
今天因为时间关系,我简单介绍一下 Chatbot 里面比较独特的一环——对话脚本撰写。因为 Chatbot 是没有 UI 的,整个服务都是通过对话的方式引导用户并推进流程的,所以对话脚本撰写其实替代了过去搭建 App 时绘制原型交互图的环节。换句话说,在 Chatbot 中,产品功能不能像图形交互那样直接呈现在界面上,而是隐藏在对话中——所以对话脚本撰写非常非常重要。我的书里总结了十条设计原则,有兴趣的可以详细看下。
5. 微软收购 GitHub 的看法
GitHub 不仅仅是一个编程工具,它已经成为开源社区的核心,某种程度上是社交网络和项目管理工具之间的交叉点。很多人开玩笑说它是"全球最大的同性交友社区",其实也可以说它是程序员界的"Facebook"——程序员在上面会大量公开开源代码,互相寻求帮助。发展到现在,GitHub 的作用已经不仅是一个程序员交流地,更成为一个猎头挖人平台,普通程序员甚至可以将自己在 GitHub 上的经验写进简历。
微软的 CEO 萨提亚说:"微软 + GitHub = 为开发者赋能。"微软收购 GitHub 对社区开发者来说,似乎是在围绕开发的生命周期各个阶段为开发者赋能:从构思,到协作,再到云部署。从我自身角度说,GitHub 给了我很多——因为我 2017 年和 2018 年基本每天都泡在 GitHub 上,我在上面认识了很多开发者,并且在技术和商务上都展开了非常多的合作。我们的开源项目托管在 GitHub 上,开发者社区也是基于 GitHub 的,我和这些开发者协同工作中,从他们身上学习到了很多。所以从我自身的角度看,GitHub 伴随了我很多年的成长,看到今天微软收购了 GitHub,感觉很是开心和激动。
从开源角度来看,我们看到了微软作为全球最大的闭源公司、最讨厌开源的公司,忽然变化了——它开始拥抱开源了。这种转变还是蛮惊讶的,说明微软对开发者更友好了。我们也看到,在收购 GitHub 之后,微软成为 GitHub 上代码贡献量最大的企业。刚刚我在后台和韦青老师交流,他说在收购 GitHub 之前,微软的很多员工就已经在使用 GitHub,这次收购对微软的员工也带来了非常大的便利。
最后,关于开源,我想再分享一下真正的开源精神——分享和贡献。这也是刚刚我在后台和韦青老师交流的体会:开源是在其他人的代码上,学习以后,再反哺给开源,大家一起推动一个项目变得更好。开源不是伸手党,而是共同学习、共同进步、推进技术领域的进步。
谢谢大家!
YouTube 直播回顾:https://youtu.be/VnI2jl71-Y8
彩蛋
下面是在后台和微软中国 CTO 韦青老师的合影,为我的新书《Chatbot 从 0 到 1:对话式交互设计实践指南》打 call。

评论