Microsoft Online Tech Forum 微软在线技术峰会 - 李佳芮专访
看点
- 最贴心的、完善的程序员成长路径
- 一款智能对话机器人从0到1的搭建历程
- 全球人工智能技术的实践落地情况
内容
1. 自我介绍
大家好,我是李佳芮,句子互动的联合创始人 & CEO,句子互动围绕微信生态为客户提供智能营销和销售服务,帮助企业引流并实现转化,客户覆盖教育、保险、大健康等多个领域。获得PreAngel、Plug and Play,Y Combination, TSVC和阿尔法公社多家中美机构投资,曾入选百度AI加速器,Facebook 大陆首期加速器。
我是一个连续创业者,过去7年一直基于微信生态为企业提供智能营销服务。同时,我也是微软人工智能最有价值专家(AI MVP),也是 GitHub 上超过 7000 Stars 的开源项目 Wechaty 的联合作者,在做 Wechaty 的过程中创建并管理了一个覆盖全球的微信聊天机器人开发者社区,仅仅在 Github 上就有超过500个开源项目是基于 Wechaty 来写的,不乏有很多 超过 1000 Star 的优质项目。可以说在 Github 上,只要是node的开发者,想做微信机器人的,没有不知道 Wechaty 这个项目的。今年随着 Wechaty 的 Contributor 队伍越来越壮大,Wechaty 陆续开始支持 Go,Python 和 Java,也欢迎广大的开发者使用并参与贡献。
除此之外,今年我出版了一本书《Chatbot从0到1:对话式交互设计指南》,刚刚在京东上架,基于我过去服务企业的经验以及和 Chatbot 开发者的交流,讲述如何从0到1搭建一个聊天机器人,其中有一个片段也提到了2018年,我们团队和陆奇博士交流 Chatbot 和小冰相关的内容,他对我们的激励,同时他也为本书做了序。
作为微软的 AI MVP 以及 Wechaty 的社区发起人,创业之初我们就和微软有非常密切的合作,微软给了社区和我们公司非常多的支持,包括在提供非常棒的技术底层服务,云资源的支持,以及市场层面的支持。可以说我们公司的发展和社区的发展离不开微软的支持。
2. 我用的微软相关的技术
Chatbot 的智能程度取决于它能够给理解的意图和实体的数量和复杂度,因此高效开发语义理解模型是智能对话中非常重要的一环。对于创业公司来说,专门去开发语义理解模块是性价比非常低的事情,因为搭建这样的系统需要长年累月的累计和海量数据的积累,有这种能力的工程师非常少而且非常贵,而海量数据对于创业公司来说,又几乎是不可能的。微软的认知服务,比如 QnaMaker 和 Luis 非常好的解决了这个问题,他是专门帮助非自然语言处理专业的开发者解决自然语言理解这一开发瓶颈的,开发者可以轻松地创建和维护高质量的自然语言理解模型,并能无缝的对接到相关的智能应用中,这一切都是基于云的 API 服务完成的。 开发的过程中,你只要持续对系统训练,也就是喂这个系统相关的语料就够了。
而 Azure 的 Machine Learning 是微软在公有云 Azure 上推出的基于 Web 使用的一个机器学习服务,可以帮助企业快速的构建和部署机器学习模型。这样开发者就不需要掌握特别多的算法基础,也不需要读海量的论文,就可以直接享受微软算法工程师的结果。甚至使用官方支持的无代码设计器,帮助企业快速搭建机器学习模型,极大的提高了企业的开发效率。
最近新冠疫情席卷全球,微软为美国疾病和预防控制中心,也就是CDC,构建了一个 Chatbot,就是用到了上面的技术。这个 Chatbot 可以指导用户进行自我评估,通过自然的对方方式引导客户,初步判断自己是否感染了新冠病毒,并在需要的时候联系其他医疗资源和相关专业人士。除此之外,微软还向客户提供了多个 COVID-19 模板,开发者可以对这些模板进行修改,帮助企业和开发者快速自建各类新冠相关的 Chatbot。这样除了 CDC 之外,任何企业和开发者都可以通过微软的云服务,快速使用医疗 Chatbot 了。
3. 我和 wechaty 与 Chatbot 的渊源
做 wechaty 社区已经做 wechaty 的开源项目,有一个非常有意思的背景。做开源项目是因为我喜欢跳舞。。。
2016年的时候,我和几个一起跳舞的小伙伴做了一个舞蹈社区,叫做舞哩,并在线录制200多期舞蹈教学视频,在b站、优酷、美拍、腾讯视频、youtube等等都有我们的舞蹈专辑,全网播放2000多万,我在视频上留了微信公众号的二维码,然后在公众号上放了一个我的舞蹈小号的微信号二维码。当我有了非常多的粉丝的时候,我面临一个问题,如何更好的管理我的粉丝。我仔细研究了下,发现我核心要解决三个问题: 如何能自动化的把他们邀请到我的舞蹈微信群 粉丝经常会问相似的问题,比如某只舞蹈的教学视频在哪里。虽然我明明已经在公众号写的非常清楚,并且还搭建了一个网页帮助用户搜索视频,但他们还是不厌其烦的问我的微信小号,这些问题应该能被自动化的回复的。 我想找到社区最活跃的用户,让他做我们大区管理员和群管理员。我判别这个用户活跃的标准就也非常简单,就是他在群里发言的多少。显然,我不可能手动的去统计每个人说话的数量。
基于上面3个核心的需求,我参与到了 wechaty 非常早期的开源项目中,并成为 wechaty 的联合作者,这样我就可以花费非常少的精力运营我的社群,大部分的操作都能自动化做了,比如自动通过好友请求,自动拉好友入群,自动找群内最活跃的人,并且用几条常用的问答训练了一个舞蹈问答的机器人,可以快速的回答舞蹈的问题。
结合我自己多年基于微信生态为企业做运营的经验,我忽然意识到:随着用户越来越习惯通过微信交流,他们更习惯于在聊天对话中直接获取服务。这是一个交互方式演进的变化,也是随着技术升级,信息服务下一阶段的必经之路。我认为 wechaty 不应该只解决我自己社区的问题,还应该为更多的企业赋能,帮助他们更好的管理他们的用户,帮助更多企业赋能。因为那个时候我有比较多的种子企业用户,所以我用这个产品问了几个之前服务的企业,他们都觉得非常棒并表明了非常强烈的需求,所以这就成为了我这次创业的开端。
后来随着开发者越来越多,我创建了 wechaty 的开发者社群,用我自己写的微信机器人管理这些微信开发者,就像当时我管理我的舞蹈粉丝一样。相关的内容我写过一篇博客,有兴趣的可以去看下:https://wechaty.github.io/2016/12/10/try-to-write-wexinrobot
之所以选择 Chatbot 是因为我认为这里面有一个巨大的机会。回顾技术发展的历史,最大的几次浪潮出现基本都伴随着一个规律:新的技术的出现和整合带来全新的人机交互方式,大量的商业应用在此基础上营运而生。其实人类的需求一直都没有变化,只是交互变得越来越便捷了。人机交互的方式 2000 年之前以鼠标键盘为主,逐步过渡到 2010 年以手指触摸为主的移动 App ,每一次交互的变革,以此引发了互联网的浪潮和移动互联网的浪潮。那么在今天,随着人工智能技术催生的自然语言处理技术和底层硬件的愈发成熟,人机交互的方式会逐渐变为以自然对话为主,比如智能音箱、手机助手等,交互方式的变革一定会带来新一轮的革命。这也是我为什么非常看好 Chatbot 的原因。
实际上,在我每次管理社区过程中,用一个 bot 回答用户的问题;或者说今天我公司提供的智能营销 SaaS 工具,主动提示销售应该怎么和用户沟通并在聊天记录中抽取关键信息,对用户进行自动化标签管理;以些都是在Chatbot爆发的前夕,基本还都是在 B端应用比较多。我认为真正的 Chatbot 带来的革命还没有完全到来,当他能直接为海量 C端用户服务并且能提供符合用户预期的服务的时候,过去的成百上千个App会逐渐演化成未来的成百上千个Chatbot,各大企业的局面会非常不一样,也会非常有意思,我期待着那一天的到来。
4. 介绍如何从0到1搭建 Chatbot
在这里,我为大家推荐我的新书,《Chatbot从0到1:对话式交互设计实践指南》,这本书的内容共分为五个部分。第1部分从人工智能的发展带动对话式交互引出Chatbot的应用场景及其分类;第2部分和第3部分从需求分析、流程设计、数据处理、对话脚本撰写、系统搭建、对话任务测评、平台渠道集成、运营反馈等方面,对Chatbot的整个生命周期进行了详细分析和介绍;第4部分通过案例分析,对Chatbot进行了实践;第5部分总结了目前对话式交互的局限性,并展望了基于人工智能发展Chatbot的机会。
《Chatbot从0到1:对话式交互设计实践指南》适合希望从事Chatbot行业的读者阅读,尤其是正在考虑将业务切入 Chatbot领域的决策者,即将或正在从事Chatbot专业工作的产品经理和项目经理,以及希望了解Chatbot领域工作流程的开发人员。
其实写这本书的原因之一,就是随着我创建我的公司并持续为企业提供自动化营销,并通过信息增量辅助销售、提高销售转化率和运营留存率的过程中,我在持续的和我服务的企业以及从业者交流的过程中发现,大部分对 Chatbot 有一个很大的误区,他们认为 Chatbot 是一个黑科技,Chatbot 等同于算法和论文,这个是不对的,我在本书主要想推出的理念是,Chatbot是一个产品问题,不是一个算法问题。我前面也介绍了,过去成百上千个 App 会逐渐演化成未来的成百上千个 Chatbot。在今天的视角看,搭建 App 其实是一个产品问题,不是你会 C Sharp 或者会 Java 这么单纯的技术问题。
这本书的第四部分的案例分析,就是通过微软认知服务的LUIS来进行了实操。LUIS的开发流程更像是一个教学过程:开发者是老师,LUIS App是学生。老师通过不停地告知学生正确的文本解析结果来完成教学。一个好的教学过程是一个“训练+实践”的闭环,标注一定量的起始数据;训练得到语义理解模型;对模型进行必要的测试;发布模型并应用到真实用户场景;甄选应用日志中的语句;继续标注并更新模型。这个过程周而复始,通过不停地迭代开发,不停地改善理解模型,使其越来越接近人类的理解能力。总结一下,四步分别是数据标注、模型训练、模型发布和主动学习。
我认为作为开发者,一定要学会站在巨人的肩膀上做事情,而不是自己死磕成为一个巨人。搭建一个 Chatbot 是比较负责的事情,算法非常重要,但依然只是搭建 Chatbot 中八个环节中的一个环节。还有很多其他的环节,比如对话脚本撰写,运营反馈等,这些几乎决定了一个 Chatbot 的成败。
今天因为时间关系,所以我简单的介绍一下 Chatbot 里面比较独特的一环,对话脚本撰写。因为 Chatbot 是没有 UI 的,整个的服务都是通过对话的方式引导用户并推进流程进行的,所以这里的对话脚本撰写其实替代了过去搭建 App 时候的绘制原型交互图。换句话说,在 Chatbot 中,产品功不能像图形式交互那样直接呈现在界面上,而是隐藏在对话中,所以对话脚本撰写其实是非常非常重要的,我的书里总结了十条设计原则,有兴趣的可以去详细看下。
今天我带了几本书,可以作为奖品现场抽奖送给大家。。。
5. 微软收购 Github 的看法
其实 GitHub 不仅仅是一个编程工具,它已经成为了开源社区的核心,某种程度上是社交网络和项目管理工具之间的交叉点。很多人开玩笑说他是“全球最大的同性交友社区”,其实也可以说他是程序员界的“Facebook”。程序员在上面会大量公开开源代码,互相寻求帮助。发展到现在,GitHub 的作用已经不仅是一个程序员交流地,更成为一个猎头挖人平台,普通程序员甚至可以将自己在 GitHub 上的经验写进简历。
微软的CEO萨提亚说,微软 + Github = 为开发者赋能。所以微软收购 Github 是对社区开发者来说,似乎在围绕着开发的生命周期的各个阶段为开发者赋能:从构思、到协作、再到云部署。 从我自身角度说,Github给了我很多,因为我2017年和2018年基本每天都泡在Github上,我认识了很多开发者,并且在技术和商务上都展开了非常多的合作。我们的开源项目也是托管在 Github 上的,我们的开发者社区也是基于 Github的,我和这些开发者的协同工作中,从他们身上也学习到了很多。 所以从我自身的角度看,Github 伴随了我很多年的成长,看到今天微软收购了 Github,感觉也很是开心和激动。
从开源角度来看,我们看到了微软作为全球最大的闭源公司,最讨厌开源的公司,忽然变化了,他开始拥抱开源了。这种转变还是蛮惊讶的,说明微软对开发者更友好了。我们也看到,在收购了 Github 之后,微软成为 Github 上代码贡献量最大的企业。刚刚我在后台也在和韦青老师交流,在收购 Github 之前,微软的很多员工也都在使用 Github,这次收购对微软的员工也带来了非常大的便利。
最后,其实关于开源,我想再分享一下真正的开源精神,其实分享和贡献。这也是刚刚我在后台和韦青老师交流的体会,开源是在其他人的代码上,学习以后,再反哺给开源,大家一起推动一个项目变得更好,开源不是伸手党,而是共同学习,共同进步,推进技术领域的进步。
谢谢大家!
本次直播内容的部分视频内容,感谢微软MVP的负责人,来自微软的@康康全称截屏~
- YouTube 地址: https://youtu.be/VnI2jl71-Y8
彩蛋
下面是在后台和微软中国 CTO 韦青老师的合影,为我的新书 《Chatbot从0到1:对话式交互设计实践指南》 打call~
原文链接: https://wechaty.github.io/microsoft-tech-forum-rui-interview/