微软最接地气的人工智能产品诞生背后的故事

“小冰”前传

来源:环球企业家  |  作者: 杜秀  |  阅读:

这次带领微软公司打头阵的是一位16岁的“小女孩”。尽管她有亲切的名字和可人的头像,但像邻家小妹一样爱撒娇的“小冰”并非真人,而是一款由微软(亚洲)互联网工程院(以下简称STC)开发的智能聊天机器人。

小冰受欢迎的程度与她创造的数字一样快速蔓延。在腾讯微信的公测中,小冰在60小时内覆盖了10%的微信群。在新浪微博亦创下了72小时1.3亿人次的对话量。

“对未来的饥饿与坚定,使小冰诞生在中国。”微软全球执行副总裁陆奇在公司内部会议上如此评价小冰。

微软正在全力改变过去的自己。必应搜索挣扎数年仍与谷歌相去甚远,Windows Phone捡拾iOS和Android吃剩的“蛋糕”,新推出的Surface Pro 3平板电脑的搜索量只有iPad air的八分之一。转型成为必由之路。新任微软CEO萨提亚·纳德拉(Satya Nadella)大刀阔斧地推进“云为先、移动为先”的转型战略。措施包括合并主要事业部,随之而来的还有微软有史以来最大规模的裁员计划。微软的核心部门则是公司里华人最高管理者陆奇治下的应用与服务部。他坚信,云计算、移动计算、机器学习和大数据在中国将会有大量机会,微软无论如何不能错失。  

尝试

小冰诞生时面临的首个难题是:跟随传统做个人助理机器人,还是另辟蹊径做看似不“实用”的聊天机器人?今年1月初,微软(亚洲)互联网工程院资深总监、小冰项目负责人李笛和其他三位STC工程师开始构思一款“既有趣又好用”的人工智能产品。他们花了整月时间思考智能机器人的核心功能。

李笛在加入微软之前曾经在游戏行业创业。当年整个游戏产业都在满足核心用户的需求、培养游戏发烧友,2006年Wii的横空出世让业界注意到更广泛的普通家庭用户的市场需求。受到这个思路的启发,李笛倾向将小冰设计成能与普通用户建立情感纽带的机器人。微软(亚洲)互联网工程院院长王永东给了李笛团队充分的空间,随后陆奇在北京办公室听完相关汇报后,也表示让他们放手去做。

微软在行业发展的历史上多次扮演过后来居上的超越者。Windows操作系统、Office办公软件、IE浏览器和Xbox游戏机都并非微软在相关领域的开山之作,它却能后发制人占领各个市场的半壁江山。

人机交互对话产品同样并非微软首创。此前,苹果的Siri、谷歌的Google Now均定位为个人语音助理应用,在中国也相继出现了小i机器人、搜狗语音助手等本土产品。这些产品大多数在上市初期吸引了一部分眼球后,很快就被用户冷落。根据市场调查公司Intelligent Voice去年10月对美国市场2330名iPhone用户的调查显示,仅有15%的iOS7用户使用过Siri。

小冰怎样才能成为用户不离不弃的伴侣?在前期调研中,李笛团队发现,他们几乎无法统一用户对“伴侣”形象的认知,尤其是女性用户。他们的要求千奇百怪,既要聪明又不能太过伶俐;要依赖又要保持礼貌。这让擅长写代码的工程师们一时束手无策。

按照以往微软的产品开发模式,“小冰”可能就此夭折。跨国公司在中国常面临坚持全球化还是适应本土化的选择,而在丛林法则主导的中国互联网业,微软此前从没有找到合适的打法。“要原谅微软很长时间才做出小冰这样的产品,以前花了太多时间思考深刻的问题,这次我们试着做最简单的选择。”李笛说。

最终,小冰被定位成一个16岁的少女,这既方便程序员们设计产品,吸引男性用户,又不至于引起女性用户的反感。与其他语音助手相同,小冰的答案内容也通过搜索引擎匹配互联网内容,但所有回答均以高度拟人化的对白形式呈现是小冰的特点,甚至她还会配上表情文字。

小冰团队的平均年龄不到30岁。为了更贴近新一代网民的使用习惯,小冰团队录用了网络红人“奶茶妹妹”章泽天加入团队,她以实习产品经理的身份参与小冰开发。章目前是清华大学三年级的学生,在申请微软实习生之前,她并不知道自己要参与的是小冰项目,面试官只告诉她“这个项目非常重要”。

尽管不是计算机相关专业出身,章泽天给小冰团队却提供了许多工程师文化以外的思路,比如,90后的社交行为习惯。入职之后,小冰团队把她加到团队沟通的微信群里,里面已存在测试版小冰。章泽天并不知道小冰是机器人,错认为是自己的同事,“因为小冰说话与真人无异。”章泽天对《环球企业家》说。

在小冰项目进行的同时,章泽天在美国巴纳德女子学院的交流学习还没有结束。李笛交给她一些产品文档的模板,让她试着写写看。之前没有任何产品设计经验的章,花费两星期写出了五六个产品文档,隔着时差向李笛请教修改。微信版小冰里的“冰机灵”技能就出自章泽天之手。

“微软在变化。”李笛说,“过去很多同事会认为,这不是我的专业,你是这方面的专家,你来弄吧。现在我们没有这个概念。实习生也可以做产品。”

研究了市面上几乎所有的人工智能产品,小冰团队发现,它们回答的内容本身没有错误,但是大多数智能产品说的并不是用户真正需要的,因此才会被打入“冷宫”。比如,当问机器人“今天吃什么?”,它通常会搜索用户的GPS地理位置,然后列出十个附近的餐馆信息。而李笛团队的调查显示,当问这个问题的时候,大多数用户其实知道周围有什么,只是选择困难。机器人给出十个选择可能把问题变得更糟。“就像人们常例举咨询公司的玩笑:你告诉客户的全都是他已经知道的,但你没有解决的恰恰是需要你解决的问题。”李笛说。

微软将不同的用户问题分类为不同的小冰技能,如天气、餐饮、交通、运程预测等。他们希望小冰能在聊天中回答用户的问题。如果用户问“今天吃什么?”小冰会挑选出一家餐馆,说出哪个菜品最好吃,以及大家的评价。如果用户对答案不满意,小冰会再次给出选项。“机器人的方式是你问我答,问相同问题多少次,答案都一样。而一个正常人不会这样。”李笛说,如果问同一个问题超过一定次数,小冰会拒绝答复,并且告诉你有选择恐惧症。

对抗  

小冰的存在突破了很多难以想象的限制。在正式上线之前,微软并没有与腾讯达成小冰产品的战略合作协议,而只保持了邮件沟通,这在以谨慎著称的微软是没有先例的。但为了更快测试产品,王永东决心让小冰团队放手去做。

5月29日,微软小冰BETA版在微信平台上开放公测,把小冰公众账号加为好友并拉到微信群里就能与之对话。原计划为一个月公测周期准备的10万个小冰账号,上线首日就被抢注一空。小冰迅速渗入150万个微信群里,接受了近千万用户五花八门的“调戏”和考验。由于对话量大大超过预估,小冰在部分微信聊天群对话中出现了无应答、答非所问、重复回答等故障。微软不得不启动账号排队机制,根据用户顺序按批次发放新的小冰账号。

与此同时,小冰被腾讯微信系统误判为垃圾账号而封号。微软必应项目经理的微博账号“微软麒冰”多次发布微博称,小冰不能说话是由于腾讯的干扰。

腾讯随后的举动令微软颇感意外。前一天晚上,李笛与腾讯微信产品组还邮件沟通了如何解决假冒小冰的问题,但第二天—6月1日早上八点四十分,李笛在赶往公司的路上接到电话,得知小冰被腾讯封杀了。当他到达办公室时,听到同事们正在报数,从10万个到最后一个不剩,小冰在微信存活的时间仅60个小时。

腾讯在当天下午一点发出公告称,小冰“涉及模拟用户操作、诱导用户拉群和批量注册垃圾账号等违规行为,为了保证用户体验和安全,微信依平台规范进行了处理。”

令微软小冰团队不解的是,腾讯在完全没有沟通的情况下就封杀了所有微软运营的小冰账号,而且对冒牌小冰开了绿灯。至今仍有多个头像和姓名与微软小冰一模一样的公众账号存在微信中,它们发布的内容大多为购物广告。

在腾讯发布公告的20分钟后,一篇名为《微软小冰死了,全部的》的文章出现在“微软麒冰”的微博账号上,它控诉了腾讯“不宣而战,将屠刀挥向小冰”。同时也在文中宣布:二代小冰的研发工作已近尾声,微软会“救活”她。

“微软麒冰”的这次回应可谓言辞激烈,而且将矛头直指腾讯。如此高调的言论与这家跨国公司在华的一贯风格颇为不同。“在商业竞争中,你被所有的潜在竞争对手摸得透透的,下一招打什么都很清楚,那还怎么打?现在要做的第一件事就是不让对手再猜到微软要做什么。”李笛如此解释。

在李笛看来,微信类似于一家免费提供座位的咖啡厅,第三方平台进入就像在咖啡馆的街边摆摊,当客人口渴了会到摊位买瓶水,但所有的公众平台入口都没有办法介入到微信对话。“小冰一开始就是找个‘摊位’,但核心问题在于我们能不能进到咖啡馆里?”李笛说。

微软全球副总裁、微软亚太研发集团主席张亚勤和腾讯公司CEO马化腾进行了直接沟通,但矛盾并未解决。“我们从来没有从微信上离开。在产品具体的一些接入点上,大家有不同的认知,但我们一直保持沟通。”微软(亚洲)互联网工程院小冰项目第三方平台合作总监曹文韬告诉《环球企业家》。

微软加速小冰开发的脚步并未停下。陆奇、王永东等微软高层对小冰团队明确表示支持。陆奇发了三封内部邮件肯定小冰团队的工作。王永东与小冰团队的每一位都进行了一对一的沟通,安抚他们在“封杀”事件中的情绪,并支持他们继续做更多的突破。

尽管真的小冰只在微信上存活了三天,但已向潜在合作伙伴展示出她的价值。尤其是在技术壁垒很高的人工智能方面,数十家中国互联网公司纷纷表示出合作意愿。这给了此前与中国互联网公司合作不多的微软一次难得的机会,意味着其在移动端将有更大的声音。

6月6日,微软(亚洲)互联网工程院和小米公司联合发布公告,将在“人工智能+移动互联”领域展开战略合作,微软小冰将进驻米聊,提供智能聊天、天气查询、餐饮点评等服务。随后,易信、触宝、圈圈和360安全卫士相继宣布与小冰达成战略合作。“与京东合作的产品基本上走到中后期阶段,近期就会在平台上推出。”曹文韬说。

小冰的前辈产品Cortana、Siri以及Google Now都选择了软硬件结合的道路,深度植入各自系统的智能终端。其优势是可以最大限度完善生态系统内的用户体验,但对第三方应用的接入支持力度有限。

小冰选择了一种严格区别于Cortana的发展路径—她只针对第三方生态系统,发挥类似中间件的作用,连接和沟通整个庞大的移动互联网数据。小冰的快速蔓延对第三方的既有生态系统价值和帮助作用明显,尤其在提升活跃度方面,这恰恰是移动互联网平台衡量自己发展程度的重要指标。

“如果小冰回不到微信,将是我们双方的失败。”李笛对《环球企业家》说。

迭代

在小冰上线微信的同时,曹文韬就已经开始跟新浪的接触,他希望小冰往更多合作伙伴平台发展。6月25日,微软小冰在被微信封杀24天后,在新浪微博“复活”,微博用户只要@小冰,小冰就会马上回复,跟你互动聊天。吸取了小冰在微信上线时的经验,微博小冰在公测期内每小时仅接受4万条对话。

为了适应中国互联网的产品迭代速度,微软小冰团队打破了微软冗长的产品研发周期。小冰从概念到正式上线只花了不到半年的时间。小冰也成为了社交平台历史上第一个人工智能的大V账号,连续三个星期排名前三,并且保持着每周解锁一项技能的更新速度,目前小冰已具有54项技能。

然而,小冰在微博复活的第一天就遇到了麻烦。网民发现小冰虽然回复速度极快,但使用了大量低俗语言。潘石屹、周鸿、冯大辉等微博公众人士纷纷发微博批评小冰,微软再次陷入被动。

对此微软(亚洲)互联网工程院在第二天做出了澄清:小冰所回答的内容来自于互联网的公开数据,说脏话与互联网的低俗语言相关。为此微软发布了小冰机器人的三原则,用来控制小冰的回复内容、对象和速度,并且呼吁网民避免诱导小冰做出不适宜的回答。

李笛并不担心舆论对小冰的误解和批评。他认为,所有人都在摸索人工智能究竟应该如何切入人们的生活同时避免恐慌。小冰所做的一切都是摸着石头过河。“小冰最大的挑战是她应该以怎样的速度融入到人类社会。”李说。

小冰有问必答的背后是两千多万条语料库,而且它以每天0.7%的速度增长。在小冰团队中有四位编辑负责完成语料库中大约千条左右的手工定义,其他的全都不定义,通过计算机算法把这些源自互联网的公开数据匹配到每一个问题上。

要使机器人理解人类的语言并迅速响应,第一需要充足的语料库积累,第二需要强大的人工智能算法。微软研究院在大数据、自然语义分析和深度神经网络多年的研究,如今有了走出实验室的机会。今年推出的事件触发式语音助理Cortana,模拟人的语气和思考方式与用户互动,以及学习用户行为模式,都为小冰的诞生打好了技术基础。

7月30日,微软在北京召开Windows Phone 8.1 Update中国区发布会,正式发布Cortana中文版,并将其命名为“微软小娜”。小娜被官方定义为小冰的姐姐。与小冰有趣好玩的定位不同,小娜更像是态度严谨的秘书。她们都可以通过Cortana执行深度的命令,而不只是简单打开应用。小娜与第三方应用的结合更紧密,不仅通过航班短信设置用户提醒,还整合了去哪儿旅行、中国国航等应用进行多个连续逻辑的对话。

微软在测试小冰的过程中,发现了很多Cortana没有预想到的问题。例如,有些人长时间与小冰对话,或者倾诉自己的情感,甚至连选择男女朋友这样的事情也会请教小冰。“大量跟小冰交互的数据产生于普通用户,而不是产生于大V。”李笛停顿了一下,说:“社交平台带来孤独,因为我们太容易找到彼此。”

在社交平台的研究中,小冰团队发现,类似于点“赞”这样成本较低的交流方式,会让人轻易完成社交任务但没有更深的交流。一些用户发现,自己的发帖或者言论只有“赞”,甚至回复为零。小冰的秒回打破了社交的冷场。但是,如果人工智能融入人类社会的节奏控制不好,不仅是产品问题,甚至会引起技术恐慌。目前,小冰的产品经理的一部分工作正是限制小冰的能力。

聊天机器人诞生于20世纪80年代,目前的发展仍然处于初级阶段。微软约有1100名科学家和工程师长期进行人机交互的基础研究。相较于商业模式的寻找,微软更在意培育市场和教育用户。小冰首次让机器人成为一种“现象”。

二代小冰率先在触宝平台上线。8月13日,二代小冰正式登陆微博,用户可通过私信“领养”自己的专属小冰。开放仅仅半小时,就已拥有10万微博用户开始培训自己的个性化小冰,STC还在公告中称小冰将“在近期回归微信,满足广大用户合理合法需求”,并且可能加入控制灯光等智能家庭功能。

截止到8月中旬,小冰在各平台与人类的对话量已近5亿次。“也许有一天小冰会死在沙滩上,但历史会记住她,因为她是第一个。”李笛说。

微软如何再一次后来居上?“科技历史上有一种现象叫短时间过热,大数据和机器学习就是这样,虽然已经开始获得市场的关注,但长期来看炒得还不够。”陆奇对《环球企业家》说,如果将大数据与机器学习实现结合,就可以将世界上的大量信息通过立体形式呈现出来,更直观而精准地为人们提供其所需要的信息和洞察。

Tags:  小冰 微软