在美国,亚马逊主要作为一个电商和云计算厂商为大家所熟知。这种印象最近两年因为一款智能音箱 Echo 的横空出世,得到了极大的改观,大家发现:原来亚马逊也很擅长制造智能硬件。 那么,亚马逊的智能音箱的发展历程是怎样的?它又是怎样进行战略布局的呢?让我们从简单回顾亚马逊的硬件研发道路开始说起。 本文摘抄自徐飞博士在极客时间开设的专栏《技术与商业案例解读》,完整版请点击阅读原文订阅专栏后获取。 从 Kindle 到 Fire Phone:亚马逊的硬件路 在做智能音箱前,亚马逊已经做了很久的硬件,其中最有名的两个产品是 Kindle 电子阅读器和手机 Fire Phone。但是,Kindle 的销售非常成功,Fire Phone 却彻头彻尾地失败了。 亚马逊开始卖电子书的这段经历,让它积累了运营数字产品的经验,并进一步将业务延伸到了音乐、视频、游戏等各大领域。和苹果一样,亚马逊成为了很早就积累到丰富数字产品运营经验的少数互联网公司。 和 Kindle 比起来,作为亚马逊最高调发售,又走高端市场的 Fire Phone,其销售情况可谓一塌糊涂,根本没人理睬,亚马逊之后不得不非常狠地打折清仓。在亚马逊的整个发展史上,如此惨败,无疑是第一次,也是目前为止唯一的一次。 为什么亚马逊会惨败呢?其实亚马逊的领导力准则给了我们答案。 亚马逊领导力准则里面强调"客户至尚",而这款手机的研发,无论从价格还是功能上,没有一个地方体现出这条领导力准则:价格昂贵,动态 3D 华而不实。Firefly 功能则是为了更好地让用户在亚马逊网站上进行消费,云端浏览器则是赤裸裸地搜集用户信息。当亚马逊自己都不遵循自己的领导力准则时,一个产品的惨败就是"必然"了。 这次惨败,让亚马逊的硬件研发团队、神秘的 Lab126 受到了重创。亚马逊的硬件研发和销售也因为 Fire Phone 的惨败有了质的变化,整个手机的产品线,和当时一直在进行的一款和虚拟现实相关的产品都被叫停了。亚马逊内部对这次惨败也进行了深刻的反思。 而这个时候,一个 2011 年就开始的研发项目,原本因为一再为手机让路而不断降低优先级,却迎来了一个历史性的契机。这个项目就是后来赫赫有名的那只音箱——Echo。 开始智能音箱的战斗:Echo 攻城略地 大约在 Fire Phone 失败半年之后,智能音箱 Echo 定型,亚马逊决定发布它。其发布非常低调,仅仅是就逐步给它的 Prime 会员推送信息,告诉他们可以购买这款音箱尝试一下。当时,音箱的库存量也很小,然而,Echo 却给亚马逊带来了意外之喜,一炮而红。 2015 年,亚马逊总共卖出了超过 250 万只音箱,到 2016 年这个规模又翻了一番,达到了 500 万只。在短短两年的时间里,Echo 智能音箱把市面上入门级的专业音箱打得落花流水,各种品牌被统统扫地出门。 智能音箱 Echo 的崛起有很多值得我们学习和思考的地方: 首先,最初这款音箱能否成功,其实亚马逊自己也不是太清楚。所以小范围内试水是一个保险的做法,如果行得通就继续加量,如果行不通就可以及时止损。万一失败,亚马逊也不会因为生产过多而导致成本失控。 其次,在发现这款音箱很畅销之后,亚马逊对市场的反应速度和能力都令人敬佩。亚马逊意识到开放的音箱生态系统是音箱得以发展的基础以后,就果断开放了第三方技能平台,允许音箱接入第三方音乐提供商。这种做法正符合亚马逊的领导力准则,就是领导者要有长远的眼光,不要只是拘泥于短期的利益。当然还有,就是做事情需要做到"客户至尚"。 总体来说,Echo 的诞生本身有一些偶然因素,但是诞生以后亚马逊充分贯彻领导力准则,围绕 Echo 的发展采取了一系列策略,让它真正能够大红大紫。 智能音箱的战斗:语音助手 Alexa 作为智能音箱核心功能的语音交互,或者更通俗的说是"语音助手",对 Echo 来说是最重要的一个模块。这两年最红火的语音助手是 Alexa,它属于亚马逊。 全力以赴打造语音助手 Alexa 是怎么诞生的呢?这就要回到 2015 年 8 月,Echo 智能音箱卖了大概 10 个月之后,亚马逊突然意识到自己的语音助手可以作为一个独立的云服务存在,并不一定要和 Echo 智能音箱捆绑在一起。 于是亚马逊悄悄地把那个叫 Echo 的语音助手改名为 Alexa。Alexa 原本是亚马逊旗下的一个网站分析工具,语音助手算是鸠占鹊巢。没过多久,谁也不再记得那个曾经的网站分析工具了,Alexa 成了专门指代亚马逊语音助手的名词。 但是为了保证向后兼容,在 Echo 智能音箱语音助手的提醒词里,虽然默认是 Hello Alexa,最初推出音箱时用的提醒词 Hello Echo 也依然保留着。只有从提醒词里,我们才能够看到过去的痕迹:原来 Alexa 曾经叫作 Echo。 亚马逊最初研发音箱的时候,对语音处理技术的重要性并不是特别清楚,所以语音助手的技术水平很一般。当 Echo 音箱卖得很好时,亚马逊很快就意识到了语音处理技术的重要性,但是语音处理技术人才储备并不多。索性西雅图有一家在消费市场并不是特别知名,但是在专业语音处理领域非常著名的公司 Nuance。 Nuance 在西雅图有一个研发中心,中心里有很多专门做语音处理技术的人才,亚马逊就狠狠地高价在这家公司里面大肆搜罗了一番。最后,Nuance 西雅图研发中心的很多核心人员都跑去了亚马逊。 为了进一步增强在语音处理领域的技术和人才储备,亚马逊又迅速出手,接连收购了 Yap 和 Evi 两家创业公司。至此,亚马逊终于有些安心,给 Alexa 储备了足够的语音处理人才。 用机器学习搞定语音识别 Echo 首先是个音箱,而音箱的主要功能是放音乐。但有些活动,比如聚餐、舞会中会有很多其他声源,这类场景下和音箱进行交互就有一个很大的问题:音箱如何在这些嘈杂的声音里识别出真正的交互命令呢? 应用场景的不同,决定了 Echo 音箱上的语音助手 Alexa 和手机上的语音助手对技术的需求有很大不同。简单来说,如果手机上的语音交互难度是一颗星,那么深处嘈杂环境下的音箱的语音交互技术起码得是四颗星。这是 Echo 智能音箱必须解决的一个难题。 在一次公开的交流中,负责 Alexa 相关业务的首席科学家、著名的机器学习学者罗希特 · 普拉萨德(Rohit Prasad)在接受采访时简单提到过,Lab126 团队因为这个问题一度让 Echo 智能音箱项目被搁浅,最后不得不在全公司范围内寻求帮助。 而之后的解决方式是机器学习。亚马逊曾经在网络上公开过一段音频,对比了在嘈杂环境上的原始声音,和经过机器学习处理的声音。在音频里你可以看到,经过机器学习处理的音频达到了近乎完美的噪音过滤,这是 Echo 在极其恶劣嘈杂的环境下,依然能够表现出非常良好的语音识别功能的主要原因。 Echo 上市以后,无论在多嘈杂的环境里,语音交互的识别能力都非常好,这是 Echo 能够迅速脱颖而出最重要的原因之一。 亚马逊公司长期以来给人的感觉是商业决策优于技术,亚马逊的核心技术并没有让人觉得多惊艳。然而在这件事情上,亚马逊显现了用技术解决难题的能力,这颇让我对亚马逊的印象有了很大的改观。 语音平台促进成长 Alexa 从 Echo 独立出去以后,就开始在亚马逊的各大设备上集成,比如说亚马逊的 Fire TV 就集成了 Alexa。Alexa 在亚马逊内部可谓大行其道,任何一个项目组的东西如果可以和 Alexa 整合,在亚马逊内部的优先级都会上升许多。 除了"内销",亚马逊还把这个语音助手"出口"到了各行各业去,包括智能冰箱、汽车,乃至华为手机,等等。Alexa 的遍地开花,让亚马逊作为一个语音助手市场的后来者,占据了很多有利位置。 从技术开发上,Alexa 也有了自己独立的研发团队,而且目前已经非常庞大,有包括一个总监在内的很多人。在亚马逊,如果一个项目有总监级别的人参与,就代表着这个项目实在是一个非常重要的项目,是公司首席级高管(C-level)可以直接看到和关注的项目了。Alexa 有了总监级人物以后,在亚马逊的地位也就突显出来,不再是 Echo 下面的一个附属项目了。 在亚马逊内部,很多人都相信语音交互是一个非常重要的、新的流量渠道,而且在未来会更加重要,占领了语音,也就在未来的新交互方式里占据了一块稳固的地盘。所以自从 Alexa 独立以后,这个团队就一直在膨胀。很有意思的是,我在 LinkedIn 上经常可以收到来自亚马逊招聘人员的邀约,其中为 Alexa 招人的比例一直居高不下。 如果说一开始 Echo 作为一款智能音箱,对于亚马逊占领客厅和厨房很重要的话,那么现在亚马逊的语音助手 Alexa 和它给第三方开放的技能平台,则是亚马逊的重中之重。如果说这之前,亚马逊更关注音箱,那么 Alexa 作为一个软件独立出来发展后,亚马逊关注的重点也就从硬件转向了软件和平台:硬件,包括智能音箱在内,都是为这个软件平台服务的。亚马逊今天发展的各种硬件,确实已经变为主要为 Alexa 平台服务,硬件本身的作用已经远远比不上这个语音平台了。 有了这个语音平台,亚马逊不但可以在自己的硬件上推广,还可以把语音平台开放给第三方。让第三方的硬件都进入这个平台。这里就有华为的手机、LG 的电器,未来我们还可以预见到的,比如说车载系统等等。 对比硬件的影响力,语音平台的影响力要大得多,最终平台会造就一个生态圈,而任何生态圈都有很强的黏性。亚马逊也可以凭借平台把影响力扩大到自己的业务之外,让 Alexa 成为整个互联网和 IT 产业里面很多公司都愿意加入的生态圈,这种影响力是智能音箱不可能达到的,也是亚马逊从来都没有企及过,但是现在却有可能成功的。 从 Echo 音箱到 Alexa 语音助手的变迁,是优先级的一个巨大改变。这个变迁在亚马逊里面用了 10 个月,亚马逊对市场反应的这个速度,让我非常吃惊。通常在其他互联网或者软件公司,这种变迁花费三年五年也是很常见的。这样看来,亚马逊能够在语音市场占据一片天地,也是有原因的。 智能音箱的战斗:亚马逊的战略布局 除了是最早进入智能音箱领域的企业,或者说是智能音箱的发明者,亚马逊还是一家对市场反应非常灵敏的企业,因此自然会有自己的战略布局。无论是否有其他竞争对手进来,亚马逊都是需要发展智能音箱的。 亚马逊在 Echo 上的布局,最初的做法也是遍地撒网,不算多高明。第一个出场的是便携式智能音箱 Tap,这个音箱可以随身携带外出旅游。但是我们知道,出行的时候带个音箱其实还是小概率事件。更重要的是,Alexa 需要联网才能工作,而 Tap 并未自带手机芯片,必须外接 WiFi 才能连接互联网,所以这个产品卖得一般般。 第二个出场的是 Echo Dot,你可以认为它就是廉价版 Echo。这个 Echo Dot 更新换代很快,半年不到就已经出到了第二代。这个产品倒是非常有意思,它有麦克风和扬声器,提供了 Alexa 语音助手,同时还可以连上其他高档音箱,把高档音箱变成智能音箱。 这样一来,就让那些喜欢更高品质音箱的人,可以兼得智能音箱的功能和高档音箱的音质。而对于在家里需要到处都有 Alexa 语音,但不一定都需要听歌的人,廉价的 Echo Dot 也是一个很好的选择。 你完全可以在不同的房间里面放个 Echo Dot,并只在厅里放个 Echo,通过"高低结合"形成一个完整的智能家居音控系统。亚马逊鼓励大家多买 Echo Dot,所以在售价上,为同时购买多个 Echo Dot 的用户提供折扣。 既然谷歌通过 Chromecast 和 Google TV 在电视上提供视频交互的功能,亚马逊也提供了对应的策略,这就是另外一款产品:Echo Show。 Echo Show 简单来说就是一个带屏幕的 Echo,音箱质量还不错,有个小屏幕,Alexa 可以提供视频和语音回答。这个产品出来以后,很多人都挺喜欢的。 谷歌在智能音箱上可谓来势汹汹,亚马逊在 Prime Day 的时候做了一次史无前例的促销。促销主要集中在亚马逊的智能音箱领域。Echo 系列全面打折,其中 Echo 音箱的折扣更是高达 50%,所以这一天很多很多的会员都买了。在我的朋友圈里,那天很多人都在贴自己买了音箱或者要剁手的照片。 当时有两种声音:一种说法是这是亚马逊通过大规模补贴来迅速占领市场,进一步巩固自己的霸主地位;另外一种说法是亚马逊在清仓了,因为很可能下一代的 Echo 产品要出来占领市场了。 最后证明果然是亚马逊出了 Echo 第二代产品。第二代 Echo 有 Echo 和 Echo Plus 两个版本。其中,Echo 的高度只有原来的一半,而价格也很神奇地降到了 99 美元,比谷歌的智能音箱还便宜。不过,Echo 据说虽然只有原来体积的一半,却比上一代有更好的音质,这主要归功于 Echo 二代里面新加的低音喇叭。 Echo Plus 售价 149 美元,看起来更像是上一代的 Echo,至少从高度上看很像。当然,149 美元的售价也比上一代更加便宜。 Echo Plus 最大的卖点是智能家居的控制。和一代产品不同,二代产品 Echo Plus 可以自动检测连接在同一个局域网里面的所有智能家居,并自动设置好。开箱之后,你就可以直接通过语音助手 Alexa 控制智能家居,完全不需要任何人工设置的过程。 这看起来的确是非常实用的一个功能。为了体现这个功能的价值,Echo Plus 还自带了一个飞利浦智能电灯泡。至于效果怎样,可能就有待市场检验了。 亚马逊在发布会上还表示,经过对三年来用户行为的学习,亚马逊发现用户最喜欢 Alexa 做的三件事情是:开灯、启动咖啡机、读新消息。所以以后用户可以设定例行程序,比如在说"Alexa good morning"的时候,就可以让它把这些事情都做了。 亚马逊还发布了一个新的产品 Echo Spot,这是个带圆形显示屏的 2.5 英寸大小的东西,比 Echo Show 要小。显示屏可以显示时间、天气,甚至可以实现和用户进行视频会议等诸多功能。作为一款屏幕如此小的产品,Echo Spot 的售价在我看来并不便宜,高达 129 美元。 最后出场的是 20 美元一个的 Echo Button。它的功能非常有限,目前也只能做一下语音交互,比如可以用作抢答问题的答题器。 亚马逊发布了新的 Echo 系列之后,我着实有些不爽。没错,我就是那个贪图便宜在 Prime Day 里面半价买了一代 Echo 智能音箱的人。"被清仓"的感觉真心不好。在我买了一代以后是不是要买二代,这个问题就显得很尴尬了。 面对谷歌咄咄逼人地进军智能音箱市场,亚马逊推出新一代产品,并主要解决了下面几个问题。 首先是谷歌的低价问题。作为一个把节俭写入了领导力准则,把成本控制看作生命,把低价看作核心价值的公司,在自己发明的智能音箱领域,居然被一个黑科技公司打趴下了,实在不是什么值得高兴的事情。所以,在 Echo 二代里,亚马逊大幅度降低了音箱的价格,性价比方面一下子就超越了谷歌。这样,亚马逊就在价格上占据了优势。 其次是对谷歌 Chromcast 和电视机结合的反击。谷歌通过音箱和 Chromecast 的组合,以及 Chromecast 和电视机的结合,提供了独一无二的体验。亚马逊的反击颇为迂回,主要体现在两个方面:一个是 Echo Show,可以放在客厅之类的地方;一个是新的 Echo Spot,小巧精致放书桌上正合适,还可以用来和他人视频通信,可谓一举数得。至于到底是大屏幕电视的体验更好,还是另起炉灶的新 Echo 硬件更好,我们很难判断。想来是各有千秋吧。 第三点,可能也是体现亚马逊战略的一点,就是亚马逊希望成为智能家居的"控制器"。为什么说是"控制器"呢?因为在上一代产品里,智能家居的控制是需要通过技能的设置来完成的。虽然设置好了以后也挺好用的,但是难免有人不懂或者不熟悉使用电脑。所以为了更好地占领智能家居市场,"让对智能设备的控制简单化、傻瓜化"也就提上了日程。这个 Echo Plus 的设备就是为此设计的。 更低廉的价格,更多的交互方式,对智能家居控制器的强化,基本上构成了亚马逊这次新产品发布的主要目的,亚马逊在商业上想得很清楚。 所以长期来看,亚马逊和谷歌在智能音箱领域的斗争依旧要延续下去。估计最后分庭抗礼的可能性比较大。 智能音箱的战斗:巨头纷纷入场 在谷歌入场一年以后,另外两大 IT 巨头苹果和微软也宣布进军智能音箱市场。苹果的入场始于 2017 年 WWDC 全球开发者大会,它们发布了一款叫作 HomePod 的智能音箱,原计划年底交货,不过目前已经推迟。 而在这之前不久,也就是 2017 年 5 月 9 日,传统音箱厂商哈曼卡顿(Karman Kardon)宣布和微软合作,推出一款搭载微软语音助手 Cortana 的智能音箱,这款音箱名为 Invoke。 进入智能音箱市场的,不仅有国外的企业,也有国内的企业。国内最著名也最早的是京东,它联合的是科大讯飞。科大讯飞作为中文语音技术的先驱,经过十余年的积累,对于中文语音处理和识别技术的掌握,基本上是全球最牛的了。名为"叮咚"的音箱是科大讯飞和京东合作的产物,推出的时间不算很晚,功能上差强人意,生态圈做得不算好。总体而言,"叮咚"应该不是亚马逊和谷歌的对手。 除此之外,国内的智能音箱还有阿里巴巴旗下的天猫精灵 X1、喜马拉雅的小雅 AI 音箱、联想推出的联想智能音箱、小米推出的小米 AI 音箱,等等。这些音箱在嘈杂的环境下都很难达到亚马逊或者谷歌音箱的水平,国内的音箱是不是能够一骑绝尘,目前来看还需要一段时间。