起了个大早,却赶了个晚集:Siri是怎么被别家甩开的?
2017-06-11 08:44:00 来源:腾讯科技

【腾讯科技编者按】虽然苹果先于竞争对手开发了Siri语音助手,但却未能保住先发优势,反而被亚马逊和谷歌(微博)后来居上。《华尔街日报》日前撰文分析了背后的原因,以下为原文内容。

2014年末,苹果Siri团队的几名成员参加了亚马逊的一场活动。他们原以为自己可以领先于这个竞争对手。

由于能够通过语音指令处理日程安排、文本消息和其他简单任务,这款发布3年的苹果产品广受欢迎。一时间,Siri似乎天下无敌。

然而,当Siri团队目睹了亚马逊的一段演示视频后,前景似乎很快发生了变化。视频里是一个能用语音控制的小音箱,可以播放音乐、订购产品、搜索信息。它证明亚马逊已经具备在嘈杂背景中分离人声的能力,而且拥有一款可以远距离响应语音指令的数字助手——而Siri当时还不具备这种能力。

“苹果员工的焦虑感陡然上升。”一位当晚出席活动的苹果Siri团队前成员说。

丧失先发优势

如今,苹果正在一个它自己开拓的产品领域奋力追赶,使得人们不禁担心这家科技巨头是否已经失去创新优势。

本周一,该公司发布了HomePod,这款内置Siri的家用音箱将于今年12月正式开售。该设备可以完成Siri的各种功能,包括调节电灯和设置提醒等,但苹果却宣称它主要是一款具备一流音效的高端家庭音响系统。

苹果花了好几年时间才开发出这样一款产品。

该公司当天还宣布将于今年秋天对Siri进行升级,可以将英语翻译成5种语言,而且能通过对用户偏好的学习,为其提供上网、聊天和应用使用建议。

苹果最多也只能算第三家进军家用音箱市场的科技巨头。亚马逊两年半以前就开始销售Echo,上月还发布了一款可以通过内置摄像头和显示器进行视频通话的设备,而且同样内置了Alexa语音助手。该公司还与很多企业展开了合作,将Alexa嵌入福特汽车、LG冰箱和通用电气的灯具之中。

Alphabet去年10月发布了基于“谷歌助手”的音箱。该公司上月表示,他们将通过一款手机应用向iPhone应用提供其语音产品。微软今年5月也发布了一款内置其Cortana语音助手的音箱,三星电子也有望把该公司的Bixby语音助手植入家电产品。

尽管已经可以兼容Apple Watch等少数其他设备,但Siri很大程度上仍然只是iPhone的一项功能。Siri的功能已经大幅增加,但竞争对手却有后来居上的迹象。多份独立研究表明,Siri在准确率方面不及Alexa或谷歌助手。

成也iPhone,败也iPhone

一些前高管、观察人士和客户都表示,由于缺乏紧迫感,加之难以将理念付诸实施,苹果的创新力似乎逐渐丧失。在CEO蒂姆-库克(Tim Cook)掌舵的6年间,该公司股价大幅飙升,但并未推出足以比肩乔布斯时代的突破性产品——包括iPod、iPhone和iPad。

其中的原因之一或许在于iPhone本身。作为有史以来最成功的消费电子产品之一,它为苹果贡献了多数销售额,并且占据了该公司的很多精力。但苹果前高管表示,正因如此,它才限制了该公司的能力,使之难以开发与手机无关的产品——全新的语音控制设备便是其中之一。

“Siri简直提供了一个教科书般的范本:它最初在技术上领先,而且拥有充裕的资金和人才,但却逐渐丧失领先优势。”科技研究和顾问公司Constellation Research首席分析师霍尔格-穆勒(Holger Mueller)说。

苹果的支持者表示,该公司在竞争对手之后进入某个领域,然后占据主导。而苹果则表示,他们的创新速度在不断加快。他们过去5年的年度研发开支增至100亿美元。该公司还在从事多个潜力巨大的项目,其中就包括无人驾驶系统。苹果指出,Siri已经借助iPhone进入全球数亿用户的口袋——触角之广远超任何一个竞争对手的语音助手。

“从创新角度来看,我们对公司现状很满意。这是我们基因的一部分。”苹果高级副总裁艾迪-库伊(Eddy Cue)在周一的发布会之前接受采访时说,他负责的产品中就包括Siri。苹果周一还针对开发者推出了增强现实功能,还发布了更加强大的Mac电脑。

数字助理已经成为当今科技行业竞争最激烈的领域之一。行业高管表示,这些采用高效人工智能算法的产品所具备的革命意义堪比PC和智能手机,未来甚至有可能让电脑与人类展开对话、回忆之前的对话记录,并在没有按钮或触摸屏的情况下提供个性化服务。

乔布斯遗作命运不济

Siri是乔布斯生前推出的最后一款重要新品。他2010年开始看好这项技术,这当时还只是一家小型创业公司针对iPhone设计的数字助手应用。Siri发明人加里-莫金塔勒(Gary Morgenthaler)表示,乔布斯在45天内给他们打了30通电话,最终说服创始人把公司卖给苹果。乔布斯随后要求他们对部分功能进行微调,以便在不同语言的iPhone上流畅使用。

苹果营销主管菲尔-席勒(Phil Schiller)曾在2011年将Siri称作iPhone 4s“最好的功能”,它可以将语音转换成文本,还能解读具体的含义,甚至播报天气和安排日程,并在推出后第一年帮助iPhone实现73%的出货量增长。就在发布第二天,乔布斯便与世长辞。

Siri团队的前成员表示,自那之后的几年间,由于未能制定野心勃勃的目标,加之战略转移,而且越来越重视用户隐私(此举导致该公司很难实现个性化,也难以改进产品),这个项目的进度便大幅放缓。该项目还遭遇了重要成员的离职,其中一些人甚至跳槽到竞争对手那里。

大约在乔布斯去世后一年,苹果挖来了亚马逊搜索高管比尔-斯塔西尔(Bill Stasior)来负责Siri。斯塔西尔在麻省理工学院研究人工智能,但他的专长在于搜索,而非语音或语言。这也导致Siri团队的部分成员认为,他不再完全认可该产品最初的目标:从iPhone向第三方应用渗透。

为了将Siri嵌入更多应用——例如,可以让用户查看银行账户余额或订购汽车服务——苹果需要开发一个平台和编码工具,让开发者将这个虚拟助手整合到iPad、iPhone或Apple Watch应用中。该公司在2016年实现了这个目标。

苹果拒绝让斯塔西尔接受采访,他本人也未作出回应。

Siri联合创始人亚当-切耶(Adam Cheyer)和戴格-吉特劳斯(Dag Kittlaus)也已经因为个人原因离职。他们创办了一家与之竞争的公司Viv Labs,专门向第三方开发者提供语音系统。此后又有6名员工追随他们离职。三星在去年斥资2.15亿美元收购了Viv。

2014年,苹果在Siri中融入了机器学习系统,利用算法来提升它的表现。库伊将这套新系统比作大脑移植,他表示,这让Siri变得更加多才多艺,使之可以理解各种表述。例如,无论你说“告诉我洋基队昨天的比分”还是“洋基队昨天比分是多少”,它都能准确理解。

“Siri这种产品的关键在于不用让你为了它而专门思考。”库伊说。苹果称,Siri的错误率已经下降一半。

Echo令苹果措不及防

大约就在同时,亚马逊推出了Alexa和Echo音箱,开创了新的领域,还利用亚力克-鲍德温(Alec Baldwin)主演的怪异电视广告展开地毯式轰炸。短短两年,这款音箱的销量就达到1100万台。

这款设备的流行令苹果措不及防。它不仅可以播放音乐,还能回答问题,甚至控制电灯和各种家电,而苹果直到最近才通过HomeKit软件系统引出了这个概念,让开发者可以设计能用Siri控制的恒温器和门锁。

iPhone本应是一项巨大优势,但却成了发展障碍。苹果表示,每月约有3.75亿台苹果设备通过21种语言使用Siri,这项服务每周大约处理近20亿条请求。仅在美国,它每周的独立用户就达到7000万。相比而言,亚马逊Alexa仅支持德语和英语,而谷歌助手也只能支持7种语言。

与此同时,为苹果贡献了三分之二营收的iPhone成为了内部的绝对焦点,导致苹果几乎忽视了Siri团队对虚拟助手的发展愿景,只是局限在日程安排和文本信息这些领域。

相反,苹果只是支持了更多语言,并在女声的基础上增加了男声,而且允许用户在用iPhone阅读文章或查看其他内容时口头创建提醒信息。Siri前语音科学家、创业公司Semantic Machines CTO拉里-吉利克(Larry Gillick)表示,苹果和其他大型企业“都倾向于逐步改进”。

隐私保护反成短板

亚马逊和谷歌都在2016年推出了自己的语音助手。Siri前员工表示,由于他们凭借各自强大的搜索引擎对语音助手进行了训练,而且不太受制于严格的隐私政策,所以比Siri更具优势。

为了保护用户隐私,苹果会随机标记Siri搜索,而且只会保留6个月的数据标记,这与谷歌和亚马逊长期保留用户数据的做法有所不同。Siri前工程师表示,由于这种做法相当于放弃了数据控制权,导致苹果难以改进Siri的使用效果。

“你被打残了。”Siri搜索团队前成员詹森-道格拉斯(Jason Douglas)说,“iTunes商店有很多数据,但跟谷歌或亚马逊不是一个级别。”

库伊表示,苹果往往会使用通用数据而非用户的个性化数据对系统进行训练,因而无法借助iPhone上的个性化信息改进Siri的性能。

第三方对接不畅

在Siri接受了“大脑移植”手术后,改进Siri对话能力的计划便暂时搁置。苹果让语言处理专家亚历克斯-阿赛洛(Alex Acero)将语音识别和自然语言两个相互竞争的团队合并起来。第一个团队是让机器学会识别人类的语音,第二个则是解决这些语音的含义。曾经任职于语音识别团队的查克-沃特斯(Chuck Wooters)表示,经历了管理层的权力斗争之后,该项目又被交给一个缺乏该领域专业技能的人负责。

这一调整令一些语音识别专家感觉梦想破灭。沃特斯表示,一位专家跳槽谷歌,另一位跳槽亚马逊。沃特斯本人也加盟Semantic,这家公司正在开发一种能让虚拟助手更加健谈的技术。

苹果拒绝对此置评,仍然任职于Siri团队的阿赛洛也没有发表评论。

其他员工也因为苹果迟迟不愿让第三方应用使用Siri而感到心灰意冷。苹果在2013年增加了一项功能,可以使用Fandango购买电影票,但两位前员工表示,斯塔西尔搁置了将Siri与更多第三方应用对接的计划。一位苹果前工程师透露,等到该项目两年后继续推进时,苹果已经减少了新的开发者可以使用的新命令数量。

去年6月,苹果在年度开发者大会上发布了大约150个新的Siri命令(他们称之为“意图”)。他们对7类应用开放了Siri,其中包括付费(Venmo)和专车(Uber)应用。相比而言,亚马逊Alexa则允许开发者自主定制命令(他们称之为“技能”),目前的总量已经达到1.2万种。借助这些命令,用户可以使用语音订购咖啡、练习冥想、查看银行余额。

当时参加发布会的开发者布莱恩-罗姆勒(Brian Roemmele)表示,Siri在命令方面的局限令很多开发者感到失望。“人们原本兴致勃勃地来参加会议,但最终却发现,‘我根本不能使用。’”他说,“有的人又恢复了原先的看法,他们认为Siri永远成不了气候,于是继续为谷歌和Alexa做开发去了。”

库伊表示,苹果选择向人们经常使用的应用开放Siri,而且能够理解通过不同方式表达的各种请求。“这都是你每天都会用到的东西。”他说。

苹果周一宣布,开发者可以在笔记和银行等四类应用中使用Siri。

准确率欠佳

Siri在其他方面的能力也落后于竞争对手。数字营销公司Stone Temple表示,在5000个不同的测试问题中,Siri的准确率为62%,而谷歌助手和亚马逊Alexa都达到90%。

市场研究公司Loup Ventures的另外一项研究表明,Siri在iPhone核心功能上的表现好于对手。这些功能都与指令相关,包括制定日程安排、拨打电话、发送文本信息。不过,在回答网络问题时的准确度却相对较低。

苹果试图通过收购缩小差距。该公司2015年收购了英国创业公司VocalIQ,后者设计了一款可以提升虚拟助手对话能力的系统。

一位苹果前工程师表示,他们的计划是通过该系统为苹果提供数据,从而让Siri更加健谈。例如,用户可以首先询问周围有哪些咖啡厅,之后还可以进一步缩小范围,从中挑选可以提供Wi-Fi的咖啡厅。

谷歌助手已经开始提供这些对话能力,但Siri仍没有取得进展。“我认为没有一家公司在对话上得到了A+的成绩。”库伊说,“这是个很有挑战的问题,这一领域有很多工作要做。今后会大幅改进,也确实需要大幅改进。”(编译/长歌)

推广:更多精彩内容,请微信搜索关注公众号「腾讯科技」(ID:qqtech)。

正文已结束,您可以按alt+4进行评论
  • 为你推荐
  • 公益播报
  • 公益汇
  • 进社区

热点推荐

即时新闻

武汉