据公众号:这篇文章的作者李志勇,十年栈道程序员,有笑话的公众号:朱奥莫西。从CES的进展来看,Google目前正在把语音交互搞得一团糟,并且正在变成一家更为紧急但不太成功的公司。谷歌的公共云不太可能到达亚马逊。
自动驾驶着急了很多年,但很有可能挂掉,在语音交互中,谷歌很有可能再次输给亚马逊。语音助手的大PK今年CES最有趣的是,语音互动产品洪水泛滥,在英伟达成了误解,各大巨头达成协议,争先恐后地杀人。
其中比较核心的两个地方分别是Amazon和Google,分别代表Echo和内置语音支持Alexa、Google home和内置语音支持Google Assistant。长期以来,从那个角度来看,谷歌有足够的优势,有技术、资源和累计,但可以清楚地看到,谷歌实际上是遥遥领先,可以得到救济。
要想理解语音交互方向的明确趋势,需要深刻地解释相关产品和技术的本质特征。Echo等产品的核心特征是多层技术的高度融合(声学、语音识别、语义、搜索、内容)。其中声学是硬件和软件的分割点,将产品ID和内部结构向上连接,影响语音识别。
意义后的部分是显示软件和内容。对Amazon和Google这样的公司来说,他们将自己定义为天生做生态和平台的公司,所以其核心不一定是Echo这个硬件产品本身,而是背后的语音助手(例如Alexa)。因为只有Alexa代表了新的生态。
Alexa这样的语音支持很多人都是Android这样的操作系统,但实际上更适合看作是操作系统——超级应用程序。(威廉莎士比亚,Northern Exposure(美国电视),语言)向各种硬件添加语音助手的方法有两种。
一种是纯洁温柔的方法。我会做好语音助手,谁想用都行。(威廉莎士比亚、哈姆雷特、语音、语音、语音、语音、语音、语音、语音)这种模式需要在技术层面探索最多的语音识别,核心是意义和对话。
对该模式最重要的参考是搜索引擎。一种是人性融合的方式。我做了标杆硬件产品,然后向外界开放了硬件产品的助手。
该模型最突出的参考是Android等操作系统。互联网公司不喜欢第一种方式。因为这个模型最重,下一个模型要组织生产和销售,还要探索到和音响一样的水平。
毫无疑问轻多了。但是模式1的核心问题有两个。
1.语音交互很难从现有平台(手机、平板电脑、电脑)开始,将近场内的语音交互移动到远场内并不坏。谁来解决问题落地过程中的各种坑洞问题?2.在不告诉硬件市场需求的情况下,如何设计与各种硬件兼容的API,如何获得对硬件供应商特别方便的方案?这种辛苦的工作能直接给几乎每个硬件制造商考虑吗?谷歌对外开放ASR和NLP的API已经很久了,但从CES的结果来看,Alexa这个系统集成方案似乎更为热门。也就是说,与底层硬件的兼容性问题也得到解决,后端内容整合问题也得到解决。
把一切往上看,我们可以谈谈做语音助手。其实有这几个重要的控制点。1.制作基准测试的硬件产品,但不太适合各种用户。新类别要避免手机和PAD。
否则一定会降低覆盖面积。2.非常丰富的后话内容,对语音助手来说,硬件、音乐甚至电话都是内容。内容要从头部开始,逐渐填满长尾内容。
衍生是将Alexa和Echo这两种产品分开,尽可能多地制造其背后的东西。3.建立技术优势,包括深度自学等纯算法和声学等与物理密切相关的领域。
内容不多的时候,前端技术(声音和语音识别)比语义更重要。因为它更影响速度和精度。亚马逊做得对吗?在上一节提到的几个方面,亚马逊完全正确。
第一,亚马逊没有避开硬件的麻烦,花了4 ~ 5年时间做了Echo。这样一来,亚马逊就能掌握难以打破的制高点。看起来很奇怪,但事实并非如此。
否则,谷歌向外部开放Google assistant就可以了。显然不需要自己做谷歌主页。
(阿尔伯特爱因斯坦,Northern Exposure(美国电视连续剧),成功)但本质上硬件和背后Assistant的结合程度远远高于搜索和浏览器,搜索和浏览器的结合程度实际上并不方便,但Alexa和前端的硬件结合程度却处理了不好的问题。(阿尔伯特爱因斯坦,Northern Exposure(美国电视),)谷歌在强迫Echo的压力下,开始建造谷歌主页。
其次,亚马逊在Echo实现可行性后,很快开始将Echo与Alexa分开,还包括完善的SDK(ASKAVS)文件和案例,正式成立Alexa基金,寻找战略合作伙伴等,采取了明确的措施。最终结果之一是所谓的7000项技术。
7000项技术是非常可怕的。几乎不足以处理面积技术和部分内容的劣势。这只是淘宝上的商家数量达到特定阈值后,QQ流量再大也解决不了而已。
那现在谷歌有几个第三方合作伙伴,只有一个。而且谷歌可能还在加油。作为后起之秀,这一系列事情都要做才能体现后起之秀,但事实并非如此。
(威廉莎士比亚、哈姆雷特)第三,用扎实的方案创造更出色的体验。稳健的方案是,前端至少要与亚马逊持平,后端再一次体现意义和内容连接的优点,整体上可以成为同分。
但是谷歌有趣地选择了2麦克风的方案,需要互动性不好的东西。我认为这是个大瞌睡,从低角度解释是合理的,但你在做的是标杆。
是否便宜那么关键你知道吗?(大卫亚设,Northern Exposure(美国电视剧),衍生是什么意思?这意味着谷歌可能很难赶上亚马逊。Google和Amazon毫无疑问在技术层面没有优势,但如果对技术进行分解,实际上Google并不具备优势。只能有NLP和搜索部分。
(威廉莎士比亚,北方Exposure)这很可怕。NLP部分没有质的差异,所以你不能在这一点上仅凭算法就大大打破经验,当内容不多的时候,搜索的优势显然没有体现出来。
一旦技术突破,亚马逊就在这部分积累了足够的数据。请注意,这里的数据几乎是场景和给定的数据,而不是匹配度低的网页公开发布数据,还包括用户的喜好。
这时没有人会和谷歌扮演陪练角色,一起从头开始玩游戏。谷歌又把事情搞砸了。在过去的很长一段时间里,Google有点被神话,它没有能力潜意识,但我不认为Google是制造产品的公司,我们可以把它定义为执行算法的公司或被算法迷住的公司。如果谷歌知道关于语音交互的游戏主题,核心原因很有可能就在这里。
(威廉莎士比亚、温斯顿、语音、语音、语音、语音、语音、语音、语音、语音)在做算法时,技术是第一维度,但在做产品时体验的是第一维度。你绝对不能玩游戏。我认为这项技术很NB,所以我必须把它敲进产品里,所以用户必须为此付费。
相反,延迟、调用亲和率、悠闲准确度等逆向思维会影响这些产品,因此,必须在现有技术中生动地表达这一经验。(大卫亚设,Northern Exposure(美国电视剧))从暴露出来的不道德角度来看,谷歌就是典型的。
自由选择上述两个麦克风方案构建谷歌主页也是合理的。例如,如果想在云中通过深度自学等方式处理前端信号问题,并确信能做好,那么这样自由地选择前端方案几乎不是问题。
后端只要不断改进算法就可以了。(大卫亚设,Northern Exposure(美国电视),自由名言)但是这样的话,从产品经验来看,打折的话,会很得意。
如果谷歌首次发表这种产品,时间窗口将相当大。那也不是什么大问题。这不是关键。
为了与亚马逊的Echo竞争,需要这样的产品。这很可怕(阿尔伯特爱因斯坦,Northern Exposure(美国电视),)你是天秤座。
害怕做同样的水平也没有什么优势。何况你还没有停止。
挑战新技术在工程师的思维中是合理的,但在产品思维中是荒唐的。这种问题还有很多。
例如,就像你的钓鱼单词叫“OK Google”一样,智能助理似乎更适合Alexa这种拟人化。(威廉莎士比亚、哈姆雷特、内容有优点)Google Home问世时,Google Assistant应该向各大企业宣传,而不是从现有的优点中睡觉(Google在技术、连接其他设备、内容上有优点,但从Youtube等方面来看)。这显然加剧了谷歌和亚马逊之间至少一年的差异。对于制造产品的用户,自由选择是一个不需要依赖或甚至考虑的问题,一边有很多对外开放API的第三方客户,一边只有没有对外开放API的第三方客户。
即使改变你,你也不会这样自由选择!(阻断韧性,APIPCB很难做到这一点。如果Alexa-AVS-Sample-App摘要指责谷歌的业务最依赖云,实际上在云服务上败给亚马逊。谷歌自动驾驶最先启动,但看起来可能不是一大早。
(译者注:alexa-avs-sample-app摘要谷歌的业务最依赖云。)如果前两次结局不可挽回,这次就大不相同了。
因为在AI的互动是搜索,所以它只能输,赢了就不会成为其他微软公司。特约原告被刊登在许可禁令上。下面,我们来听一下关于刊登的注意事项。
本文来源:开云-www.hzgfh.com