品玩

科技创新者的每日必读

打开APP
关闭
智能音箱

发布了智能音箱领域的iPhone后,Rokid想把自己开放成语音交互的Android

Misa不满足Rokid被称作中国版Echo——“不客气地说,我们现在更像是Google加Apple。”

王飞

发布于 2017年10月17日

10月12日,阔别阿里三年之久的Rokid创始人兼CEO祝铭明(Misa)作为云栖大会演讲嘉宾再次现身,这个几乎不参加公开场合的低调CEO在现场宣布了行业重磅消息:Rokid(若琪)将与阿里云携手合作,共同推出全栈语音开放平台(turn key solution),为业界提供一站式语音解决方案。

全栈语音开放平台(turn key solution)由Rokid提供端到端的全栈技术方案,由阿里云提供云端支持,现在正通过这种合作的方式向业内开放。也就是说,音箱提供商、甚至是个人开发者使用这个全栈开放平台可以快速的复制Rokid智能音箱的全部语音能力。

Misa这个人很Geek,又特别容易打开话匣子,是很典型的加州人风格;多数人的眼中,他对产品细节考究,对团队要求苛刻,但又在一些无关紧要的小事儿上,他不拘小节,保持了一种独立个性的风格。多数见过他本人的人,都或多或少会被他的这种个人魅力吸引。

多数有理想的创业公司的目标都是打造一台“iPhone”,意思是说在产品设计、研究、制作方向上保持极其前沿先进的思维,甚至执拗。在Misa眼中,Rokid Alien、Pebble都是这样的产品。然而,正式在研发三年、推出两代“iPhone”产品后,今天它又把Rokid的技术开放的像一个Google Android的一样。

很多疑问。在这个时间点,为什么一家创业公司也选择做开放和平台?这个全栈语音技术平台的开放和阿里巴巴本身天猫精灵之间有什么样的关系?这种模式和百度DuerOS开放的模式又有怎样的区别?

开源开放,是投下一个炸弹,也是新兴领域的第一时期

不过,先说道开源开放,扔炸弹真是听了太多次了。

当年我们还玩不起智能手机的时候,MTK的开放造就了时下最火热的山寨机概念,也是通过这样的方式,MTK几乎在杂乱无序的手机时代里铺满了市场;后来来到了Android时代,它也因为开放成了如今唯一可以和iOS较量的手机平台,现在是我们谈论任何新兴市场的标杆性生态。

去年我们讲VR的时候,我也看到了不少公司再讲开源开放,比如HTC Vive和Vavle共同开放Lighthouse的定位技术,来助推6DOF VR头盔的发展,当时也有不少媒体就说Vavle扔出了重磅炸弹;今年年初,百度陆奇也开放了阿波罗自动驾驶计划,一些媒体也说陆奇扔下了自动驾驶领域的一颗炸弹。

先把炸弹放一边,开源开放其实从来就是一件大好事。但侧面的理解,开源和开放,其实都只能算是一个领域的不成熟期。

这个时期大家摸着石头过河,有人喜欢做封闭,有人喜欢做开放,因此这个时期会产生无数的标准和协议制定者;不过,正是在接下来的这场战争中,会留下最后几个标准开放者。而后,才会产生iOS这种封闭标准定义者以及生态内的跟随者。

对于智能音箱,我一直认为——何时出现封闭标准定义者和跟随者,这个时间点非常重要。

所以在不成熟期,开源几乎是培养这个市场持续下去的唯一条件。

我或多或少的在Misa的谈话里也提炼出了类似的观点。他认为一个新形态的产品,第一时期只能在自己的产品上做功夫,持续打磨体验,小切口切入;然后第二时期,有可能进一步的形成平台和入口通路;至于,大家特别爱谈论的和其他产品进行交互,产生生态,如何炫酷地和生态交互起来,其实是最后产业成熟期的事儿了。对于智能音箱来说,确实还有一段时日。

而在这个不成熟期,Rokid选择用已经被打磨好、成熟的技术推动市场前进。Rokid和阿里云的开放战略是——提供了一个完整直接可用的硬件开发板,开源了他们全部的语音技术,部分已经写好的系统代码。

先来看看这个开发板。在这个黑色的圆形开发板上,集成了CPU、GPU、蓝牙、麦克风阵列等所有涉及到语音开发的需求,甚至还设置好了音频、电源、HDMI视频接口,它其实就可以理解为Amazon Alexa的Echo Dot,到手插上即用。

而使用这个开发板,就可以结合已有的两套分别搭载Linux和Android操作系统的开发套件,根据需要选择阿里云或Rokid的语音服务,双方共享海量语音技能,完全开放给开发者及合作伙伴使用。

在Misa这里,他愿意给这些事儿加一个前提或者划个重点——“全栈真开源、真开放。”

真开源是优势,其实就是你到底要共享多少的态度问题。在Rokid这里,除了共享了70%的系统框架代码,连这个小小开发板的设计图纸甚至也已经给开发者准备好,另外——

Rokid开放的语音技术包括语音识别、信号分析处理、语音合成、语义理解、自定义唤醒词、声纹识别、个性化语音合成、语种识别、自定义对话引擎等等。总之,在整个链条上的语音技术会全部开放。

在Rokid自家产品上开发的无版权服务也都将直接免费开放给合作伙伴,而一些需要授权的合作商内容也可以通过Rokid享受合作价格。在生态连接上,开发套件也会与阿里小智、小米、Lifesmart、Broadlink等多家公司的智能家居产品直接连通。

有了这样一个漂亮的开发板,它完整到甚至直接接上电脑插上耳机,就完成了给你的耳机添加上“语音交互”的动作。

所以,一它是可以连接任何已有的传统音箱升级为智能对话音箱,享受完整的Rokid产品的技术能力;二它可以作为开发者的开发套件,在Rokid原有生态之上,为它添加更多的技能。

在新闻稿中提到——从此以后,不管是是个人还是公司,都能够轻松打造像若琪一样优质语音体验的交互设备,让身边电视,冰箱甚至机顶盒,开口说话,为你提供服务。

 

好了,现在炸弹扔出去了,这个阶段到底把谁炸飞了?

首先它绝对不会对一些C端的用户产生直接影响,对于一个B端开放方案、作为一个全链条、端对端的AI公司,被波及的也将会是处于这条链路上某个单一环节的公司。

比如说有些公司光训练和定义一个个性的唤醒词就收取几十万的公司,有些公司会提供一个收费的语音方案,Misa认为这样的商业模式将会直接被摧毁。毕竟人家也可以自定义唤醒词了,还开放了语音技术,还不收费.....

不过,那么多大公司如百度腾讯,都推出了云业务下的开放平台,三家公司三种开放,Rokid和阿里云的优势在哪?

对比来看,百度腾讯目前都属于没有尖刀型产品的公司——对于自己打磨产品,目前还没有看到他们走完一个完整的链条。

对于阿里巴巴本身来说,天猫精灵和Rokid也并没有形成左右互搏的局面——Rokid更像是一个典型的技术产品特种部队,优秀的产品提供更好的开源技术;而天猫精灵产品更像是天猫购物的一个补充,两者的“人设”不同。

对于Misa来说,衡量一个语音产品的唯一标准就是用户体验。他认为,这只有实际打磨硬件产品的过程中,才会懂用户究竟需要什么样的智能语音产品,虽然国内已经存在多家语音开放平台,但Rokid是国内唯一一家兼具一流产品与平台实力的人工智能公司。

正因为如此,Misa坚定认为Rokid也是唯一能够提供真正全栈方案,并实现真开放的AI公司。

在云栖大会的现场,Misa谈到——AI时代的产品,无法像移动互联网一样通过手机这样的单一产品形态去赢得整个战场,所以既要专注,把产品软硬件、端对端的用户体验打磨到最好;又要开放,让有想法的开发者,可以用过你打磨好的技术,去创造出更多品类的智能产品。

本质上,AI时代的产品和手机时代的产品还是有些不同的,他们的发展轨迹可能也不尽相同。

 

一个Google加Apple的故事

在常人眼中,Rokid像是一家智能音箱公司。但其实在业内,Rokid一直是一家打造全链条AI技术的公司,不只是一家智能音箱公司......

Rokid将会继续推出的新的AI产品,听说Rokid Pebble系列的新品会更小,在明年CES的时候,还会登陆一个采用先进视觉的AI产品,视觉技术由Rokid美国R-Lab提供。并且,Misa本人还在琢磨造机器人的事儿。

Rokid如今的商业模式可以这样理解——从前都是按照iPhone的标准造亲儿子,卖产品;而现在是尖刀产品和技术开放双线走,其实成了另外一个Pixel和Google Android的故事。

在这个模式的背后其实是两个机动部队,技术开放部门和产品部门。在创立之初,Misa就已经规划好了这样的路径。

Rokid仍然不会出低价产品,自家尖刀型产品的价格会继续往高端走,他们会通过B端开放战略覆盖更低的价位段,让有一些妥协的公司拿着自己成熟的技术方案去499、599那些区间里厮杀——从一家用枪打仗的公司,转变为给行业卖枪的公司,并且自己研究更好的炮。

Misa不满足Rokid被称作中国版Echo——“不客气地说,我们现在更像是Google加Apple。”

下载品玩App,比99.9%的人更先知道关于「智能音箱」的新故事

下载品玩App

比99.9%的人更先知道关于「智能音箱」的新故事

iOS版本 Android版本
立即下载
王飞

资深作者 线索采集微信:xcodejk关注智能硬件市场及汽车商业领域

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测