一位阿里巴巴前员工的机器人梦,和一群在西溪湿地自由生长的猴子

两年前,两位前同事几乎同时离职。一位从事财务工作方面的做了投资人,一位实验室领头人创业成为了公司 CEO,投资人因为个人之间的信任在没有看到任何产品的情况下直接投资了这位创业同事的公司。

这本来是再正常不过的戏码,但如果你看到 Rokid 如今的发展,这听起来应该叫佳话了。

Misa 是 Rokid 公司的 CEO,Rokid 就是他离职阿里巴巴后参与创办的公司,这家公司目前的产品是家庭对话机器人。在加入阿里巴巴之前他创办了一家叫猛犸科技的公司,后来被阿里巴巴收购,他也随之进入阿里巴巴的 M 实验室,并成为这个实验室的牵头人,负责深度学习,图像识别等前沿技术。

楼军则现任 IDG 资本副总裁,负责风险投资。在得知 Misa 有要创业并推出 Rokid 这个产品的想法时,楼军连夜电话说服董事会投资 Rokid,为了说服董事会他还不惜用个人投资的形式做担保。

“从夜里提出方案到敲定投资 Rokid 几乎也只是一个晚上的时间,但那时候却连原型都没有,只有 Misa 给我画的一张图,他告诉我大概是一个蛋的形状,这里是音响。”

几个月后,Rokid 第一个代号 Alien 的产品拿出了原型机。一年后已经有一些媒体关注到这家公司进行了报道,但 Misa 仍然希望团队的状态是沉住气,希望媒体也多关注产品本身。

Misa 认为“一家制作家庭对话机器人的公司”这个概念其实并不是特别准确。在 Misa 的字典里,Rokid 从来就是一家主攻人工智能技术的公司,家庭对话机器人只是其软件系统的一个硬件落地。

两年之内将公司做到估值 4.5 亿美金——这是一份成绩非常优秀的答卷。

尽管预言到了人工智能的爆发趋势,但 Misa 自己可能也没想过资本会来的这么快,“我们都没有打算公开寻求风险投资机构的支持,最早的钱有些是自己当年卖公司的积蓄,另外也有一些朋友得知消息也慷慨相助。”Misa 在一篇自述中写下这样的一段话。

IMG_5079

“这里面包括我的学长(前 91 的 CEO,MFund 的胡泽民),我的老领导(阿里 18 个创始人之一的吴泳铭),还有好朋友姜皓天,当时刚刚起步的基金(王淮和张川的线性资本)。唯一一个知名基金就是 IDG。就这样我们凑了一笔钱开始了这个奇妙之旅。”

天使轮投资人吴泳铭无疑是一个重要的 VC 背书。吴泳铭是元璟资本创办人兼董事长,他是天使投资人,也是阿里巴巴十八创始人之一,其也是 Misa 在阿里巴巴工作时的顶头上司。

在吴泳铭看来,Misa “能把技术、产品、需求三者做到很好的兼顾和平衡”。Misa 还有一个外号是“中国版乔布斯”,Rokid 市场部一位员工告诉我,“这是楼军给他起的,是对他的一种认可,但 Misa 自己根本就不喜欢这个绰号。”

投资方大都是因人而投,而大部分天使轮投资的人对 Misa 要做的产品并没有一个完全的了解。

Misa 自己却对媒体说,“我希望大家都能去公司各个部门转转,关注到产品本身。”他越是这样说,就越构成了他这种独有的气质。

2014 年 12 月 Rokid 获得了 IDG、线性资本、Mfund、元璟资本数百万美金的天使轮投资;2015 年 7 月,Rokid 获得了华登国际领投,天使投资方跟投的千万美元 A 轮融资。

今年的 9 月份,尚珹资本进入到 Rokid B 轮。“Misa 在中国和美国都有求学经历,整合了中国跟美国智力上和文化上的长处。”在投资方面尚珹资本合伙人张顺也做出了基于对一个人的判断。

“以后价值肯定会翻 10 倍,20 倍。” Rokid CFO Eric Wong 在评价 4.5 亿估值时仍然是信心满满。

杭州西溪湿地,Misa 把 Rokid 公司的地址选在了这里。我第一次到这里还下着小雨,屋外有小后院和湖面。Rokid 在一栋二层小楼内办公,楼上楼下全部都是办公区,我进入这个区域挨个工位“扫荡”了一圈——如 Misa 所讲,并没有太多人会注意到我。

IMG_4791

几乎所有员工的工位前面都摆着一台若琪测试机,“他们大都是工程师,在调试代码。”一位同事转过身告诉我。

徐剑是 Rokid 的设计负责人,2014 年他加入了 Rokid,开始深入接触人工智能。Rokid 是一个可以通过智能语音与外界交流的设备,徐剑希望 Rokid 未来能像真人一样沟通说话。

“我们希望她本身不讨厌,最起码看起来也是一个艺术品,融入到环境。”他向我们介绍这款产品。

在他的认识里,不管产品的外形还是逻辑算法,设计本身的初衷是让 Rokid 看起来有温度,让用户感觉没有那么冰冷。就好像大白一样,它虽然几乎没有表情,但能够完成用户各种要求。Rokid 希望达成一点:表达情感,与用户建立信任。

这种对于产品设计的理解也可能蔓延到了公司本身。Rokid 喜欢这样描述自己的办公环境以及员工——他们说这里有这么一群猴子,他们在园区里自由的生活、生长,无拘无束…

IMG_4784

“之所以被称为猴子,是因为这里并没有设置传统的上下级关系,大家也都无拘无束”——你可以随时用你的想法挑战目前的方案,“如果你对现在的方案不满意,你可以提出一个更好的。”

徐剑只是所有猴子中的一个。在这家公司中,Rokid 所有团队成员大概有 90 人,其中博士学历占到了 20 人左右。Rokid 在北京和美国设置了两个实验室,北京实验室主要关注语音识别方面的技术研究;美国的实验室更偏向前沿技术领域。

“这里基本都非常开明,如果你有想法,有想做的事情,公司都会支持。”在机场回程的时候我碰到了 Rokid 的一位产品经理,他告诉他想尝试一种新的语音交互方式,公司一口答应立马派他去北京的实验室和同事交流。

Misa 在工作上很开放,在生活中看起来也像一个“玩乐派”,这些也或多或少构成了独有的气质。

Misa 喜欢养狗,是一只体型庞大的纽芬兰犬,但很温顺;Misa 喜欢机车,他就在自己的办公区域外摆上自己收藏的老爷车;Misa 喜欢咖啡,他租下了办公室旁边一个 100 多年前的古建筑弄了一个咖啡店。“他家还是一个类似车库一样的地方,他在门口还放了硕大的《星战》里的黑武士和白兵。”Misa 一位同事告诉我。

开放环境本身似乎跟传统意义上的大公司是冲突的。但在 Rokid 内确实有太多阿里巴巴的身影——Misa 本身是阿里巴巴 M 实验室的领头人,而这家公司的 CFO Eric Wong 是此前阿里巴巴的 VP。

Misa 近期在朋友圈也晒出了一张与阿里巴巴蔡崇信握手的合照,蔡崇信是阿里巴巴集团的副主席,还有一个外号是“马云背后的男人”。

一位不具姓名的员工告诉我,“创始团队中有一部分来自原阿里巴巴的成员。”

我追问了 Misa 阿里巴巴与 Rokid 之间的关系。Misa 告诉我后续可能会宣布一个大消息

“2014 年 7 月份离开阿里巴巴,9 月份团队到位。在 2014 年 11 月 15 号,这个产品就准备好了。”Misa 对整个产品早有一个清晰的构思。

Rokid 外形看起来像一个蛋但加上了一个音响底座——这是大部分人对于这款产品的第一眼印象。

11

徐剑作为设计负责人向我介绍了很多设计元素,我大体感受到了他对于外形设计的一些追求——她首先要看起来好看,放在任何家庭场景中不突兀,能融入到一体;它表现得应该像一个自然、原始的圆润元素有机体——不计成本以及工艺难度。

Rokid 会有三条路线,第一条是 Home AI,她用来陪伴你的家庭生活;第二条路叫 Portable AI,在之前的基础上更轻薄便携;第三条路是 Personal AI,这是一种跟在你身边的 AI,两年之后才会看到。

Misa 一直强调 Rokid 是一家强调 Serious AI 的公司——简而言之,他认为 AI 是一种技术方向,Rokid 作为一家人工智能公司,愿景和方向不会改变。

这都离不开一个大背景——就是承认语音交互技术的前景是毋庸置疑的。

有一些观点证明。KPCB 的明星分析师玛丽·米克尔在其 2016 年互联网趋势报告中将语音定义为新一代的「计算界面平台」,它是从 1832 年打孔卡片制表机诞生以来,人机交互行业经历三个触控式阶段之后,重新被发明的一次机会。

Rokid 的人工智能属性更大意义讲是“陪伴性”——通过语音交互。“很多我们的天使用户用上我的产品就不会在用手机去操控,比如用户需要听音乐只需要喊出我要听音乐。”

Rokid 在底座上各方面分别布置了八个高灵敏度的麦克风阵列,负责寻声采集和声纹识别。“而要实现语音的远场识别,必须在识别算法和噪音信号处理进行了诸多优化。”将语音、语义的理解与用户习惯结合理解,Misa 认为这是对“技术边界的打磨”。

当你需要问天气的时候也可以直接开口。Rokid 强调的是自然语言交流,你可以用各种方式跟她直接交流——比如“我想听歌”、“放点摇滚”、“来点音乐吧” 。Rokid 则与喜马拉雅 FM、网易新闻等达成合作来获取内容。

这只是 Rokid 本身最基础的功能。产品经理告诉我还可以预设一个场景,在这个场景下,你可以触发多个语音指令。比如在“早上好”这个场景下,你可以预设好,打开灯,打开窗帘,自动播放流行乐等命令。

机器智能和智能机器本身有着一定区别,这大概强调的是设备本身的学习性。

“在未来,我们希望这些交互都是基于语音的命令,比如我们通过优化算法让 Rokid 自己记住这些指令,而不是通过手机预设的方式,在闲聊的过程中记住你的喜好,自己学习到当你说早上好的时候,她就知道要打开窗帘了”,Rokid 的一位产品经理这样告诉我。

人工智能目前还不是一个特别赚钱的生意。

一方面市面上太多“伪 AI”的产品,这种类型的产品已经快速的推向市场,人们对于这个市场大体上会有这样的了解——“哦原来这就是 AI,原来一点都不智能”;第二方面,人工智能仍是一种晦涩难懂的技术,那些做技术,做研究的公司难以形成成熟的、体验好的产品,消费者群体对于 AI 概念普及度也不高,面向 C 端用户有着天然的屏障。

在人工智能的领域也是有标杆产品的,比如 Google Home、Amazon Echo 这些都是耳熟能详的硬件。微软也已经将“对话即平台”作为下一巨大平台——这背后也是自然语言语义理解技术。

即使已经发展了两年半,一家创业公司跳出来说要挑战大公司让人听起来会觉得可笑。不过在 Misa 的朋友圈,他不断推介着 Rokid Alien 与 Google Home 的一些对比演示,他不断强调“虽然我们不愿意做这个标杆,但是大家可以看我们产品与其他产品的对比。”在自然语言沟通来看, Rokid 看起来确实比 Google Home 要更容易听得懂人话。

“实际上在一些语言的沟通上,其实中国的技术并不比美国硅谷差太多。”Misa 这样评价产品的技术。

产品归产品,市场归市场——即使产品已经足够惊艳,但这也仅仅算走出了良好的第一步而已。

IMG_5078

Rokid Pebble

对于 Rokid 来说,拿出 Rokid Alien 只是第一步,最新推出的 Pebble 是第二步。尽管在 Misa 的规划里,这两个产品并没有前后更新跌代的关系——Alien 用来进入家庭场景,在技术方面做一定的积累;Pebble 则为了更贴近消费者,当然它拥有更有“Rokid 风味”的外形设计,并且会有一个更亲民的售价。

为了让产品快速的进入到市场,11 月 7 号,Rokid 和神州数码公司签订了总代协议,正式将神州数码作为 Rokid 的总代理,在发布会现场 Rokid 和神州数码还邀请到几百家代理伙伴。

在一众 AI 热的硬件中,神州数码集团助理总裁朱斌也认为这是他们看到的很靠谱的 AI 产品,“移动互联网时代的手机其实束缚了我们的双眼,双手。”他评价道。

“理论上 AI 提出已经有 100 多年的概念,这几年 AI 概念被重新认可,是因为计算能力提高,互联网的普及。接下来 3-5 年我认为会全面进入到 AI 的领域,不然会被淘汰掉。”

从 Home AI 到 Personal AI 其实是场景的转换,目前一些代表 Personal AI 的产品的核心问题是并没什么用。“总体来说产品体验好,保证其功能可靠,现在的一些语音助手还没有做到这两点,而最后一步就是要突破心灵的连接。”Misa 特别有信心地说。

订阅更多文章