百度的“可穿戴设备” BaiduEye与Google Glass有哪些不同?

BaiduEye

有关百度“可穿戴设备”BaiduEye的消息最早是2013年3月份传出来的。那个时候,有媒体曝光百度正在开发一款类似Google Glass的产品,并公布了一张谍照,谍照上是一个普通眼镜,粗糙地捆绑了一块芯片,与Google Glass的产品思路看起来没有什么不同。时隔一年半时间,当在不久前的百度世界大会上被正式公布出来的时候,它已经变成了一款与Google Glass完全不同的产品。

显然,BaiduEye取消了像Google Glass那样的显示屏(用户可以通过Google Glass向视网膜上的投射,像看大屏幕那样看到信息),它的机身主体是一个摄像头和一个入耳式耳机。PingWest此前的报道里已经提到了它的使用方式:用户佩戴上之后,可以通过语音命令控制它,它会使用垂直向前的摄像头捕捉到用户面前的物体,通过Wi-Fi连接,进行在图像识别基础上的一系列的信息搜索和交互。而在一段百度官方的展示视频中,BaiduEye被用来在购物等场景中联网查找眼前的物品信息,再通过入耳式耳机返回语音搜索结果到用户。

所以你可以看到,BaiduEye与Google Glass的工作方式和使用场景有着许多不同之处:你可以利用Google Glass的屏幕和语音交互干各种各样的新奇酷的事情,甚至可以在它上面使用Evernote、查看邮件和信息,第一视角摄像只是它功能的一部分。而BaiduEye更像是一个跟随在人的眼睛旁边的“第三只眼睛”,在你需要的时候唤醒它,它会捕捉人面前的物品图像或是记录,再上传到百度的搜索网络处理,返回服务。

而在百度开发这个项目的团队——百度深度学习研究院(IDL)看来,他们也把BaiduEye和Google Glass定义为两个不同品类的可穿戴设备。不久前,PingWest参加了百度深度学习研究院副院长余凯的一次内部分享演讲,余凯详细解释了百度为什么要开发BaiduEye、它的产品外观和功能设计思路、未来的使用场景甚至商业化空间——以及在这些方面,BaiduEye与Google Glass有着怎样的不同。

顾名思义,百度的初衷是让BaiduEye成为一个“眼睛”。余凯认为,手机正在越来越懂用户,了解用户的个人信息、知道他们每天关心的内容和习惯。而在人们日常的手机使用中,摄像头在一定程度上代替了眼睛的功能:把看到的感兴趣的内容捕捉下来、对图像进行搜索、把照片分享给朋友……如果想要手机更加了解用户,必须更多地了解用户每天都看到了什么——余凯说,大脑每天收到的信息有90%以上是通过视觉获得的。

所以,百度开发BaiduEye的基本思考是:让这个设备成为人眼的自然延伸。

注意,他们还并不想让用户与BaiduEye之间发生视觉交互,也就是配备一块屏幕。余凯认为,想要做到让BaiduEye成为人眼的延伸,首先要做到的是有一个无障碍的视野,用户看到的就是它“看到”的,两者之间通过语音来交流。余凯坦白地表示,Google Glass会让用户的视力首先受到影响,而这是一件很糟糕的事情。他认为Google Glass的操作是“反人类”的设计。

来看看BaiduEye是怎样成为“人眼的延伸”的。它的主体是在脑袋右侧伸出的摄像头。用户可以使用语音命令控制它来捕捉眼前的图像。此前在百度世界大会上,百度主要展示的是利用手势“取景”的方式进行图像搜索的场景,即用户用手势在想要捕捉的物体周围划一个圈,BaiduEye会通过算法识别用户圈定的物体,再上传到网上,利用百度大脑的图像识别技术、搜索物体在网络上的相关信息,再用语音的方式反馈到用户左耳的耳机里。而实际上这只是BaiduEye的一种使用方式。用户还可以通过红外线扫描来进行图像捕捉:当你按下摄像头旁边的按钮,BaiduEye会投射出一条红外线,然后会自动捕捉和搜索红外线所落在的物体。

在百度深度学习研究院的现场演示中,BaiduEye主要有一个作用,就是搜索人面前的物品信息。当BaiduEye捕捉到一款商品的图像之后,会自动把图像发送到网上进行识别,再把从百度百科等网站里找到的商品信息“念”给用户听。而且,BaiduEye会在用户的手机上配有一个专门的APP,搜索到的结果信息也会同时被推送到这个APP上展示。

你可能觉得这种操作方式和功能过于简单了。不过在余凯看来,这正是BaiduEye不同于Google Glass的地方——他认为,Google Glass的使用没有一个特定的垂直场景,“一个用户从他醒来到睡觉,一整天的时间里面你不知道哪一个时刻和很清晰的场景是要用Google Glass来做的”。

那么BaiduEye是为怎样的“时刻”和“清晰的场景”设计的呢?余凯的答案是“O2O”。余凯认为:Google Glass主要是一个to C的产品,而百度把BaiduEye定义为一个to B的产品。目前它的使用场景专注在两个方面:商场购物和博物馆游览。

如果你是顾客,佩戴上BaiduEye可以随时搜索货架上商品的信息以及网络上对这个商品的评价,同时它会记录下你放弃和购买了哪些商品,向你推荐相关商品,甚至向你推荐与已经购买的上衣搭配的裤子,它就在这家商场的另外一家门店出售……

不过,这并不是百度最想做的。百度想让BaiduEye给线下商家使用,来捕捉顾客在购物过程当中的行为,比如你拿起了哪些商品,在哪些货架前面停留,最后决定购买了哪件……在这些信息的基础上,商场导购可以顺势向顾客推荐相关的打折促销和优惠信息。

“我们目前主要考虑的是to B的环境。BaiduEye的图像识别都是通过百度大脑来完成的,它可以在后台进行大量的数据分析,再推送到BaiduEye中。比如说,商店在交钱的地方一般都有一个小的货架,那个货架的意思就是想让你在排队结账的时候再买点东西。而使用了BaiduEye的商家就可以根据你在整个店面里所有的关注行为,为你提供一个你私人定制离店货架。”余凯说。

在百度世界大会上,百度与银泰商业共同宣布了一件事:银泰的线下商店将会引进BaiduEye,为商场导购配备,来帮助完成上面所说的场景。余凯说,这就是现阶段百度向商家推广BaiduEye的思路:暂不开放,而是挑选一些线下商家为合作伙伴,一起在使用过程当中针对具体场景进行优化,同时进行产品迭代,而且百度计划将BaiduEye向商家合作伙伴免费提供。

而余凯提到的另一个使用场景“博物馆导游”就更容易被理解了:百度想让它来代替导游和传统导游机的作用。

在此之外,余凯还描述了另一种更有意思的使用场景——比如工人在修复电缆线的时候,会出现的一个的问题是有能力处理故障的专家并不在现场。BaiduEye可以在这种场景下,让工人佩戴着BaiduEye在现场操作,专家通过现场录像进行远程指导。事实上,这种“远程同步”的操作也早已经开始用另一种方式实现了——不久前,一位欧洲医生在手术过程中把GoPro戴在头上,以第一视角拍摄了整个手术过程,而在手术室外的实习医生们就可以戴上Oculus Rift用第一视角还原整个手术的过程了。而用BaiduEye,这个过程甚至可以达到同步进行。当然,Google Glass也完全能够胜任这个任务。

接下来,BaiduEye在今年年内还会进行两次迭代,两次都会以外观上的更新为主——毕竟它还是一个需要被佩戴在人们脑袋上的东西,不能太丑。

看到这里你差不多应该了解BaiduEye了。现在问题来了,当商场里的导购们都佩戴着这样一个设备,用前突的摄像头捕捉顾客的一举一动,你的心里会作何感想?

 

以下是余凯关于媒体对BaiduEye的一些问题的回答,由PingWest编辑整理如下:

BaiduEye接下来的两次迭代会是什么思路?只是做得更轻更时尚,还是会增加更多传感器等功能?

余凯:主要是更好看时尚。目前来讲,在设计上发生了些故事,使我们来不及改进,后面迭代我们会发生翻天覆地的变化,甚至可能会取消掉脑袋后面的电池。但是这个问题可以解决,对于一个人最关注的是什么?是脸的长相。BaiduEye不会在你面前罩个什么东西,你的视野是一览无余的。当然后面这个东西的美观我们也认为很重要,所以我们会找很著名的时尚设计师跟我们一起来合作设计。

商家们关心顾客在店内活动的信息么?

余凯:商家会用数据来帮助提高服务质量,其实商家们现在已经在做这个事情了。比如说像尼尔森会提供这样的服务,一些商家在摆一个货架时,他会在旁边你看不见的地方录像,录大概一个礼拜,记录数据,再把这个数据提供给商家,进而优化他的货架摆放。

两个问题,一个是用户到商店里面,如果我从来没有用过BaiduEye,那么商家怎么为TA提供服务?第二个问题,如果他使用BaiduEye,他的哪些信息会被商家识别到?通过怎样的方式、存储在哪里?

余凯:一种是老客户,BaiduEye会在手机上面有一个相应的APP,进店的时候会有一个二维码,商家会通过二维码把你们匹配起来。对于新的用户,其实对于识别他是谁,我们不是那么关心,我们更关心的是他在店里的行为。就像我们不关心你的名字,但我们更关心你爱吃什么菜,所以至于说真正识别这个人并不重要,你这个人在购物过程中对什么东西关心,这是我们所关心的。

这个听起来很酷,但不是刚性需求,可能很难大规模推广。

余凯:对于用户来讲,到了商场里面,可能想要知道这个商品大家的评价怎么样,对你可能不一定是刚性需求,但对有的人来讲就是刚性需求。比如说我们预测的出来你非常需要这些商品推荐给你,同时这些商品是打折的,这件事对你不是刚需,对有些人是刚需。再或者,推荐给你的商品不是打折的,但是你之前没有想到,看到之后却很喜欢的。以亚马逊为例,他们30%的商品销售是顾客上网站之前原本不想买的东西。
再比如,我前段时间去了陕西博物馆,搞了一个导游机,需要在听介绍之前输入编号信息才行,很麻烦。

你们和合作商家的数据是相互共享吗?

余凯:这个还在沟通的过程中,但是数据基本上对双方来说是共享的。

BaiduEye是你们的试水么?

余凯:BaiduEye不是试水。在几年以后某种设备一定会成为主流,它知道你在做什么,然后非常清晰地帮助你。它可能不是百度做的,可能是某个公司做的,但我们希望是百度做的。

百度的无人汽车和无人机项目,核心也是百度大脑。BaiduEye只是当中的一个模块,它有什么侧重点吗?

余凯:百度大脑是一个智慧的能力,但是这个能力必须要通过物理的实现才能得到伸展。传统上来讲,所有的互联网服务都是完全是线上的虚拟服务,但是这个是不完整的。比如我定了一个披萨,如果你完全在信息世界里扭转,这个披萨不会发生,一定是这个人拿着这个信息去做一个披萨,一定是真实的人骑着自行车或者是开着车送到你家里,所以未来一定是虚拟世界到物理世界融合的过程。互联网最后的一公里实际上是物理世界,它有可能将来会被优化。比如说,我有成千上万的参数知道你需要什么东西,但是一个做披萨店里面的人是不知道的,也不能做个性化的披萨;但如果一个机器人做披萨,这些参数会起作用:你的佐料需要放多少量,等等。最后,披萨会通过怎样高效的方式送到你家里去?它很有可能是一部无人驾驶汽车送到你家里。

会不会开放给开发者?

余凯:开发者开放这块可能是后面的计划,现在还没有考虑。一开始我们选择有价值的垂直行业去重点优化BaiduEye在里面的交互体验,如果完全地开放去做,我们不认为这是最好的推行方式。

还有就是,如果我们这个东西将来对开发者开放的话,就会设计价格问题。我们现在2B的模式是不涉及到价格的,肯定是免费的。如果涉及到价格,将来我们要去做这种更广泛的应用场景合作,这个价格肯定是很便宜很便宜。

BaiduEye现在的交互方式还有点儿傻。

余凯:我们一开始设计的时候有一个原则,就是一定要轻交互。它不是一个语音助手,它一定让用户有一个明确的预期,是来说话的。Siri很失败的地方就是,它给用户很高的预期,它设想可以告诉你百度股票多少钱,今天涨没涨,你可以用各种各样的方法来问一件事情。现在的人工智能,Siri达不到这种程度。我们只是给你一些指令性的东西,你可以开启这个东西,查一下。所以一定是轻交互。而且接下来,如果语音反馈太长,我们会限制住,长篇大论会显示在手机里。但现在我们还没有做到这一点。

订阅更多文章