百度的“可穿戴设备” BaiduEye与Google Glass有哪些不同？-品玩

有关百度“可穿戴设备”BaiduEye的消息最早是2013年3月份传出来的。那个时候，有媒体曝光百度正在开发一款类似Google Glass的产品，并公布了一张谍照，谍照上是一个普通眼镜，粗糙地捆绑了一块芯片，与Google Glass的产品思路看起来没有什么不同。时隔一年半时间，当在不久前的百度世界大会上被正式公布出来的时候，它已经变成了一款与Google Glass完全不同的产品。

显然，BaiduEye取消了像Google Glass那样的显示屏（用户可以通过Google Glass向视网膜上的投射，像看大屏幕那样看到信息），它的机身主体是一个摄像头和一个入耳式耳机。PingWest此前的报道里已经提到了它的使用方式：用户佩戴上之后，可以通过语音命令控制它，它会使用垂直向前的摄像头捕捉到用户面前的物体，通过Wi-Fi连接，进行在图像识别基础上的一系列的信息搜索和交互。而在一段百度官方的展示视频中，BaiduEye被用来在购物等场景中联网查找眼前的物品信息，再通过入耳式耳机返回语音搜索结果到用户。

所以你可以看到，BaiduEye与Google Glass的工作方式和使用场景有着许多不同之处：你可以利用Google Glass的屏幕和语音交互干各种各样的新奇酷的事情，甚至可以在它上面使用Evernote、查看邮件和信息，第一视角摄像只是它功能的一部分。而BaiduEye更像是一个跟随在人的眼睛旁边的“第三只眼睛”，在你需要的时候唤醒它，它会捕捉人面前的物品图像或是记录，再上传到百度的搜索网络处理，返回服务。

而在百度开发这个项目的团队——百度深度学习研究院（IDL）看来，他们也把BaiduEye和Google Glass定义为两个不同品类的可穿戴设备。不久前，PingWest参加了百度深度学习研究院副院长余凯的一次内部分享演讲，余凯详细解释了百度为什么要开发BaiduEye、它的产品外观和功能设计思路、未来的使用场景甚至商业化空间——以及在这些方面，BaiduEye与Google Glass有着怎样的不同。

顾名思义，百度的初衷是让BaiduEye成为一个“眼睛”。余凯认为，手机正在越来越懂用户，了解用户的个人信息、知道他们每天关心的内容和习惯。而在人们日常的手机使用中，摄像头在一定程度上代替了眼睛的功能：把看到的感兴趣的内容捕捉下来、对图像进行搜索、把照片分享给朋友……如果想要手机更加了解用户，必须更多地了解用户每天都看到了什么——余凯说，大脑每天收到的信息有90%以上是通过视觉获得的。

所以，百度开发BaiduEye的基本思考是：让这个设备成为人眼的自然延伸。

注意，他们还并不想让用户与BaiduEye之间发生视觉交互，也就是配备一块屏幕。余凯认为，想要做到让BaiduEye成为人眼的延伸，首先要做到的是有一个无障碍的视野，用户看到的就是它“看到”的，两者之间通过语音来交流。余凯坦白地表示，Google Glass会让用户的视力首先受到影响，而这是一件很糟糕的事情。他认为Google Glass的操作是“反人类”的设计。

来看看BaiduEye是怎样成为“人眼的延伸”的。它的主体是在脑袋右侧伸出的摄像头。用户可以使用语音命令控制它来捕捉眼前的图像。此前在百度世界大会上，百度主要展示的是利用手势“取景”的方式进行图像搜索的场景，即用户用手势在想要捕捉的物体周围划一个圈，BaiduEye会通过算法识别用户圈定的物体，再上传到网上，利用百度大脑的图像识别技术、搜索物体在网络上的相关信息，再用语音的方式反馈到用户左耳的耳机里。而实际上这只是BaiduEye的一种使用方式。用户还可以通过红外线扫描来进行图像捕捉：当你按下摄像头旁边的按钮，BaiduEye会投射出一条红外线，然后会自动捕捉和搜索红外线所落在的物体。

在百度深度学习研究院的现场演示中，BaiduEye主要有一个作用，就是搜索人面前的物品信息。当BaiduEye捕捉到一款商品的图像之后，会自动把图像发送到网上进行识别，再把从百度百科等网站里找到的商品信息“念”给用户听。而且，BaiduEye会在用户的手机上配有一个专门的APP，搜索到的结果信息也会同时被推送到这个APP上展示。

你可能觉得这种操作方式和功能过于简单了。不过在余凯看来，这正是BaiduEye不同于Google Glass的地方——他认为，Google Glass的使用没有一个特定的垂直场景，“一个用户从他醒来到睡觉，一整天的时间里面你不知道哪一个时刻和很清晰的场景是要用Google Glass来做的”。

那么BaiduEye是为怎样的“时刻”和“清晰的场景”设计的呢？余凯的答案是“O2O”。余凯认为：Google Glass主要是一个to C的产品，而百度把BaiduEye定义为一个to B的产品。目前它的使用场景专注在两个方面：商场购物和博物馆游览。

如果你是顾客，佩戴上BaiduEye可以随时搜索货架上商品的信息以及网络上对这个商品的评价，同时它会记录下你放弃和购买了哪些商品，向你推荐相关商品，甚至向你推荐与已经购买的上衣搭配的裤子，它就在这家商场的另外一家门店出售……

不过，这并不是百度最想做的。百度想让BaiduEye给线下商家使用，来捕捉顾客在购物过程当中的行为，比如你拿起了哪些商品，在哪些货架前面停留，最后决定购买了哪件……在这些信息的基础上，商场导购可以顺势向顾客推荐相关的打折促销和优惠信息。

“我们目前主要考虑的是to B的环境。BaiduEye的图像识别都是通过百度大脑来完成的，它可以在后台进行大量的数据分析，再推送到BaiduEye中。比如说，商店在交钱的地方一般都有一个小的货架，那个货架的意思就是想让你在排队结账的时候再买点东西。而使用了BaiduEye的商家就可以根据你在整个店面里所有的关注行为，为你提供一个你私人定制离店货架。”余凯说。

在百度世界大会上，百度与银泰商业共同宣布了一件事：银泰的线下商店将会引进BaiduEye，为商场导购配备，来帮助完成上面所说的场景。余凯说，这就是现阶段百度向商家推广BaiduEye的思路：暂不开放，而是挑选一些线下商家为合作伙伴，一起在使用过程当中针对具体场景进行优化，同时进行产品迭代，而且百度计划将BaiduEye向商家合作伙伴免费提供。

而余凯提到的另一个使用场景“博物馆导游”就更容易被理解了：百度想让它来代替导游和传统导游机的作用。

在此之外，余凯还描述了另一种更有意思的使用场景——比如工人在修复电缆线的时候，会出现的一个的问题是有能力处理故障的专家并不在现场。BaiduEye可以在这种场景下，让工人佩戴着BaiduEye在现场操作，专家通过现场录像进行远程指导。事实上，这种“远程同步”的操作也早已经开始用另一种方式实现了——不久前，一位欧洲医生在手术过程中把GoPro戴在头上，以第一视角拍摄了整个手术过程，而在手术室外的实习医生们就可以戴上Oculus Rift用第一视角还原整个手术的过程了。而用BaiduEye，这个过程甚至可以达到同步进行。当然，Google Glass也完全能够胜任这个任务。

接下来，BaiduEye在今年年内还会进行两次迭代，两次都会以外观上的更新为主——毕竟它还是一个需要被佩戴在人们脑袋上的东西，不能太丑。

看到这里你差不多应该了解BaiduEye了。现在问题来了，当商场里的导购们都佩戴着这样一个设备，用前突的摄像头捕捉顾客的一举一动，你的心里会作何感想？

以下是余凯关于媒体对BaiduEye的一些问题的回答，由PingWest编辑整理如下：

BaiduEye接下来的两次迭代会是什么思路？只是做得更轻更时尚，还是会增加更多传感器等功能？

余凯：主要是更好看时尚。目前来讲，在设计上发生了些故事，使我们来不及改进，后面迭代我们会发生翻天覆地的变化，甚至可能会取消掉脑袋后面的电池。但是这个问题可以解决，对于一个人最关注的是什么？是脸的长相。BaiduEye不会在你面前罩个什么东西，你的视野是一览无余的。当然后面这个东西的美观我们也认为很重要，所以我们会找很著名的时尚设计师跟我们一起来合作设计。

商家们关心顾客在店内活动的信息么？

余凯：商家会用数据来帮助提高服务质量，其实商家们现在已经在做这个事情了。比如说像尼尔森会提供这样的服务，一些商家在摆一个货架时，他会在旁边你看不见的地方录像，录大概一个礼拜，记录数据，再把这个数据提供给商家，进而优化他的货架摆放。

两个问题，一个是用户到商店里面，如果我从来没有用过BaiduEye，那么商家怎么为TA提供服务？第二个问题，如果他使用BaiduEye，他的哪些信息会被商家识别到？通过怎样的方式、存储在哪里？

余凯：一种是老客户，BaiduEye会在手机上面有一个相应的APP，进店的时候会有一个二维码，商家会通过二维码把你们匹配起来。对于新的用户，其实对于识别他是谁，我们不是那么关心，我们更关心的是他在店里的行为。就像我们不关心你的名字，但我们更关心你爱吃什么菜，所以至于说真正识别这个人并不重要，你这个人在购物过程中对什么东西关心，这是我们所关心的。

这个听起来很酷，但不是刚性需求，可能很难大规模推广。

余凯：对于用户来讲，到了商场里面，可能想要知道这个商品大家的评价怎么样，对你可能不一定是刚性需求，但对有的人来讲就是刚性需求。比如说我们预测的出来你非常需要这些商品推荐给你，同时这些商品是打折的，这件事对你不是刚需，对有些人是刚需。再或者，推荐给你的商品不是打折的，但是你之前没有想到，看到之后却很喜欢的。以亚马逊为例，他们30%的商品销售是顾客上网站之前原本不想买的东西。

再比如，我前段时间去了陕西博物馆，搞了一个导游机，需要在听介绍之前输入编号信息才行，很麻烦。

你们和合作商家的数据是相互共享吗？

余凯：这个还在沟通的过程中，但是数据基本上对双方来说是共享的。

BaiduEye是你们的试水么？

余凯：BaiduEye不是试水。在几年以后某种设备一定会成为主流，它知道你在做什么，然后非常清晰地帮助你。它可能不是百度做的，可能是某个公司做的，但我们希望是百度做的。

百度的无人汽车和无人机项目，核心也是百度大脑。BaiduEye只是当中的一个模块，它有什么侧重点吗？

余凯：百度大脑是一个智慧的能力，但是这个能力必须要通过物理的实现才能得到伸展。传统上来讲，所有的互联网服务都是完全是线上的虚拟服务，但是这个是不完整的。比如我定了一个披萨，如果你完全在信息世界里扭转，这个披萨不会发生，一定是这个人拿着这个信息去做一个披萨，一定是真实的人骑着自行车或者是开着车送到你家里，所以未来一定是虚拟世界到物理世界融合的过程。互联网最后的一公里实际上是物理世界，它有可能将来会被优化。比如说，我有成千上万的参数知道你需要什么东西，但是一个做披萨店里面的人是不知道的，也不能做个性化的披萨；但如果一个机器人做披萨，这些参数会起作用：你的佐料需要放多少量，等等。最后，披萨会通过怎样高效的方式送到你家里去？它很有可能是一部无人驾驶汽车送到你家里。

会不会开放给开发者？

余凯：开发者开放这块可能是后面的计划，现在还没有考虑。一开始我们选择有价值的垂直行业去重点优化BaiduEye在里面的交互体验，如果完全地开放去做，我们不认为这是最好的推行方式。

还有就是，如果我们这个东西将来对开发者开放的话，就会设计价格问题。我们现在2B的模式是不涉及到价格的，肯定是免费的。如果涉及到价格，将来我们要去做这种更广泛的应用场景合作，这个价格肯定是很便宜很便宜。

BaiduEye现在的交互方式还有点儿傻。

余凯：我们一开始设计的时候有一个原则，就是一定要轻交互。它不是一个语音助手，它一定让用户有一个明确的预期，是来说话的。Siri很失败的地方就是，它给用户很高的预期，它设想可以告诉你百度股票多少钱，今天涨没涨，你可以用各种各样的方法来问一件事情。现在的人工智能，Siri达不到这种程度。我们只是给你一些指令性的东西，你可以开启这个东西，查一下。所以一定是轻交互。而且接下来，如果语音反馈太长，我们会限制住，长篇大论会显示在手机里。但现在我们还没有做到这一点。