没有遥控器的未来

初创公司PredictGaze认为一项可以识别你的视线落点和面部表情的技术将会在未来大放异彩。

Ketan Banjara的客厅里并没有成堆的遥控设备。他只需把一根手指放在唇边做出嘘的动作,音乐就会自动关上;当他从沙发上站起离开房间时,电视就会自动关闭。

Banjara是PredictGaze的创始人之一,该公司设计出的一款软件可以进行视线跟踪、手势识别和面部特征识别,让顾客可以以一种更自然的方式控制家里的一切。

在人们刚接触触屏设备时,PredictGaze便预言无需触摸的控制方式将会成为一项重要的技术革新,各种设备上的前置摄像头让这种技术实现成为可能。

到目前为止,PredictGaze的软件已经被植入一款iOS游戏中。在这款游戏中,用户可以通过转动头部控制怪兽。日本的一些商店也在对这种技术进行测试,在顾客驻足某商品时,摄像头将会记录他们的性别、面目表情和驻足时间,得到的数据将有助于提高销售额,比如给犹豫不决的顾客适时奉上优惠券或是改善广告植入方式。

PredictGaze 认为该项技术在应用方面大有可为,例如当你开车犯困时通过面部表情的识别来及时提醒你。

PredictGaze的技术集机器学习和计算机视觉算法为一体,在一个支持标准VGA摄像头的软件中,该软件可以探测出你的视线、性别、表情甚至是你的动作等,设备识别出这些信息后将会采取相应的回应。

该种软件也可以识别人的年龄,PredictGaze通过大量不同年龄人的照片来训练自己的软件识别,这样的话,当你站在一个比如iPad这样的有摄像头的设备前,这个软件就可以识别你的年龄。

同样的,为了能够识别“嘘”这一动作,该公司训练自己的软件识别数千幅“嘘”与“不嘘”的图片信息。在进行视线跟踪时,摄像头会不停地捕捉你的眼神动作,并经过计算得出你视线落点。而你也可以通过眼神控制游戏中的人物。

“这并不是几种技术的集合体,而是一个支持面部、动作和视线识别的新技术,这是一个创新。” Banjara说。

PredictGaze称该公司软件处理采集的信息都是在本机上进行的,而不是将这些信息远程发送给服务器,并且软件本身不会储存用户的信息。即使在光线变化的环境里,该软件在也能正常使用。

在Banjara位于加州山景城的装饰简单的客厅里,PredictGaze团队分别在电视、笔记本电脑、iPad、iPhone和iPod Touch上给我做了演示。

在第一个演示中,我和Banjara坐在一个与运行PredictGaze软件的iPad连接的平板电视前,当Rihanna的音乐视频正在播放时,Banjara站起身走开,什么事都没有发生。而当我离开时,视频却中断了,因为摄像头检测到已经没有人在观看视频了。

在另一段演示中,PredictGaze团队的一员用iPad浏览网页,并用眼神翻页。

第三段演示中,我们俩坐在iPad前,该软件便可以准确地感应到有几个人,摸清我俩的性别,以及我们是不是在微笑等等。就算我戴上了眼镜,遮住了头发,该软件还是能识别出我的性别。

现在,PredictGaze需要克服的问题是软件的灵敏度过高:在上面的测试中,如果我和Banjara面对面地坐在沙发上,音乐会停止,当我在玩集成了PredictGaze软件的iPhone游戏时,因为我头部轻微的动作,游戏也会停止。如果调整一下,如在电视或平板电脑上安装一个可以捕捉更多动作的广角摄像头,那样效果相对来说会好一些。

该公司现在有意将软件开发工具包卖给相关应用的开发者,同时也计划将该技术出售给销售有前置摄像头设备的电子设备公司,这样一来,该项技术就可以直接植入相关设备。甚至PredictGaze也有意自己制造硬件设备。

加拿大皇后大学人机交互方向的副教授以及该校人类媒体实验室负责人Roel Vertegaal表示,虽然人机交互并不是一个新鲜的课题,但是在人们生活中的应用依然比较少,而该技术在人们生活中的逐渐深入一定会帮助人们塑造一个完全不同的世界。

via TR

订阅更多文章