机器也能“看图说话”,创业公司Cortica通过模拟人类大脑皮层认知过程识别图片

194722v2

如果你拍了一张照片,你的电脑可以识别出来照片里的人是谁吗?

创业公司Cortica说可以。

他们的方法如下:如果你拍了一张照片,用Cortica的产品Image2Text,它会模仿人类大脑识别图片的过程——无论图片里是一个人还是一个物品,都从形状、颜色等不同角度判断,再配合电脑计算。

和其他做图片识别的创业者不同,Cortica强调自己是“基于科学研究和完全模仿人类大脑皮层的认知过程去认识一张图片(或视频)”,因为“到目前为止即便是性能最强的电脑,对人类语言和信息的识别能力还不如一个三岁的小孩,所以与其发明新的复杂算法,我们还是决定从学习人类大脑皮层思维模式出发。它已经证明了很有效。”Cortica联合创始人Igal Raichelgauz对PingWest说。此前他曾经对媒体说Cortica的图片识别做到了零失误。

Cortica的做法和几个创始人有神经科学的学术背景有关。他们曾经在大学时的一起做过一个研究课题——对人类大脑皮层网络计算能力的分析。“我们模仿大脑皮层中神经网络的功能非常有兴趣,特别是如何用它来根据特定的信号来识别图案或者其他图片或声音的模型,以及如何把他们转化成有用的参数。”Igal Raichelgauz说。“而传统的图片识别则是基于模型寻找视觉上的相似点”。

根据Igal Raichelgauz的介绍,实现Image2Text主要经历了两个步骤。第一是解决“表现”的问题,简单来说就是分解信息再把他们转化成“数字世界的”关键字,让他们成为数据分析可以参考的变量(例如当一张照片放在你面前的时候,你会通过照片中图案的形状来判断这是一个人、一辆车或者其他的东西,还有颜色、动作、包含的文字信息以及所处背景等)第二步是从生物学的角度实现机器学习——数据当然是互联网上大量的图片。

在今年7月接受李嘉诚旗下风投Horizons Ventures(跟投)和Mail.Ru Group共计640万美元的投资以前,Cortica的业务主要是放在通过图片识别来做广告,主要用于电子商务,就像你在电商网站上看到展示某个产品的图片,例如一个手机,Cotica会识别出图片中是个手机并在图片中手机的位置打出文字或者做Flash来帮客户推广。

Igal Raichelgauz说Cortica经历了很长的“产品调试期”,主要的变化发生在“当可以识别的图片超过100万张”时,在这轮融资以后,他们希望转向下一个方向——视觉搜索。

“这样我们的客户可以直接用图片和用户交流,我们的盈利模式就会按照搜索引擎的广告模式一样。”Igal Raichelgauz说。现在他们在以色列有两个研发中心,并且在纽约设立办公室,主要负责市场推广和商业化。

订阅更多文章

你可能感兴趣的:

更多有趣好玩的内容 尽在品玩微信公众号