品玩

科技创新者的每日必读

打开APP
关闭
人工智能

机器也能“看图说话”,创业公司Cortica通过模拟人类大脑皮层认知过程识别图片

电脑可以模仿人类“读图”的思维过程吗?来自以色列的创业公司Cortica正因为创始人都有神经系统学科的背景,正在尝试从生物学的角度把人“看图说话”的过程数字化、可运算,再结合互联网上大量的图片数据进行机器学习过程。这不止听起来有点玄,他们还打算继续做视觉搜索。

Ronghui

发布于 2013年7月16日

如果你拍了一张照片,你的电脑可以识别出来照片里的人是谁吗?

创业公司Cortica说可以。

他们的方法如下:如果你拍了一张照片,用Cortica的产品Image2Text,它会模仿人类大脑识别图片的过程——无论图片里是一个人还是一个物品,都从形状、颜色等不同角度判断,再配合电脑计算。

和其他做图片识别的创业者不同,Cortica强调自己是“基于科学研究和完全模仿人类大脑皮层的认知过程去认识一张图片(或视频)”,因为“到目前为止即便是性能最强的电脑,对人类语言和信息的识别能力还不如一个三岁的小孩,所以与其发明新的复杂算法,我们还是决定从学习人类大脑皮层思维模式出发。它已经证明了很有效。”Cortica联合创始人Igal Raichelgauz对PingWest说。此前他曾经对媒体说Cortica的图片识别做到了零失误。

Cortica的做法和几个创始人有神经科学的学术背景有关。他们曾经在大学时的一起做过一个研究课题——对人类大脑皮层网络计算能力的分析。“我们模仿大脑皮层中神经网络的功能非常有兴趣,特别是如何用它来根据特定的信号来识别图案或者其他图片或声音的模型,以及如何把他们转化成有用的参数。”Igal Raichelgauz说。“而传统的图片识别则是基于模型寻找视觉上的相似点”。

根据Igal Raichelgauz的介绍,实现Image2Text主要经历了两个步骤。第一是解决“表现”的问题,简单来说就是分解信息再把他们转化成“数字世界的”关键字,让他们成为数据分析可以参考的变量(例如当一张照片放在你面前的时候,你会通过照片中图案的形状来判断这是一个人、一辆车或者其他的东西,还有颜色、动作、包含的文字信息以及所处背景等)第二步是从生物学的角度实现机器学习——数据当然是互联网上大量的图片。

在今年7月接受李嘉诚旗下风投Horizons Ventures(跟投)和Mail.Ru Group共计640万美元的投资以前,Cortica的业务主要是放在通过图片识别来做广告,主要用于电子商务,就像你在电商网站上看到展示某个产品的图片,例如一个手机,Cotica会识别出图片中是个手机并在图片中手机的位置打出文字或者做Flash来帮客户推广。

Igal Raichelgauz说Cortica经历了很长的“产品调试期”,主要的变化发生在“当可以识别的图片超过100万张”时,在这轮融资以后,他们希望转向下一个方向——视觉搜索。

“这样我们的客户可以直接用图片和用户交流,我们的盈利模式就会按照搜索引擎的广告模式一样。”Igal Raichelgauz说。现在他们在以色列有两个研发中心,并且在纽约设立办公室,主要负责市场推广和商业化。

下载品玩App,比99.9%的人更先知道关于「人工智能」的新故事

下载品玩App

比99.9%的人更先知道关于「人工智能」的新故事

iOS版本 Android版本
立即下载
Ronghui

保持初学者的心态。

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测