围猎深度学习——初创公司、科技巨头、研究机构在角力

深度学习是大数据下最热门的趋势之一,这项技术将对自然语言处理和图像识别等前沿领域提供支持。Gigaom.com网站整理了一个指南:深度学习领域的快速发展,鼓舞着越来越多在自然语言处理和图像识别等领域的初创企业去研究它。同时,包括Google、微软、Facebook和雅虎在内的科技巨头,在深度学习方面的投入也在提高。也有不少高校的研究机构也在该领域在做着前沿的研究。

什么是深度学习?

google-nn

(Google深度学习模型)

人们对这个概念存在误区,深入学习并不是真的教授机器模仿人类的大脑主动思考。相反,根据Google的深度学习模型,它在教授机器逐级往下处理信息,并能根据前后的意思去修正,思考过程逐渐从简单到复杂。整个工作下来,就如同一只动物慢慢意识到它所有的特定功能,并把这些功能连贯在一起。例如,在文本处理方面,过程便是教机器如何认识单词之间的相互关联,以及如何将单词结合在一起形成短语或表达含义。

虽然深度学习存在许多亟待解决的难题,但研究者们都迫切希望新轮的研究能够更精确地处理文本信息、搜索、翻译和目标内容的处理,因为数据作为当前最大的金矿,夺得先机就意味着更多的财富。

在这个意义上说,深度学习离不开它的孪生兄弟“大数据”。对该方面的研究最早从硅谷开始,逐渐延伸到医学和科学等领域时,才会有巨额的回报。更重要的是——深度学习模型计算能力越强,它的成本反而会越便宜。越来越多的资源通过云计算实现,也就意味着人们无需自建数据中心,也能提交想要处理的请求。让我们先来看看这个领域的初创企业:

初创公司

AlchemyAPI :这是科罗拉多州丹佛的一家创业公司,它通过API提供基于深度学习的文本分析,最近还展示了最新图像识别技术。有许多公司通过它提供的服务,提取关键词进行情感分析、内容分类和标记。 AlchemyAPI目前致力于让它的功能更实用, 以此吸引那些对通过API实现服务不感兴趣的群体。

alchemydemo

Cortica : Cortica提供专业级的图像识别技术,它的原理是仿照人类在识别图像时大脑皮质中神经网络的图像处理的方式。它的联合创始人兼CEO Igal Raichelgauz称,这项技术源自他之前在以色列理工学院的实验室,对于大脑组织的研究。该公司将他们的产品出售给出版商和广告商,用以展示与页面图片内容相关的广告内容。

corticademo

Ersatz:Ersatz是一个深度学习的平台,它由旧金山名为Blackcloud BSG的咨询公司发展而来。不止图像识别和情感分析等基础服务,它还提供了深度学习的企业级工具,为深度学习设计了类似亚马逊云计算这样的产品。他给予用户网页交互界面、API、基于云端资源的GPU和神经网络的执行。它能够让用户以他们需要的方式,组建和运行模型。使用者为这些模型,支付费用给Blackcloud。

ersatz_screen_confusion_matrix

Semantria:总部位于马萨诸塞州艾摩斯特市,它是文本分析老将Lexalytics的一款副产品,他通过API和Excel插件实现功能,而不需要安装软件。它的创始人兼CEO Oleg Rogynskyy称,公司通过整合更多深度学习的方法和扩展除维基百科(Lexalytics 引擎获取语义知识的地方)之外的数据源,来提高服务的精度。

semantriademo

这些公司只是未来深度学习发展趋势的一小部分案例。许多知名的深度学习的学者,正在一些初创公司中准备一些新的秘密模型,与已经成熟的图形识别公司Dropcam和Sight Machine的产品相比,可能没有太多的惊喜。但还有许多其他的公司,诸如Palm创始人Jeff Hawkins新公司Grok,它的产品将跨越深度学习和实际类人脑的计算架构的界限,或许能推向深度学习走向新的境界。

科技巨头

Facebook:Facebook是这个领域的新人,但它有大量的文字和图像需要处理分析。据报道,该公司希望深入学习帮助它更好地优化News Feed功能,并实现更畅快的照片共享体验。然而,Facebook对于深入学习领域最大的贡献可能是它数量众多的基础设施和它开源的专业硬件。这些东西对于那些需要基础设施处理大量数据的人来说,都是很方便的。

Google:Google是深入学习领域中最著名的公司,这要归功于它高度公开的图像识别领域的研究(这个模型不需要训练,就能够识别猫脸和人脸)。最近它又决定将开源一些文本分析的新工具。Google之所以能够做这么多的事情,主要原因是它有大量的资源、许多聪明的工程师和足够大体量的数据。深度学习已经支持Andriod手机上的语音识别,你还能直接在Google+上搜索图片,即便这些图片没有任何标签。

IBM :你听说过Watson吗?这个IBM系统,在智力竞赛节目《危险边缘》中,击败了所有对手获得冠军。比赛过程中没有联网,而是利用多个算法应对竞赛中的挑战。现在,这个技术被应用到医疗保健等领域,它整合了大量的数据分析技术,其中就包含深度学习。除此之外,IBM还围绕“认知计算”作了大量的努力。IBM还联合四家高校进行科研合作,并把深度学习作为其中的一个核心。

微软:微软研究院对大数据进行了长年的研究。去年11月,主管Rich Rashid因为在现场展示微软在深度学医领域的最新进展——普通话和英语的同声传译技术,让他成为各家媒体的头条。和Google一样,微软也在想方设法从网络和移动应用收集各种数据,并希望深入学习能帮助它在其网页、移动、游戏,甚至商业软件平台提供更迷人的体验,而这背后最大的王牌可能是Kinect技术。

雅虎:雅虎没有像Google和微软那样得到注目,但它在过去的几个月里,分别收购了两家基于深度学习的图像识别公司, IQ Engines和LookFlow。雅虎本应该有各种各样的方式去利用这些技术和人才,但目前的重心只是让Flickr变得更具吸引力,让它在移动端的设置更简单智能。

研究机构

多伦多大学研究小组:这个研究小组由Geoffrey Hinton领导,几年来在深度学习领域有许多重大的突破,2013年他创建的DNNresearch被Google收购。 Hinton现在在多伦多大学和Google之间奔走。Marc’Aurelio Ranzato曾是Hinton实验室的成员,最近,他离开Google,成为Facebook深度学习小组的一员。

斯坦福大学研究小组:斯坦福大学拥有许多该领域的专家,以及Coursera创始人Andrew Ng。目前,Christopher Manning领导学校的深度学习小组。这个团队有一位博士候选人Richard Socher,它的研究侧重于对整个句子的理解,而不是单个单词。目前,对于在分析电影评论情感分析的准确率已经达到85%。

slowandrepetitive

(Socher的模型如何拆解句子)

纽约大学研究小组:Yann LeCun和Rob Fergus都是纽约大学的图像识别领域的专家。他们在一起做了许多开创性的工作,比如90年代的笔迹识别。目前,他们正在研究让计算神经网络更加简单。纽约大学也是“IBM认知计算”的合作伙伴之一。

蒙特利尔研究小组:蒙特利尔大学的LIST实验室,它由Yoshua Bengio领导,是另一个深入学习的主要研究中心,并创造了一个开源数据库Theano(下载地址)。它能使得复杂的程序语言Python变得更加简单,同时让这种语言在GPU上运行(Python语言与深度学习神经网络的并行特点,使它成为最理想的语言)。

瑞士研究小组:Juergen Schmidhuber和人工智能研究所Dalle Molle学院,在1991年就开始研究深度学习了。现在的处理能力已经赶上了他们开发的模型,他们的工作需要进入下一个阶段。该团队已经赢得了无数的竞赛,其中包括一场人脑图像识别的竞赛。

图片源自于Gigaom.com

订阅更多文章