李飞飞在Google云计算大会上发车了:推出API让计算机看懂视频

去年 11 月,PingWest品玩(微信公众号:wepingwest)曾经报道了李飞飞 (Fei-fei Li) 加盟 Google 一事。李飞飞是斯坦福大学终身教授和该校人工智能实验室主任,因主导创立的 ImageNet 项目而在机器学习学界知名,加入了 Google 云计算部门(以下简称 Google Cloud)担任首席科学家,在该部门旗下领导一个新成立的人工智能和机器学习 (AI/ML)研究团队。

美国时间 3 月 8日,李飞飞第一次以 Google 员工的身份出现在 Cloud Next 17 上。加盟新公司四个月后,她带来了一个口号,以及几项新宣布。

李飞飞的口号是:让人工智能“人尽可用” (Democratizing AI)。她在台上反复表示:“Google is democratizing AI, Cloud is the vehicle to deliver.”也就正如我们的标题所说,她所带领的人工智能和机器学习 (AI/ML)研究团队,将会发动 Google 云计算的车,把人工智能送到千家万户。

这的确不是我第一次听见 democratizing AI 这句话了,不过李飞飞的描述听起来更有说服力。

WechatIMG237

她的这个想法在斯坦福大学任教的时候就已经产生了。因为成本和技术门槛等原因,不是所有人都能够“参与”人工智能。就拿成本来说,想要搭建一个高效训练神经网络的计算设备,造价十分昂贵(比如英伟达的单机箱超级计算机 DGX-1,售价 13 万美元)。即便是用目前业界最强大的显卡进行训练工作,往往也需要数年的时间,这基本断绝了“作坊式”的人工智能系统搭建的可能。

而李飞飞认为云计算是让人工智能普及的最佳途径。上周该公司的一项宣布证明了李飞飞的观点:荷兰密码学家使用 Google 的大规模计算技术,一共用了两年时间就成功训练出了一个算法,然后攻破了需要 1200 万年才能暴力破解的 SHA-1 加密算法

根据 Google Cloud 负责人戴安·格林妮的说法,Google Cloud 已经是“世界上最可靠云计算平台”,上面运转着全球最大金融服务商汇丰银行的金融安全系统,还驱动着社交软件 Snapchat 里面各种酷炫的实时人脸滤镜特效,去年黑五帮助美国家用品超市 Home Depot 的电商网站平稳度过了疯狂购物潮,还帮助迪士尼、Verizon(美国第一大电信运营商)等知名公司的数十万名员工,只用了几个月时间就从原来的办公软件成功迁移到了 G Suite 上。

你可以总结为:大规模计算、高集成性和高可靠性,再加上对 TensorFlow 等各大常用机器学习技术的支持——就是李飞飞支持 Google Cloud,对其爱之深以至于要加入的理由。所以,去年 11 月时一些业界人士猜测李飞飞加入 Google 的原因,可能是看中了 Google 作为业界领袖所拥有的海量数据,现在来看这一猜测还是有几分道理的。

“如果有一辆自动驾驶汽车,一个司机可以更轻松地通勤。如果有一千辆,这个地区的交通阻塞也会显著减少;那如果有一百万辆呢?整个城市的交通都会被重新定义……从一辆到一千两再到一百万辆,每一个级别之间的区别就在于参与不一样。普及人工智能,重在让人们能够参与进来。”李飞飞在大会的主题演讲中说道。

她认为 Google Cloud 是提高人工智能参与度的答案。因为每天都有数十亿人使用 Google 的产品,无论是搜索、广告、邮件还是 Android;而 Google 所有产品的背后,现在都是 Google Cloud 以及某种形式的人工智能在驱动着。“人工智能即将改变我们生活和工作的方式,在斯坦福做了这么多年研究,当我看到 Google Cloud 这样一个平台的时候,是很兴奋的,”她说。

必须说,尽管今天 Google Cloud 负责人戴安·格林妮连续在台上“召见”了 SAP 、Verizon 等顶级合作伙伴高管,尽显强大的气场;Alphabet 董事长埃里克·施密特用标志性的幽默推销惹得观众笑声不断;但李飞飞的演讲给 Google Cloud 带来的广告效果其实是最好的。

另外,李飞飞还在大会上发布了 Google Cloud 的几项重大消息。

在新宣布方面,李飞飞首先确认了 Google 收购了创业公司 Kaggle 的消息。

Kaggle 是一个专门服务数据科学家的社区,用户数已经超过 50 万。用户经常在 Kaggle 上面发布算法、数据集等相关的重要资料,使得这个网站在相关领域的影响力很大,可以说不逊于计算机专业的论文库。Kaggle 之前和 Google 已经有过深度的合作了,多次联合举办机器学习方面的比赛,比如“YouTube 8M Video Understanding Challenge ” 等。

在演讲后的采访会上,李飞飞表示 Kaggle 将会“在一段时间内”继续保持独立品牌和运营,收购的价格尚未可知。就用户数字来看,Kaggle 的竞争优势已经很明显,但更吸引李飞飞的应该是 Kaggle 在数据科学和机器学习算法上的集市 (marketplace) 功能。

李飞飞还介绍了 Google Cloud 基于神经网络技术新推出的一些 API 和引擎,比如 Video Intelligence API、Cloud Vision API、Cloud Natural Language API、Cloud Jobs API、Cloud ML Engine 等。

machine-learning-next-1

其中最重要的应该是 Video Intelligence API。众所周知,过去的计算机进行图像识别主要是在静态图像上完成,而这枚新推出的 API 能对视频进行全片分析,提炼全片的故事脉络,记录一共发生了多少个场景、每个具体场景的情节。这有助于对视频进行更精确的标签分类。

更有趣的是,Video Intelligence API 可以准确地在每一帧中识别、标记和索引物体 (object)。索引的目的是为了搜索,比如一家媒体机构的编辑,想要在海量的视频素材中找到某个片段非常痛苦,但通过 Video Intelligence API,编辑可以直接搜索想找到的内容,比如“自行车”、“腊肠犬”或者“棒球”,系统可以自动搜索并且返回“这些物体在哪几秒出现过”的结果。

ezgif.com-resize

Google 为该枚 API 提供了一个 demo 页面, 你可以测试一下它的效果。不过,该 API 仅支持储存在 Google Cloud Storage 里的视频。

另外一项重要的宣布是 Cloud Machine Learning Engine。这是Google 之前面向有限开发者提供的机器学习算法开发引擎,基于 TensorFlow。在这次大会上,该工具也正式面向所有公众开放了。

李飞飞的加盟为 Google Cloud 增添了一员人工智能大将。Google/Alphabet 旗下现在已经有了好几个人工智能研究团队,包括由资深学者杰夫·迪恩领导的 Google Brain 团队、收购而来的英国公司 DeepMind 等等。李飞飞对 PingWest品玩透露,自己大部分时间都在大脑团队的办公楼里度过,经常穿梭于各个组织部门之间,对现在跨团队协作感到满意。

李飞飞的主题演讲和媒体问答主要围绕 Google Cloud 的技术进行,但当被其他记者问及在斯坦福和 Google 的不同感受时,她回答:“最大的区别应该是免费的食物吧!”

毫无疑问,人工智能和机器学习是这一届 Google 云计算大会的主角。并不是说 Google Cloud 的这些 AI/ML 技术在最近才诞生,而是面临着 AWS、Azure、IBM 等云计算巨头越来越大的竞争压力,Google 决定把过去很多内部的技术开放出来给客户使用(其实 Google 过去内部工具和技术的开放也都是类似路线),而“普及人工智能”概念流行和李飞飞的加盟,给了 Google 这样做更大的动力。

更多有趣好玩的内容 尽在品玩微信公众号