斯坦福博士休学蛰伏两年,弄出了这辆叫板 Google和特斯拉的无人车

这是一辆蓝色的林肯汽车,车顶有一块 LED 屏,几个黑色的圆柱形的东西围绕在 LED 屏周围,不停转动。车头前方也有一个黑色的凸起。在驾驶座旁边是一个屏幕,上面显示着蓝色的密密麻麻的点和蓝色的框,随着汽车的行驶,屏幕上的点和线也在不断的刷新。在副驾上座位边上,还配备着一个小型灭火器。

132

我坐在这辆车上,在山景城兜了一圈。在这段 7.5 公里,20 分钟左右的车程里,我们经过了 16 个红绿灯、经过了四向 STOP SIGN(停止标识) 路口,经过了红色箭头左转路口等。大部分时间里,整个体验都很舒服,只有偶尔略觉突然的加速减速,和司机旁边显示屏上科幻感极强的画面,在提醒我这是一辆无人驾驶车。

Annotation tool

没错,我身旁的司机手并没有放在方向盘上,脚也离开了油门和刹车。车顶的相机、激光雷达和雷达是汽车的眼睛,而车厢后的计算机是汽车的大脑,一套基于深度学习的算法把我从路边接了上去,又把我送回到停车场。

这就是我们此前报道过的创业公司 Drive.ai 研发的自动驾驶汽车。这家神秘的自动驾驶汽车公司成立不到两年,但这已经是它的第四代车辆。我也有幸成为了它第一个外部乘客。机器人司机表现得非常的自然,比我以往坐过的自动驾驶汽车更像“人类”,比如当我们驶到一个路口时,恰好遇上红灯转绿灯,车子并没有先停下来再启动,而是用无比自然的减速加速切换,度过了这个路口。

“虽然看起来很简单,但其中有一些很难的地方。”陪我一起体验的工程师说。比如某一个左转路口是左转箭头绿灯亮起才能走,而要让汽车明白在这个特定的路口前行绿灯和左转箭头绿灯的差别,并不容易。“刚开始汽车是搞不明白的。我们就收集了一些这样的路口数据来对它进行训练,它才学会。”

IMG_4098

当然,这辆车也还有很多可以做的更好的地方,比如加减速的处理如何更平稳、怎么做到红灯合理右转以及无无保护左转等。但是整体来说,已经是很不错的驾驶体验。

联合创始人兼 CEO Sameep Tandon 告诉我们,目前他们的车队已经具备 L4 级别(部分状况下的完全自动驾驶)的自动驾驶水平,接下来他们希望和更多的合作伙伴进行合作,把他们的软硬件解决方案带到商务车队上去。

IMG_4617

经典机器人方向 V.S. 深度学习方向,自动驾驶哪家强?

自动驾驶汽车公司这么多,Drive.ai 有什么不同?

在采访中,几位联合创始人一再强调,Drive.ai 是一个“深度学习技术为先”的公司。这也就意味着他们采用的技术和 Waymo(原Google 无人驾驶车部门)、特斯拉等都不太一样,他们用的是深度学习技术来打造自动驾驶系统。

这意味着什么?

在自动驾驶领域,基本可以分成两个流派:一个是采用经典机器人方向,是基于规则的(rule-base) 的。工程师会为每个场景都写好固定的代码,来告诉机器人应该怎么去做。这样的结果是,如果新的场景出现、又没有对应代码的话,那么机器很可能就不知道怎么应对。这就严重限制了它的可拓展性。

举一个例子,Waymo 的自动驾驶汽车,在从总部山景城扩展到奥斯汀的时候,仅仅因为山景城的红绿灯是竖向的,而奥斯汀的则是横向,就没有办法顺利识别红绿灯,而不得不让程序员重新去写程序“教”它。

另外一个现在更受欢迎、包括 Drive.ai 也选择的方向,是基于深度学习技术。深度学习可以模拟大脑识别机制,对于非结构化数据(比如图像语音等)进项更好的识别、判断和分类,让算法可以从数据和训练中得到学习。这样就像人脑一样,只需要工程师通过类似的场景不断对机器进行训练,它就能自己学会做出判断,这样即使在全新的场景里,车子也知道如何处理,更有利于适应和扩展。

比如,同样是在识别红绿灯的时候,rule-base 的自动驾驶汽车会需要在高精度地图上特别标注出所有红绿灯、让机器固定看到那个方向;但是深度学习算法可以直接从相机里识别红绿灯的颜色,所以车辆就可以自己看懂红绿灯,以及整个路口的行车情况,以此来决定是否前行了。

Sameep Tandon 说,随着深度学习的优势被意识到,越来越很多公司都号称自己的技术是基于深度学习基础,但是事实上很少有人真正做到这点。“我们所有的技术,比如地图、移动规划、决策全部都是基于深度学习的。我们是用深度学习来设计我们的整个系统,这和其他公司走经典机器人方向、只是把深度学习当做一个补充部分,这有很大不同。”他说。

122

从数据处理到算法训练再到计算资源,基于深度学习打造一个自动驾驶公司

Drive.ai 的另外一个创始人 Tao Wang 说,自动驾驶的难点之一自动驾驶产生的数据量是极大的,在收集到自动驾驶数据之后,怎么使用成为 了关键。第一步要做的事情就是标记它们,才能让算法引擎得到训练。一个小时自动驾驶产生的数据,即使是在大互联网公司里,也需要 800 个小时的人工来去标记它。

Drive.ai 他们自己打造了一个定制化的数据标记工具,可以不断优化整个数据工作流程,进行高质量的数据分类。他们使用深度学习来让同一个任务可以同时进行多个分类,把输出结果整合到一起后,就可以产生高质量的标记。他们现在数据标记的速度已经是大公司的 20 倍,这也就意味着可以有更多数据可以“喂”给算法引擎学习,从而让汽车可以快速处理新的道路、学习新的使用场景,随着训练数据的增加而持续提高性能。

Tao Wang 说,Drive.ai 的深度学习系统甚至比专门的人类标注者都更准确。有一次算法显示某个灯是红灯,但是专门的标注员回忆说是绿灯,结果他们专程查看了一下数据后,发现真的是红灯。“这也表明算法可以被训练得比人类更聪明。无论是决策,路线规划还是定位都可以做得很好。”

有一次,他们的车看到了路上有一只狗狗滑滑板,标注员很震惊地和工程师说,“请问这个要怎么分类?”然而汽车还是能正常的行驶。深度学习关键就在于不需要识别每一样东西,而是知道怎么样是安全的驾驶,然后自己做出决策。

另外一个很重要的部分是,Drive.ai 打造了一个模拟器,可以模拟生成各种场景,比如自行车车抢道等,检查学习引擎怎么处理这些情况。这个模拟器是 7*24 小时运转,所以相当于他们的车一直在虚拟世界的道路上进行各种测试。而在真实世界里,作为最早拿到加州自动驾驶汽车上路测试许可证的创业公司之一,Drive.ai 也已经让自家无人车在山景城的城区上路测试9个月了,没有任何的事故发生。

还有一个关键点在于,基于深度学习的自动驾驶系统可以摆脱对于昂贵硬件的依赖。和特斯拉与 Waymo 的“天价”定制传感器不同, Drive.ai 使用的是商业化的低成本硬件,包括激光雷达、雷达和相机,深度学习系统会同步所有的传感器数据,来基于这些信息作出最明智的决策,避免单个噪点导致的误判。这样即使其中一个失灵了,别的也可以正常工作。

101

正是传感器的冗余设计,才让他们完成了雨夜开车的成就 —— 即使雨水把相机给挡住了,但是其他的传感器让汽车仍然能安全进行自动驾驶。

由于传感器会将信息传递给他们软件系统的人工智能神经网络,这些神经网络系统可以在普通计算硬件上运行,所以这让他们的解决方案成本大大降低。

“我们的改装方案并不贵,而且可以适应各类汽车,无论是汽车,货车,卡车,或者是高尔夫车都行。可以在一周之内,就登陆一个新的汽车平台。而且由于我们在为机器应用打造规模化神经网络方面的专长,我们可以只需要其他自动驾驶汽车的计算资源的一部分,就可让自动驾驶汽车运行。每台车需要的处理器资源差不多是一台台式电脑的30%而已。”Sameep Tandon 说。

大部分的自动驾驶汽车都需要精确到厘米的高精度地图,来进行感知,搞清楚汽车开向哪里,这样做的结果就是会需要持续地更新高精度地图,非常昂贵而且很危险。而深度学习让 Drive.ai 的自动驾驶汽车可以比较地图上的物体和真实的环境,像是车道、人行道这类东西,所以即使环境改变了,汽车也能适应。

斯坦福整个人工智能实验室成员跑来创业

为什么 Drive.ai 可以做到这一点?这还要从他们团队的成员背景开始说。虽然Drive.ai 公司才成立不到两年,但是早在四五年前,这个团队的创始人们就已经在斯坦福的人工智能实验室,开始了怎么把深度学习系统规模化的研究。

没错,团队核心成员都来自于深度学习界鼎鼎大名的吴恩达的实验室。两年前,由于发现了深度学习在无人驾驶上的机会,实验室的 6 个人全都从博士项目中暂停,一起成立了这家公司。所以,在一些公司有一两位深度学习方面的专才就很稀罕的时候,这个团队可以说把斯坦福的人工智能实验室都搬空了……

1

“自动驾驶是非常难的,如果只是某一个人的话,都很难做好,所以我们决定大家一起做好了。”联合创始人兼 CEO Sameep Tandon 说。“我们那时就和很多汽车公司都聊过,发现我们有这么棒的技术,等不及毕业了。”

Tandon说,团队在从很早的时候就开始做非常基础的研究,比如数据标注等,是最棒的深度学习团队之一。当他们还在斯坦福的时候,就曾经打造过世界上最大的神经网络。当时 Google 用1000 台机器在他们 Google 大脑项目里做了一个实验,结果他们只用 了16 GPU 机器就复现了这个效果,只花了十分之一的成本。所以Tandon 很有底气的说,他不知道其他号称深度学习的公司都有些什么核心技术,但是他们绝对是世界上最好的深度学习团队之一。

IMG_4104

在低调研发了两年后,Drive.ai 现在认为自家在 L4 级别无人驾驶的研究上已经到了一定的阶段,希望能够进一步寻找合作伙伴,把他们的技术带到更多汽车上去。联合创始人 Carol Reiley 告诉我们,Drive.ai 和 OEM 商们关系很亲密,也希望获得汽车制造商们的支持。“我们不造车和传感器,我们只是提供一个解决方案。现在希望先从商务车队开始合作,包括包裹运送、食物运送、零售等可以。我们希望和合作伙伴们一起先做到 L4 的程度,提高定位准确性,一起收集数据,然后不断向外拓展,最终会再向消费者层级的 L5 级进发。”

“深度学习作为人工智能的一种领先方法,可以教机器如何像人类一样思考,这就是无人驾驶的关键。在这个基础上,打造一个可以扩展的、适用广泛、安全的平台,就是我们做的事。我们相信,无论是从安全性还是到效率方面,自动驾驶会整个颠覆交通系统。”Sameep Tandon说。

更多有趣好玩的内容 尽在品玩微信公众号
brand

PingWest品玩移动客户端