从深度学习的角度探索无人驾驶,为商业车队提供后装套件。 在自动驾驶领域的众多玩家中,大众耳熟能详的入局者无非是国外的谷歌、国内的百度。而就在今年上半年,一家硅谷的初创公司Drive.ai在短短数月得到多次曝光。 一是因为2月份Drive.ai发布了一段长约四分钟的视频,视屏中,测试汽车在雨夜中穿行过美国加利福尼亚山景城(芒廷维尤)的街道,全程驾驶员的双手并没有碰触方向盘,也没有做出任何干预动作。这段视频流出后,Drive.ai得到了一次大曝光,开始进入大众视野。 再次大面积曝光是在3月份,全球顶尖的人工智能专家吴恩达离职百度,宣布结束自己首席科学家的任期,外界很多传言称这位大神有可能加入Drive.ai,一个重要的原因是吴恩达的妻子卡罗·莱利(Carol Reiley)是这家公司的创始人之一。 时隔三个月后,创业邦采访了Drive.ai的联合创始人王弢,聊了聊他和Drive.ai背后的故事,以及Drive.ai在自动驾驶领域的竞争格局和发展愿景。 始于一个简单的想法 王弢属于话不多的那类人,基本上对每个问题都是简明扼要地作答。他说自己是一个没有特点的人。王弢初中便在新加坡了,很顺利地念完了高中和大学,可以说他从小就是那个老师眼中的好学生,家长心中的好孩子。而在斯坦福大学念书一直是王弢的梦想,他努力、坚持,最终如愿以偿,顺利进入了斯坦福大学攻读研究生。自小到大,他似乎就是按照既定的轨迹一路走来。 但是,王弢在斯坦福读博士期间,人生出现了岔路口。一边是自己从小的梦想,另一边是需要休学来换取的创业机会,当时的王弢毫不犹豫地选择了创业,让自己暂缓博士毕业。"在斯坦福读博士确实是我的一个梦想,但创业的机会是人这一生可遇不可求的。"王弢说。 创业对王弢而言可以说是一种必然。早在2013年,他和在斯坦福一起学习的伙伴们就开始酝酿出来建立一个公司,把科研成果带到实际应用中来。那时他们已经形成了一个团队,各自分工,久而久之,团队成员之间彼此形成默契,这也为后来创业省去了团队磨合需要的时间。 2015年4月,他们集体创办了Drive.ai这家深度学习公司,公司共有7个联合创始人。除吴恩达的妻子之外,大部分创始团队成员都来自斯坦福大学人工智能实验室吴恩达教授的团队。团队主要研究的課题是深度学习与自动驾驶认知,而王弢的主攻方向是计算机视觉认知在自动驾驶方面的应用。 王弢有一个简单的想法,希望通过自动驾驶从根本上改变出行方式,解决目前因交通导致的事故、效率等问题。不过他也坦言,自动驾驶对他而言虽然是一项很有吸引力的工作,但面临着巨大的技术挑战。 自动驾驶L4级:充满挑战又极其性感 王弢说Drive.ai是直面第4级(L4)的自动驾驶,从深度学习的角度来探索无人驾驶,为商业车队提供包括传感器组、控制系统和车内外交互界面在内的后装套件。这套服务工具包对车辆本身的限制很小,普通汽车用后即可变成无人车,也可以很容易地把它从一辆车转移到另一辆车上。"车的接口做一些工作即可。"王弢说。 在今年2月份的时候,一段测试汽车在雨夜穿行的4分钟视频,为Drive.ai这家公司揭开了神秘的面纱。 可以说,雨夜行驶对无人驾驶技术而言极具挑战性,其对传感器的影响非常大。比如激光雷达,受雨水的影响,激光光速散射,驾驶员会看不到地面上的车道线。 Drive.ai尝试从深度学习的角度解决这些问题。实际上,几乎所有进入自动驾驶领域的公司都在使用深度学习技术,但不同于大多数公司将深度学习只用在自动驾驶技术的某个组件上,Drive.ai从整体出发,看得更全面:他们不但让深度学习在决策和感知上协助自动驾驶汽车,还想"教"它汽车交通规则和常识来确保车辆的安全。 王弢认为自动驾驶是一个系统工程,深度学习在认知和决策上大有可为,汽车本身的车辆控制系统如方向盘踩刹车、油门等业界已被研究得很深,可以拿来直接使用。 感知方面,深度学习的应用是类似于识别摄像头画面中的行人这样的任务。Drive.ai后装套件中的传感器包括9个摄像头、2个雷达和6个激光雷达。每一台Drive.ai的车都在不断为生成地图而捕捉数据,并把数据送入深度学习系统,当然数据也用户驾驶任务本身。 "这样的组合可以在某一传感器出现错误或故障的情况下提供一定冗余度,譬如摄像头和雷达可以在雨雪雾等极端天气中为精度严重下降的激光雷达提供环境感知,避免灾难性结果出现。"王弢说。 一个小细节是,Drive.ai所使用的传感器基本上是市场上已经成熟的传感器,不像定制的传感器那样,一旦其中的一个传感器出故障就会影响整个系统的运作,这也就避免了前面提到的传感器失灵,形成了一种保护。王弢说,这是他们根据"深度学习第一"的理念所作的决定,可以让团队把主要精力花在深度学习算法上,"通过软件的进展来整合已存在的硬件传感器而达到目标"。 决策方面,Drive.ai使用的是基于非规则学习的深度学习网络模型。这样的网络模型优势明显,它可以更好地即时理解数据并解决新的和罕见的情况,并且能够基于路面状况作出复杂的决策,例如是否超车、变道等等,就像AlphaGo,基于对方的动作决定自己的下一步棋如何走。 目前Drive.ai共有5辆车进行路测。去年4月,Drive.ai成为第13家获批在加州进行自动驾驶汽车路测的公司。 当然,底层技术终归是底层技术,现实应用又是另外一回事。自动驾驶行业的竞争对于创业者而言,犹如一场激烈的战争,巨大的挑战——技术、政策、人类不规则行为等——是所有参与者都必须要面临的。 这样的竞争格局下,已经占有先机的Drive.ai唯有在执行速度上够快,才能跑在行业的前面。而对于王弢本人,一个能让人暂放梦想去做的事情,无疑是件令人兴奋而又性感的事。 无疑,自2006年加拿大多伦多大学教授、机器学习领域的泰斗Geoffrey Hinton提出"深度学习"这一概念后,语音和视觉识别的准确率得到了大幅提升,人工智能也进入到了第三个发展高峰期。 但同时,我们对于深度学习知之甚少,目前业界对其存在的一个最大疑虑就是"黑箱问题"。简单来说,深度学习识别模式的过程发生在神经网络上所运行的算法之中,这个数据输入再输出并决策的过程,我们看不见摸不着,根本不知道当中发生了什么,所以即便是系统作出了错误的决策,我们也并不能确切地知道这个错误决策是怎么出现的。 Drive.ai将这一过程分解成几个部分,然后分别对其应用深度学习技术,每部分都能用不同的方法来验证,这样相对而言让人比较放心。 随着技术的推进,除了不停地在现实或者模拟器当中进行验证,积累大量的测试数据来证明深度学习的可靠性外,王弢告诉创业邦(微信搜索:ichuangyebang),他们还在尝试深度学习系统内部结构的研究,在内部抓取一些特征,以更好地了解深度学习内部的运作机制。"通过这些研究,深度学习的‘黑箱可能会逐渐变成一个‘灰箱,甚至‘白箱也不无可能。" 全世界每年因为交通事故死亡的人数接近125万,相当于全球每天约有3500人因交通事故死亡,绝大多数的交通事故是人为造成,而自动驾驶的到来能使交通事故率降低90%,顺带还可以解决交通拥堵问题。但自动驾驶的终态却不能一蹴而就,因为它面临的不仅有巨大的技术挑战,政策、大众接受程度等也同样考验着这个行业。 "回过头来讲,市面上能见到的L2级带有辅助驾驶技术的车辆,离‘聪明一说着实还有点远,更别说L5级什么时候到来。"王弢说,"我想什么时候我们能坐着无人车上下班、接送孩子上下学的时候,真正的无人驾驶也就到来了吧。"