特斯拉即将举办自动驾驶投资者日,预计将揭示其在自动驾驶技术研发中的最新进展。完全自动驾驶的实现对公司财务产生重大影响,因此相关技术问题显得尤为重要。对于投资者而言,关键问题是:特斯拉是否能利用其在现实世界中训练大规模数据的优势,以实现更优于竞争对手的自动驾驶性能。
近期,特斯拉宣布将于本月22日举行位于帕洛阿尔托总部的自动驾驶投资者日活动。在此次活动中,埃隆·马斯克、工程副总裁Stuart Bowers、硬件工程副总裁Pete Bannon和人工智能高级主管Andrej Karpathy都将出席并进行讲话。此外,投资者还将有机会体验最新的自动驾驶软件,并参与试驾环节。
我们希望在这次活动上向特斯拉提出的五个问题如下:
特斯拉正在使用深度监督学习执行计算机视觉任务,但是在路线规划和驱动策略方面,它使用的是模仿学习还是强化学习?或者两者的结合?
在谷歌Waymo等公司仍在努力解决这一问题时,为何特斯拉认为自己的选择有效?它如何证明模仿学习会起作用,以及为什么单纯进行强化学习无法成功?
特斯拉已经完成了哪些计算机视觉任务?它如何衡量这些任务完成情况?是否仅需通过增加更多标记数据来完善训练集?
特斯特勒传感器套件获取周围物体深度信息精确度如何,与激光雷达相比,它们有什么优势和劣势?
特斯特勒是否已发现端到端学习潜力?目前是否已经达到实用阶段?该公司如何结合无监督表示学习和端到端学习?
我们期待着通过这次活动获得关于特斯特勒技术战略的透明解释,以及论证其所选方案正确性的信息。ARK Invest发布的一份财务模型显示,如果特斯特勒能够在未来五年内推出完全自主车辆,其股价可能翻番至当前市值。如果任何一家公司能成功实施完全自主系统,那么盲目投入便是一种简单直接的事。但是目前的问题是,从可行性角度看,是不是真的可以实现完全自主,而如果可以,是哪家公司最先做到了。这就是为什么理解特斯特勒自动驾驶技术战略如此重要。
现在,对于特斯特罗投资者的关键挑战是,将从以上五个问题得到结论,即:能否利用庞大的45万辆汽车训练数据来实现更好的自主性能。让某些资源决定竞争力的不仅仅是它们需要大量训练数据,而且这些数据不需要昂贵且缓慢的人类标签,这就是模仿学習和端到端學習之所以被看作胜利方案的地方。而与之相反的是,用手工编码规则告诉汽车应该做什么,这种方法并不依赖任何来自真实世界的训练数据;还有纯粹强化學習,在虚拟环境中生成訓練資料,而非從現實世界獲得。
因此,无论何种方案成为胜利标准,都取决于所选方案是否依赖大量来自现实世界的大型培训资料。如果胜利方案要求这种资料,那么拥有庞大数千万辆车用于培训就成为了一个决定性的资源——但只有当这个资源被正确地利用的时候才会如此。这意味着,我们需要了解两个事项:首先,当前采用的技术路线是什么;第二,该路线正确吗?
根据调查报告,我认为Tesla正在采用“模拟學習”的方式推动自動駕駛。我对这种方法持乐观态度,因为DeepMind AlphaStar项目展示了纯粹模仿学習以及增强強化學習效果的潜力。此外,一些专家也公开表明模仿学習是一个非常有前景的手段去解决自動駕駛問題。
我对于手工编码方法持怀疑态度,因为直至目前为止,没有太多成功案例,而且人类很难把复杂任务转换成一套既定的规则,所以我对此保持观望态待。我同样对于只在虚拟环境中使用纯粹強化學習也感到怀疑,因为要创建真实的人类行为模型,就像打造全自動車一样复杂,因此这里存在一个先鸡后蛋的问题。
如果我们能够从Tesla 自動駕駛投資者日获得足够信息以支持或反驳模擬學習,這將是一個非常重大的事件,对於我們個人來說,比發布季度收益或交付車輛數據更加重要。