特斯拉|马斯克的凡尔赛:我们都用人模仿机器人了 你们还在用人模仿机器人( 三 )


第二个是两边停满车的拥挤窄到遇到对向来车的场景 , 可以看到特斯拉先是停车避让 , 在观察到对向来车停车避让时迅速做出反应 , 快速通过 。 这样的场景在不同时期 , 不同国家和地区 , 根据驾驶员的不同习惯会有多种不同的结果 , 因此这类场景也需要在不同市场、不断的采集大量数据对神经网络进行训练 。
第三个场景被称为“停车场困局” , 相较外部道路有道路线等约束 , 停车场存在的可能路径会变得更多 。 可以看到公开的视频中特斯拉几乎画出了全部的可以通行的位置 , 通过神经网络在其中找出最优的行进路线 。
其实这样的路径规划内核从视觉感知诞生之初就一直延续 , 上世纪六七十年代诞生的人类最早的视觉感知自动驾驶车辆——StanfordCart , 在1977年便实现了立体视觉感知 , 并在随后两年完成了在散落椅子等干扰物的空间中自行规划路径通过的壮举 。
只是随着半导体技术和人工智能技术的发展 , 如今的芯片算力与当年已不可同日而语 , 人工智能也从专家模式转变为基于卷积神经网络的深度学习算法 。 因此当年在规划的路径上一个个稀疏的点 , 如今已经变成了一个接一个的密集的点 。 就在近些年辅助驾驶刚刚兴起时 , 还有车辆在过弯时会走出不断“撞线”的折线 , 那便是稀疏的路径点和未能很好优化的算法导致的 。
其实在上述几点之前 , 自动驾驶最先需要完成的是对目标物体的识别 。 想要让人工智能系统认识形形色色的人、车 , 还有路标、车道线等等事物 , 需要的不是特别强大的高科技 , 而是海量的标注员通过人海战术对庞大的数据进行标注 , 将标注完成的数据“喂”给神经网络进行学习 。 不管是当下的自动驾驶还是高精度地图的绘制等 , 这都是不可或缺的一步 。
不过这种笨办法显然不是长久之计 , 在系统认识足够多的事物之后 , 可以让机器自动对海量的数据进行标注 , 将机器标注的数据“喂”给神经网络进行深度学习 , 这也就是“无监督学习算法”(Unsupervised Learning , 无需人工对训练数据集进行标注 , 系统可以自行根据样本间的统计规律对样本集进行分析) 。
当然 , 无监督训练几乎所有的人工智能公司都在应用 。 但是 , 无监督训练是在完成了海量数据标注和更多的数据搜集之后才能发挥出其威力 。 率先在量产高级自动辅助驾驶领域发力的特斯拉不论在标注还是数据搜集方面都有着绝对的优势地位 。 目前 , 特斯拉已经积累了100万个10秒左右的视频 , 并给60亿个物体贴上了深度、速度和加速度的标签 , 这些数据目前已经达到了惊人的1.5PB , 且每天都还在增加 。 在“AI DAY”上提到 , 特斯拉已经完成了横跨美国绝大多数道路的数据采集 , 这些道路数据和场景都可以通过无监督学习帮助特斯拉自动辅助驾驶算法进行训练升级 。
而如此海量的数据和对应的需求的惊人算力 , 就需要本次“AI DAY”上亮相的主角——“Dojo”超级计算机来完成了 。
“Dojo”与自动驾驶汽车本身需要的芯片并不相关 , 特斯拉车型上目前搭载的是其自研的FSD芯片 , FSD芯片能够完成车辆所需的感知、决策、规划等所需的算力 。 而“Dojo”是为最终推送给用户的算法的研发、训练服务的超级计算机 。
当然 , Dojo最早要等到明年才能投入使用 , 当下特斯拉数据中心使用的是由5760个Nvida A100 80GB的GPU , 组成了720个节点 , 总算力达到1.8EFLOPS(EFLOPS:每秒千万亿次浮点运算) , 有10PB的存储空间 , 读写速度为1.6TBps的超级计算机 。 但在数据量、训练强度不断增加的情况下 , 这台超级计算机已经越来越不能满足特斯拉的需求 。 而且需要海量的物理结构进行连接以实现通讯的超级计算机不仅耗费大量成本 , 且由于连接结构的带宽限制成为“木桶短板” , 导致整体效率较低 , 并且还有分散的庞大散热问题 。

相关经验推荐