在本届AI Day大会上,伊隆·马斯克把“擎天柱”人形机器人当成了宣传重点。没错,如果真能按马斯克介绍的2万美元价格实现大规模量产,“擎天柱”也许真能给人类的生活和全社会带来深远影响。但演示文稿中相对不引人注目的另一部分,反而是最具份量的新消息。这就是Dojo超级计算机,而且有望比双足机器人更快改变世界。
每个Dojo托架由6块D1处理器tile组成。
首先要强调的是,特斯拉本身是一家软件公司,只是碰巧也制造与软件配套的硬件方案。作为“软件定义汽车”的核心力量,特斯拉率先向汽车当中引入了系统与连接性元素。这既降低了成本、增强了功能,也让系统更新变得更加易行。事实上,虽然特斯拉在各个方面都处于领先地位,但其压制各家竞争对手最强的手牌当数出色的软件开发能力。
汽车目前最重要的新兴能力就是自主驾驶功能,基本上属于软件问题。特斯拉的FSD beta因为把车主当成测试对象而受到争议,但正如人类自己也没法在不上路的情况下学会开车一样,自动驾驶汽车同样需要经历现实情况以制定应对策略。开发自动驾驶系统的公司可以根据现实世界数据建立模拟与测试模型,借此加速整个训练进程。但要让FSD真正发挥作用,它还是需要针对真实场景下的混乱状况接受测试,据此改进应对策略。
这就是Dojo的舞台所在。特斯拉已经在使用由英伟达GPU驱动的大型超级计算机处理其FSD数据,借此构建起更强的自动驾驶模型。其中包含5760块英伟达A100显卡,安装在总计720个节点当中,每节点含8个GPU。其性能达到1.8百亿亿次,成为世界上速度最快的超级计算机之一。该系统的一项重要任务就是“自动标记”,即为原始数据添加标签,使其成为决策系统中的一部分。尽管自动驾驶汽车在运行过程中也会自主执行部分识别,但大多数传感器数据还是要跟预处理过的世界模型相匹配,再针对特定情况采取预定义的动作。就像人类也会凭借以往的经验判断道路状况、做出相应反应一样,自动驾驶汽车同样要利用AI模型中的驾驶经验决定如何行动。
每个特斯拉exapod由10台机柜组成,每柜安装有两个托架。
Dojo承诺大幅加快这些模型的改进速度。在AI Day期间,特斯拉宣称只需要四台Dojo系统机柜,就能实现等同于72个传统机架中4000个GPU所实现的自动标记性能。该公司对于自动驾驶模型训练中的其他环节也做出了类似的性能提升承诺。特斯拉将通过所谓“exapod”集群部署Dojo,该集群由10台机柜组成,而且计划在帕洛阿尔托数据中心内部署7套这样的exapod集群。每个exapod的处理能力为1.1百亿亿次,面向特斯拉自动驾驶汽车(可能还包括「擎天柱」机器人)的AI模型进行换算之后,其处理能力将逼近8百亿亿次。
Dojo的设计思路与基于CPU或GPU的传统超级计算机有很大区别。Dojo由众多“tiles”组成,这与常规计算机CPU或GPU截然不同。CPU一般会将多个处理核心集成至单一芯片当中,每个处理核心都能高频执行复杂的软件操作。但目前的主流CPU设计最多只能支持64个核心,而单节点最多可以容纳2块CPU和128个核心。基于CPU的超级计算机会将大量此类节点聚集在同一系统当中。今年上线的全球最快超级计算机Frontier就拥有9400个节点,对应60万2112个CPU核心。
现代GPU中的核心数量倒是非常夸张。最近发布的英伟达GeForce RTX 4090有16384个核心,特斯拉在基于GPU的最新超级计算机中使用的A100则包含6912个核心。但与CPU不同,GPU的核心只能执行非常简单的操作,且速度极快。因此,GPU才广受AI和机器学习类应用,特别是涉及构建自动驾驶模型的程序的青睐。常见的节点最多可容纳8个GPU,而特斯拉基于GPU的最新超级计算机集群共包含近4000万个GPU核心。
Dojo的特别之处,在于它的D1 tile并非由多个小芯片所构成,而是单一包含354个核心的大芯片,专门针对AI和机器学习设计而成。之后,一个托架可以容纳6块D1 tile外加配套计算硬件,每台机柜可以安装两个这样的托架。这样算来,每机柜就将包含4248个核心,而由10台机柜组成的exapod共拥有42480个核心。基于CPU的超级计算机在相同空间中的核心数量肯定达不到这么多,GPU在这方面具有碾压性优势。而且由于Dojo专门针对AI和机器学习处理进行了优化,所以在同等数据中心空间之内,它比传统CPU或GPU超级计算机都要快上几个数量级。
特斯拉的“擎天柱”机器人也将受益于Dojo更快的AI模型处理能力。
特斯拉的目标,是在2023年第一季度部署第一台Dojo exapod,但其他六台何时落地还不明确。当这种级别的处理性能安装到位之后,相信特斯拉的FSD模型训练将大大加快,由此推动自动驾驶汽车的显著发展。目前全球已经有16万多特斯拉车主在参与FSD beta,为公司收集真实世界中的驾驶数据。而Dojo exapod将利用这些数据构建起新的模型,向这16万名用户不断推送系统更新,由此形成良性循环。如果效果不错,项目将吸引到更多测试者的加入,从而进一步推动开发加速。
所以我们认为,特斯拉AI Day 2022大会上真正的重磅新闻应该是Dojo,而绝不是什么“擎天柱”。在之前的AI Day 2021上,特斯拉公布了D1芯片的规格并亮出了早期样品。一年过去,情况发生了很大变化。虽然马斯克的宣传经常用力过猛,我们不可尽信,但假如Dojo真能在明年之内开始交付,那预计特斯拉FSD beta将加快迭代与改进速度,自动驾驶的商业推广也许真能超出我们以往的预期。
好文章,需要你的鼓励
受中国各智能手机品牌坚持低库存战略的影响,智能手机NAND闪存产品面临订单减少,且合同价格与上季度基本持平。与此同时,由于零售市场需求疲软,闪存晶圆的合同价格也开始逆转进入下行。
12月5日,IEEE Tech Frontiers论坛举办,囊括IEEE PES T&D、PVSC、CVP三大会议精华。
年初时,整个存储行业依然处于低迷期,但随着AI需求的迅猛上升,存储需求也随之激增,推动了行业的快速复苏与发展。这一波技术创新与市场需求的双重浪潮,给Solidigm带来了前所未有的机遇,也考验着其应对行业变革的能力。
艾斯本不断推陈出新,依托丰富的行业经验,推出了包括绩效工程、制造与供应链、资产绩效管理、地下科学与工程、数字电网管理和工业数据结构在内的六大解决方案。更值得一提的是艾斯本提出的“工业AI”理念,正以有型的投资回报率,推动客户实现价值跃升。