在本届AI Day大会上,伊隆·马斯克把“擎天柱”人形机器人当成了宣传重点。没错,如果真能按马斯克介绍的2万美元价格实现大规模量产,“擎天柱”也许真能给人类的生活和全社会带来深远影响。但演示文稿中相对不引人注目的另一部分,反而是最具份量的新消息。这就是Dojo超级计算机,而且有望比双足机器人更快改变世界。
每个Dojo托架由6块D1处理器tile组成。
首先要强调的是,特斯拉本身是一家软件公司,只是碰巧也制造与软件配套的硬件方案。作为“软件定义汽车”的核心力量,特斯拉率先向汽车当中引入了系统与连接性元素。这既降低了成本、增强了功能,也让系统更新变得更加易行。事实上,虽然特斯拉在各个方面都处于领先地位,但其压制各家竞争对手最强的手牌当数出色的软件开发能力。
汽车目前最重要的新兴能力就是自主驾驶功能,基本上属于软件问题。特斯拉的FSD beta因为把车主当成测试对象而受到争议,但正如人类自己也没法在不上路的情况下学会开车一样,自动驾驶汽车同样需要经历现实情况以制定应对策略。开发自动驾驶系统的公司可以根据现实世界数据建立模拟与测试模型,借此加速整个训练进程。但要让FSD真正发挥作用,它还是需要针对真实场景下的混乱状况接受测试,据此改进应对策略。
这就是Dojo的舞台所在。特斯拉已经在使用由英伟达GPU驱动的大型超级计算机处理其FSD数据,借此构建起更强的自动驾驶模型。其中包含5760块英伟达A100显卡,安装在总计720个节点当中,每节点含8个GPU。其性能达到1.8百亿亿次,成为世界上速度最快的超级计算机之一。该系统的一项重要任务就是“自动标记”,即为原始数据添加标签,使其成为决策系统中的一部分。尽管自动驾驶汽车在运行过程中也会自主执行部分识别,但大多数传感器数据还是要跟预处理过的世界模型相匹配,再针对特定情况采取预定义的动作。就像人类也会凭借以往的经验判断道路状况、做出相应反应一样,自动驾驶汽车同样要利用AI模型中的驾驶经验决定如何行动。
每个特斯拉exapod由10台机柜组成,每柜安装有两个托架。
Dojo承诺大幅加快这些模型的改进速度。在AI Day期间,特斯拉宣称只需要四台Dojo系统机柜,就能实现等同于72个传统机架中4000个GPU所实现的自动标记性能。该公司对于自动驾驶模型训练中的其他环节也做出了类似的性能提升承诺。特斯拉将通过所谓“exapod”集群部署Dojo,该集群由10台机柜组成,而且计划在帕洛阿尔托数据中心内部署7套这样的exapod集群。每个exapod的处理能力为1.1百亿亿次,面向特斯拉自动驾驶汽车(可能还包括「擎天柱」机器人)的AI模型进行换算之后,其处理能力将逼近8百亿亿次。
Dojo的设计思路与基于CPU或GPU的传统超级计算机有很大区别。Dojo由众多“tiles”组成,这与常规计算机CPU或GPU截然不同。CPU一般会将多个处理核心集成至单一芯片当中,每个处理核心都能高频执行复杂的软件操作。但目前的主流CPU设计最多只能支持64个核心,而单节点最多可以容纳2块CPU和128个核心。基于CPU的超级计算机会将大量此类节点聚集在同一系统当中。今年上线的全球最快超级计算机Frontier就拥有9400个节点,对应60万2112个CPU核心。
现代GPU中的核心数量倒是非常夸张。最近发布的英伟达GeForce RTX 4090有16384个核心,特斯拉在基于GPU的最新超级计算机中使用的A100则包含6912个核心。但与CPU不同,GPU的核心只能执行非常简单的操作,且速度极快。因此,GPU才广受AI和机器学习类应用,特别是涉及构建自动驾驶模型的程序的青睐。常见的节点最多可容纳8个GPU,而特斯拉基于GPU的最新超级计算机集群共包含近4000万个GPU核心。
Dojo的特别之处,在于它的D1 tile并非由多个小芯片所构成,而是单一包含354个核心的大芯片,专门针对AI和机器学习设计而成。之后,一个托架可以容纳6块D1 tile外加配套计算硬件,每台机柜可以安装两个这样的托架。这样算来,每机柜就将包含4248个核心,而由10台机柜组成的exapod共拥有42480个核心。基于CPU的超级计算机在相同空间中的核心数量肯定达不到这么多,GPU在这方面具有碾压性优势。而且由于Dojo专门针对AI和机器学习处理进行了优化,所以在同等数据中心空间之内,它比传统CPU或GPU超级计算机都要快上几个数量级。
特斯拉的“擎天柱”机器人也将受益于Dojo更快的AI模型处理能力。
特斯拉的目标,是在2023年第一季度部署第一台Dojo exapod,但其他六台何时落地还不明确。当这种级别的处理性能安装到位之后,相信特斯拉的FSD模型训练将大大加快,由此推动自动驾驶汽车的显著发展。目前全球已经有16万多特斯拉车主在参与FSD beta,为公司收集真实世界中的驾驶数据。而Dojo exapod将利用这些数据构建起新的模型,向这16万名用户不断推送系统更新,由此形成良性循环。如果效果不错,项目将吸引到更多测试者的加入,从而进一步推动开发加速。
所以我们认为,特斯拉AI Day 2022大会上真正的重磅新闻应该是Dojo,而绝不是什么“擎天柱”。在之前的AI Day 2021上,特斯拉公布了D1芯片的规格并亮出了早期样品。一年过去,情况发生了很大变化。虽然马斯克的宣传经常用力过猛,我们不可尽信,但假如Dojo真能在明年之内开始交付,那预计特斯拉FSD beta将加快迭代与改进速度,自动驾驶的商业推广也许真能超出我们以往的预期。
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。