动汽车制造商蔚来运用领先的 AI 基础设施打造高性能软件定义汽车。

新一代智能汽车需要通过能够驱动先进技术的 AI 基础设施来打造。
电动汽车制造商蔚来正在使用 NVIDIA HGX A100 构建综合全面的数据中心基础设施,并在此基础上开发 AI 驱动的软件定义汽车。凭借高性能计算,蔚来可以在复杂的深度学习模型上不断迭代,在闭环环境中构建强大的自动驾驶算法。
蔚来 AI 平台负责人白宇利表示:“量产车面临的复杂场景是蔚来自动驾驶能力的试金石,同时,量产车产生的海量数据也是蔚来自动驾驶能力护城河。NVIDIA 的高性能计算解决方案,成为了蔚来在自动驾驶这条道路上的加速器。”
蔚来已推出在该基础设施上开发的多款智能汽车,例如智能电动旗舰轿车 ET7 。蔚来的中型智能电动轿跑 ET5 也计划在 9 月首发。
这两款车型均使用高性能数据中心开发,并且在搭载了 4 个 NVIDIA DRIVE Orin 系统级芯片的 Adam 超算平台上构建。它们的自动驾驶和智能座舱功能可以通过数据中心不断迭代和改进,带来具有颠覆性的客户体验。
使用 NVIDIA GPU 和网络构建高性能 AI 基础设施
数据中心可以采集、整理和标记海量数据,以用于训练大型 AI 模型。
数据采集车队每年产生数百 PB 的数据和数十亿张图像。这些数据会被用于优化将在车辆中运行的深度神经网络(DNN)。
蔚来的可扩展 AI 基础设施由 NVIDIA HGX 驱动,共配备 8 个 A100 Tensor Core GPU 和 NVIDIA ConnectX-6 InfiniBand 网卡。这个可扩展的超级计算机集群中包含一组 NVME SSD 服务器,并通过高速 NVIDIA Quantum InfiniBand 网络平台相互连接。
这个强大的基础设施具有 200Gbps 的超高传输速率,可将大量深度学习训练数据传输到超级计算机内存或 NVIDIA A100 显存。
NVIDIA HGX A100 是专为 AI 场景设计的高性能服务器平台,包含了许多大型数据集和复杂的模型(如用于驱动自动驾驶汽车的模型)。该平台在 NGC 中整合了经过全面优化的 NVIDIA AI 软件堆栈,具有 5 PETAFLOPS 的 AI 性能,树立了计算密度的新标杆。
凭借 HGX A100,蔚来自动驾驶研发平台(NADP)能够灵活地开发和部署可扩展的 AI 系统,以一站式平台取代多个孤立的基础设施,以管理大量复杂的 AI 应用,并将模型开发效率提高 20 倍,进而缩短自动驾驶汽车的上市周期,开发出更新、更快的架构。
锐意进取
蔚来正在凭借其软件定义汽车阵容抢占“跑道”。公司宣布计划将合肥工厂的产能提高一倍,达到每年 24 万辆,最高总产可达 30 万辆。
随着蔚来产能的扩大以及在全球市场的不断扩张, NVIDIA HGX 也将随之扩展,助力蔚来部署汽车行业最先进的 AI 平台。
好文章,需要你的鼓励
据《华尔街日报》报道,在马斯克针对OpenAI的诉讼失败后,OpenAI正加速推进IPO计划。CEO萨姆·奥特曼希望公司最快于今年9月上市,目前已与高盛、摩根士丹利合作,并可能在数日或数周内秘密提交上市申请。与此同时,马斯克旗下SpaceX的IPO文件也预计近期公开。两家公司的上市竞争,标志着马斯克与奥特曼的博弈从法庭转移至资本市场。
KAIST团队提出策略助推方法,通过强制分配解题方向引导AI探索多样思路,仅用八份样本就超越了消耗八倍资源的传统方法。
调查显示,51%的专业人士认为AI生成的低质量内容(即"workslop")正在降低生产效率,45%的人因此对职场使用AI更加谨慎。这类内容表面精致却缺乏准确性和实质价值。专家建议两步应对:一是重塑AI生产力思维,推行"AI先行、人工复核"的工作模式;二是保持持续投入,深入掌握AI工具的有效用法。企业领导者强调,真正从AI中受益需要坚持与学习,而非浅尝辄止。
要理解这项研究,先得明白现在的AI是怎么"画"图的。 可以把AI生成图片的过程想象成一个特殊的厨房。当AI要学会画图时,它不会像人类画家那样一笔一画地描绘,而是采用一种叫做"自回归"的方式——简单说就是"一个食材接一个食材地添加"。但问题在于,AI厨房处理的"食材"不是真实的图像像素,而是一种被压缩过的"标准化食材包"。 这个压缩过程,叫做"离散分词",由一个叫"分词器"(tokenizer)的设备完成。打个比方,分词器就像一台高级的食材切片机,它把一整张图片切成很多小块,然后给每一小块贴上一个"编号标签",对应到一本"标签字典"(也就是研究者口中的"码本")里的某个条目。比如,标签001可能代表"蓝天的一小块",标签002代表"绿草的一小块"。 这种做法的好处是大幅简化了AI的工作量——它不用记住几百万个像素,只需要记住一串编号就行了。这就是为什么如今像Chameleon、Emu3这些大名鼎鼎的多模态AI模型都用这种技术。 但问题也恰恰出在这里。当切片机以16倍的压缩率工作时(也就是说原本256个像素被压缩成1个标签),很多细节就被无情地丢弃了。蓝天少一些云彩、草地少几根草尖,人眼几乎看不出来。可一旦切到了文字或人脸,灾难就发生了——一个英文字母"e"和"c"的差别可能就在那么几个像素,一张脸上眉眼的位置稍微挪一挪,整个人就变了样。 研究团队发现,认知科学研究早就指出,人类的视线会不自觉地被文字和人脸吸引,对这两类内容的细节扭曲特别敏感。换句话说,AI画其他东西糊一点没关系,但文字和脸糊了,用户立马就能察觉。 之前的研究者也意识到了这个问题,他们的解决思路通常是"加大切片机的容量"——比如把标签字典从1万6千条扩展到26万条,或者让每张图用更多的标签。但这就像为了切好一根胡萝卜而把整个厨房改造成大型工厂,成本高得离谱,而且效果也不见得好。 清华和微软的团队提出了一个完全不同的思路:与其让切片机变得更大,不如教它学会"看重点"。 二、给切片机装上"火眼金睛"