“站在计算机行业重启的起点上,你是否已经为下一段重要旅程做好了准备?” NVIDIA 创始人兼首席执行官黄仁勋在Computex 2024(2024台北国际电脑展)上这样问。
当计算机图形学、模拟与人工智能交汇,背后的奥秘,却来自数学、科学和计算机科学的精髓,以及令人叹为观止的计算机架构。
这一切的背后,NVIDIA有着怎样的领会?
GPU 一年一更
在摩尔定律逐渐失去其“预测力”的当下,随着CPU扩展速度放缓,数据量却继续呈指数级增长,最终导致计算需求爆炸性增长和计算成本的提升。而GPU将是解决这一问题的关键。
目前,与2016年发布的Pascal GPU相比,Blackwell GPU的计算能力提升了1000倍,几乎“超越了摩尔定律在最佳时期的增长”。在提高计算能力的同时,成本却在不断下降。使用Pascal产品训练一个GPT-4模型需要消耗高达1000吉瓦时的能量,而利用Blackwell产品仅需3吉瓦时。
面对这样的更新节奏,老黄还是觉得太慢。当NVIDIA最新技术路线图公布,这场“速度与激情”正式上演。“NVIDIA计划之后每年推出一款新的GPU架构,明年将升级Blackwell芯片,进一步提升AI计算的性能和效率。”黄仁勋这样说。
升级后的Blackwell芯片将包括全新的GPU、基于Arm的新CPU——Vera。同时也将带来采用NVLink 6、CX9 SuperNIC和X1600的高级网络平台。据悉,下一代CPU被命名为“Vera”,GPU则为“Rubin”,灵感来源于宇宙暗物质研究先驱、美国女天文学家Vera Rubin。这些新架构将覆盖整个数据中心GPU产品线,打破以往两年更新一代的传统。据透露,NVIDIA 下一代R系列AI芯片或将采用台积电3纳米制程工艺,使用CoWoS-L封装技术,搭载新一代的HBM4高带宽内存技术,有望在2025年第四季度实现大规模生产。
黄仁勋强调,NVIDIA的技术创新步伐将每年加快,通过持续的技术突破,为数据中心、AI工厂、消费级设备和机器人等提供强大的计算能力,推动新一轮的工业革命。
量“厂”定制数据中心
与今年在加州圣何塞会议中心一样,在此次COMPUTEX大会上,黄仁勋在演讲中不断提到了“AI工厂”的概念。
“新一轮工业革命已经开始。众多企业和地区正在与 NVIDIA 合作推动价值万亿美元的传统数据中心向加速计算转型,并建造一种新型数据中心——AI 工厂来生产新的商品:人工智能。”黄仁勋表示 ,“从服务器、网络和基础设施制造商到软件开发商,整个行业正在准备使用 Blackwell 来加速各个领域实现 AI 驱动的创新。”
目前,NVIDIA已经与永擎电子、华硕、技嘉、鸿佰科技、英业达、和硕、QCT、Supermicro、纬创资通和纬颖等合作伙伴携手,共同发布了一系列采用Blackwell架构的系统。这些系统搭载Grace CPU以及NVIDIA网络和基础设施,旨在助力企业建立AI工厂和数据中心,推动新一轮生成式AI的突破。
为了满足各类应用的需求,NVIDIA推出了“量‘厂’定制”的产品组,合覆盖云计算、专用系统、嵌入式和边缘AI系统等多种应用场景。这些新系统的配置非常丰富,涵盖从单GPU到多GPU、从x86到Grace、从风冷到液冷技术等。无论是大型企业还是初创公司,NVIDIA的产品组合都能够满足各种需求,帮助他们在竞争中脱颖而出。
对于更倾向于液冷技术的用户,黄仁勋推荐了NVIDIA全新的系统——MGX。它采用了液体冷却技术,确保了高效稳定的运行。
灵活性也是MGX的亮点,借助 MGX,OEM 和 ODM 合作伙伴可以针对不同用例打造量身定制的解决方案,同时节省开发资源并缩短上市时间。该模块化参考架构支持不同的 GPU、CPU 和 DPU 配置(包括 NVIDIA Grace、x86 或其他 ARM® CPU 服务器以及 NVIDIA OVX™ 系统),可加速各种企业数据中心工作负载。
目前,已有包括AMD 和英特尔在内超过25家合作伙伴的90多套已发布或正在开发中的系统使用了MGX参考架构,较去年来自6家合作伙伴的14套系统有了显著增加。通过采用MGX,开发成本大幅降低,开发时间缩短,显著提高了系统开发效率。
行业层面上,NVIDIA方面透露,中国台湾的长庚纪念医院以及全球最大电子制造商之一Foxconn,都将使用 NVIDIA Blackwell 计算平台推进自身在行业的演进。
NIM让开发者“转行”了
“每个企业都希望在其运营中融入生成式 AI,但并非每个企业都拥有专门的 AI 研究团队。NVIDIA NIM 可被集成到任意平台中,任何地方的开发者都可以访问,并且可以在任意环境中运行——它正在助力科技行业将生成式 AI 普及到每一个企业组织。”黄仁勋说。
NIM通过优化的容器形式提供模型,能够显著加快生成式AI应用的部署时间,将其从数周缩短至几分钟。全球2800万开发者现在可以下载NIM,用于构建和部署copilots和聊天机器人等复杂的生成式AI应用。
事实上,NIM提供了一种简单、标准化的方式,将生成式AI添加到应用中,显著提高了开发者的工作效率。黄仁勋强调,NIM不仅加快了AI模型的部署速度,还显著降低了开发成本和复杂性。开发者无需重新构建或重新训练模型,只需通过NIM提供的标准化接口,即可快速将生成式AI模型集成到应用中。
NIM还可以使企业最大限度地利用其基础设施投资。资料显示,与未使用NIM的情况相比,在NIM中运行Meta Llama 3-8B时,后者在加速基础设施上可产生高达3倍的生成式AI token。这使企业能够大幅提高效率,使用相同的计算基础设施来生成更多的结果。
NVIDIA NIM通过其云原生架构,使企业能够快速部署和管理AI模型。NIM容器是预构建的,以加速模型部署,可用于GPU加速推理,其中包括NVIDIA CUDA软件、NVIDIA Triton推理服务器和NVIDIA TensorRT-LLM软件。通过NIM,开发者可以在任何环境中轻松运行生成式AI模型,显著提高了模型部署的灵活性和效率。
黄仁勋透露,NIM还与多个技术合作伙伴集成,包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和新思科技等近200家技术合作伙伴。这些合作伙伴正在将NIM集成到他们的平台中,以加快生成式AI部署到特定领域应用中的速度,例如copilots、代码助手和数字人虚拟形象。
通过NVIDIA AI Enterprise软件平台,企业可以使用NIM在生产系统中部署AI应用。NVIDIA开发者计划的会员可以免费使用NIM,在其选择的基础设施上进行研究、开发和测试。NIM容器还可以在全球领先的云平台上运行,包括亚马逊云科技、谷歌云、Azure和Oracle云基础设施。
“NIM将彻底改变AI模型的部署和管理方式,使得生成式AI技术能够更快、更广泛地应用到实际场景中。”黄仁勋这样说。
时代革新“四重奏”
“让机械化将成为常态,工厂全面实现自动化,机器人协同工作,制造出一系列机械化产品。它们之间的互动将更加密切,共同创造出一个高度自动化的生产环境。”这是NVIDIA对于人工智能与机器人相结合的未来愿景
现在,它正逐步成为现实。
Omniverse是一个用于创建和操作工业和科学应用的实时3D仿真平台。黄仁勋展示了如何通过Omniverse帮助制造商构建数字孪生,以实时模拟不同工厂布局,优化空间、流程和效率。电子制造商如Delta Electronics、Foxconn、和硕和Wistron等正在利用Omniverse和Isaac技术,打造机器人增强型设施,提高工厂的自主化水平。
黄仁勋解释说,Omniverse平台不仅限于工业应用,它还被广泛应用于娱乐、建筑、汽车设计等多个领域。例如,汽车制造商可以使用Omniverse进行虚拟车辆设计和测试,从而缩短产品开发周期,降低研发成本。影视制作公司则可以利用Omniverse进行虚拟拍摄和特效制作,实现前所未有的创意表达。
Isaac是NVIDIA最新的机器人技术平台。Isaac平台为开发和部署自主机器人提供了一整套工具和服务,涵盖从传感器数据处理到机器学习模型训练的各个环节。通过Isaac,企业可以快速开发和部署高性能的自主机器人,提高生产效率和工作安全性。
黄仁勋提到,Isaac平台与Omniverse的结合,使得机器人开发和部署更加便捷和高效。通过在虚拟环境中进行仿真测试,开发者可以在物理部署前对机器人进行全面的验证和优化,从而减少开发周期和成本。
此外,NVIDIA更是推出了最新网络技术平台Spectrum-X。作为全球首款专为AI打造的以太网网络平台,Spectrum-X能够显著提升AI模型的训练和推理速度。Spectrum-X采用先进的动态路由技术和拥塞控制算法,确保数据传输的高效性和稳定性,为AI应用提供了坚实的网络基础设施。
在边缘计算方面,通过NVIDIA IGX平台,企业可以在边缘部署高性能的AI应用,实现实时数据处理和智能决策。这一平台特别适用于医疗、工业和科学等需要低延迟和高可靠性的应用场景。
写在最后
从Blackwell芯片的年度升级,MGX的定制化与生态扩展,到NIM云原生微服务的灵活高效,再到Omniverse和Isaac平台的广泛应用,NVIDIA正在通过不断的技术突破和战略合作,推动全球计算技术的变革和发展。正如黄仁勋所说:“新一轮工业革命已经开始,我们将继续努力,引领时代潮流,塑造未来。”
好文章,需要你的鼓励
阿里巴巴推出全新 Qwen3 系列人工智能模型,采用混合专家技术在编码、数学和推理测试中超越部分美国顶级模型,支持119种语言,助力实现超越人类智慧的通用人工智能目标。
OpenAI更新ChatGPT搜索功能,新增购物体验,提供产品推荐与直购链接,力图挑战Google购物服务。
这篇文章介绍了 14 款在心理健康领域具有创新性的生成式 AI 工具,涵盖正念应用、聊天机器人、个性化疗法助手以及 AI 驱动的日记记录。虽然 AI 还无法完全替代专业治疗师的人性关怀,但这些平台正在为更广泛人群提供便捷、匿名的支持和指导,推动数字心理健康护理的普及与革新。
Nvidia 推出基于 BlueField 处理单元的 DOCA Argus 框架,实现对 AI 工作负载的无代理实时威胁检测,并与 Cisco 合作,为 AI 基础设施提供全方位安全防护。