长久以来,将大量GPU出售给超大规模计算基础设施运营商和云服务商,一直是扩大生成式AI模型并展示其能力的最佳方式,同时充分证明生成式AI对于全球各国的重要战略意义。但大规模云环境往往由美国和中国的企业控制,因此让很多人心存疑虑。
随着英伟达逐渐扩大“Hopper”和“Blackwell”GPU的产能,并找到新的途径能够满足超大规模计算设施运营商、云服务商乃至更多政府部门和企业的硬件资源需求,主权AI云的概念也就此一飞冲天。相信各位也都能想到,此番浪潮之下受益最大的就是英伟达自己。
上个月,英伟达公司CEO黄仁勋在印度提出了这一“主权AI”观点,宣布与印度各主要IT厂商及云服务商建立合作伙伴关系,包括Reliance Industries、Infosys、Yotta Data Services、Tata Communications以及Tech Mahindra,旨在扩大AI科技在整个印度经济体系中的应用。
黄仁勋当时指出,“印度应当构建自己的AI,而且有着充分的理由。一个国家不能总是通过出口数据的形式来换取智能资源。”
这对此类国家不啻为一个福音,意味着他们将逐渐掌控一种新兴技术,进而从诸多方面在根本上改变其商业乃至全社会的运作模式。主权AI也将成为英伟达的一大胜利,因为其能够将这个概念传播到全世界,激起更多国家的建设意愿。英伟达预计到今年年底,该公司在印度的GPU部署量将增长近10倍。
本周,这家GPU制造商在东京召开的AI峰会则将焦点集中在日本。黄仁勋与软银集团董事长兼首席执行官孙正义坐在一起,讨论了英伟达和日本在运用AI以及英伟达软硬件组合在实现这一目标方面的宏伟抱负。
据报道,日本官员希望通过宽松的监管方式让日本成为AI友好型国家,从而吸引更多AI厂商进入该国。黄仁勋和其他英伟达公司高管则盛赞了日本的创新历史,以及该国浓厚的技术应用氛围和良好的AI技能储备。
英伟达公司电信业务高级副总裁Ronnie Vasishta在视频采访中告诉记者,“日本正身处这一转型的前沿,采用英伟达AI基础设施的日本云计算领先厂商将帮助日本推动各最重要行业的转型,使其建设主权AI的雄心真正落地。”
英伟达还指出,他们已经在AI项目上与众多日本企业开展合作,而其中最具份量的当数同日本跨国集团软银的合作。软银将成为第一家使用英伟达Blackwell平台构建其超级计算机(也将成为日本最强大的超级计算机)的公司。
软银集团将使用英伟达的DGX B200系统作为其英伟达DGX SuperPOD超级计算机的基础,这套超级计算机系统在帮助软银实现生成式AI目标之余,也将向日本的其他企业、大学以及研究机构开放访问。DGX B200系统于今年3月首次公布,搭载8张Blackwell GPU,采用英伟达公司第五代NVLink实现互联互通,可为每张GPU提供1.8 TB/秒的双工吞吐量。
该平台还包含一套专用的RAS(可靠性、可用性及可维护性)引擎和一套解压缩引擎,用于加快数据库的查询速度。据英伟达方面介绍,该平台的AI模型训练性能可达其前代产品的三倍,推理性能更是达到其前代产品的15倍。
软银这套超级计算机系统还将采用英伟达的AI Enterprise软件以及Quantum-2 InfiniBand网络,大大降低大语言模型(LLM)的开发门槛,在主权AI概念的推动下更好地为日语用户提供服务。
软银还计划使用英伟达的Grace-Blackwell平台构建起另一套基于英伟达架构的超级计算机系统,该平台采用GB200 NVL72液冷机架级系统,其中同时搭载Blackwell GPU以及基于Arm的Grace CPU。这套系统将主要用于计算极端密集型工作负载。
介于两者之间的另一个项目,则是由软银集团和英伟达共同开发的AI-RAN——这是一套可同时运行AI及5G工作负载的电信网络。
英伟达的Vasishta解释称,“要实现AI科技的大众化,首先需要建议起国家级的AI基础设施。这些AI设施的作用就是创造智能,也就是构建并训练出能够为日本产业服务的全新模型。与此同时,还需要一套交付网络来实现智能资源分发,使得AI推理尽可能靠近端点。AI应用程序则需要配合这些AI原生端点以使用智能资源。”
该网络将使用软件定义的5G射频协议栈,其中包括基于英伟达Aerial加速平台的L1软件。两家公司已经在选定的日本地区对AI-RAN网络进行了户外测试,并实现了运营商级的5G性能,同时利用网络中的过剩容量运行了AI推理作业。软银方面估计,为了应对峰值期高企的临时负载,传统电信网络在大部分时间里只使用到了三分之一的容量。
软银方面表示,他们纳入企业环境的英伟达Aeria RAN Computer-1系统在运行时将比传统5G网络基础设施节约40%的电力。软银的孙正义在与黄仁勋同台时指出,“通过我们携手打造的这套智能网络,日本基础设施智能将就此迎来一颗巨大的神经大脑。”
对于电信业务来说,由于能够在同一网络之上运行AI类工作负载,因此也将开辟出新的收入来源。英伟达和软银估计,电信企业在新的AI-RAN基础设施上每投资1美元,就能从AI推理收入方面获得约5美元的回报。软银还估计,他们每增加一台AI-RAN服务器,就能获得高达291%的回报。
英伟达还建立了其他合作伙伴关系,包括与GMO Internet Group、KDDI以及Sakura Internet等云计算厂商合作,共同依托英伟达的硬件和软件构建国家AI基础设施网络,推动日本在机器人、医疗保健和药物研究等领域中的AI创新。
好文章,需要你的鼓励
在技术快速发展的时代,保护关键系统越来越依赖AI、自动化和行为分析。数据显示,2024年95%的数据泄露源于人为错误,64%的网络事件由员工失误造成。虽然先进的网络防御技术不断发展,但人类判断仍是最薄弱环节。网络韧性不仅是技术挑战,更是人员和战略需求。建立真正的韧性需要机器精确性与人类判断力的结合,将信任视为战略基础设施的关键要素,并将网络韧性提升为国家安全的核心组成部分。
南洋理工大学团队开发了Uni-MMMU基准测试,专门评估AI模型的理解与生成协同能力。该基准包含八个精心设计的任务,要求AI像人类一样"边看边想边画"来解决复杂问题。研究发现当前AI模型在这种协同任务上表现不平衡,生成能力是主要瓶颈,但协同工作确实能提升问题解决效果,为开发更智能的AI助手指明了方向。
自计算机诞生以来,人们就担心机器会背叛创造者。近期AI事件包括数据泄露、自主破坏行为和系统追求错误目标,暴露了当前安全控制的弱点。然而这种结果并非不可避免。AI由人类构建,用我们的数据训练,在我们设计的硬件上运行。人类主导权仍是决定因素,责任仍在我们。
360 AI Research团队发布的FG-CLIP 2是一个突破性的双语精细视觉语言对齐模型,能够同时处理中英文并进行精细的图像理解。该模型通过两阶段训练策略和多目标联合优化,在29个数据集的8类任务中均达到最先进性能,特别创新了文本内模态对比损失机制。团队还构建了首个中文多模态评测基准,填补了该领域空白,为智能商务、安防监控、医疗影像等应用开辟新可能。