长久以来,将大量GPU出售给超大规模计算基础设施运营商和云服务商,一直是扩大生成式AI模型并展示其能力的最佳方式,同时充分证明生成式AI对于全球各国的重要战略意义。但大规模云环境往往由美国和中国的企业控制,因此让很多人心存疑虑。
随着英伟达逐渐扩大“Hopper”和“Blackwell”GPU的产能,并找到新的途径能够满足超大规模计算设施运营商、云服务商乃至更多政府部门和企业的硬件资源需求,主权AI云的概念也就此一飞冲天。相信各位也都能想到,此番浪潮之下受益最大的就是英伟达自己。
上个月,英伟达公司CEO黄仁勋在印度提出了这一“主权AI”观点,宣布与印度各主要IT厂商及云服务商建立合作伙伴关系,包括Reliance Industries、Infosys、Yotta Data Services、Tata Communications以及Tech Mahindra,旨在扩大AI科技在整个印度经济体系中的应用。
黄仁勋当时指出,“印度应当构建自己的AI,而且有着充分的理由。一个国家不能总是通过出口数据的形式来换取智能资源。”
这对此类国家不啻为一个福音,意味着他们将逐渐掌控一种新兴技术,进而从诸多方面在根本上改变其商业乃至全社会的运作模式。主权AI也将成为英伟达的一大胜利,因为其能够将这个概念传播到全世界,激起更多国家的建设意愿。英伟达预计到今年年底,该公司在印度的GPU部署量将增长近10倍。
本周,这家GPU制造商在东京召开的AI峰会则将焦点集中在日本。黄仁勋与软银集团董事长兼首席执行官孙正义坐在一起,讨论了英伟达和日本在运用AI以及英伟达软硬件组合在实现这一目标方面的宏伟抱负。
据报道,日本官员希望通过宽松的监管方式让日本成为AI友好型国家,从而吸引更多AI厂商进入该国。黄仁勋和其他英伟达公司高管则盛赞了日本的创新历史,以及该国浓厚的技术应用氛围和良好的AI技能储备。
英伟达公司电信业务高级副总裁Ronnie Vasishta在视频采访中告诉记者,“日本正身处这一转型的前沿,采用英伟达AI基础设施的日本云计算领先厂商将帮助日本推动各最重要行业的转型,使其建设主权AI的雄心真正落地。”
英伟达还指出,他们已经在AI项目上与众多日本企业开展合作,而其中最具份量的当数同日本跨国集团软银的合作。软银将成为第一家使用英伟达Blackwell平台构建其超级计算机(也将成为日本最强大的超级计算机)的公司。
软银集团将使用英伟达的DGX B200系统作为其英伟达DGX SuperPOD超级计算机的基础,这套超级计算机系统在帮助软银实现生成式AI目标之余,也将向日本的其他企业、大学以及研究机构开放访问。DGX B200系统于今年3月首次公布,搭载8张Blackwell GPU,采用英伟达公司第五代NVLink实现互联互通,可为每张GPU提供1.8 TB/秒的双工吞吐量。
该平台还包含一套专用的RAS(可靠性、可用性及可维护性)引擎和一套解压缩引擎,用于加快数据库的查询速度。据英伟达方面介绍,该平台的AI模型训练性能可达其前代产品的三倍,推理性能更是达到其前代产品的15倍。
软银这套超级计算机系统还将采用英伟达的AI Enterprise软件以及Quantum-2 InfiniBand网络,大大降低大语言模型(LLM)的开发门槛,在主权AI概念的推动下更好地为日语用户提供服务。
软银还计划使用英伟达的Grace-Blackwell平台构建起另一套基于英伟达架构的超级计算机系统,该平台采用GB200 NVL72液冷机架级系统,其中同时搭载Blackwell GPU以及基于Arm的Grace CPU。这套系统将主要用于计算极端密集型工作负载。
介于两者之间的另一个项目,则是由软银集团和英伟达共同开发的AI-RAN——这是一套可同时运行AI及5G工作负载的电信网络。
英伟达的Vasishta解释称,“要实现AI科技的大众化,首先需要建议起国家级的AI基础设施。这些AI设施的作用就是创造智能,也就是构建并训练出能够为日本产业服务的全新模型。与此同时,还需要一套交付网络来实现智能资源分发,使得AI推理尽可能靠近端点。AI应用程序则需要配合这些AI原生端点以使用智能资源。”
该网络将使用软件定义的5G射频协议栈,其中包括基于英伟达Aerial加速平台的L1软件。两家公司已经在选定的日本地区对AI-RAN网络进行了户外测试,并实现了运营商级的5G性能,同时利用网络中的过剩容量运行了AI推理作业。软银方面估计,为了应对峰值期高企的临时负载,传统电信网络在大部分时间里只使用到了三分之一的容量。
软银方面表示,他们纳入企业环境的英伟达Aeria RAN Computer-1系统在运行时将比传统5G网络基础设施节约40%的电力。软银的孙正义在与黄仁勋同台时指出,“通过我们携手打造的这套智能网络,日本基础设施智能将就此迎来一颗巨大的神经大脑。”
对于电信业务来说,由于能够在同一网络之上运行AI类工作负载,因此也将开辟出新的收入来源。英伟达和软银估计,电信企业在新的AI-RAN基础设施上每投资1美元,就能从AI推理收入方面获得约5美元的回报。软银还估计,他们每增加一台AI-RAN服务器,就能获得高达291%的回报。
英伟达还建立了其他合作伙伴关系,包括与GMO Internet Group、KDDI以及Sakura Internet等云计算厂商合作,共同依托英伟达的硬件和软件构建国家AI基础设施网络,推动日本在机器人、医疗保健和药物研究等领域中的AI创新。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。