长久以来,将大量GPU出售给超大规模计算基础设施运营商和云服务商,一直是扩大生成式AI模型并展示其能力的最佳方式,同时充分证明生成式AI对于全球各国的重要战略意义。但大规模云环境往往由美国和中国的企业控制,因此让很多人心存疑虑。
随着英伟达逐渐扩大“Hopper”和“Blackwell”GPU的产能,并找到新的途径能够满足超大规模计算设施运营商、云服务商乃至更多政府部门和企业的硬件资源需求,主权AI云的概念也就此一飞冲天。相信各位也都能想到,此番浪潮之下受益最大的就是英伟达自己。
上个月,英伟达公司CEO黄仁勋在印度提出了这一“主权AI”观点,宣布与印度各主要IT厂商及云服务商建立合作伙伴关系,包括Reliance Industries、Infosys、Yotta Data Services、Tata Communications以及Tech Mahindra,旨在扩大AI科技在整个印度经济体系中的应用。
黄仁勋当时指出,“印度应当构建自己的AI,而且有着充分的理由。一个国家不能总是通过出口数据的形式来换取智能资源。”
这对此类国家不啻为一个福音,意味着他们将逐渐掌控一种新兴技术,进而从诸多方面在根本上改变其商业乃至全社会的运作模式。主权AI也将成为英伟达的一大胜利,因为其能够将这个概念传播到全世界,激起更多国家的建设意愿。英伟达预计到今年年底,该公司在印度的GPU部署量将增长近10倍。
本周,这家GPU制造商在东京召开的AI峰会则将焦点集中在日本。黄仁勋与软银集团董事长兼首席执行官孙正义坐在一起,讨论了英伟达和日本在运用AI以及英伟达软硬件组合在实现这一目标方面的宏伟抱负。
据报道,日本官员希望通过宽松的监管方式让日本成为AI友好型国家,从而吸引更多AI厂商进入该国。黄仁勋和其他英伟达公司高管则盛赞了日本的创新历史,以及该国浓厚的技术应用氛围和良好的AI技能储备。
英伟达公司电信业务高级副总裁Ronnie Vasishta在视频采访中告诉记者,“日本正身处这一转型的前沿,采用英伟达AI基础设施的日本云计算领先厂商将帮助日本推动各最重要行业的转型,使其建设主权AI的雄心真正落地。”
英伟达还指出,他们已经在AI项目上与众多日本企业开展合作,而其中最具份量的当数同日本跨国集团软银的合作。软银将成为第一家使用英伟达Blackwell平台构建其超级计算机(也将成为日本最强大的超级计算机)的公司。
软银集团将使用英伟达的DGX B200系统作为其英伟达DGX SuperPOD超级计算机的基础,这套超级计算机系统在帮助软银实现生成式AI目标之余,也将向日本的其他企业、大学以及研究机构开放访问。DGX B200系统于今年3月首次公布,搭载8张Blackwell GPU,采用英伟达公司第五代NVLink实现互联互通,可为每张GPU提供1.8 TB/秒的双工吞吐量。
该平台还包含一套专用的RAS(可靠性、可用性及可维护性)引擎和一套解压缩引擎,用于加快数据库的查询速度。据英伟达方面介绍,该平台的AI模型训练性能可达其前代产品的三倍,推理性能更是达到其前代产品的15倍。
软银这套超级计算机系统还将采用英伟达的AI Enterprise软件以及Quantum-2 InfiniBand网络,大大降低大语言模型(LLM)的开发门槛,在主权AI概念的推动下更好地为日语用户提供服务。
软银还计划使用英伟达的Grace-Blackwell平台构建起另一套基于英伟达架构的超级计算机系统,该平台采用GB200 NVL72液冷机架级系统,其中同时搭载Blackwell GPU以及基于Arm的Grace CPU。这套系统将主要用于计算极端密集型工作负载。
介于两者之间的另一个项目,则是由软银集团和英伟达共同开发的AI-RAN——这是一套可同时运行AI及5G工作负载的电信网络。
英伟达的Vasishta解释称,“要实现AI科技的大众化,首先需要建议起国家级的AI基础设施。这些AI设施的作用就是创造智能,也就是构建并训练出能够为日本产业服务的全新模型。与此同时,还需要一套交付网络来实现智能资源分发,使得AI推理尽可能靠近端点。AI应用程序则需要配合这些AI原生端点以使用智能资源。”
该网络将使用软件定义的5G射频协议栈,其中包括基于英伟达Aerial加速平台的L1软件。两家公司已经在选定的日本地区对AI-RAN网络进行了户外测试,并实现了运营商级的5G性能,同时利用网络中的过剩容量运行了AI推理作业。软银方面估计,为了应对峰值期高企的临时负载,传统电信网络在大部分时间里只使用到了三分之一的容量。
软银方面表示,他们纳入企业环境的英伟达Aeria RAN Computer-1系统在运行时将比传统5G网络基础设施节约40%的电力。软银的孙正义在与黄仁勋同台时指出,“通过我们携手打造的这套智能网络,日本基础设施智能将就此迎来一颗巨大的神经大脑。”
对于电信业务来说,由于能够在同一网络之上运行AI类工作负载,因此也将开辟出新的收入来源。英伟达和软银估计,电信企业在新的AI-RAN基础设施上每投资1美元,就能从AI推理收入方面获得约5美元的回报。软银还估计,他们每增加一台AI-RAN服务器,就能获得高达291%的回报。
英伟达还建立了其他合作伙伴关系,包括与GMO Internet Group、KDDI以及Sakura Internet等云计算厂商合作,共同依托英伟达的硬件和软件构建国家AI基础设施网络,推动日本在机器人、医疗保健和药物研究等领域中的AI创新。
好文章,需要你的鼓励
Instagram负责人莫塞里在接受采访时透露,平台正考虑引入长视频内容功能,尽管此前一直专注于短视频。他承认为了吸引优质内容,Instagram可能需要支持长视频格式。此外,Meta最近推出了"您的算法"功能,旨在让用户更好地控制信息流内容。莫塞里承诺未来将提供更多工具,让用户主动塑造个性化内容,但完整实现可能需要2-4年时间。
香港大学联合Adobe研究院提出PS-VAE技术,成功解决了AI无法同时具备图像理解和生成能力的难题。通过创新的两阶段训练策略,让AI既能准确理解图片语义,又能生成高质量图像,在图像编辑任务上性能提升近4倍,为统一视觉AI系统开辟新路径,在数字创作、教育、电商等领域具有广阔应用前景。
在信息爆炸的时代,AI实验室的研究员们常常需要面对海量的论文、专利文件、论坛发言等各种渠道的信息。传统的查找方式不仅费时费力,还容易遗漏关键内容。那么,有没有一种方式能让AI真正代替人工,完成从找资料到写出稿的全流程工作?
华中科技大学与马里兰大学研究团队开发出Sage评估框架,首次无需人工标注即可评估AI评判员可靠性。研究发现即使最先进的AI模型在评判任务中也存在严重不一致问题,近四分之一困难情况下无法保持稳定偏好。团队提出明确评判标准和专门微调等改进方法,为构建更可靠AI评估体系提供重要工具。