全球最先进的AI系统现可按照每20个节点为一个增量单元搭建;首批产品将在年底前安装到韩国、英国、瑞典和印度。
NVIDIA今日发布企业版NVIDIA DGX SuperPOD™解决方案,这是全球首个一站式AI基础设施,能够让企业以惊人的速度安装功能强大的AI超级计算机——通常只需短短几周时间。
已上市的DGX SuperPOD是由包含20个到140个独立的NVIDIA DGX A100™系统构建的集群,现已发往韩国、英国、瑞典和印度,预计在年底前安装完毕。
DGX SuperPOD系统以借助NVIDIA Mellanox® HDR InfiniBand网络互联的20个模块来销售,AI性能最低可达到100 petaflops,最高可达700 petaflops,可运行最复杂的AI工作。
NVIDIA副总裁兼DGX系统总经理Charlie Boyle表示:“传统超级计算机可能要花费数年时间来进行规划和部署,但企业版NVIDIA DGX SuperPOD作为一款一站式解决方案,可以即刻开启AI转型之旅。最先进的对话式AI、推荐系统和计算机视觉的工作负载迅速突破传统基础设施的能力所限,此次发布的全新解决方案让客户‘与时俱进’——享有全球最先进、且可扩展的AI基础设施,获益于NVIDIA的专有技术。”
全球“创新者”采用DGX SuperPOD打造顶尖AI中心
一些有远见的组织正采用企业版DGX SuperPOD解决方案打造顶尖AI中心。今日发布全新DGX SuperPOD AI超级计算机的组织包括:
NAVER,韩国领先的搜索引擎NAVER与日本首屈一指的即时通讯服务公司LINE共同创立了AI技术品牌NAVER CLOVA。NAVER CLOVA使用的DGX SuperPOD包含140个DGX A100系统,用于已部署NVIDIA TensorRT™ SDK的AI平台上,扩展自然语言处理模型和对话式AI服务的研发,以实现高性能深度学习推理。
Linköping University,位于瑞典,其正在打造BerzeLiU,一台由60个DGX A100系统组成的DGX SuperPOD。它将成为推进AI研究的强大动力,并推动学术界和瑞典工业界在Kunt和Alice Wallenberg基金会资助下的研究项目间的合作,比如Wallenberg AI、自主系统和软件程序,以及生命科学和量子技术方面的新倡议。
C-DAC,印度高级计算发展中心(印度电子和信息技术部下属机构)正在启用印度最快、最大的高性能计算-AI超级计算机PARAM Siddhi -AI。该超级计算机由42个DGX A100系统组成,将通过研究学术界、业界和初创企业间的研究伙伴关系和相互协作,帮助应对医疗健康、教育、能源、网络安全、空间、汽车和农业等领域的全国性和全球性挑战。
此外,NVIDIA今天另行宣布了Cambridge-1的建造计划,这是一款80节点的DGX SuperPOD,具备400 petaflops 的AI性能。今年年底一经部署便将成为英国最快的超级计算机。该系统将被用于英国学术界、业界和初创企业在AI和医疗健康领域的合作研究。
Cambridge-1将加速各类医疗工作的开展,包括使用NVIDIA Clara™医疗应用程序框架进行药物研发。它还允许研究人员借助NVIDIA NGC™软件中心中专业的NVIDIA BioMegatron模型运行自然语言运算,快速分析大量医疗信息。
全球领先的AI创新基础设施
企业版DGX SuperPOD解决方案是基于NVIDIA多年致力于创造全球最先进的AI系统的成果打造而成,旨在推动NVIDIA在汽车、医疗健康、对话式AI、推荐系统、数据科学和计算机图形等领域的工程。
NVIDIA Selene是一款280节点的DGX SuperPOD,在今年早些时候发布的TOP500和MLPerf测试中均名列前茅,奠定了AI更高的门槛。其DGX SuperPOD架构还实现了效率突破,其20 gigaflops /瓦的效率创造了Green500性能记录。
AI基础设施需要极高的存储速度,以并行处理各类数据,例如文本、表格数据、音频和视频。NVIDIA 企业版DGX SuperPOD解决方案采用全闪存存储并经过优化,能满足客户的特定要求以及AI工作负载的独特需求。DDN是企业版DGX SuperPOD解决方案首个通过NVIDIA认证的存储合作伙伴。
完全集成的AI部署跨系统至软件
从定制化容量规划和数据中心设计服务,到应用程序性能测试和开发人员操作培训,企业版DGX SuperPOD解决方案是实现大规模AI创新的捷径。每台DGX SuperPOD均由NVIDIA认证的合作伙伴进行调试、堆叠和配置。这些精心选拔而出的NVIDIA AI专家可确保安装轻松易行,即便是通过大量电缆连接数十甚至数百个节点的AI基础设施的安装流程也十分简单。
安装后,NVIDIA和认证专家将与客户合作,以确保其AI工作负载通过NGC中的最新NVIDIA软件进行优化,包括云原生GPU优化型容器、模型和适用于特定行业的SDK。
供货
企业版DGX SuperPOD解决方案可从全球优选的NVIDIA合作伙伴获得。
除全新的企业版DGX SuperPOD解决方案外,DGX SuperPOD 蓝本已可作为NVIDIA认证的合作伙伴用于规划和部署自身DGX SuperPOD方案的行业指南,并为NGC软件提供完整服务和经认证的支持。
好文章,需要你的鼓励
大数据可观测性初创公司Monte Carlo Data推出全新Agent Observability产品,为AI应用提供全方位数据和AI可观测性。该工具帮助团队检测、分类和修复生产环境中AI应用的可靠性问题,防止代价高昂的"幻觉"现象,避免客户信任度下降和系统宕机。新产品采用大语言模型作为评判器的技术,能够同时监控AI数据输入和输出,提供统一的AI可观测性解决方案。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
网络安全公司Aikido披露了迄今最大规模的npm供应链攻击事件。攻击者通过钓鱼邮件获取维护者账户凭证,向18个热门JavaScript包注入恶意代码,这些包每周下载量超过26亿次。恶意代码专门劫持加密货币交易,监控浏览器API接口将资金转移至攻击者地址。受影响的包括chalk、debug等广泛使用的开发工具库。虽然攻击在5分钟内被发现并及时公开,但专家警告此类上游攻击极具破坏性,可能与朝鲜黑客组织相关。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。