本周在圣路易斯举办的SC25超级计算大会上,多家主要科技企业借此机会发布了面向人工智能热潮的关键高性能计算产品和服务。
大会聚焦超级计算行业发展
这一北美超级计算行业的重要盛会举办了研讨会、教程和供应商展示,重点关注大数据、机器学习、存储、量子和百亿亿次系统、性能监控等领域。超过500家参展商向18000多名与会者展示了他们的产品和服务。
顶级芯片制造商和计算机制造商纷纷在活动中发布新产品。以下是大会迄今为止的新闻汇总:
英伟达发布新一代AI模型和超级计算机
GPU领域巨头英伟达将推出名为Apollo的物理仿真AI模型产品,以及为日本理化学研究所开发的两台新超级计算机。
据英伟达介绍,Apollo的AI模型针对特定物理工作负载进行优化,每个模型都专注于可扩展性、精度和性能提升。
在SC25大会前的新闻发布会上,哈里斯表示:"虽然CUDA-X可以将物理求解器从数天加速到数小时,但AI可以进一步压缩多年时间和PB级仿真数据以及数十年知识,形成能够实时运行的AI模型。"
英伟达还公布了基于Grace-Blackwell GPU架构和InfiniBand互联技术为日本理化学研究所开发的两台超级计算机。第一套系统将处理生命科学、材料科学、天气预报和制造自动化等高性能计算工作负载,采用GB200 NVL4平台上的1600个Blackwell GPU。
第二套系统将专门处理量子计算,配备540个Blackwell GPU,使用英伟达的Quantum-X800 InfiniBand网络。
理化学研究所计算科学中心主任松冈聪在声明中表示:"将英伟达GB200 NVL4加速计算平台与我们的下一代超级计算机整合,代表了日本科学基础设施的关键性进步。"
戴尔推出专注AI的服务器和交换机,升级AI工厂
戴尔科技的XE9785和XE9785L服务器现已正式发布,采用AMD Instinct加速器,同时首次推出基于英特尔的PowerEdge服务器R770AP。
XE7985和XE9785L专门针对AI训练和推理,承诺提供比前一代更好的性能。公司表示,R770AP将处理高性能计算和AI工作负载。
戴尔还在PowerSwitch系列中推出了两款新交换机——Z9964F-ON和Z9964FL-ON,通过提供102.4Tb/s的交换容量来处理AI工作负载。
戴尔还表示,新升级将使其与英伟达的AI工厂合作受益,包括ObjectScale和PowerScale存储设备与英伟达NIXL库的集成。英伟达将NIXL描述为其分布式推理服务框架。
两家公司还将戴尔的PowerEdge XE7740和XE7745服务器添加到AI工厂阵容中,配备英伟达的RTXPro 600 Blackwell服务器版GPU和Hopper GPU。
Omdia实践总监斯科特·辛克莱尔表示:"企业正在寻求结合自动化、可扩展性和性能的AI基础设施解决方案,以加快价值实现时间,同时降低复杂性。戴尔AI工厂的最新增强功能简化了部署,并提供具有安全基础的集成工具,帮助组织有信心地从实验转向生产。"
法国展示首台百亿亿次超级计算机
法国先进计算公司Eviden与AMD合作,建设法国首台百亿亿次超级计算机,该系统将作为欧洲的大规模AI工厂。
这台名为Alice Recoque的超级计算机将超过每秒1百亿亿次浮点运算,与同等级百亿亿次计算机相比,GPU效率提升高达50%,服务器机架减少25%。该系统将采用AMD的EPYC CPU和Instinct MI430X GPU。
这套耗资6.4亿美元、建设周期5年的系统将成为欧洲第二台百亿亿次超级计算机。法国替代能源和原子能委员会(CEA)将在其超大规模计算中心(TGCC)部署这台计算机。
该系统将基于Eviden新发布的BullSequana XH3500平台构建,该平台采用模块化架构,专为融合HPC和AI工作负载而设计。
Eviden表示,这台超级计算机将具有可持续性,通过改进的应用工作负载能效,预计与类似的百亿亿次系统相比,整体能耗降低约20%。
法国高等教育、研究和太空部长菲利普·巴蒂斯特称这台超级计算机是"法国和欧洲的重大进步"。
巴蒂斯特在声明中表示:"该项目体现了我们在高性能计算、人工智能和量子技术领域的共同雄心,同时加强了我们的技术领导地位。"
Q&A
Q1:英伟达Apollo AI模型有什么特别的功能?
A:Apollo是英伟达推出的专门针对物理仿真的AI模型产品,能够将多年时间和PB级仿真数据以及数十年知识压缩成可实时运行的AI模型。每个模型都针对特定物理工作负载进行优化,专注于可扩展性、精度和性能提升。
Q2:戴尔新发布的服务器和交换机有哪些亮点?
A:戴尔发布了采用AMD Instinct加速器的XE9785和XE9785L服务器,专门针对AI训练和推理;还有基于英特尔的PowerEdge R770AP服务器。同时推出两款新交换机Z9964F-ON和Z9964FL-ON,提供102.4Tb/s的交换容量来处理AI工作负载。
Q3:法国Alice Recoque超级计算机有什么特色?
A:Alice Recoque是法国首台百亿亿次超级计算机,性能超过每秒1百亿亿次浮点运算。与同等级计算机相比,GPU效率提升高达50%,服务器机架减少25%。采用AMD EPYC CPU和Instinct MI430X GPU,预计整体能耗比类似系统降低20%。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。