就在几天前,另一台类似的学术研究用超级计算机刚刚入驻德国慕尼黑
HPE正为新的AI超级计算机揭开面纱。作为本周亮相的第二台AI超算,新系统意在为学术研究构建并训练出更大的机器学习模型。

这台最新超级计算机位于HPE在法国格勒诺布尔的卓越中心,为纪念19世纪在破译埃及象形文字方面取得重大进展的法国学者而命名为Champollion。此系统由HPE与英伟达合作构建,搭载有英伟达A100 GPU和AMD家的Apollo计算机节点。
HPE表示,Champollion将高性能计算(HPC)与专用AI技术结合起来,能够大规模训练机器学习模型并更快给出结果。HPE此前就一直通过格勒诺布尔卓越中心为客户及科研社区提供HPC与AI资源,并有计划向全球科学家和工程师开放Champollion访问权限,帮助他们加快AI建模和研究测试的速度。
这里所谓的“专用AI技术”,指的是HPE机器学习开发环境。这是一套软件平台,属于HPE上月推出的HPE机器学习开发系统的组成部分。
巧合的是,HPE机器学习开发系统同样搭载有英伟达GPU外加AMD家的Apollo计算机节点,所以Champollion在本质上可能就是对HPE机器学习开发系统的超大规模魔改。
HPE提到,Champollion采用20个HPE Apollo 6500 Gen10 Plus服务器节点、160个英伟达A100 GPU,再加上英伟达Quantum InfiniBand网络。HPE机器学习开发系统最低四节点起步,客户可以根据实际需求扩大资源规模。
如果真是基于HPE机器学习开发系统,那么Champollion的各个Apollo节点应该同样配备有4 TB内存和30 TB NVMe本地存储,同时可选HPE并行文件系统存储。系统之上运行有HPE机器学习开发环境,负责为模型的构建和训练工作提供一套可与各流行机器学习框架(例如TensorFlow和PyTorch)相兼容的集成平台。
HPE表示,Champollion目前已经向部分指定用户开放,并将在不久之后放宽使用范围,帮助更多用户开发并训练自己的模型。
本周早些时候,HPE还在慕尼黑莱布尼茨超级计算中心部署了另一台AI超级计算机,也就是HPE Superdome Flex服务器与Cerebras CS-2专用AI系统的结合产物。这套系统还在设计上优化了科学和工程类应用的加速能力。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
延世大学研究团队通过分析AI推理过程中的信息密度模式,发现成功的AI推理遵循特定规律:局部信息分布平稳但全局可以不均匀。这一发现颠覆了传统的均匀信息密度假说在AI领域的应用,为构建更可靠的AI推理系统提供了新思路,在数学竞赛等高难度任务中显著提升了AI的推理准确率。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
蒙特利尔大学团队发现让AI"分段思考"的革命性方法Delethink,通过模仿人类推理模式将长篇思考分解为固定长度块,仅保留关键信息摘要。1.5B小模型击败传统大模型,训练成本降至四分之一,计算复杂度从平方级降为线性级,能处理十万词汇超长推理,为高效AI推理开辟新道路。