就在几天前,另一台类似的学术研究用超级计算机刚刚入驻德国慕尼黑
HPE正为新的AI超级计算机揭开面纱。作为本周亮相的第二台AI超算,新系统意在为学术研究构建并训练出更大的机器学习模型。
这台最新超级计算机位于HPE在法国格勒诺布尔的卓越中心,为纪念19世纪在破译埃及象形文字方面取得重大进展的法国学者而命名为Champollion。此系统由HPE与英伟达合作构建,搭载有英伟达A100 GPU和AMD家的Apollo计算机节点。
HPE表示,Champollion将高性能计算(HPC)与专用AI技术结合起来,能够大规模训练机器学习模型并更快给出结果。HPE此前就一直通过格勒诺布尔卓越中心为客户及科研社区提供HPC与AI资源,并有计划向全球科学家和工程师开放Champollion访问权限,帮助他们加快AI建模和研究测试的速度。
这里所谓的“专用AI技术”,指的是HPE机器学习开发环境。这是一套软件平台,属于HPE上月推出的HPE机器学习开发系统的组成部分。
巧合的是,HPE机器学习开发系统同样搭载有英伟达GPU外加AMD家的Apollo计算机节点,所以Champollion在本质上可能就是对HPE机器学习开发系统的超大规模魔改。
HPE提到,Champollion采用20个HPE Apollo 6500 Gen10 Plus服务器节点、160个英伟达A100 GPU,再加上英伟达Quantum InfiniBand网络。HPE机器学习开发系统最低四节点起步,客户可以根据实际需求扩大资源规模。
如果真是基于HPE机器学习开发系统,那么Champollion的各个Apollo节点应该同样配备有4 TB内存和30 TB NVMe本地存储,同时可选HPE并行文件系统存储。系统之上运行有HPE机器学习开发环境,负责为模型的构建和训练工作提供一套可与各流行机器学习框架(例如TensorFlow和PyTorch)相兼容的集成平台。
HPE表示,Champollion目前已经向部分指定用户开放,并将在不久之后放宽使用范围,帮助更多用户开发并训练自己的模型。
本周早些时候,HPE还在慕尼黑莱布尼茨超级计算中心部署了另一台AI超级计算机,也就是HPE Superdome Flex服务器与Cerebras CS-2专用AI系统的结合产物。这套系统还在设计上优化了科学和工程类应用的加速能力。
好文章,需要你的鼓励
Xbox 部门推出了名为 Muse 的生成式 AI 模型,旨在为游戏创造视觉效果和玩法。这一举措反映了微软全面拥抱 AI 技术的战略,尽管游戏开发者对 AI 持谨慎态度。Muse 不仅可能提高游戏开发效率,还有望实现老游戏的现代化改造,但其实际效果和对行业的影响仍有待观察。
Sonar收购AutoCodeRover,旨在通过自主AI代理增强其代码质量工具。这项收购将使Sonar客户能够自动化调试和问题修复等任务,让开发者将更多时间用于改进应用程序而非修复bug。AutoCodeRover的AI代理能够自主修复有问题的代码,将与Sonar的工具集成,提高开发效率并降低成本。
人工智能正在推动数据中心的变革。为满足 AI workload 的需求,数据中心面临前所未有的电力消耗增长、散热压力和设备重量挑战。应对这些挑战需要创新的解决方案,包括 AI 专用硬件、可再生能源、液冷技术等。同时,数据中心还需平衡监管压力和社区关切。未来数据中心的发展将决定 AI 技术能否实现其变革性潜力。