HPE日前向英国三所大学捐赠了三台Apollo迷你超级计算机集群,以帮助英国建立Arm超级计算专业技术及推广旗下的Apollo设备。
三所大学分别为爱丁堡大学的爱丁堡并行计算中心(EPCC),布里斯托尔大学和莱斯特大学。此举是为期三年的Catalyst英国计划的一部分,安装将于2018年夏季完成。
三所大学的计算机集群大致相同,由HPE设计、构建和支持,集群含64个HPE Apollo 70系统,每个Apollo 70系统配有两个32核Cavium ThunderX2处理器及由16个带Mellanox InfiniBand互连DDR4 DIMM组成的128GB内存。
操作系统是个HPC SUSE Linux Enterprise Server。预计每个集群将占用两个电脑机架,共耗电约30KW。
即是说每个安装的内核为4096个,共12288个内核。
布里斯托尔大学HPC研究小组负责人Simon McIntosh-Smith教授表示,“布里斯托尔曾通过EPSRC资助的GW4 Isambard项目及欧洲FP7资助的Mont-Blanc 2项目积累了经验,我们有信心在生产环境中探索基于Arm的超级计算机用于实际工作负载的部署...... HPE Apollo 70 HPC系统将首次令我们能够将我们的经验应用到探索跨InfiniBand的扩展上,我们期望这些结果对于我们的工业和学术合作伙伴具有重要意义。“
爱丁堡大学EPCC主任Mark Parsons教授在一篇事先准备的文稿里补充表示,“EPCC非常高兴能够参与Catalyst英国计划......这是我们第一台基于ARM的大规模超级计算机。Arm处理器超级计算技术如要获得成功,我们就需要建立一个强大的软件生态系统,EPCC会将英国许多重要科学应用移植到我们的HPE Apollo 70系统中。”
莱斯特大学科学和技术设施委员会DiRAC高性能计算(HPC)设备中心主管Mark Wilkinson博士表示,Catalyst英国计划令我们中心可以探索Arm系统支持HPC工作流程的潜力,“包括模拟引力波和行星的形成、地球观测科学模型和基础粒子物理计算“。
他表示,中心的培训课程组合里配有基于ARM的集群有助于“确保工业界和学术界里下一代英国HPC专家拥有必要的技能,以利于HPC专家在解决最复杂的研究问题时能使用最合适和最具成本效益的硬件”。
HPE表示,Catalyst英国计划将与英国工业界合作,利用Arm系统功能共同开发应用程序和工作流程。计划将为研究人员提供培训,为他们提供知识和技能,以期他们将来能从事基于ARM系统的工作,计划的重点放在E级计算上,即每秒可执行百亿亿次计算的计算机。
上述这些可能离这些64节点Apollo集群还有一段距离,但却为英国研究人员和HPC工作人员提供一些掌握复杂机器技能和学习专业知识的途径。
例如,富士通公司的百亿亿次级计算机Post-K将使用ARMv8 及扩展、可扩展的定制CPU内核,用于支持FP16半精度数学运算(更多细节可参考https://www.nextplatform.com/2017/08/09/fujitsu-bets-deep-leaning- hpc-divergence/ ),节点数大于10,000,功耗接近30MW,不妨与Apollo集群的30KW功耗比较一下。
Parsons教授表示,一台英国百亿亿次级计算机在5年内可能消耗30MW,成本在4.5到5亿之间,需要200到300个机架。为了有个比较,他表示英国2017年贡献给CERN款项为1.32亿美元。英国能承担得起百亿亿次级系统吗? 他表示,“这会是英国在HPC方面学术投资的大幅加码。”
您能否在工业上和科学上论证钱值得花?Parsons教授表示,“是的,有必要。”
教授告诉记者,他认为至2025年左右英国可能会拥有一个百亿亿次级系统,数千万个甚至数亿个内核。该系统可以运行1亿到5亿个线程。他表示,“没人知道这样的系统能用在什么地方,”这也就是为什么学习是如此的重要。
Parsons教授认为,HPC在硬件和软件方面的创新严重不足,他表示百亿亿次级的创新有需要。 Arm处理器的使用将有助于刺激这方面的创新。
记者问到x86开发是否已经停滞。他表示,“任何大公司都需要挑战者。”
他认为英国目前在高性能计算支出方面并不具有竞争力:例如,德国的支出要大得多。日本、中国、美国和欧洲都在采取行动。Parsons告诉记者,“我认为英国应该拥有一两个百亿亿次级系统,否则我们将被抛在后面。”
老板是软银的Arm基础设施/ HPC工具高级总监David Lecomber表示,“我认为百亿亿次级系统物有所值,值得我们花钱。”
不过,如果买得起系统,要运行它还得先学习, Catalyst英国计划和三所大学要做的就是学习。
好文章,需要你的鼓励
DeepSeek 发布了新的大语言模型系列 R1,专为推理任务优化。该系列包括两个主要模型 R1 和 R1-Zero,采用混合专家架构,拥有 6710 亿参数。R1 在多项推理基准测试中超越了 OpenAI 的 o1 模型,而 R1-Zero 则代表了机器学习研究的重大进展。DeepSeek 已在 Hugging Face 上开源了这些模型的源代码。
国家机器人研究中心与 Freshwave 公司合作,利用私有 5G 网络测试农业机器人。这项合作旨在提升农业生产力,预计到 2026 年农业科技产业规模将达到 156 亿英镑。私有 5G 网络将为农业机器人提供高速、低延迟的连接,实现实时数据分析和精准农业操作,有望彻底改变农业生产方式。
Cognizant 推出了神经 AI 多代理加速器和服务套件,旨在帮助企业快速开发和部署 AI 代理。该技术通过预构建的代理网络模板和无代码框架,实现了跨职能的可扩展性和自主决策能力。这一创新有望推动 AI 代理在企业工作流程中的广泛应用,促进人机协作,提升业务效率和适应性。
西部数据公司财务总监Wissam Jabre将于2月28日辞职,恰逢公司分拆为硬盘和固态硬盘两个独立业务。公司正在寻找新的财务总监。尽管面临闪存业务定价环境更具挑战性,公司第二财季收入预计仍将达到43亿美元,同比增长42%。分析师认为硬盘业务表现强劲,可能抵消了闪存业务的部分疲软。