每当说起HPC与企业之时,生成式AI及其对于计算和存储等各种资源及延迟的需求都占据着绝对的主导。英特尔、AMD、英伟达、Arm乃至其他芯片制造商,纷纷鼓吹自家最新产品能够为AI工作负载提供何等助力。与此同时,微软、谷歌和亚马逊云科技等云服务商则在竞相推出比对手更快的AI服务。
HPE公司HPC与AI客户解决方案副总裁Gerald Kleyn表示,生成式AI尽管声量巨大,但使用HPC环境的组织和机构仍然稳定存在,并继续运行自己的非AI负载。这些组织所需的大部分计算、存储与网络功能,都可以在HPE庞大的GreenLake混合云服务平台当中找到。而且与大部分负载都在云端完成的AI不同,目前HPC的根据地仍然主要设在本地。
这在一定程度上推动了HPE扩展其Cray服务器及存储系统,也成为这位IT巨头最近推出Cray存储系统C500的驱动力。这款存储设备与体量更大、价格更高的Cray ClusterStor E1000存储系统间存在不少功能交集,只是体积更小且配置更加亲民。
根据Kleyn在采访中的介绍,C500能够支持HPC与AI计算集群,但主要“面向经典HPC环境及运行建模/仿真(例如在HPE构建的计算集群上进行计算机辅助工程的计算流体动力学)的部门。”
拥有AI工作负载的企业可以通过GreenLake for File Storage服务从云端获取文件存储系统,借此满足企业AI的各类需求,例如高效、高性能的数据聚合与准备,模型训练,调优能力,推理,生成式AI以及大语言模型。它还提供充足的灵活性以适应组织在快速开发生成式AI技术方面的现实需求。
HPE也在继续构建其GreenLake存储功能,并于本周推出了GreenLake Block Storage for AWS。这是一项软件定义的存储服务,用于管理混合云中的块存储,且支持在HPE的Alletra Storage MP之上为中端关键任务提供最高5.6 PB的NVM-Express存储容量。
Hyperion Research分析师在上个月关于2023年HPC发展现状的报告中提到,HPC领域正在不断变化,但仍然以本地业务为绝对主体,同时云和AI领域也出现了快速增长。去年,HPE在全球HPC市场的份额为372亿美元,其中本地服务器仍占40%,存储占17%,云支出则增长至20%。
他们预计本地HPC服务器市场将由2023年的150亿美元(较上年同比下降2.7%)增长至2024年的163亿美元。Hyperion还提到,总体而言,本地HPC支出将达到32亿美元。不过严峻的经济形势的确给买家造成了压力,加上供应链(例如GPU)持续收紧,且部分百亿亿级系统的交付也可能有所延迟。
此外,低端本地数据中心市场更是一片低迷。
但也有部分领域在持续增长,特别是在预测与生成式AI、以及大语言模型(LLM)领域。此外,分析师们发现云计算正成为越来越多HPC工作负载的选择。Kleyn提到,HPE发现部分新型超级计算机开始在传统HPC代码之外,愈发重视AI模型的运行需求,且预计这一趋势还将持续下去。
也请注意一语道破,HPE公司还将继续帮助组织构建其本地HPC环境。
Kleyn指出,“HPE不仅希望向公共部门以及企业之内HPC部门的本地HPC用户提供服务器,同时还将提供一套完整的解决方案,除我们的HPC服务器之外,其中还包括存储、互连及中间件,以此通过HPE服务团队交付一套全面的生命周期服务方案。”
而这也正是Cray存储系统C500的意义所在。据HPE介绍,五年前他们推出的Cray ClusterStor E1000存储系统,旨在利用Cray EX超级计算机为各站点提供百亿亿级、次百亿亿级以及国家级AI超级计算机。这套强大的存储系统包含嵌入式Lustre文件系统。
然而,也有一些企业在基于Cray XD2000服务器的小型HPC计算机集群上运行建模与模拟工作负载,并且需要在规模和成本上与应用环境相匹配的存储功能。C500包含与E1000相同的软件、2U24存储控制器以及5U84 HDD机箱。只是在系统管理单元方面,C500使用的是HPE的ProLiant DL325 Gen11服务器,而非2U24控制器。
另一个区别在于,E1000使用2U24控制器加24个NVMe SSD的组合充当元数据单元,另一套相同组合则作为可扩展存储单元闪存。C500是将二者集成至单一2U24聚合MDU及具有24个NVMe SSD的SSU-F当中。此外,E1000仅支持全配置存储机箱,而C500允许购买半配置选项。
再有,E1000来自百亿亿级系统,而C500只能扩展至2.6 PB,且搭配全闪存功能与4 PB SSD/HDD混合容量。Kleyn称这样的容量设置“是受测试能力所限,而非架构所限。”
虽然E1000适用于使用HPE大型HPC和超级计算机的组织,但Kleyn表示“我们也收到基于HPE服务器构建的入门级与中端HPC集群用户的反馈,他们希望HPE能为该产品推出「入门版本」。”
他还提到,C500的竞争对手包括戴尔-EMC的Ready Solution for HPC Pixstor Storage,IBM的Storage Scale System 3500,以及联想的Distributed Storage Solution for IBM Spectrum Scale。这三者都嵌入了IBM Spectrum Scale作为并行文件系统,该系统按照每TB容量或部署的存储驱动器数量收取许可费,因此使用成本更高。
相比之下,C500搭配有Lustre文件系统,Kleyn表示组织无需承担上述许可费用、因此使用起来更具成本优势。
好文章,需要你的鼓励
后来广为人知的“云上奥运”这一说法,正是从这一刻起走上历史舞台。云计算这一概念,也随之被越来越多的人所熟知。乘云科技CEO郝凯对此深有感受,因为在2017年春节过后不久,他的公司开始成为阿里云的合作伙伴,加入了滚滚而来的云计算大潮中。同一年,郝凯带领团队也第一次参加了阿里云的“双11”活动,实现了800万元的销售业绩。
随着各行各业数字化变革的不断深入,人类社会正加速迈向智能化。作为智能世界和数字经济的坚实底座,数据中心也迎来了蓬勃发展。面