如何以更低成本维护温冷数据成为企业数据中心重要课题
提到企业冷数据,最先闪出的概念是一大堆无人问津的1和0,这些数据可能是三年前产生的某个世界级比赛视频,可能是三个月前的一封邮件,也或许是上个月的某个网红视频,这些数据具有一个共同的属性--被读取的可能性极低。
往往一个公司拥有PB级别的数据,那么很大程度上可以说是拥有了巨大的财富宝藏,但是这些数据需要被持续的存储和挖掘,才能让数据从资源变成资产。这一挖掘时间可能持续数月甚至数年的时间才能完成,在此期间如何以更低的成本维护这些数据,是企业数据中心必须考虑的课题,因为每天都有海量的新数据产生,第二天大部分数据就变成冷数据堆积在服务器的硬盘中。处理这些冷数据的做法,往往会使用最低成本的设备来存储,比如低性能的处理器,低带宽网卡,高密度低转速的硬盘,总之一切以低成本为考量。
但是,随着大数据挖掘技术的发展,越来越多的冷数据被参与到计算和分析中,因此许多互联网数据中心发现一味追求低性能并不能完全满足要求。但解决方案却往往矫枉过正,一些业务同学会要求使用更高性能的部件,比如处理器由低功耗的E3-1220v3升级到了高功耗的E5-2620v4。这样的方法简直是简单粗暴,计算性能肯定会大幅度提升,但是要付出更多的采购成本,电力成本,运维部门自然不乐意。另一方面,虽然采用高配方案能够使计算性能提升一大截,但也远远超出客户所需要的能力,造成服务器整体利用率只用20%左右。
Intel Xeon-D CPU
那么是不是能采用一款性能适中的存储服务器平台,既有不错的性能,又能够控制功耗?近日,浪潮SA5224M4服务器上市,基于Intel Xeon-D CPU,拥有介于Intel Xeon E3和E5服务器的性能,功耗却远低于E5,更适合温冷数据的存储应用。
浪潮SA5224M4温冷数据存储服务器
优势一 80%性能、43%功耗,高能效比节省千万成本
浪潮SA5224M4服务器所搭载的Xeon-D CPU与E5-2600v4系列CPU技术架构相同,并可以通过SoC架构平衡计算性能和功耗参数。从实际测试数据来看来看,搭载D-1531 CPU的SA5212M4的计算性能已经达到原E5-2620V3 平台服务器的80%左右,但是单CPU的TDP(散热设计功耗)只用45W,相比传统E5 CPU功耗降低35W以上。一般服务器的生命周期为三年,这样算下来,1000台的存储服务器集群就能节省下至少1050万的电费。
而在性能方面,温冷数据存储应用(如云存储、邮箱数据存储和数据备份等)在传统E5 CPU存储服务器上的负载率约为30%,而使用浪潮SA5224M4时CPU的负载率约在40%,满足应用计算性能需求的同时,保留足够的性能冗余,防止出现短时数据流量骤增带来的计算压力。
优势二 内存容量提升,解决数据列表瓶颈
目前,数据的存储多采用检索方式,即软件产生索引表,这种方式具有简单、精准、容量大的特点,但是对于内存容量的需求大。在4T硬盘时代,单机36块硬盘的144T数据需要30G的内存存储索引,但是随着硬盘单体容量的快速增大,6T/8T最终代替4T,因此对于36盘位存储服务器的索引表占用的内存空间需要突破32G。但是,传统的冷数据存储服务器往往基于Intel E3 CPU/Atom CPU,这两种CPU只能支持32G内存,因此导致数据读取、存储的效率不佳。
浪潮SA5224M4最大支持128G内存,这有效解决了低功耗存储服务器内存容量扩容的难题。同时,浪潮SA5224M4支持DDR4内存,内存功耗降低50%,性能则能够提升33%。
优势三 集成万兆网络,省成本也省功耗
随着数据中心内外数据交换量的大增,万兆网络正在成为越来越多互联网服务器的标配。但传统的外插网卡形式,一方面会占用PCIe扩展资源,另一方面也会增加功耗和成本。SA5224M4中的Xeon-D CPU集成了内存控制器、PCH万兆网络等周边电路,因此主板功耗会更低,相比传统10-20W的外插万兆网络卡,至少能够节约20%以上功耗。
更重要的是网络部分不需要客户再付费升级10G,直接使用即可。因为浪潮SA5224M4中已经使用CPU集成的万兆网络做了板载万兆网络设计,而且有光口和电口两种,方便客户的应用选择。
伴随互联网产生的数据越来越多,数据正成为互联网企业不可抛弃的重要资产,而其中温冷数据的存储成本和效率的平衡是互联网IT人员关注的焦点问题。浪潮SA5224M4这种"不太冷"的存储型服务器,将会为云存储、邮箱数据存储和数据备份等应用提供能具性价比的硬件平台。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。