
如何以更低成本维护温冷数据成为企业数据中心重要课题
提到企业冷数据,最先闪出的概念是一大堆无人问津的1和0,这些数据可能是三年前产生的某个世界级比赛视频,可能是三个月前的一封邮件,也或许是上个月的某个网红视频,这些数据具有一个共同的属性--被读取的可能性极低。
往往一个公司拥有PB级别的数据,那么很大程度上可以说是拥有了巨大的财富宝藏,但是这些数据需要被持续的存储和挖掘,才能让数据从资源变成资产。这一挖掘时间可能持续数月甚至数年的时间才能完成,在此期间如何以更低的成本维护这些数据,是企业数据中心必须考虑的课题,因为每天都有海量的新数据产生,第二天大部分数据就变成冷数据堆积在服务器的硬盘中。处理这些冷数据的做法,往往会使用最低成本的设备来存储,比如低性能的处理器,低带宽网卡,高密度低转速的硬盘,总之一切以低成本为考量。
但是,随着大数据挖掘技术的发展,越来越多的冷数据被参与到计算和分析中,因此许多互联网数据中心发现一味追求低性能并不能完全满足要求。但解决方案却往往矫枉过正,一些业务同学会要求使用更高性能的部件,比如处理器由低功耗的E3-1220v3升级到了高功耗的E5-2620v4。这样的方法简直是简单粗暴,计算性能肯定会大幅度提升,但是要付出更多的采购成本,电力成本,运维部门自然不乐意。另一方面,虽然采用高配方案能够使计算性能提升一大截,但也远远超出客户所需要的能力,造成服务器整体利用率只用20%左右。

Intel Xeon-D CPU
那么是不是能采用一款性能适中的存储服务器平台,既有不错的性能,又能够控制功耗?近日,浪潮SA5224M4服务器上市,基于Intel Xeon-D CPU,拥有介于Intel Xeon E3和E5服务器的性能,功耗却远低于E5,更适合温冷数据的存储应用。

浪潮SA5224M4温冷数据存储服务器
优势一 80%性能、43%功耗,高能效比节省千万成本
浪潮SA5224M4服务器所搭载的Xeon-D CPU与E5-2600v4系列CPU技术架构相同,并可以通过SoC架构平衡计算性能和功耗参数。从实际测试数据来看来看,搭载D-1531 CPU的SA5212M4的计算性能已经达到原E5-2620V3 平台服务器的80%左右,但是单CPU的TDP(散热设计功耗)只用45W,相比传统E5 CPU功耗降低35W以上。一般服务器的生命周期为三年,这样算下来,1000台的存储服务器集群就能节省下至少1050万的电费。
而在性能方面,温冷数据存储应用(如云存储、邮箱数据存储和数据备份等)在传统E5 CPU存储服务器上的负载率约为30%,而使用浪潮SA5224M4时CPU的负载率约在40%,满足应用计算性能需求的同时,保留足够的性能冗余,防止出现短时数据流量骤增带来的计算压力。
优势二 内存容量提升,解决数据列表瓶颈
目前,数据的存储多采用检索方式,即软件产生索引表,这种方式具有简单、精准、容量大的特点,但是对于内存容量的需求大。在4T硬盘时代,单机36块硬盘的144T数据需要30G的内存存储索引,但是随着硬盘单体容量的快速增大,6T/8T最终代替4T,因此对于36盘位存储服务器的索引表占用的内存空间需要突破32G。但是,传统的冷数据存储服务器往往基于Intel E3 CPU/Atom CPU,这两种CPU只能支持32G内存,因此导致数据读取、存储的效率不佳。
浪潮SA5224M4最大支持128G内存,这有效解决了低功耗存储服务器内存容量扩容的难题。同时,浪潮SA5224M4支持DDR4内存,内存功耗降低50%,性能则能够提升33%。
优势三 集成万兆网络,省成本也省功耗
随着数据中心内外数据交换量的大增,万兆网络正在成为越来越多互联网服务器的标配。但传统的外插网卡形式,一方面会占用PCIe扩展资源,另一方面也会增加功耗和成本。SA5224M4中的Xeon-D CPU集成了内存控制器、PCH万兆网络等周边电路,因此主板功耗会更低,相比传统10-20W的外插万兆网络卡,至少能够节约20%以上功耗。
更重要的是网络部分不需要客户再付费升级10G,直接使用即可。因为浪潮SA5224M4中已经使用CPU集成的万兆网络做了板载万兆网络设计,而且有光口和电口两种,方便客户的应用选择。
伴随互联网产生的数据越来越多,数据正成为互联网企业不可抛弃的重要资产,而其中温冷数据的存储成本和效率的平衡是互联网IT人员关注的焦点问题。浪潮SA5224M4这种"不太冷"的存储型服务器,将会为云存储、邮箱数据存储和数据备份等应用提供能具性价比的硬件平台。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。