物联网出现很久之前,电脑还不够个人化,手机、冰箱和汽车也不够智能的年代,你是否记得电视上曾经反复播放着某品牌机油滤清器的广告?
高档的机油滤清器的价格比普通品牌高出将近一倍,这对于用户来说无疑十分昂贵。因而这种高档品 牌的产品首次进入市场时曾经遭遇用户非常严重的抵触情绪。然而,随着它的卓越技术逐渐提高了汽车的性能,同时有效减小故障发生的几率以及避免了昂贵的检修 费用。于是毫无疑问,相较于更换汽车引擎,人们还是更倾向于更换机油滤清器。
于是该产品逐渐获得了用户的青睐,并最终占据了市场的统治地位。
这个旧时代的营销故事所带给我们的启示完全可以适用于今天关于数据中心基础设施管理(DCIM)解决方案的一些误解和错误逻辑。
误解一:DCIM太昂贵
英特尔委托Redshift调研机构对200位来自美国与英国的数据中心管理者进行了咨询。调查结果显示,最大的窘境是,仍有43%的数据中心管理者还在依靠手工方法替代DCIM工具进行产能规划与预测。
随着我们进入数字时代,微软的Excel表格软件,甚至传统的测量卷尺仍然在很多基础设施管理者的工具包中占据着非常重要的地位,这似乎有悖常理。但事实的确如此,如今仅有55%的数据中心管理者在使用DCIM平台。部署DCIM方案最大的反对原因就是人们的感知成本,有46%的受访者表示,他们认为DCIM的实施费用过于昂贵。
乍一看,数据中心管理者对于成本的顾虑似乎合情合理。但是,考虑到DCIM工具可以为管理者提供有效信息用来识别运营问题,并帮助确定真实运营成本、隐性成本以及系统中断的真实原因,因而针对DCIM任何基于成本的反对都是对人们的误导。要知道,受访的118家数据中心都可以清晰的量化其每次运营中断的平均成本竟已高达28900美元!
别搞错了。无论是由于硬件故障、电源供应或散热问题,大型数据中心不可避免会在其生命周期的某个阶段面临运营中断和停机故障。只是那些已经部署DCIM分析工具来进行产能规划和散热效能监测的数据中心管理者可以清楚的计算出运营中断对于业务的损失成本,而与此同时没有部署DCIM的数据中心管理者仅仅只有14%的比例能够做到这一点。
此外,由于时间就是金钱,据统计数据中心运营中断所需要的平均恢复时间接近8个小时。值得注意 的是,部署了DCIM的数据中心中有21%的比例可以有效的把恢复时间控制在2个小时以内。而那些没有使用DCIM工具的数据中心则只有11%的比例可以 做到这一点。比例相差将近2倍!
误解二:DCIM的实施需要更多的时间和资源
有35%的数据中心管理者表示,采用手工的方法进行数据中心产能规划和预测的原因是担心缺乏必要的时间和资源实施部署更为自动化的方案。这个理由从表面上看又似乎很有说服力。但事实上,有56%采用手工方法的数据中心管理者每月需要投入40%以上的时间来进行产能规划和预测。
数据中心管理者这类自相矛盾的状况体现了一种恶性循环。采用手工方法的数据中心管理者表示缺乏时间和资源部署实施DCIM工具进行产能规划和预测,这正是因为他们的大部分时间都浪费在某些工作上,而这些工作恰恰可以由DCIM自动完成。
误解三:机柜热传感器和电子表格便足以轻松完成机房的散热工作
数据中心的电力消耗非常巨大。根据国家资源保护委员会预估,数据中心的电力消耗到2020年时将达到年均大约1400亿千瓦时,这相当于50个发电厂的年发电量,每年仅电费一项即需要支出130亿美元。除了服务器运行的供电费用外,散热也需要消耗很大一部分电能,因此有效提高散热效率成为节省运行总成本的必要手段。
57%的受访数据中心声称,他们在过去一年中经历了热能相关的挑战,并因此严重影响了运营效 率。63%的数据中心目前正在使用DCIM分析工具帮助优化散热效率,而有多达20%的数据中心目前还仅仅依靠机柜热传感器和电子表格来完成散热工作。没 有使用DCIM分析工具的数据中心不太可能实施热点审计,更不可能完成计算流体动力学(CFD)的模拟工作。
CFD功能是DCIM解决方案的核心功能,可以通过实时监控的信息不断提高和调整散热策略和空调选择。拥有CFD能力的DCIM系统将对数据中心的运营产生直接而积极的影响。
结论
数据中心管理者为了正确的运营决策需要收集精确的数据信息,包括能耗、热量、气流和使用率。随着DCIM工具的普及以及自动化控制水平的日渐提高,数据中心管理者的运营 效率逐渐提高,及时应对运营中的常见挑战,例如产能规划与分配,以及散热效率等。任何有关DCIM投资的成本效益分析都应该考虑到节约资源、减少宕机时间 和提高散热效率,这些因素最终将会对投资回报率产生积极的影响。
换言之,汲取自本文开头所提到的旧时代机油滤清器的经验在今天的数字时代依然适用。
更多Intel数据中心管理产品信息敬请登录:
http://www.intel.cn/content/www/cn/zh/software/data-center-overview.html ,
或者发送邮件至dcmsales@intel.com 与我们联系。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。