ZDNet至顶网服务器频道 07月09日 新闻消息:如何最大化数据中心在整个生命周期内的绩效表现?在IT行业迅猛发展的今天,这已成为每个数据中心所有者和管理者不断思考的问题。对数据中心高效运作之道的探讨,也从最初对设计阶段的单方面关注,逐渐转向对数据中心生命周期内五个阶段的综合剖析。正如良好的基因并不能确保人类一生的健康安乐,只有对数据中心生命周期内五个阶段的全面深入理解,才能成就其高效运作之道。
凭借在数据中心物理基础设施领域的多年经验,全球能效管理专家施耐德电气对此研发出一套覆盖数据中心全生命周期的解决方案,并针对如何最大化数据中心在使用期限的性能,提出了涵盖规划、设计、建设、运行、评估五大阶段的数据中心生命周期管理指南。
第一阶段:规划——过程、系统概念以及选址:什么才是最佳选择?
规划阶段是决定整个数据中心项目成败与否的关键。在此阶段,数据中心所有者及管理者需要搭建起系统架构和项目预算的雏形,为系统选择模型设计,识别并确定有可能影响系统设计的要素。
确定系统概念之后,便可着手准备选址评估。选址评估需要综合考虑:能源成本、税收优惠以及人工成本等财务因素,影响可用性和收益性的风险因素,以及选址和气候因素等。
在数据中心规划阶段,切忌以下9类常见错误:
先选址,后制定设计标准
错误理解PUE
设计标准不合理
错误理解能源与设计标准(LEED)
先进行场地规划,后制定设计标准
估算建造成本能力欠佳
设计方向误入“死胡同”
关注资本支出,而不是总成本
设计过于复杂
第二阶段:设计——归档、要求、合适人选:什么才是设计重点?
将规划结果转化成图表和施工文件,是设计阶段的核心内容。在此阶段,确保合适的人选在合适的时间加入到整个项目中同样重要。设计团队应包含IT和设计工程师,甚至还可能包括建筑师以及机械、电气、给排水工程师。建筑团队由电气、网络、机械、低电压的总包商和分包商组成。数据中心所有者或管理者需负责选择这些团队,并审查所有的设计成果。
第三阶段:建设——建造、培训和调试:项目如何进行?
当专家团队全部就位,建设工作全面启动之时,数据中心所有者及管理者在项目中仍然扮演着重要的角色:关注项目进度、质量性能并进行风险调度,这其中还包括一系列施工文件、建筑许可和项目订单变更的审查与批准。
在建设阶段,施工团队的文件资料与设备供应商的专业技能相互结合,将成为管理团队及员工学习提升的极佳机会。调试过程可带来有价值的文件资料,助力设备运行状况的改善。尽管调试过程并非完全必要,但通过检测整个系统对于外界输入内容以及外界变化的反应,可帮助整个团队更好地了解数据中心的复杂程度。
第四阶段:运行——运行、维护与团队合作:数据中心表现稳定的秘诀是什么?
运行阶段是数据中心生命周期中,历时最长、花费最大的阶段,有时甚至长达20年。
成功的运维(O&M)项目,需要对环境健康与安全、人员管理、应急准备和响应、培训、性能监测,以及对维护、归档、基础设施、质量、能源以及财务等各方面进行有力管理。此外,强烈的使命感和相互协作的团队文化,将推动IT和设备人员更好地各司其职,为整个项目的稳定运行提供保障。
第五阶段:评估——监测、表现和评估:当前状况如何?
监测——这一常常被忽视的阶段,实际上为理解运行人员和基础设施系统如何运作,提供了很多有价值的信息和可行性的建议。持续定期对电源、制冷、空间能力以及使用趋势做分析,能更好地判定基础设施是否满足设计意图。
评估阶段还包括对员工效率和运维项目业绩的考核。对于数据中心所有者和管理者而言,确保审查结果并对审查结果做出相应反应,将确保整个项目更加安全可靠。
数据中心全生命周期管理:长远而势在必行
无论对数据中心在其生命周期的表现有何预期,其所有者和管理者都可以通过了解以上五个阶段的性质、任务和常见问题,为提升数据中心持续可用性及性能做好准备。
好文章,需要你的鼓励
五家光学存储初创公司正在开发长期存储技术,旨在用超过100年寿命的光学介质替代只有5-7年寿命的磁带。这些公司包括Cerabyte、Ewigbyte、HoloMem、Optera和SPhotonix,它们的技术类似微软Project Silica项目。光学存储介质具有更强的化学、冲击、辐射、水和热抗性,同时保持低能耗和高容量特性。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
Nutanix发布分布式主权云产品组合更新,为多云环境提供更安全的运营和管理功能。该解决方案支持企业在分布式环境中灵活部署和治理基础设施,运行传统虚拟机、现代云原生和AI应用。新功能包括支持完全断网环境的暗站点管理、政府云集群正式发布、Kubernetes平台增强安全合规性、企业AI平台集成NVIDIA微服务,以及云平台新增跨站点灾难恢复能力,为用户提供统一管理和运营简化体验。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。