至顶网服务器频道 08月17日 新闻消息: 服务器作为数据中心的核心组件,承载着数据中心绝大部分计算任务,其可靠性、性能稳定性以及故障之后问题定位的精准度等特性都直接影响着整个系统运行。据Forrester的统计数据,服务器运维成本在IT系统TCO中占比高达70%,因此,一个高效、功能全面的服务器管理工具对于IT系统而言至关重要。
为了实现对服务器全生命周期的360°监控和管理,华为打造了包括一体化融合运维管理产品家族,而eSight Server就是其中的代表。
遍历服务器的一生
全生命周期就是指服务器上电运行一直到结束服务下线的过程,这个过程又可以分为规划、交付、提供服务(日常运维)以及退服下线四个阶段。
首先是规划阶段。根据企业客户上层业务需求,数据中心基础架构确定,服务器的配置规划、网络IP规划等等也随之明确。一个完整而科学的解决方案将为数据中心之后所有的运行维护工作奠定一个良好的基础;第二步是交付阶段,完成服务器采购之后,便开始上电和配置RAID、BIOS等工作,操作系统安装和网络配置也是这一阶段的任务。所有服务器厂商都在追求高效的完成交付工作,让业务尽快上线。
第三阶段是就是服务器提供服务。这一阶段在服务器整个生命周期中时间最长,同时也充满了不确定因素。全方位监控、故障快速而精准的定位和处理是这一阶段最主要的任务。最后,服务器退服,完成资产清退和数据擦除等工作。至此,一台服务器生命周期到达尾声。
全生命周期管理,让IT系统TCO得到质的降低
通过全生命周期管理,企业客户能够以最少的人力和实践成本完成服务器运维工作,进而削减IT系统TCO。
首先,全生命周期管理提高交付效率。如今大规模和超大规模数据中心越来越普及,服务器交付工作也随之变得复杂而繁重。华为eSight采用带外部署方式,可以在24小时内就完成这一工作,带外部署的设计使得服务器配置等交付工作高度自动化,其效率较其他解决方案有了质的提升。在服务器生命周期交付阶段,eSight通过带外部署等技术即能够将IT系统交付效率提高50%。
第二,运维成本降低。服务器上线之后,便进入一个长期的日常运维阶段。在这个阶段,华为eSight全面简化了固件升级等工作。通过基线管理和基于策略的任务升级两个方面策略,企业用户只需设置固件升级时间等基本需求,而其他的操作则完全由eSight自动处理。这样一来就将固件升级的高复杂度降到了最低,无需专业人员投入长期的精力就可以完成日常运维工作,运维成本也随之降低。
监控是日常运维的一个重要工作。在服务器日常运行过程中,全面和深度的监控管理可以第一时间发现故障并进行精准定位,进而最大程度缩短服务器的离线时间,降低运营成本。eSight系统提供了完善的监控、分析、恢复功能,帮助用户及时发现和解决问题,保证企业ICT环境的健康运行。
最后,意外宕机时间降低。服务器故障造成的宕机将会给上层业务系统造成巨大的损失,而精准的故障定位和高效的故障处理,将宕机时间降到最低是服务器全生命周期管理的一大工作。华为eSight服务器管理组件提供的无状态计算特性,实现备件配置自动恢复,借助eSight,服务器意外宕机时间可以降低75%。首先,eSight会将原故障件的所有配置信息,完全复制到新的备件上,其次,当检测到同组设备中有不可修复的故障时,无状态计算可以实现自动倒换,隔离故障设备。
从发现故障到故障诊断和处理是一个争分夺秒的过程,意外宕机时间多一分钟都可能造成直接的经济损失。华为eSight的对故障的精准判断、自动恢复等特性都使得大规模数据中心在出现服务器故障之后能够在最短的时间内得到处理并恢复业务。
华为eSight使得IT系统运维复杂度取得质的降低,在实践过程中,企业客户部署eSight Server之后,由简化管理带来的人力成本节约达37%,由降低意外宕机时间带来的成本节约达42%,此外因避免更多不必要的硬件采购可以削减21%的成本,综合起来看,eSight Server 智能全生命周期运维平台能够给企业客户带来110%的投资回报率。如今,华为eSight Server已经广泛应用于各类规模的企业级IT系统中,在服务器得到全面而细致的管理的前提下,企业客户将更多的精力放置于业务创新和拓展上。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。