随着“新基建”的加速实施,数字经济发展迎来新动能。新型基础设施建设作为“新基建”战略的核心具有极强的溢出效应,不仅推动投资消费的快速成长,还将逐步融入到经济社会各领域,驱动各行业的数字化转型升级。
与新型基础设施相匹配的运维能力成为新基建能否持续发挥效能的关键影响因子。可以说,“欲善新基建,必先利运维”。面对新基建,运维要从技术创新、协作模式、业务价值三个关键点实现变革,迎接未来的挑战。
“云”与“智” 运维技术变革的核心基因
2020年新基建投资总规模可望达到9120亿元(数据来源:中信建投),新型基础设施的规模将爆发式增长;业务形态从线下转到线上,从本地部署转为云端部署,对可用性的要求也进一步提升。“新基建”的改变对运维构成巨大挑战,解决之道在于融合新技术实现“云化”和“智能化”转型。
随着业务走上云端,运维也逐步“云化”。运维需要提供对云化、虚拟化资源的高效管理。另一方面,资源监控、终端管控、安全支持等运维服务转化为云端应用,企业可以根据需求实现订阅,发生故障后第一时间获得云端运维支持。目前,紫光旗下新华三集团推出的U-Center统一运维云服务,提供云化运维应用和线上线下整合服务,顺应运维云化的趋势。
数字基础设施快速增长与有限运维资源之间的矛盾则需要“智能化”来解决。数字基础设施在运行过程中产生海量运维数据,新华三集团U-Center统一运维解决方案将“智能化”落地,实现将运维数据集成和标准化,通过内化专家经验和人工智能算法形成数据洞察并带入实践,监控系统状态,辅助或者主动发掘故障根因,甚至在故障前提供智能预警,切实保障系统的可靠性。
多维度实现运维协作模式变革
作为一项国家战略,“新基建”参与者众多、竞争激烈,新型基础设施建设这项系统性工程需要做到“速度”与“质量”的双优,以往纵向延伸、条块分割的IT建设体系已经不再适用,需要建立一套全新的、常态化的机制。
作为IT服务质量的把关人,运维部门需要进一步加强与其他业务部门的合作,消除协作过程中的信息鸿沟。在传统模式下,运维的价值目标是实现系统稳定工作,开发的价值目标是推动变革,安全的业务目标是消除外部威胁。“新基建”下的运维协作可以看作DevOps模式的延伸,不同部门之间的壁垒将被打破,在数字基础设施建设和服务的全生命周期内,研发、交付、运维、安全等部门更为高效的协同。
实现运维与其他业务模块高效协作,可以在企业内部通过组织结构变革实现,比如部门整合,组建一个高度整合的业务团队。或者组织结构不变情况下,打造运维中台。无论是北向的IT运维解决方案,还是南向的数据中心基础设施运维解决方案,新华三集团都提供完善的运维数据中台。
从业务出发重新定位运维价值
出于开发成本和开发难度的考虑,通用技术被大规模应用于新型基础设施建设中。但是,通用技术并不意味着运维方案的同质化。相反,新型基础设施的运维方案设计中更需要强调“个性”,从外部环境和IT业务的实际情况入手,真正做到定制化开发,为未来的业务成长预留充足的空间。所以,IT服务的需求方和实施者需要进行充足沟通,为未来IT系统建设提供具有远见的规划。
企业甚至要基于运维能力来决定业务形态。新基建的提速缩短了运维到业务的价值链,当运维能力不足会构成业务发展的瓶颈。在关键业务实施之前,企业需要评估运维水平再做出评定,新华三集团为企业提供云运营管理咨询、业务连续性及容灾咨询、运维数据治理咨询等统一规划服务,就是希望为企业把脉,帮助企业在业务与运维中寻求更加平衡的适配性。
只有实现运维能力跨越式发展,重构自身运维体系,才能有效驱动自身业务的高速成长。得运维者得新基建,作为数字化转型的领导者,新华三集团将与百行百业的客户合作,帮助用户在新基建风口下创造全新价值。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。