Leon Adato,SolarWinds首席极客
可以说,2021年是开发运维(DevOps)发展的关键一年。IDC的最新研究结果显示,去年全球DevOps软件市场投入达到了119亿美元,呈现了强劲的两位数增长。而且根据IDC 2021-2025年的预测,全球DevOps市场将继续保持强劲增长,市场规模将增长一倍以上。
现在我们已经到了2021年的下半年,我们可以确定这一年是多么的关键。事实也确实如此,越来越多的企业开始意识到DevOps给运营带来的机会。
比起改变流程,开发运维的理念更能够帮助团队完成以前似乎不可能完成的事情——打破业务、IT、工程师和业务负责人之间的孤岛。随着我们更加清楚需要通过提高和保持生产力、效率和服务交付水平才能成功度过未来的一年,因此,开发运维的理念是最重要的一项变化。
对有些人而言,“开发运维”虽然看上去十分陌生,但其根本目标却是我们所熟悉的,就是让IT形成真诚、高效、积极的团队协作以及集体责任感。有些企业已全力搭建混合团队,让运营、开发和业务专家可以共同对IT系统大部分方面的生命周期负责。当每个人都能了解技术领域以及客户旅程并承担相关负责时,彼此间的指责就变得没有必要了。
虽然有些企业机构将开发人员和管理员保留在他们现有的孤岛或团队中,但他们同时也在培养团队间全新、开放以及互利的沟通,将开发运维的理念带入到团队之中。无论如何,团队成员都需要进行合作、执行工作并不断改进。开发运维倡导无责备的执行总结、冲刺回顾和数据驱动的规划,这些都能够让团队提供及时反馈,改善流程以及促进协作。
开发运维推动业务成功
根据最新的《中国DevOps现状调查报告(2021年)》显示,由于传统IT无法满足企业在软件服务质量和交付方面的需求,中国的企业正在积极向DevOps转型。
自20年前作为一项“运动”出现以来,开发运维有足够的时间趋向成熟、解决错误并证明自己不是“昙花一现”。随着复杂性成为许多企业机构所面临的头号挑战,采用开发运维会更加务实。这意味着开发运维在扩展后更加重视分布式应用、混合运营、软件即服务(SaaS)和微服务,而这又需要监测各元素的应用性能,无论它们是在哪里实现现代化升级。
《中国DevOps现状调查报告(2021年)》显示,中国近六成企业实现了对整体应用性能管理的优化设计,12.39%的企业建立了完善的性能设计流程,且性能指标支持自动化实时分析。集体可观察性以及快速适应和分享生产性能数据的灵活性可以促进更有效的团队互动,尤其是对于开发运维团队而言,在监测基础设施的同时或之前投资于应用性能监测(APM)并不少见。
以反馈为导向的开发运维方法非常适合用来帮助IT专业人员将APM整合到业务中以评估影响。对于管理者而言,在企业数字化转型项目中,风险的可控性就体现在真实数据所反映出的实际运营情况。
开发运维与APM的天作之合
“反馈循环”是连接开发运维的“粘合剂”,而这只是开发运维文化为APM部署所带来的优势之一。APM展现的越多,开发和运营团队就越了解实时使用情况和性能情况。团队了解的越多,就越能找到优化的机会;优化得越多,应用就越容易使用;而应用越容易使用,就会有越多的客户被吸引到这个平台——整个循环就这样周而复始。
当技术、厂商、架构和运营方式的具体细节被置于整体服务和变更质量的次要位置时,就更容易解除孤岛。APM消除了阻碍团队了解全局的障碍,并且整个企业机构都可以从中受益,尤其是对于有多个跨团队组件的应用。
APM的采用也可能受到更多开发运维学术协会的鼓励。开发运维的支持者往往更加推崇以数据和研究为依据的决策流程。团队之间的合作几乎都是通过对可验证的生产实际情况达成共识来加以改进(或至少消除摩擦),尤其是在开发运维所支持的企业文化变革早期。当所有人对指标和事件分析达成一致意见时,团队就可以专注于他们最擅长和最喜欢的事情:通过配置技术满足业务需求。随着改进访问和正常运行时间已成为复杂、关键应用的一项规范,越来越多的管理员转向APM获得关键、客观的共享运营情况。
开发和运维具有不同的“基因”
在关于开发运维价值的讨论中,人们常常忽略了性能下降对 “传统”运营团队而言是多么令人沮丧的一件事情。在“开发运维”中,开发被放在第一位,因为它主要是由希望帮助减少运营人员负担的开发人员所领导。但开发人员和运营管理员有着不同的“基因”。运维团队并不总是急于在解决极为罕见的问题后投资于仪器设备;同样,开发团队也并不总是急于从生产应用中获取不相关的性能数据。
但这两个团队中的资深专业人员都知道关注业务成功的重要性,并渴望发现业务的具体需求并将其纳入到技术流程中。根据IDC报告,中国市场到2023年,40%的DevOps团队将投资于工具,专注于业务KPI(成本、收入等),而运营将在端到端应用程序性能和业务影响中扮演更重要的角色。
业务应该推动技术方向,而不是由技术推动业务方向。此外,IT不应该成为自己最大的客户。即使在应对看似无尽的事件队列时,运维团队也可以扩大可见性并提高效率,而APM系统和指标可以成为实现这一目标的一个新的共同基础。同时,APM还可以提供简洁、经过消化的反馈,从而无需数据科学家在开发运维的开发端发挥作用。
在不确定的时期,IT部门往往会韬光养晦并通过精打细算来应对预算的变化。在过去几个月的动荡消散之前,企业似乎应该推迟发起任何关于采用开发运维文化的大范围行动。但我认为这给IT团队带来的价值可能正是企业转型的关键目标,即数字化转型、市场生存或是其他。《中国DevOps现状调查报告(2021年)》也验证了这一点,我们看到中国的企业在积极参与开发运维的转型,并且认可开发运维带给企业的价值。幸运的是,在采用开发运维的许多原则时,并不一定需要推倒重来或孤注一掷。我们的目标应该是围绕共同指标创造品质,确保团队中的每个人都能得到准确的经验反馈,而这可能是一个循序渐进的过程。
无论 “下一个常态”是什么,优秀的服务交付的基础在根本上都是相同的。在一个光明、充满可能性的技术未来,开发运维对灵活性和持续流程改进的专注将继续打破转型僵局,成为一颗越来越耀眼的“新星”。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。