Splunk中国区总经理严立忠
如今,无论是从事IT运维、敏捷开发,还是DevOps(开发运营),甚至站点可靠性的工程师们(SRE),都在不断提及一个概念——可观察性(Observability)。为什么他们都在关注可观察性?可观察性在IT领域有哪些深层的含义?在开始探讨这些问题之前,我们需要先了解可观察性到底是什么?
理论上来讲,可观察性是从外部输出知识中推断所获得,可理解为衡量一个系统内部状态的方法。如同IT领域的众多新概念(比如DevOps), 可观察性第一次被提出是在工业领域。当时的可观察性被描述成为一种系统的外部监测属性,比如设备操作者可以查看系统中隐藏的各个流程。
举个例子,水处理厂的操作员如果无法看到水管的内部状况,就无法监测到水的正常流动,流动的方式,以及水质的干净程度。但在管道内可以添加可观察性的工具——流量计和传感器后,状况就截然不同,这些工具将通过遥测连接到仪表板,帮助操作员能够完全掌握管道中水流的情况,并及时根据状况进行调整,大大提高了工作效率。
可观察性也已被快速地引入到 IT 领域,并广泛应用于软件服务行业。尤其是在软件开发工程师编写代码的时候,所使用是就是具有可观察性的测量和遥测应用程序。它可以帮助运维团队获得:
随着AI技术的涌现,企业要想获得商业的成功,只靠新的数据、图表、KPI或者项目仪表盘是远远不够的。可观察性才是企业获得真正商业价值的“抓手”。企业无论在面对实时问题还是事件分类,关闭DevOps反馈回路亦或提前预防问题,都要收集可观察性的数据,并与其它监测的数据一起进行分析处理,并运用机器学习的方式生成自动响应,那么将监测与可观察性、机器学习和预测分析的高级数据集合后,则就拥有了Gartner所定义的“AIOps”,即在AI时代,让IT运维具备机器学习和算法的能力。
当AIOps有了可观察性数据后,可帮助企业:
DevOps中一个重要的概念是强调研发与运维的无缝配合形成一个整体,能给企业带来更大的业务灵活性,使企业能够更快地响应客户行为、市场变化和新技术。而可观察性带来了企业团队文化的转变,在可观察性的语境下,研发是主体,需要主动考虑如何将应用的关键指标以什么形式暴露出去;而之前大部分研发只有在应用出现故障的时候,才会考虑在什么位置加个日志,将研发与运维真正协作统一。
作为一个运维智能平台,Splunk是机器数据的引擎。Splunk通过监控和分析客户的点击流、交易数据、信息安全事件和网络活动,Splunk帮助客户获得机器生成数据中富有价值的运维智能。它使开发者能够直接看到生产环境中的数据,而无需访问生产机器,能够协助用户进行DevOps过程,包括持续的集成和资源配置。
对于交付网络式服务的云初创企业来说,可观察性带来了全新的活力。而对于传统IT运维商来说,尤其是大型企业,可观察性的实现依然需要突破阻力。作为传统监测的补充,可观察性标志着IT运维和软件服务交付的一个新时代的到来,助力企业实现真正的商业和技术融合。
好文章,需要你的鼓励
Gartner预测,到2030年所有IT工作都将涉及AI技术的使用,这与目前81%的IT工作不使用AI形成鲜明对比。届时25%的IT工作将完全由机器人执行,75%由人类在AI辅助下完成。尽管AI将取代部分入门级IT职位,但Gartner认为不会出现大规模失业潮,目前仅1%的失业由AI造成。研究显示65%的公司在AI投资上亏损,而世界经济论坛预计AI到2030年创造的就业机会将比消除的多7800万个。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。
人工智能正从软件故事转向AI工厂基础,芯片、数据管道和网络协同工作形成数字化生产系统。这种新兴模式重新定义了性能衡量标准和跨行业价值创造方式。AI工厂将定制半导体、低延迟结构和大规模数据仪器整合为实时反馈循环,产生竞争优势。博通、英伟达和IBM正在引领这一转变,通过长期定制芯片合同和企业遥测技术,将传统体验转化为活跃的数字生态系统。
韩国成均馆大学研究团队开发了首个机器遗忘可视化评估系统Unlearning Comparator,解决了AI"选择性失忆"技术缺乏标准化评估的问题。系统通过直观界面帮助研究人员深入比较不同遗忘方法,并基于分析洞察开发出性能优异的引导遗忘新方法,为构建更负责任的AI系统提供重要工具支持。