Splunk中国区总经理严立忠
如今,无论是从事IT运维、敏捷开发,还是DevOps(开发运营),甚至站点可靠性的工程师们(SRE),都在不断提及一个概念——可观察性(Observability)。为什么他们都在关注可观察性?可观察性在IT领域有哪些深层的含义?在开始探讨这些问题之前,我们需要先了解可观察性到底是什么?
理论上来讲,可观察性是从外部输出知识中推断所获得,可理解为衡量一个系统内部状态的方法。如同IT领域的众多新概念(比如DevOps), 可观察性第一次被提出是在工业领域。当时的可观察性被描述成为一种系统的外部监测属性,比如设备操作者可以查看系统中隐藏的各个流程。
举个例子,水处理厂的操作员如果无法看到水管的内部状况,就无法监测到水的正常流动,流动的方式,以及水质的干净程度。但在管道内可以添加可观察性的工具——流量计和传感器后,状况就截然不同,这些工具将通过遥测连接到仪表板,帮助操作员能够完全掌握管道中水流的情况,并及时根据状况进行调整,大大提高了工作效率。
可观察性也已被快速地引入到 IT 领域,并广泛应用于软件服务行业。尤其是在软件开发工程师编写代码的时候,所使用是就是具有可观察性的测量和遥测应用程序。它可以帮助运维团队获得:
随着AI技术的涌现,企业要想获得商业的成功,只靠新的数据、图表、KPI或者项目仪表盘是远远不够的。可观察性才是企业获得真正商业价值的“抓手”。企业无论在面对实时问题还是事件分类,关闭DevOps反馈回路亦或提前预防问题,都要收集可观察性的数据,并与其它监测的数据一起进行分析处理,并运用机器学习的方式生成自动响应,那么将监测与可观察性、机器学习和预测分析的高级数据集合后,则就拥有了Gartner所定义的“AIOps”,即在AI时代,让IT运维具备机器学习和算法的能力。
当AIOps有了可观察性数据后,可帮助企业:
DevOps中一个重要的概念是强调研发与运维的无缝配合形成一个整体,能给企业带来更大的业务灵活性,使企业能够更快地响应客户行为、市场变化和新技术。而可观察性带来了企业团队文化的转变,在可观察性的语境下,研发是主体,需要主动考虑如何将应用的关键指标以什么形式暴露出去;而之前大部分研发只有在应用出现故障的时候,才会考虑在什么位置加个日志,将研发与运维真正协作统一。
作为一个运维智能平台,Splunk是机器数据的引擎。Splunk通过监控和分析客户的点击流、交易数据、信息安全事件和网络活动,Splunk帮助客户获得机器生成数据中富有价值的运维智能。它使开发者能够直接看到生产环境中的数据,而无需访问生产机器,能够协助用户进行DevOps过程,包括持续的集成和资源配置。
对于交付网络式服务的云初创企业来说,可观察性带来了全新的活力。而对于传统IT运维商来说,尤其是大型企业,可观察性的实现依然需要突破阻力。作为传统监测的补充,可观察性标志着IT运维和软件服务交付的一个新时代的到来,助力企业实现真正的商业和技术融合。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。