戴姆勒卡车运用图数据库技术梳理IT架构获运营红利

戴姆勒卡车在2021年从奔驰集团分离时,面临1500多个IT系统需要拆分的复杂挑战。公司采用Neo4j图数据库技术,结合ExtraHop网络遥测数据,构建了应用系统依赖关系的动态图谱。该方案成功识别隐藏依赖关系,用3.5年完成分离,应用数量减少40%。图技术不仅解决了分离难题,还为公司提供了全面的IT可观测性平台,结合大语言模型实现智能运维,能快速诊断故障原因并识别安全风险。

当戴姆勒卡车控股公司在2021年开始与梅赛德斯-奔驰集团进行复杂的分离过程时,面临着一个令人生畏的问题。

几十年来紧密交织的信息技术系统、共享基础设施和未记录的依赖关系需要被理清。超过1500个IT系统和应用程序需要被分离、重新设计或更换。这些变化将影响全球10万名员工、5.5万家经销商和6000个业务合作伙伴。

简单地"切断"两家公司之间的联系并不可行。意外的依赖关系可能导致双方的关键应用程序崩溃,且没有明确的方式来诊断或从故障中恢复。

"如果我们只是切断那个链接,两家公司都会崩溃,"戴姆勒卡车的AI架构师康纳·奥谢说。"由于数十年交织的基础设施,恢复几乎是不可能的。"

戴姆勒卡车转向图数据库技术来映射其应用程序架构,作为系统交互的活跃模型。最初作为分离工具开始的项目,最终成为这家新独立公司可观测性、安全洞察和应用程序智能的基础平台。

分离不可见的连接

像许多大型企业一样,戴姆勒股份公司依靠配置管理数据库来跟踪应用程序和基础设施。CMDB是一个集中式系统,存储组织IT资产信息并记录它们如何配置和关联。

虽然对记录保存有用,但CMDB缺乏上下文。应用程序被记录为服务器集合,但现实世界的依赖关系,如DNS条目、代理、数据库、邮件中继、税务服务以及与遗留系统的连接经常缺失或过时。

"有人绘制出一个应用程序,那个人离开了,新的负责人并不真正理解这对他们的应用程序意味着什么,"奥谢说。

填补这个空白至关重要。多年来,戴姆勒卡车和梅赛德斯-奔驰系统已经深度互联。一方的应用程序经常依赖另一方拥有的基础设施。没有这些关系的完整图景,意外的中断是不可避免的。

手动分析不现实。戴姆勒卡车估计雇用承包商手动映射依赖关系将花费超过100万美元和数月的努力。即便如此,也无法保证结果是完整的。需要的是一种了解应用程序实际行为方式的方法。

戴姆勒卡车选择了Neo4j公司的图数据库技术,将其IT环境建模为本体论,即实体及其关系的结构化表示。目标是理解一切是如何连接的。

来自ExtraHop Networks公司的网络遥测提供了基础。ExtraHop捕获整个企业的实时流量,识别客户端-服务器通信、端口、协议和行为信号。戴姆勒卡车使用Go语言构建了一个提取/转换/加载管道,Go是一种针对可扩展网络服务和分布式系统优化的语言,用于采样和转换数百万流量为图关系。

每个流量成为一组连接节点,显示客户端和服务器IP地址、协议和服务。然后使用IP地址作为主键将它们链接到公司ServiceNow数据库中的应用程序记录。结果是一个持续更新的图,代表应用程序在网络上的运行方式。

与静态文档不同,图随环境演进。随着连接变化,ExtraHop数据提供了一个随之变化的本体论。这在分离规划期间被证明是关键的。

干净分离

有了图的支持,戴姆勒卡车能够识别哪些应用程序属于卡车业务,哪些属于梅赛德斯-奔驰,以及它们在哪里重叠。

ServiceNow和Salesforce等共享服务相对简单分离。每家公司都建立了自己的实例并迁移数据。内部应用程序是另一回事。使用图,戴姆勒卡车能够发现隐藏的依赖关系,包括SMTP中继、数据库连接以及位于欧洲或亚太地区的公司仍然依赖的网络服务。

这使迁移团队能够逐案开发分离计划,与应用程序负责人和基础设施团队协调,安全地复制、迁移或重新配置服务。图减少了未知数,这是大规模IT转换中最危险的因素。

转换用了3.5年完成。除了应用程序外,13万台移动设备被迁移,1.5万台服务器被移至戴姆勒卡车的数据中心。这项工作将应用程序总数减少了40%,同时在财务、备件物流和人力资源等领域实现系统现代化,其中一些系统已有30多年历史。

一个意外但受欢迎的好处是戴姆勒卡车获得了对其IT架构前所未有的可见性。通过将图扩展到包括防火墙日志、安全遥测和思科系统公司Splunk机器数据分析平台生成的系统事件,戴姆勒卡车创建了多个重叠的本体论,在图中表示网络行为、安全策略和应用程序意图。这使得不仅能看到正在发生的事情,还能看到应该发生的事情。

长期价值

"本体论的价值不仅仅是分离两家公司,"奥谢说。"它是应用程序级别的可观测性仪表板。"

迁移团队更进一步,在图之上添加了大语言模型,向任何需要的人公开数据。用户无需依赖网络工程师或安全专家运行复杂查询,而是可以问诸如"为什么这个应用程序今天失败了而昨天还工作?"和"哪些依赖关系存在风险?"等问题。

"你不必了解网络术语,"奥谢说。"你只需用你的话就能得到你想要的。任何人都能做到。"

使用图作为结构化上下文大大减少了大语言模型幻觉的风险,并能发现人类会遗漏的问题。例如,图识别出两台后端服务器上的过期证书是间歇性应用程序故障的根本原因,奥谢说这通常需要人工工程师几小时或几天来诊断。

图还暴露了未充分利用和未知的资产。没有明确所有者的遗留服务器可以被监控并安全关闭,而不是出于害怕破坏某些东西而无限期运行。安全风险变得更容易发现,因为异常行为在预期关系中明显突出。

在一个案例中,图帮助识别了作为出站攻击代理的受损设备,这种活动已被防火墙阻止,但以前从未在应用程序级别进行关联。

最初作为管理分离风险工具开始的项目已成为战略资产,为戴姆勒卡车提供了对其应用程序如何工作、如何变化以及故障如何传播的持久可见性,这些好处远远超出了分离两家公司的最初目标。

Q&A

Q1:戴姆勒卡车为什么选择图数据库技术来处理与梅赛德斯-奔驰的分离?

A:戴姆勒卡车面临着超过1500个IT系统需要分离的复杂问题,传统的配置管理数据库缺乏上下文,无法显示应用程序之间的真实依赖关系。手动分析需要超过100万美元和数月时间,且无法保证完整性。图数据库技术能够将IT环境建模为实体及其关系的结构化表示,实时映射系统交互,避免分离过程中的意外中断。

Q2:图数据库技术如何帮助戴姆勒卡车发现隐藏的系统依赖关系?

A:戴姆勒卡车使用ExtraHop网络遥测捕获实时流量,通过Go语言构建管道将数百万流量转换为图关系。每个流量成为连接节点,显示客户端和服务器IP地址、协议和服务,然后链接到ServiceNow数据库中的应用程序记录。这创建了一个持续更新的图,能够发现SMTP中继、数据库连接和网络服务等隐藏依赖关系。

Q3:除了系统分离,图数据库技术还为戴姆勒卡车带来了哪些长期价值?

A:图数据库技术成为了戴姆勒卡车的战略资产,提供应用程序级别的可观测性仪表板。通过添加大语言模型,用户可以用自然语言查询系统状态。图技术能够快速诊断问题,如识别过期证书导致的应用程序故障,发现未充分利用的遗留服务器,识别安全风险和受损设备。这些功能为公司提供了对IT架构的持久可见性和智能运维能力。

来源:SiliconANGLE

0赞

好文章,需要你的鼓励

2026

01/05

10:42

分享

点赞

邮件订阅