人们很容易认为,在数据中心及其他领域,自动化是没有界限的。在人工智能似乎为改善数据中心运营和网络提供无限机会的世界中,整个IT行业已经接受了工作流程可以变得完全自动化以至于我们达到NoOps状态的概念,数据中心内似乎没有什么是我们无法实现自动化的。
然而,现实愈发发人深省。尽管现代技术在许多领域为数据中心自动化提供了巨大潜力,但在可预见的未来,数据中心运营的一些关键方面可能是无法实现自动化的。
事实上,数据中心的物理性质意味着在某些方面,数据中心设施和设备的自动化比其他类型的IT基础设施或环境(例如公有云平台)更具挑战性。在公有云环境中,用户交互的所有内容都在这个平台上,并且是软件中定义,因此可以使用基于软件的解决方案轻松实现自动化。
为了证明这一点,我们来看看下面数据中心或数据中心运营的这五个方面,是所有人都不应指望很快就能实现完全自动化的。
1、服务器部署
在公有云中,自动部署服务器就像应用一些基础设施即代码模板来配置云资源一样简单。
然而,在数据中心中,这种自动化是不可能的,因为你部署的服务器是物理硬件,必须有人安装服务器,连接到电源和网络电缆,确保服务器适当冷却,等等。
理论上说,机器人可以自动化执行数据中心内服务器部署的大部分工作。然而,要使用机器人经济高效地完成这项工作,你就需要大规模的操作。你还需要足够一致且可预测的服务器部署,以便在无需人工帮助的情况下实现自动化。如今,大多数服务器部署都不符合这个标准。
尽管人们已经谈论机器人数据中心自动化的潜力至少有十年时间了,但我们在数据中心内仍然很少会看到机器人,这是有原因的:在大多数情况下这是不切实际的。在可预见的未来,预计服务器部署仍将是手动的方式。
2、硬件维护
类似地,在大多数情况下,在数据中心内部署后维护服务器硬件也不是一项可以实现自动化的任务。更换故障磁盘、更换磨损的电缆和电源、更新网卡是大多数数据中心的例行程序,处理这些问题的唯一方法是由技术人员操作。
3、HVAC的安装与维护
HVAC系统可以防止IT设备过热,是每个数据中心的重要组成部分。与服务器一样,HVAC系统也包含需要人工维护的物理组件。
远程HVAC传感器和监控系统可以帮助实现与HVAC管理相关的一些流程自动化,但最终,HVAC维护并不是一项可以在数据中心轻松实现自动化的工作。
4、物理安全
数据中心物理安全是另一个领域,监控系统可以帮助自动化某些任务,但需要人工干预来应对重大问题。
你可以使用传感器来跟踪数据中心内人员的移动,可以部署生物识别设备来自动控制对数据中心的物理访问,但如果检测到入侵者,或者自动访问控制系统无法正常运行,你就需要安全人员做出响应。
5、灾难恢复
在某些情况下,灾难恢复例行程序是可以自动化的,事实上,灾难恢复自动化对于在发生故障后恢复数据或应用时节省时间是至关重要的。
但是,只有当你需要恢复的资产是基于软件的,而且你有足够的基础设施来托管恢复的资产时,你才能自动执行灾难恢复。
如果恢复需要部署新硬件或更换故障组件(如果数据中心遭受自然灾害导致某些系统无法运行,则可能会出现这种情况),你就需要依靠人工手动执行工作。
数据中心自动化的局限性
尽可能广泛地自动化数据中心运营是有很多充分的理由,但数据中心管理的许多方面并不适合自动化。
即使在生成式AI和机器人技术的时代,也很难想象很快就会将人类从数据中心完全剔除。
好文章,需要你的鼓励
来自耶路撒冷希伯来大学的研究团队开发了WHISTRESS,一种创新的无需对齐的句子重音检测方法,能够识别说话者在语音中强调的关键词语。研究者基于Whisper模型增加了重音检测组件,并创建了TINYSTRESS-15K合成数据集用于训练。实验表明,WHISTRESS在多个基准测试中表现优异,甚至展示了强大的零样本泛化能力。这项技术使语音识别系统不仅能理解"说了什么",还能捕捉"如何说"的细微差别,为人机交互带来更自然的体验。
这项研究提出了"力量提示"方法,使视频生成模型能够响应物理力控制信号。研究团队来自布朗大学和谷歌DeepMind,他们通过设计两种力提示——局部点力和全局风力,让模型生成符合物理规律的视频。惊人的是,尽管仅使用约15,000个合成训练样本,模型展现出卓越的泛化能力,能够处理不同材质、几何形状和环境下的力学交互。研究还发现模型具有初步的质量理解能力,相同力量对不同质量物体产生不同影响。这一突破为交互式视频生成和直观世界模型提供了新方向。
北京交通大学与西蒙弗雷泽大学联合研发的混合神经-MPM方法实现了实时交互式流体模拟。该方法巧妙结合神经物理学与传统数值求解器,在低时空分辨率下运行神经网络并设置保障机制自动切换到MPM,显著降低计算延迟同时保持高保真度。团队还设计了基于扩散模型的控制器,支持用户通过简单草图直观控制流体行为,为游戏、VR和设计领域提供了实用解决方案。
这项研究介绍了EgoZero,一种创新的机器人学习系统,能够仅通过Project Aria智能眼镜捕获的人类示范数据,训练出零样本迁移的机器人操作策略。研究团队提出了一种形态无关的状态-动作表示方法,使用点集来统一人类和机器人数据,并开发了从原始视觉输入中提取准确3D表示的技术。在没有任何机器人训练数据的情况下,EgoZero在7种真实世界操作任务上实现了70%的成功率,展示了强大的泛化能力,为解决机器人学习中的数据瓶颈问题提供了新思路。