AI有望以多种方式改变数据中心,例如改变数据中心就业市场以及改进数据中心监控和事件响应操作。
然而,AI可能对数据中心产生的最大影响是改变数据中心的工作方式。对于那些想要充分利用现代AI技术的企业来说,数据中心所容纳的基础设施及其管理方式必须有所改变。
AI将会引发数据中心怎样的发展还有待观察,但以下是一些值得期待的关键变化。
AI对数据中心的独特需求
要评估AI对数据中心的影响,你必须首先了解的是AI工作负载与数据中心中其他类型的工作负载(例如标准应用托管)之间有什么不同。
虽然AI工作负载有很多形式且要求各异,但大多数都满足以下的独特需求:
当然,其他类型的工作负载也可能有这些要求,例如,运行AI应用和服务并不是唯一可以从裸机服务器中受益的用例,但总的来说,AI软件要比其他类型的工作负载需要更多上述资源。
为了AI升级数据中心
为了优化AI工作负载的设施,许多数据中心运营商需要做出改变,以满足AI独特的需求。以下是数据中心在这方面的关键升级。
至少在过去十年中,虚拟机一直是托管工作负载的首选基础设施资源。但考虑到AI应用和服务对于裸机硬件的需求,有越来越多的数据中心运营商可能会发现扩展裸机产品变得十分重要。
在某些方面,这实际上是简化了数据中心的运营。如果你在裸机上运行工作负载,最终会得到一个不太复杂的托管堆栈,因为你没有混合使用虚拟机管理程序和虚拟机编排器。
另一方面,扩展用于托管工作负载的裸机基础设施可能需要数据中心对托管的服务器以及服务器所在的机架进行更新升级。传统上看,在数据中心设置服务器的最简单方法,就是配置非常强大的裸机机器,然后根据工作负载的需求将其分配到任意数量的虚拟机中。但如果你需要直接在裸机上运行工作负载,那么则可能需要更多的服务器来隔离工作负载——这意味着数据中心必须将高功率服务器更换为较小的服务器,并且可能要相应地更新服务器机架。
尽管在AI工作负载进行训练的时候,使用支持GPU的服务器是有利的,但AI应用不一定需要GPU来进行日常操作。因此,许多企业只需要临时访问支持GPU的基础设施即可。
为了满足这一需求,数据中心运营商应该考虑那些让企业能够共享基于GPU的基础设施的产品。少数企业可能希望拥有配备GPU的服务器,因为他们并不会永远都需要这种服务器。但如果数据中心运营商能够临时提供对GPU资源的访问(例如通过GPU即服务的模式),那么他们就能够更好地吸引那些有AI工作负载需求的企业。
大多数企业级数据中心已经提供了对高性能网络基础设施的访问,以及有助于尽快将数据移动到外部设施的互连。但为了充分利用AI,数据中心网络产品可能需要变得更加强大。
那些拥有AI工作负载的企业需要两个关键功能:首先,高带宽网络连接,可以非常快速地移动大量数据,这在分布式基础设施上训练AI模型的时候尤其重要。其次,网络能够提供个位数的延迟,如果你希望AI应用和服务真正做到实时执行,这一点至关重要。
由于AI工作负载的资源需求波动很大,因此可能需要在支持基础设施数量方面更加灵活的数据中心。AI还可能让人们更加需要能够让企业在其他数据中心内按需部署服务器、而不是自己设置这些服务器的服务,因为按需基础设施是解决资源需求波动的一个好方法。
为此,那些想要优化AI的数据中心运营商应该考虑使其设施更加灵活的产品。短期合同,和那些不仅仅包括了客户可以建立自己基础设施的机架空间服务,二者的结合可能对于那些需要部署AI工作负载的组织来说是有吸引力的。
结论
AI变革仍在上演,现在想要确切地知道AI将如何改变数据中心的运营方式或者其中部署的基础设施类型,还为时过早。但可以相对肯定地是,支持GPU的服务器和更灵活的解决方案等变化,可能在以AI为中心的世界中变得至关重要。想要分一杯羹的数据中心运营商应该确保更新他们的设施,以满足AI工作负载的独特要求。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。