康普北亚区技术总监吴健
2021年,数据中心将加速部署新兴技术。高性能网络不断增长的需求,管理效率的提高以及COVID-19疫情的影响等全球重要趋势都将对数据中心新兴技术的部署产生影响。外卖订单的增多和实体店零售购物的大幅下滑,大大推动了线上销售的增长,也对数据中心带来了显著影响。以下是2021年数据中心的四大发展趋势:
加速向云迁移
在非“常态”的情况下,大小型企业都在向云迁移,且无论疫情态势如何,这种趋势都将在2021年提速。之前还处在观望中的企业,如今正快速地转向采取基于云的模式来运营业务。许多安排员工在家办公的企业已经采用了基于云的应用,以推行远程办公策略,而零售商则紧随行业巨头们的步伐,将销售工具转移至云端。
与云计算相关的另一大趋势是私有云基础设施的加速采用。此前业界还普遍认为,一切最终都会转移到公有云中。但从许多企业的需要看,他们偏爱将财务、医疗保健等敏感信息保存在私有云中。与此同时,还有一些应用根本无法转换到公有云。而那些运维大型数据中心的企业也发现,私有云的价格要低于公有云。因此,大多数企业将采用公有云和私有云混用的形式,来管理其应用和数据,这也将成为一种行业的标准做法。
增加人工智能的采用
融合人工智能(AI)应用一直是数据中心的大势所趋,且该趋势在2021年并无放缓迹象。尽管在疫情期间推出的应用在疫情结束后仍可能继续被使用,但上述趋势确实与COVID-19疫情有着较强的关联性。AI被用于推动安全和安防应用的发展,例如自动体温测量、免接触式授权、支付和控制系统以及人员流量监控,同时AI也被应用于暖通空调控制和照明等楼宇管理系统。
通过处理大量数据或ML(机器学习)训练集,能够开发复杂的AI算法。例如,可扫描数百万张人脸,以提供一种能够全面了解人类表情细微差别的算法。算法创建完成后,可负责对大量实时信息做出反应,例如面部抽动、皱眉和瞳孔扩张等。
AI/ML数据通常存储在庞大的数据池中,而配备加速器的专用服务器,例如GPU,非常适合处理AI/ML任务。数据中心网络正在增加带宽,为这些系统提供足够大的数据管道,从而实现经济且高效的AI工具的开发。
物联网部署将激增
随着企业致力于实现更完善的设施和人员管理,物联网应用正在迅速激增。诸如LTE-M和Zigbee等较新的连接协议,让温度、水消耗、空间占用、暖通空调控制和其他应用的无线传感器得以应用,而以太网供电(PoE)更使得从Wi-Fi接入点到监控摄像机等所有应用的统一高效成为可能。
物联网提供了关键数据。举例来说,物联网可以推动制造的优化,使AI在流程控制方面的应用成为一种趋势。若要实现机器间的通信,数据通信系统必须实现非常低的延迟。而延迟也是将那些新的较小的分布式系统或边缘数据中心(边缘数据中心用以支持近距离的应用和服务)部署时主要考量的因素。这种趋势正在加速分布式网络的设施部署,以支持大量的边缘数据中心应用。
随着物联网应用的不断增加,预计生成的数据量也将呈指数级增长。处理IoT数据最行之有效的方法,可能就是在位于边缘的本地处理数据。据Gartner预测,到2025年,约65%的服务器将被部署在边缘数据中心。
推动单模光纤发展
远程办公人员和购物者对快速响应的需求将推动单模光纤的广泛采用。单模光纤虽存在已久,但随着数据中心在2021年逐渐采用400G以太网,其部署将进一步加速。尽管受疫情影响,2020年400G的部署速度有所放缓,但预计这种情况将在2021年有所改善。
此外,数据中心的容量将持续增长,其效率也势必需要不断提升。由于前几代铜缆在速度和传输距离方面均达到了上限,因此需要更高效的网络交换设备,并推动“光纤到服务器”的使用,这也正是光纤网络带动网络设备及光学器件带宽提升的原因。IEEE 802.3db工作组的目标是服务器的连接达到100、200和400Gbps的速度,这将有助于开发基于VCSEL的低成本光学器件(多模光纤收发器)在短距离中的应用。
在2021年,适应并满足远程办公人员和客户的需求,使设施更安全、更高效并实现性能提升,将成为数据中心的关键趋势。随着行业持续变革,推行这些计划的企业将走在数字化浪潮的前沿。
好文章,需要你的鼓励
这项研究介绍了一种名为FlowPathAgent的神经符号代理系统,用于解决流程图归因问题。研究团队提出了流程图精细归因这一新任务,构建了FlowExplainBench评估基准,并开发了结合视觉分割、符号图构建和基于代理的图形推理的方法。实验表明,该方法在归因准确性上比现有基线提高了10-14%,特别在处理复杂流程图时表现出色,为提升人工智能系统在处理结构化视觉-文本信息时的可靠性和可解释性提供了新途径。
这项研究首次从神经元层面揭示了大型语言模型(LLM)评估中的"数据污染"机制。研究团队发现当模型在训练中接触过测试数据时,会形成特定的"捷径神经元",使模型无需真正理解问题就能给出正确答案。他们提出了一种新方法,通过识别并抑制这些神经元(仅占模型总神经元的约1%),成功恢复了模型的真实能力表现。实验证明,该方法与权威可信基准测试结果高度一致(相关系数>0.95),并在不同基准和参数设置下都表现出色,为解决LLM评估可信度问题提供了低成本且有效的解决方案。
这份来自向量研究所、康奈尔大学和格罗宁根大学研究团队的综述分析了基于大语言模型的代理型多智能体系统中的信任、风险和安全管理框架(TRiSM)。研究系统地探讨了代理型AI从概念基础到安全挑战,提出了包含治理、可解释性、模型运营和隐私/安全四大支柱的TRiSM框架。文章还详细分析了威胁向量、风险分类,并通过真实案例研究展示了潜在脆弱性。
这项研究提出了一种名为ConfiG的创新方法,通过生成针对性的数据增强样本来解决知识蒸馏中的协变量偏移问题。研究团队利用教师模型和学生模型之间的预测差异,引导扩散模型生成那些能挑战学生模型的样本,从而减少模型对训练数据中欺骗性特征的依赖。实验表明,该方法在CelebA、SpuCo Birds和Spurious ImageNet数据集上显著提升了模型在缺失组别上的性能,为资源受限环境下的AI应用提供了实用解决方案。