AI 可能是迄今为止推动数据中心转型和发展的最大驱动力之一。这场现代淘金热已经产生影响,运营商正在更新基础设施以适应 AI 数据处理所需的存储需求增长。
虽然数据中心的转型和行业发展对运营商来说是好消息,但向更先进处理器的转移将加速对新基础设施的需求,同时需要更多的超大规模数据中心来适应这种转变,这为一场潜在的环境灾难埋下了伏笔。
即使在 AI 广泛应用之前,数据中心的电力需求也在迅速增长。爱尔兰中央统计办公室报告称,2022 年至 2023 年间数据中心用电量增加了 20%。
美国也面临类似问题。根据美国能源部和劳伦斯伯克利国家实验室最近发布的报告,随着国家进行 AI 转型,未来三年数据中心需求可能增长近三倍,消耗高达全国 12% 的电力。报告还估计,过去十年数据中心负载增长了三倍,预计到 2028 年将增长两到三倍。
然而,在数据中心采用和部署 AI 也有其积极的一面,包括能够根据实时需求动态调整服务器工作负载,从而更有效地管理资源分配。
AI 还可以根据访问频率、重要性和监管要求自动对数据进行分类和归类,从而优化数据存储。而 AI 自动化执行常规任务的能力几乎可以立即带来投资回报。
在数据中心环境中,这意味着可以实现网络管理、服务器配置和软件修补的自动化。这减少了日常运营所需的人工干预,使员工能够专注于更高价值的任务。这只是在数据中心环境中利用 AI 的部分优势。
AI 带来的诸多好处与潜在的负面影响(能源消耗增加和电子废弃物)之间的平衡,应该成为数据中心运营商的警醒,并推动当前流程的改变。通过调整流程,可以成功减轻因 AI 所需的高性能硬件更新而导致的电子废弃物大幅增加。
为支持不断发展的 AI 功能而进行持续升级的需求可能会缩短数据中心设备的使用寿命,加快设备升级周期。据估计,使用寿命仅为三到五年,美国每年有 2000 万到 7000 万个昂贵的硬盘驱动器 (HDD) 达到使用寿命末期——其中大多数被粉碎并送往垃圾填埋场,产生大量废物。然而,物理销毁并不是唯一的选择。
新的一年,新的流程
数据中心所有者和运营商可以通过多种方式更新和现代化流程,以应对硬件更新对可持续性和电子废弃物造成的压力。
例如,许多运营商认为,一旦停用,数据中心驱动器必须进行物理销毁以确保数据安全。然而,对于数据中心退役,还有更安全和可持续的替代方案。
应考虑两个更可持续的选择:
数据清除和重用:数据中心可以与认证的 IT 资产处置 (ITAD) 公司合作,安全地清除退役设备中的数据,或在内部管理数据清除(如果他们具备相关专业知识),而不是物理销毁旧硬件如硬盘驱动器 (HDD)。这个过程会删除所有敏感数据,使硬件可以翻新和转售,或用于其他用途。通过重复使用设备,数据中心可以延长硬件的使用寿命,减少送往垃圾填埋场的电子废弃物数量。运营商或 ITAD 可以安全地清除使用过的 HDD,完全擦除任何敏感数据。这使驱动器可以转售或捐赠给服务不足地区的非营利组织,在减少环境影响的同时给予它们第二次生命。
更好的硬件生命周期管理:数据中心可以通过使用模块化、可修复和可升级的系统来实施可持续的硬件生命周期管理实践。这种方法允许更换或升级单个组件(如电源、内存或处理器),而不是丢弃整个服务器或其他硬件,从而减少完整设备更换的频率,并在不影响运营效率的情况下最小化电子废弃物。
好文章,需要你的鼓励
这项研究介绍了Ankh3,一种创新的蛋白质语言模型,通过多任务预训练策略显著提升了模型性能。研究者采用两种互补任务:多掩码概率的掩码语言建模和蛋白质序列补全,使模型仅从蛋白质序列就能学到更丰富的表示。实验表明,Ankh3在二级结构预测、荧光预测等下游任务中表现优异,尤其在模型未曾训练过的任务上展现出强大泛化能力,为蛋白质设计和分析开辟了新路径。
法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、有因果关系的解释,同时保持高诊断准确率。研究显示,通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为,包括假设检验和非线性思考,提供与临床决策流程一致的排序诊断结果。
这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性,用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改,适用于任何白盒语言模型,为事实核查提供了实用支持。
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。