长期以来,电子垃圾(e-waste)一直是数据中心运营商在环境可持续性和社会责任方面面临的一项挑战。然而,围绕人工智能的持续热潮可能会使数据中心的电子垃圾问题变得更加严重。
因此,现在数据中心运营商以及在数据中心内部署人工智能工作负载的企业应该开始考虑电子垃圾管理策略了。若能未雨绸缪,他们就可以减少人工智能基础设施造成的电子垃圾数量。
数据中心电子垃圾:基础知识
电子垃圾是指任何类型的不再使用并可能对环境造成危害的电子产品。数据中心的设备(如服务器、网络交换机和电源装置)可能含有铅和汞等化学物质。这意味着这些设备不再使用后有可能成为电子垃圾。
从环境可持续发展的角度来看,电子垃圾是有害的,因为数据中心设备中的危险化合物会渗入自然环境,对植物、动物和人类造成潜在危害。它还会对发展中国家的人民造成负面影响,因为这些国家往往是废弃IT设备的最终归宿。
人工智能会让电子垃圾问题变得更糟糕吗?
和很多技术行业一样,几十年来,数据中心一直在在助长电子垃圾的产生。但随着越来越多的企业寻求利用人工智能,尤其是生成式人工智能,这一问题可能会越来越严峻。
因为生成式人工智能应用和服务必须经过一个名为训练的过程,这个过程需要解析大量数据以识别模式。训练通常使用配备了图形处理器(GPU)的服务器进行。GPU的训练速度比传统CPU快得多,因为GPU具有更高的并行计算能力,这意味着它们可以同时处理更多数据。
在大多数情况下,人工智能训练是一个临时或一次性的过程。人工智能模型一旦完成训练,就不需要再次训练,除非开发人员想“教”它新的信息。这意味着,要想训练生成式人工智能模型很可能就要部署配备GPU的服务器,而对这些服务器的需求并不持续。
换句话说,在训练结束后,企业启动并运行了人工智能模型,对这些硬件的需求就会减少,因为除了训练人工智能模型之外,数据中心里GPU的用例并不多,而绝大多数组织都不需要经常重新进行训练。
从电子垃圾的角度来看,这有可能导致一些GPU或配备GPU的整个服务器的寿命明显缩短。它们仍能正常工作,但可能会因需求不足而被淘汰。
类似的故事已经在加密货币挖矿领域上演过了——GPU和其他专用硬件也很重要,因为它们经常被用于挖矿。由于为加密货币挖矿而制造的设备几乎没有其他有用的用途,因此很多设备也都成了电子垃圾。
减少人工智能造成的数据中心电子垃圾
好消息是,有一些方法可以避免人工智能训练造成数据中心电子垃圾的大量增加。
其中一个关键步骤就是企业共享人工智能训练服务器。企业可以选择“GPU 即服务”(GPU-as-a-Service)产品,这实际上是租用 GPU,而不是自己购买配备 GPU 的服务器进行训练。当他们完成训练后,这些GPU就可以被其他需要训练模型的企业使用。这比拥有无需持续使用的GPU服务器更具可持续性,更不用说成本效益了。
选择使用预先训练好的模型,而不是从头开始构建模型,是帮助降低人工智能电子垃圾风险的另一种方法。越来越多的模型可以从开源项目中获得,这些模型已经过训练,无需任何类型的专用数据中心基础设施。
当然,企业还应该确保在不再需要人工智能服务器时对其进行适当的回收或处理。但在理想情况下,他们首先应该尽量减少部署的服务器数量,因为这些服务器有可能在短时间内成为人工智能电子垃圾。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。