短于内核,长于线程和矩阵数学
作者:Tobias Mann
更新时间:协调世界时2024 年 5 月 7 日(星期二)20:39
IBM不甘被排除在人工智能基础架构的游戏之外,于本周二推出了一对微小的Power 10服务器,瞄准网络边缘的数据处理。
Power S1012系统既有PC风格的塔式配置,也有更为传统的2U半宽机架式机箱。两款系统均可配备IBM自主研发的Power 10处理器,支持1核、4核或8核,板载内存最高可达256GB。
虽然与英特尔和AMD边缘-中心芯片(最多可配备64个内核)相比,这听起来并不算多,但值得注意的是,IBM的Power平台基于RISC架构,优先处理高线程工作负载,支持SMT4或SMT8。
这意味着这些系统中使用的Power 10 eSCM模块每个内核最多可支持8个线程,最高配置可支持64个线程。
IBM宣称其新服务器的性能是即将推出的Power S814的三倍,这听起来似乎令人印象深刻,不过想一想,该系统基于的Power 8平台已有10年历史。不过话说回来,Power 10系列也不是新丁,它也将在9月份迎来三周岁生日。
IBM设想将这些系统部署在多种场景中,包括在空间或功率受限的边缘部署中进行人工智能推理,或在远程或后台办公场景中运行更传统的工作负载。
其主要思路似乎是,就地处理从边缘流入的所有数据流,而不是将其全部送回中央数据中心,客户可以通过这种方式减少延迟并抑制带宽消耗。
从表面上看,IBM 瞄准的是现有的Power 客户,他们熟悉与 SMT 重型架构相关的特定硬件和软件细微差别。分析管理商Equitus就是这些客户中的一员,IBM称该公司已经在使用这些系统,在边缘运行人工智能模型。
至于IBM是如何处理这些人工智能工作负载的,可能与你想象的大相径庭。据我们所知,这些系统并没有配备IBM在公告中没有提到的GPU。相反,IBM 似乎依靠处理器的矩阵数学加速器(MMA)来完成繁重的工作,每个内核都内置了四个矩阵数学加速器。
在很多方面,这些 MMA都让人想起英特尔2023年起推出的第四代和第五代Xeon Scalable平台中的AMX引擎。正如我们最近探讨过的,这些引擎完全有能力运行规模在70亿到130亿参数之间的小型大语言模型。
除了MMA之外,IBM还强调了对透明内存加密的支持,以保护进出设备上人工智能模型的数据。考虑到这些系统很可能部署在安全性或监管有限的远程位置,这很可能是一个受欢迎的功能,尤其是对于那些受到高度监管的行业。
S1012系统将于6月14日开始发售。
另:IBM 刚刚向开源世界发布了一系列代码生成模型,该公司表示:“我们的目标是让代码生成对于尽可能多的开发人员变得尽可能的简单。”
好文章,需要你的鼓励
Linux Mint 22.1 Xia 终于发布,虽然比预期晚了一些,但带来了多项改进。新版本基于 Ubuntu 24.04,提供 Cinnamon、MATE 和 Xfce 三个桌面版本。主要更新包括新的 Apt 包管理工具和改进的电源管理。Cinnamon 桌面升级到 6.4.6 版本,支持实验性 Wayland。
随着AI技术的广泛应用,其安全性和可靠性问题日益凸显。为此,思科和英伟达近期推出了一系列新工具,旨在解决AI模型可能存在的漏洞,如内容不当、话题偏离和越狱等问题,以提升AI系统的安全性和可控性。这些工具将为企业提供更可靠的AI应用保障。
英国替代网络运营商Netomnia集团在2024年实现快速增长,服务范围扩大至208万户,收入同比增长321%。同时,CityFibre开始在肯特郡偏远地区为超5万户提供全光纤宽带服务,这是政府"千兆项目"的一部分。这些举措将显著提升英国的宽带网络覆盖和速度,推动数字经济发展。
微软开始向用户设备分发 Windows 11 24H2,标志着操作系统推广进入新阶段。虽然企业用户暂不受影响,但家庭版和专业版用户将自动升级。尽管用户可选择推迟更新时间,但最终都将安装该版本。然而,这次更新并非一帆风顺,微软正面临一系列已知问题的挑战。