戴尔为其XE9680服务器添加了英特尔Gaudi 3 GPU支持,并将APEX文件存储移植至Azure以支持各类AI工作负载。
XE9680服务器发布于2023年1月,配备第四代至强处理器(最高56核心)、PCIe 5.0总线,并支持最多8张英伟达GPU。截至去年10月,XE9680已经成为戴尔公司有史以来增长速度最快的服务器产品。到今年3月,其已经能够支持英伟达H200 GPU,外加风冷版B100与液冷版HGX B200。英特尔的Gaudi 3加速器(GPU)拥有两块互连计算芯片,每芯片包含8个矩阵数学引擎、64个张量核心、86 MB SRAM缓存、16条PCIe 5.0通道、24条200 GbE链路、128 GB HBM2e内存与3.7 TBps传输带宽。
如今XE9680新增对Gaudi 3 AI加速器的支持。Gaudi 3 XE9680版本拥有多达32个DDR5内存DIMM插槽、16块EDSFF 3闪存驱动器、8个PCIe 5.0插槽和6个OSFP 800 GbE端口。这是一台毋庸置疑的本地AI处理巨兽。
Deania Davidson
OSFP链路允许直接接入外部加速器结构,而无需在系统内放置外部网络接口卡。戴尔产品经理Deania Davidson表示,“戴尔已经与英特尔合作,允许特定客户通过其「英特尔开发者云」方案着手测试英特尔的加速器产品。”
戴尔于去年5月推出了基于PowerScale横向扩展OneFS软件的APEX File for AWS。现如今,新的APEX File Storage for Microsoft Azure也已正式亮相,旨在对现有APEX Block Storage for Azure加以补充。戴尔公司首席产品经理Kshitij Tambe在博文中表示,APEX File Storage for Azure是“一项改变游戏规则的创新成果,弥合了云存储与AI驱动见解之间的鸿沟。”
Kshitij Tambe
Azure APEX File Storage能够为AI用例提供高性能且可扩展的多云文件存储支持。Tambe表示,客户可以“使用高级本机复制功能将数据从本地迁移至云端,且无需重构存储架构。在上云之后,客户可以体验到所有企业级PowerScale OneFS功能。凭借在单一命名空间中支持多达18个节点和5.6 PiB的横向扩展架构,APEX File Storage for Azure在提供可扩展性与灵活性之余,也保持了便捷的管理操作体验。”
他随后将其与Azure NetApp Files进行了比较,表示:
他还提到,傲视同侪的吞吐量性能与命名空间容量使其在AI领域极具市场竞争力。我们已经就这一结论向NetApp方面求证,并将在得到答复后更新后续报道。
好文章,需要你的鼓励
从浙江安吉的桌椅,到广东佛山的沙发床垫、河南洛阳的钢制家具,再到福建福州的竹藤制品,中国各大高度专业化的家具产业带,都在不约而同地探索各自的数字化出海路径。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。