IBM公司在本月早些时候于纽约召开的AI纽约峰会上指出,其POWER 9方案在支持AI以实现“认知”工作能力方面优于通用或专用型X86商业现成(简称COTS)工具。
蓝色巨人最近公布了一项“演示”,据称其能够利用自有专有服务器配合低延迟/高带宽技术接入FlashSystem阵列——例如PCIe Gen 4、EDR与QDR InfiniBand以及NVMe over Fabrics,从而在性能表现上将COTS服务器及存储方案远远甩在身后。
当然,E8、Excelero、Pavilion以及Farmation Data Systems等初创企业都已经在推出NVMe over Fabrics访问型存储阵列,而Pure Storage也有意作出尝试——这一切都能够支持立足X86服务器的访问能力。
另外,IBM公司在展示中还使用了NVMe over Fabrics InfiniBand(简称NVMe-oF)。IBM公司并没有正式公布在AC922服务器或者FlashSystem 900阵列上支持NVMe-oF协议,但从目前的技术预览来看确有这种可能。
此次展示于今年12月5日到6日召开的AI纽约峰会上正式亮相。荐AC922采用PCIe第四代总线,速度是目前大多数服务器所使用的PCIe第三代总线的两倍。
IBM公司还向与会者们展示了基于POWER 9的AC922与五台FlashSystem 900阵列利用NVMe-oF实现对接的预览方案,并表示其能够有效降低数据访问延迟并提升传输带宽。
蓝色巨人Flashsystem产品组合与赋能战略经理Woody Hutsell在博文中指出,这台AC922服务器“能够将I/O数据吞吐能力提升至目前x86服务器内所使用的PCIe第三代总线的5.6倍。”
IBM公司表示,其将成为AI实现方案的理想之选——其能够摄取“海量数据,同时完成实时推理(对象检测)。”
Hutsell表示,FlashSsytem 900已经能够利用InfiniBand连接支持SRP(即SCSI over RDMA协议),并可将SCSI代码替换为NVMe代码以进一步降低延迟水平。
IBM公司在技术预览中使用的硬件配置。
在展示中,AC922服务器通过一个双閊NVMe-oF EDR 100Gbit Mellanox适配器接入一台Mellanox Switch-IB 2 7800交换机——后者又接入五台FlashSystem 900阵列,每台阵列配有4个每秒40 Gbit QDR InfiniBand端口。
这套配置可提供每秒41 GB总传输带宽,其中读取与写入能力最高可分别达到每秒23 GB与每秒18 GB。不过IBM方面并没有给出访问延迟数据。
IBM公司指出,POWER 9服务器加FlashSystem 900/NVMe-oF InfiniBand的组合能够为企业AI提供必需的低延迟与高传输带宽,意味着其在性能表现上要优于采用NVMe连接的其它一切x86服务器加闪存存储阵列方案。然而由于延迟数字尚未提供,这样的结论似乎很难令人信服。
Excelero公司为美国宇航局艾姆斯实验室打造的一套NVMe over Fabrics虚拟SAN系统可为4K IOPS提供平均199微秒的延迟水平,其最低延迟甚至仅为8微秒。这套系统的传输带宽在1 MB存储块大小的情况下可超过每秒140 GB。
该系统拥有128个计算节点,因此不能直接与IBM公司演示的单服务器进行比较。尽管如此,我们还是能够借此发现一些端倪,也许某家至强SP服务器供应商会采用PCIe第四代总线、NVMe over Fabrics外加每秒100 Gbit以太网连接全闪存阵列系统来观察所能达到的性能峰值。
好文章,需要你的鼓励
在Meta Connect大会上,Meta展示了新一代Ray-Ban智能眼镜的硬件实力,配备神经腕带支持手势控制,电池续航翻倍,摄像头性能提升。然而AI演示却频频失败,包括Live AI烹饪指导、WhatsApp通话和实时翻译功能都出现问题。尽管Meta在智能眼镜硬件方面表现出色,但AI软件仍远未达到扎克伯格提出的"超级智能"目标。文章建议Meta考虑开放AI生态,允许用户选择其他AI服务商,这可能帮助Meta在AI硬件市场获得优势。
DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型,无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越,在AIME 2024中达到79.8%准确率,编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型,使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。
英伟达同意以50亿美元收购英特尔股份,双方将合作开发多代数据中心和PC产品。英伟达将以每股23.28美元的价格收购约4%的英特尔股份,成为其最大股东之一。两家公司将通过NVLink接口整合各自架构,实现CPU和GPU间的高速数据传输。英特尔将为英伟达AI平台定制x86处理器,并开发集成RTX GPU的x86系统级芯片,用于消费级PC市场。
微软研究院推出rStar-Math系统,通过创新的"深度思考"训练方法,让小型AI模型在数学推理能力上达到甚至超越OpenAI o1水平。该系统采用代码验证、过程偏好模型和四轮自进化训练,将70亿参数模型的数学能力从58.8%提升至90.0%,在美国数学奥林匹克竞赛中达到前20%水平,证明了精巧方法比模型规模更重要,为AI发展开辟了新路径。