在人工智能(AI)领域,如果把数据和计算比作燃料和引擎,那么存储就是承载并激发整个过程的燃料箱。因此,若想实施可行的AI解决方案,必不可少的第一步便是制定正确的存储策略。各家企业都在竞相采用AI技术,以期深入改变运营方式、增强决策能力并解锁新的可能性。戴尔科技观察到这一关键需求,为企业提供所需的专用基础架构,满足AI的特定需求。
作为灵活性1和效率2出众且十分安全3的横向扩展NAS存储,Dell PowerScale在AI优化基础架构领域被反复提起。Dell PowerScale提供NVIDIA GPUDirect支持(是首批提供该功能的存储厂商之一),可通过NFSoRDMA和多租户功能实现低延迟存储访问,多协议同步支持以及能够确保在模型推理期间无中断运行的6x9s可用性和弹性。
在上述基础之上,戴尔科技于今年早些时候推出了专为AI打造的新一代PowerScale全闪存节点——PowerScale F210和PowerScale F710。而在上周举行的戴尔科技全球峰会(DTW)上,戴尔科技发布了新一代全闪存PowerScale平台的最新成员PowerScale F910。
PowerScale F910——以超高密度实现大规模AI性能
PowerScale是全球率先通过NVIDIA DGX SuperPOD验证的以太网存储解决方案。戴尔科技推出的F910则将AI优化存储提升至全新的水平。PowerScale F910测试版用户、World Wide Technology(WWT)技术解决方案架构师John Lochausen表示:“PowerScale F910令本已非常出色的平台如虎添翼。随着对AI领域愈加深入的研究,我们的客户正在寻求一个能够处理任何任务的单一平台。F910带来的强大性能提升,可帮助客户轻松处理涵盖AI专用和通用工作负载等各种任务。
AI就绪性能:借助OneFS软件的持续创新和包括英特尔至强CPU、最新DRAM以及第5代PCIe在内的最新技术,F910的流式性能提升高达127%4,加速获取AI洞察。此外,它还加速了AI流程中的模型检查点和训练阶段,将每个集群的GPU利用率保持高达300PBs。PowerScale还于近期推出了Dell APEX File Storage for Azure,赋予云端数据访问更高的灵活性和更多选择,其集群性能较Azure NetApp Files提升6 倍。5
更高的存储效率:对企业客户而言,效率对性能和成本都至关重要。PowerScale F910采用2U节点实现性能和密度的平衡,最大程度地减少数据中心占地面积,以可持续发展为首要宗旨管理AI数据增长。与此前发布的F710相比,F910的每RU密度提高了20%6。同时,F910拥有比上一代产品提升高达2倍的每瓦性能7并利用PowerScale卓越的横向扩展NAS数据缩减保障8,进一步控制了存储成本并优化存储利用率,有效帮助客户做到事半功倍。
WWT技术解决方案架构师John Lochausen表示:“我们高度关注AI Proving Ground中的AI创新,全闪存PowerScale F910远超我们的预期。PowerScale F910实现性能翻倍的同时,降低了相同工作负载所需的电力和能源成本,进一步推动实现客户的可持续发展目标。”
戴尔科技全力实现AI就绪
戴尔科技致力于满足客户的AI需求,在过去一年中通过软硬件创新结合实现了PowerScale性能和效率的双提升,收获了卓越成果。
戴尔科技将坚持不懈追求创新解决方案,并计划于今年下半年发布更多增强功能:
全栈产品组合——戴尔科技AI就绪数据平台
戴尔科技新一代PowerScale系列产品是戴尔科技AI就绪数据平台的关键组成部分,后者提供可覆盖AI数据之旅各方面的AI优化基础架构。在助力企业畅想AI之旅的过程中,戴尔科技通过AI专业服务,可为企业提供训练有素的AI和行业专家团队。无论是AI战略制定,还是数据准备和用例部署,戴尔科技都是帮助客户将AI愿景转化为实际成果的绝佳合作伙伴。
PowerScale F910于2024年5月21日起在全球上市。可点击规格表和PowerScale网站了解AI优化PowerScale节点的更多信息。
好文章,需要你的鼓励
UniR(Universal Reasoner)是一种创新的推理增强方法,可为冻结的大语言模型提供即插即用的推理能力。由韩国科学技术院研究团队开发,该方法将推理能力分解为独立的轻量级模块,无需改变主模型结构。UniR的核心优势在于高效训练(仅更新小型推理模块)、出色的模型间迁移能力(小模型可指导大模型)以及模块组合能力(多个专用模块可通过logits相加组合使用)。在数学推理和翻译测试中,UniR显著超越现有微调方法,展示了轻量级模块如何有效增强大语言模型的推理能力。
Nebius团队开发了SWE-rebench,一个自动化管道用于从GitHub收集软件工程任务并进行去污染评估。该系统解决了两大挑战:高质量训练数据稀缺和评估基准容易被污染。通过四阶段处理(初步收集、自动安装配置、执行验证和质量评估),SWE-rebench构建了包含超过21,000个Python交互式任务的数据集,并提供持续更新的评估基准。研究发现部分语言模型在传统基准上的表现可能被污染效应夸大,而DeepSeek模型在开源模型中表现最为稳健。
这项研究提出了JQL(发音为"Jackal"),一种通过多语言方法提升大型语言模型预训练数据质量的创新系统。研究团队从拉马尔研究所等机构通过四阶段方法解决了多语言数据筛选的难题:先由人类评估内容教育价值创建基准数据,然后评估大型语言模型作为"评判者"的能力,接着将这些能力提炼到轻量级评估器中,最后应用于大规模数据筛选。实验表明,JQL在35种语言上显著优于现有方法,甚至能泛化到未见过的语言如阿拉伯语和中文,为多语言AI发展提供了高效可靠的数据筛选方案。
浙江大学和西湖大学研究团队开发的Styl3R实现了艺术风格化3D重建的重大突破,能在不到一秒内从少量未标定照片和任意风格图像创建具有多视角一致性的3D艺术场景。通过创新的双分支网络架构将结构建模与外观着色分离,系统不仅保持了原始场景结构,还准确捕捉了参考风格特征。与现有方法相比,Styl3R在处理速度和视觉质量上均显著领先,为创意内容制作开辟了全新可能。