富士通已经对其整个x86服务器产品组合进行了更新,增加了对英特尔Optane DC持久内存的支持。该内存于昨天晚间正式发布。
基于3D XPoint技术的Optane DC内存有望提供与DRAM相当的速度,但容量更接近于SSD。Optane DC还可以在机器关闭或重新启动的情况下保留数据——这一点可能会彻底变革分层存储架构。
根据加州大学圣地亚哥分校的研究人员称,对Optane DC内存的早期基准测试结果看起来很有希望,不过这项技术仍有许多问题需要解决。
由于Optane内存仅与Cascade Lake CPU兼容,所以富士通实际上是把两项公告捆绑在一起公布的:尽管未提及单个组件,但对Optane NVDIMM的支持,意味着富士通已经为自己的服务器配备了第二代Xeon SP CPU。为什么不呢?这些芯片的价格几乎与第一代SP芯片完全相同。
但说回Optane DC:这种内存是基于英特尔与美光合作开发的技术,并在2015年大张旗鼓对外公布的。
3D XPoint最初应用于存储设备以打造Optane SSD系列——因为其不同寻常的细长外形而被称为“Ruler”——让系统设计人员能够将PB级的闪存容纳到单个机架空间内,这一点令人印象深刻。
与Optane SSD不同,Optane DC内存可接入DIMM插槽,充分利用了服务器系统上任何可用的高速互连。每个模块的容量为128GB到512GB不等,而传统的DRAM目前最大容量仅为16GB。
富士通的M5代Primergy以及Primequest服务器将把Optane DC内存作为选件。富士通希望客户将NVDIMM用作缓存层,从而提高CPU与存储之间的数据交换速度。
富士通已经在内部对Optane DC内存进行了测试,并表示使用Optane DC的Primergy RX2540 M5双路服务器在基准测试中已经打破了VMware VMmark测试(用于衡量虚拟化性能的测试)的两项记录,并且该服务器与Primergy RX4770 M5服务器在测试Java性能的SPECjbb2015基准测试中也创造了多项记录。
富士通EMEIA地区负责人Olivier Delachapelle表示:“企业过去常常认为管理和存储大型数据湖的需求是很不方便的,但现在企业正在认识到它们的巨大潜力。”
“这项突破性技术让庞大的数据集能够更接近服务器处理器,使得我们可以充分利用时间进行洞察,确保客户能够从他们累积的数据中获得比以往更高的价值。”
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。