IDC一项新的预测显示,到2024年,开放计算项目(OCP)基础设施市场的全球收入将达到338亿美元。由于疫情期间的资本保全策略,2020年同比增长将略有放缓,在这个情况下,OCP计算和存储基础设施市场在2020年到2024年预测期内的复合年增长率(CAGR)预计为16.6%。这个预测是假设在全球经济强劲复苏的推动下,该市场将在2021到2022年实现快速复苏。不过,长期危机和经济不确定性可能会让市场复苏推迟到2021年之后,在此期间,基础设施方面的投资,将以对云服务提供商的投资以及由云服务提供商进行的投资为主导。
OCP创立于2011年,是一个致力于设计硬件技术的开放社区,目标是满足中大型数据中心运营商(超大规模数据中心)对计算基础设施不断增长的需求。目前,OCP已经得到了Facebook、微软、LinkedIn、阿里巴巴、百度、腾讯和Rackspace等市场领导厂商的支持。 OCP鼓励基础设施供应商、超大规模数据中心厂商、云服务提供商、系统集成商和组件供应商围绕关键领域的创新、规范和各类项目展开合作。
IDC基础设施系统、平台和技术研究经理Sebastian Lagana表示:“IDC相信,通过在社区内开放和共享创新和设计,OCP将成为数据中心基础设施创新与发展的最重要风向标之一,特别是在超大规模数据中心和云服务提供商群体之间。”
IDC基础设施系统、平台和技术研究总监Kuba Stolarski表示:“IDC预计,全球范围内生成、传输和存储的数据量迅猛增长,其中很多数据将流入和流出云,并存储在超大规模云数据中心中,这将推动对基础设施的需求。”
未来五年,计算市场仍将是OCP基础设施整体收入的主要动力,约占整个市场的83%。尽管该市场占有很大的一部分份额,但到2024年,计算市场与存储市场的五年复合增长率将持平,细分如下:
计算:计算平台(例如包含了加速卡和互连模块的服务器)支出的五年复合增长率预计为16.2%,将达到280.7亿美元。此部分包括外部连接的加速卡例如JBOG(GPU)和JBOF(FPGA)。
存储:存储支出(例如基于服务器的平台,以及外部连接的平台和系统)支出的五年复合年增长率预计为18.5%,将达到57.3亿美元。外部连接的平台也称为JBOF(闪存)和JBOD(HDD),不包含控制卡。外部连接系统自身使用的是存储控制卡。
来自OCP成员企业的采购占到了OCP基础设施市场收入的很大一部分,并有望在2024年达到14.8%的复合年增长率,占总市场近75%的份额。相反,非会员企业的支出预计复合年增长率达到23.2%,在预测期内让OCP基础设施市场的份额扩大600多个基点。
从最终用户类型来看,2019年超大规模数据中心所占市场份额最大,超过78%,预计到2024年支持的复合年增长率将达到14.2%,不过这会导致对总份额的侵蚀。相反,非超大规模数据中心的支出在同期内将增长23.8%,市场份额增加大约650个基点。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。