继软件开源得到市场广泛认可之后,硬件开源也已逐渐成为一种趋势。而在硬件开源方面,OCP和ODCC功不可没。从2011年OCP、ODCC先后成立以来,它们不仅成为服务器、存储、网络以及数据中心基础设施等相关技术创新的一大推动力,更使得“开放计算”的理念深入人心。
如今,开放计算在数据中心产业中得到了广泛的认可,通过开放计算组织孵化出了大量的技术创新和产品创新,充分地诠释了“开放才有未来”这句话的深刻内涵。正如OCP中国社区联席主席郭洪昌在日前举行的OCP China Day 2020大会上致辞中所说:“开源开放促成了今天的IT世界。我们相信开放连接世界,开源技术让用户受益。”
开放计算推动联合创新
在开放计算流行之前,计算行业的创新主要来自各个厂商踽踽独行的探索和研究,基于它们对用户需求的理解和把握,用户参与度不高。而OCP和ODCC等组织的成立改变这一状态,让用户参与到产业创新中来。简而言之,通过一个开放组织共建了一个开放生态,从而让参与者能发挥各自所长。
“OCP或者ODCC组织给整个行业带来最大的改变,是为云计算基础设施提供了一个产业链融合的机会。它们改变了传统数据中心服务器、存储、网络设备商等各自为政的局面,通过软硬件一体化的设计、融合来推动数据中心技术的演进。”来自百度的系统架构专家如此表示。
众所周知,这些开放计算组织都是互联网巨头发起成立的:OCP是由Facebook联合微软、Google等互联网巨头发起,ODCC是阿里、腾讯、百度发起。发起背景是,它们都在规划、建设和使用超大规模的数据中心,单个数据中心服务器规模动辄数万台,甚至更多。在管理和运维上,这些互联网企业面临很大压力,也有着很多个性化的需求。为了解决这些痛点,互联网巨头们投入了不少精力,也积累了丰富的经验和技术。通过开放组织把这些技术共享出来,大家互相交流和学习,无论对自己还是对行业的发展都是一件非常好的事情。因此,开放计算组织很快流行开来,不只是互联网大厂,还有众多产业链上下游的厂商和传统企业客户纷纷加入。
如今,开放计算组织的创新能力得到了业界的普遍认可,英特尔、浪潮等厂商都是这些组织的成员,而且非常活跃。比如,浪潮就同时参与了三大主流开放计算标准组织,是ODCC的核心会员并参与多项标准制定,还是OCP的铂金会员和Open19的首批会员。
浪潮信息副总裁刘军表示,数据中心已经从原来的Server as Computer(服务器即计算)发展到今天的机架即服务(Rack is Computer)和数据中心即服务(Datacenter is Computer),但标准还停留在服务器时代。由于缺乏标准做依据,给计算系统和数据中心的发展带来极大的困扰。开放计算组织的一大价值就是制订标准,第二个价值就是联合创新。
以AI领域为例,迅速普及的AI应用对AI芯片和AI服务器提出了新的需求。为了给AI应用提供更好的硬件支撑,OCP设立了OAI(Open Accelerator Infrastructure)小组,负责开发OAM(OCP Accelerator Module)规范,将加速器模块标准化,以简化和规范化AI基础架构的设计。
“仅靠AI芯片创新不能完全满足AI时代算力需求,基于OAI标准,我们把底座做好,合作伙伴就可以聚焦芯片、架构、应用领域创新,这样我们就能看到越来越多创新技术的出现,这样才能真正让这个时代更加智能化。”刘军说。
让更多人从创新技术受益
众所周知,无论是OCP、ODCC还是Open19都是由互联网巨头牵头发起的,早期不少技术面向的也都是大型和超大型数据中心的硬件设计和运维,和传统企业客户的需求有一定距离。不过,这些年开放计算组织也越来越重视传统客户,并致力于让更多行业从这些技术中受益。
以天蝎服务器规范为例,早期天蝎服务器的设计关注性能和整机交付效率、运维,而最新推出天蝎3.0在思路上发生了改变,在生态上兼顾了传统客户需求,希望让更多传统企业客户也能用上天蝎服务器。比如,天蝎3.0的机柜尺寸上兼容了19英寸机柜,散热方式也从原来的整机柜改成了单节点。这些修改让天蝎服务器能适应更多行业和应用场景。
实际上,一些符合开放计算标准的产品也的确被行业用户所采纳,比如东方地球物理公司研究院就部署了一批符合ODCC认证的整机柜服务器产品。其次,国内也出现了一些获得OCP认证的传统数据中心。
值得一提的是,在开放组织中,厂商发挥了举足轻重的作用。比如浪潮,它们不仅贡献自己在计算领域的多年技术积累,同时还借助全面的系统集成能力、产品化的能力,推出一些通用化的产品,加速创新技术落地,从而更好地赋能传统客户。
浪潮信息副总裁、服务器产品部总经理沈荣表示,浪潮几乎参与了所有比较大的开放计算标准组织,因为浪潮坚信开放计算就是未来。
“开放计算让大家都可以看到最新、最成熟的技术,加速了创新的步伐;同时,通过开放可以减少了用户对安全问题的担心,有利于产业发展。创新加快了,作为厂商的我们也必须跑得快。我们坚信开放计算的价值,也希望和大家一起壮大开放计算,让更多用户受益。”沈荣表示。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。