ZD至顶网服务器频道 10月28日 新闻消息(文/邹大斌):10月27日至28日,SPEC 2016亚洲峰会(SPEC 2016 Asia Summit)在北京成功召开。SPEC 2016亚洲峰会由SPEC(Standard Performance Evaluation Corporation,标准性能评估组织)主办,这是SPEC组织首次在亚洲举办此类会议,有200多位来自全球的企业级IT专家和学者参加了为期两天的大会。与会代表围绕“发现真实的计算效率”这个主题,共同探讨了云计算、大数据趋势下的计算性能、效率的评估模型与规范、测试方法的制定及实际应用。SPEC还联手中国标准化测试研究院,发布首个中国市场服务器效率研究报告。
近年来,伴随中国经济的高速发展,中国成为全球服务器市场为数不多的仍处于增长阶段的市场之一。Gartner的数据显示,2016年第二季度x86服务器出货量增长2.1%。除亚太与北美地区分别增长了5.6%与3%之外,其他地区都在下降,而亚太区的增长大部分来自中国。
中国服务器市场的高速增长带动了中国对服务器计算效率的关注,中国的企业也是越来越期盼能了解服务器的性能和效率究竟如何。这背后的原因在于:服务器的性能直接影响系统运行效果,影响用户体验,在很大程度上决定了最后的采购成本,而效率涉及能耗,它决定了服务器的长期运营成本,同时也关系到产品是否合规(比如,要符合国家能效标准)。
中国对服务器计算和效率问题的关注度其实是伴随着数据中心走向大型化和超大型化而逐步凸显出来的,尤其是能耗问题。研究显示,数据中心的运营成本中用电成本高达40%。为了降低数据中心的能耗,不少地方对新建数据中心的PUE值提出明确要求,比如北京就严格限制PUE值1.5以上的新建数据中心。而对于中国而言,降低能耗除了符合保护环境、走可持续发展之路的国家大政方针之外,还涉及能源安全,鉴于此我国也把包括服务器在内的相关能耗标准的研制提上议事日程。
“在我国的十三五规划中,明确提出要健全节能标准体系。国家标准化体系建设发展规划(2016-2020)中也指出,要整合精简强制性标准,提高节能标准,加快能效能耗标准研制。”中国标准化研究院李鹏程博士在演讲时透露,服务器能耗标准也正在研制当中。
中国标准化研究院李鹏程博士
用户对服务器计算效率的关注,直接带动了对相关测试方法论和测试工具的需求。作为测试方法论和测试工具的主要提供者的SPEC组织就是该领域的一个权威的、非常活跃的第三方机构,在本次大会上带来众多最新的服务器能耗测评规范,包括SPEC CPU 2006、SPECvirt_sc2013以及全球首发的SPEC CPU 2017正式公共测试版。这些测试规范将大大方便我们了解自己所拥有的服务器真正的计算效率。
SPEC主席Walter Bays表示:“作为一个非营利性的第三方组织,SPEC旨在制定、修改以及认证一系列计算系统应用性能评估的标准。SPEC的这些基准测试以及性能指标可以广泛适用并真实反映出客户的实际计算环境。基于测试基准,用户可以对比不同的硬件及软件;供应商可以利用基准测试提升真实环境的硬件性能。我们这次大会的目的是给中国用户介绍SPEC组织和我们的测试方法,同时期待听到中国市场对基准测试的相关需求。”
SPEC主席Walter Bays
目前,对服务器计算效率的评估SPEC提供有SPECcpu和SPECpower两个基准,前者用于对服务器的计算性能进行测评,后者用于对服务器的能耗进行测评。其中,SPECcpu是SPEC最早推出的基准之一,也是很多中国用户最早接触的来自SPEC的基准。而SPECpower起步稍晚,但在全球对节能环保高度重视的背景下,普及也非常快,SPECpower也就成为继SPECcpu之后又一个得到广泛应用的基准。在中国SPECpower测试基础早在2007年起就拥有了自己的用户,包括中国电信和中国移动都有成熟的应用。
实际上,SPECpower也是本地大会上非常受关注的一个话题。中国电信BOSS评测中心主任李先绪在演讲中透露,中国电信建立了自己的IT基础设施测试标准集CTITS,其中的CTITS-E专门用于测试服务器、存储设备能耗,他们每年会利用SPECpower测试6-8个厂家、约10个集采模型及每个模型的不同典型配置,平均测试约60款设备,这些测试结果不仅用于指导采购,还会为中国电信IDC机房规划建设、能耗分析与控制等提供科学依据。
中国电信BOSS评测中心主任李先绪
李先绪给予SPECpower很高评价。他说:“SPECpower数据充分体现了各厂家在主板元器件选用、生产工艺、电源风扇等配件选择等关键节能控制技术差异,数据准确,效果显著。PECpower的测试结果对于中国电信实施绿色采购、开展绿色运营、打造绿色IT具有重要意义。”
SPEC成员单位浪潮集团副总裁胡雷钧
应该说,一直以来SPEC推出的一系列测试规范为我们了解服务器的真实效率提供了帮助,如今,随着技术的不断进步,标准化测试技术不会停滞不前。SPEC也在听取用户需求,不断优化和改进现有规范、乃至推出新的规范。正如SPEC成员单位浪潮集团副总裁胡雷钧在演讲中所言,“随着高性能计算的飞速发展,云计算的迅速普及,开发适用于今后发展的基准测试与指标体系是SPEC面临的主要挑战。因此我们必须观察市场如何发展,收集信息,并鼓励广泛的参与。寻找这些愿意帮助我们了解未来市场需求的参与者,也是SPEC关注中国市场和用户的理由之一 。”
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。