ZD至顶网服务器频道 12月05日 新闻消息(文/邹大斌): 如今云计算已经进入务实落地的阶段,一批云数据中心正在各地拔地而起,大批x86服务器被采购、部署,为各种云服务的交付发挥重要作用。这些服务器除了CPU型号、内存和存储空间的型号和大小不同,整体架构上大同小异,并没有哪款服务器是专门为其中某类应用类型而专门订制的。在曙光看来这并不合理,在这个领域应该有专用的服务器,就像曙光刚刚推出的“星河”云服务器。
11月29日,曙光“星河”云服务器在天津宣布正式量产,这是一款专门为云计算典型应用需求而研发的服务器。这也是业界首款支持亿级并发的云服务器系统,由于采用了全新的国产架构,可以有效应对亿级以上的并发访问,特别是适合用户在线访问和互动搜索应用。
尽管当下云服务种类繁多,但仔细分析,不难发现这些云服务大多离不开简单的交互,比如我们要到互联网上去查询,互联网给我们返回一个查询结果。其实,这也正是最主要的应用类型。根据有关机构对云服务类型进行的调查研究,发现简单的Web访问类应用和信息检索查询应用占现有云应用90%以上。这些服务对计算能力的要求并不高,反而对并发更为敏感。这与传统企业级市场有很大区别,在传统企业市场,用户普遍更关注前者。这只是云服务市场对服务器的特殊要求之一,但它说明了云服务对服务器有着不同的需求,这也正是曙光推出“星河”云服务器的一个大背景。
“近几年,我们看到,服务器从4U到2U、1U,服务器的计算密度越做越高,还出现了整机柜这种产品。它们都是在用物理上的资源共享来让传统的通用服务器适应现代大型数据中心的互联网应用。”曙光高级副总裁聂华表示。
而厂家乐此不疲地要压缩服务器的空间和体积、降低服务器的功耗和成本,其背后的原因在于它们希望借此来满足云数据中心的新需求。而其实不管是现有的服务器还是经过调整之后的服务器都很难满足这些需求,比如计算资源的浪费(利用率普遍不到30%)、高并发的响应不足、能耗高、占空间。
“我们认为,这是并不是仅仅通过服务器物理结构上的改变就可以解决的,包括整机柜服务器、高密度的机架服务器等都只是在一定程度上部分解决了问题,不能说从根本上解决这方面的问题。”聂华说。
面对云计算这样重大的需求,曙光应该做点什么?应该怎么样更好地满足市场?曙光先是对于最典型的云服务做了调查,然后总结了这些应用对服务器的需求,随后决定推出为这个市场定制的云服务器,并成功申请国家863计划“亿级并发云服务器系统研制”课题。
“云计算是一个非常重要的市场,在这个市场争夺十分激烈,但是,到目前为止我们并没有掌握到云计算的核心技术,也就没有掌握云时代的话语权。我们希望从基础装备的角度做出自己的努力。”聂华表示。
基于上述目的,课题组对目前市场需求进行了归纳。除了前面提到的并发要求高之外,共性需求还包括需要是高能效的,而且是弹性可扩展,能按需分配,可以软件定义,只有这样用户才能面对不同的云应用拿出不同的资源去响应。最后,提出了这款云服务的两个基本特征,即可通用原则和简约原则。
“尽管定制,但我们的服务器必须有它的通用性,能进入x86服务器现有的生态系统中。另外要简约,就是对服务器的功能做减法,这两个是贯穿我们整个云服务器设计当中的两个基本原则。”聂华说。
聂华进一步解释说,之所以有两个基本原则很大程度上是基于过去的经历。因为太多国产自主的系统由于通用性不足,导致生态不够完善,厂商要花很大力气来改变、要塑造生态,最后效果都不理想。而在高度的简约方面,就是希望用减法来减掉一些浪费的部件,从而进一步提升价格优势。
经过3年多的研究,11月29日“亿级并发云服务器系统研制”课题正式对外公开了自己的研究成果,这就是业界首款支持亿级的并发云服务器系统——“星河”云服务器系统。该系统有着多项技术上的突破,从而使得其性能功耗比和整体服务能力较传统服务器有显著提升。
比如,“星河”云服务器系统采用了英特尔高节能的Xeon D处理器,与传统架构相比,云服务器系统的节点性能功耗比提升3倍以上;去掉了各种非必要的传统输入输出设备及扩展支持,成本降低70%,系统复杂性降低60%;标准4U空间容纳32路单路节点,与业内最好的传统架构服务器相比,空间占用减少50%。
据聂华介绍,之所以能实现这些重大突破,源于该云服务器实现了三大核心技术突破:第一,全球首创全新云计算基础装备,专为云计算需求设计的简洁节能结构,首创单路直连紧耦合体系架构和全硬件存储虚拟化,实现真正的软件定义云服务器;第二,实现系统负载并发处理能力大于1亿次,单节点可应对典型云服务日请求处理数大于900亿次;第三,采用全新国产体系架构和安全可控技术承载现有的标准和应用,在保留产品尖端技术和通用性的前提下,不留安全后门,保证云计算应用的安全。
据悉,“亿级并发云服务器系统研制”课题共申请相关国际发明专利2项,国内发明专利23 项。该研究成果已在中国银联的联云平台、中国电信的天翼云、中国教育电视台的教育新媒体云上得到有效的应用推广,获得用户的广泛好评,取得了显著的社会和经济效益。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。