至顶网服务器频道 04月08日 新闻消息(文/邹大斌):4月3日,英特尔在全球同步发布了第二代至强CPU等产品,引发各个OEM厂商的产品升级热潮。紧随英特尔的脚步,华为也在同一天发布了最新一代的服务器——FusionServer Pro智能服务器,正是基于第二代至强可扩展处理器的服务器产品。“智能”被作为这一新服务器的一大特色在发布会被反复强调。值得一提的是,在华为在计算产业的布局中,FusionServer Pro不只是作为一款新的服务器产品,而是华为帮助客户构建智能世界的一个基础。
智能世界需要智能的基础设施
人类社会正在迈向更智能的世界。一个重要的表现是,大数据分析、AI正在被广泛地应用到我们工作、生活的各个领域,这些先进的技术不仅帮助我们提高工作效率,更重要的是更为智能进行信息处理,包括自动地识别风险、做出更为科学的决策以及更快地做出反应等。而这一切都离不强大的算力以及更为智能的底层基础设施的支持:一方面需要强大的算力来进行海量数据的处理,另一方面需要更为灵活的调度和快速响应需求的能力。
“基于对新世界的上述认识,华为公司在2018年伊始提出了新的愿景和使命:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。2018年12月华为还正式成立智能计算业务部,发布了我们在计算产业的全新战略。” 华为智能计算业务部总裁马海旭在演讲时表示。
马海旭表示,华为在计算产业的这个全新战略就是,通过华为全自研的“计算,传输,存储,管理,AI”五大类芯片,满足端、边、云全场景下计算需求,并在此基础上构建华为全栈全场景AI解决方案,为客户数字化转型,迈向智能化时代提供智能计算的底座。
显然,华为成立的智能计算业务部门也正是这一战略的推出。马海旭解释说,华为之所以从原来的服务器产品线变更为智能计算部门也是因为这个部门的职能变了。
“我们的业务从数据中心的计算到边缘计算、到未来车载计算,覆盖领域扩宽了;产品型态从板卡模组到边缘侧的计算设备到数据中心的服务器、再加上车载计算形态,形态也已经变化了。另外,智能计算事业部不仅仅是一个研发组织,它包括了从前端的销售服务、到后面的研发组织、生产,事业部有利于我们把资源更加集中,更加专业、也更好地服务客户、响应市场的变化。” 马海旭说。
突破计算边界
如今的x86已经成为业界主流的架构,随着英特尔CPU的升级,各服务器厂商也都会升级自己的产品。作为这个x86大家庭的一员,FusionServer Pro智能服务器如何凸显自己的特色是华为必须回答的一个问题,而答案就是“智能”。
“华为在服务器领域已经有17年的积累了,我们处在英特尔的生态体系中,这是一个成熟的生态体系。我们需要创新,我们也一直在创新,就是依靠我们的技术和行业积累给客户创造更大的价值。” 华为智能计算业务部FusionServer领域总裁张小华表示。
张小华介绍,FusionServer Pro智能服务器从智能加速、智能管理、智能数据中心三个方面体现出“智能”。其中,“智能加速”是从计算层面,“智能管理”是从服务器的管理层面,“智能数据中心”则上升为整个数据中心的管理。
张小华表示,传统服务器以CPU作为传统的计算资源,而在部分业务场景下单纯使用CPU并不是最经济的选择,现在越来越多的场景会是异构计算;其次,传统服务器在管理和维护上自动化程度低、运维成本高;第三,基于这些传统服务器构建的传统数据中心成本基础设施(风、火、水、电)与IT设备缺乏联动,成本高,而且还不够灵活。
FusionServer Pro直抵传统服务器的痛点。比如,在计算方面FusionServer Pro将突破计算的边界。FusionServer Pro引入了智能加速引擎,不只是支持CPU、还支持FPGA等AI加速卡,以实现计算、存储和网络协议的智能卸载和提升,有效的提升业务体验,降低运营成本,提升投资回报。在规模部署方面,FusionServer Pro引入智能管理引擎,它提供智能部署管理、智能资产管理、智能版本管理、智能能效管理、智能故障管理等五大智能特性,提升管理与运维效率,降低OPEX可达15%。而在超大规模的部署方面,FusionServer Pro支持实现数据中心的制冷与服务器的智能化联动,提升数据中心整体能源利用效率。
另外,针对部门对节能环保非常敏感的客户,华为还提供全液冷机柜解决方案以及整机柜的解决方案,从而最大程度低降低能耗,降低运维成本,实现数据中心向智能化升级。
据悉,FusionServer Pro和上述这些先进的产品和解决方案目前都已经在华为云和部分客户得到部署实施,得到了非常好的市场反应。
“从市场的反映来看,这些年来市场对华为公司在服务器产业和后来的智能计算市场的表现还是很认可的,也让我们坚信我们的创新。面向未来,随着IoT时代的到来,随着智能化的深入,我们的创新还将深入下去。” 华为智能计算全球Marketing销售与服务部总裁郑殿海表示。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。