11月29日,在“进化·智能·算赋新生”新华三智慧计算新品发布会上,新华三集团为与会者分享智慧算力的发展趋势,并带来新华三“内生智能·成就智慧计算”战略全新解读:以数算双核驱动的可进化架构,赋能从数据产生到算力释放的全过程,通过云、网、边、端的海量数据赋能核心算法,让算力可以为智能服务。
新华三集团副总裁、计算存储产品线总裁徐润安
数字经济进入高速发展期,企业智慧计算需求升级
当前,中国数字经济迅猛发展,牵引算力需求,尤其是全国一体化大数据中心体系、“东数西算”工程、“双碳”战略等大动作,加快了算力基础设施建设进程。截至2022年6月底,我国在用数据中心机架总规模超过590万标准机架,服务器规模约2000万台,算力总规模超过150 EFlops,近5年平均增速超过30%,算力规模排名全球第二。
在徐润安看来,算力供应已经走过“从无到有”、“从少到多”阶段,企业算力需求正在从“有得用”向“用得好”进化。这是因为数字技术向社会各个角落进一步渗透,百行百业进行业务数字化、智能化转型,智慧城市、智慧生活、智能制造等新业态开始大规模落地,对算力应用提出新的挑战。
举例来说,在整个计算流程中,算力调度、算力负载、数据迁移、数据同步都会带来大量损耗,算力效率问题不解决,企业继续堆砌服务器,会造成额外的支出;再比如,各类数字应用尤其是对实时计算要求较高的应用,需要硬件与软件高度协同,让算力输出始终保持在“最佳区间”,才能实现业务的稳定性与可靠性。
对此,徐润安认为,现阶段智慧算力要与产业需求同频共振,往多元泛在、智能敏捷、绿色低碳、持续进化方向发展,才能更好支撑5G、大数据、人工智能、云计算等新一代信息通信技术的创新,为各行各业生产效力提升、商业模式创新、服务能力优化提供有力支撑。
战略与技术双重进化,新华三打造算力“最优解”
对企业而言,具体需要什么样的智慧计算基础设施?作为数字化解决方案领导者,新华三集团很早就在长期深耕实践、服务客户的过程中有所洞察:计算基础设施不能仅限于算力生产,还要提供算力服务,帮助企业以最简易甚至自动化的方式,实现算力效率与效益的最大化,支撑业务落地与创新。
2020年,新华三集团发布智慧计算战略“内生智能·成就智慧计算”,提出智慧计算不仅要提供强劲、高效的算力为人工智能等新兴应用提供支持,更要立足于智能的平台,实现算力的管理与调度,让企业能够更高效、敏捷、稳定地使用算力。
两年后,随着数字经济蓬勃发展,人工智能等技术得到进一步普及,数字应用与场景结合更加深入,带来算力需求的高度差异化。举例来说,自动驾驶与智能制造都大面积应用了人工智能技术,但两者计算模式、计算负载、数据吞吐、数据类型并不相同,对算力要求也不一致。同时,企业IT基础设施更趋于一体化和原生化,将算力生产应用流程嵌入整个业务环节,以更好支撑智慧应用高效运作。
企业算力需求在变化,新华三集团“内生智能”的IT战略也随之演进,徐润安表示,智慧IT需要从底层硬件、中层平台到上层应用提供全栈智慧计算能力,打通感应负载、分析算力、生产算力、高效聚合、智能调度、全面释放等环节,结合企业自身智慧业务特征,找到算力的“最优解”,并持续升级进化,才能跟上数字经济高速发展的需求。
这背后是新华三集团在智慧计算领域清晰的“软硬结合”进化路径:在硬件层面通过模块化设计,充分结合用户算力场景来优化计算单元,同时打通异构计算之间传输限制,为未来多元异构算力发展铺平道路;在软件层面通过内置AI算法进行算力调度与设备管理,同时不断对算法进行训练调优,助推IT基础设施升级进化,与企业应用场景和业务发展保持高度贴合。
目前,新华三集团已形成智慧计算体系“一体·两中枢”,覆盖所有计算场景体系的同时,提供智能化的管理与调度能力,既能充分实现底层基础设施高效协同,又能敏捷响应百行百业智慧应用,让每一分算力“用到刀刃上”。
“自‘内生智能’战略发布以来,新华三集团服务器与存储产品一直位居国内市场前二。”徐润安认为,新华三能够在计算市场稳步向前,正是切中了数字化转型大潮对于智慧计算的深度需求,“打造更适用于数字时代的计算产品,要具有前瞻战略性,在技术产品革新上‘想在客户之前’,还需要聚合生态力量,联合产业合作伙伴共研共建。”
“高效、绿色、智能,是未来智慧计算产品的标配。”徐润安强调,“新华三集团智慧计算将始终‘保持进化’,构建未来就绪的可进化算力,发挥技术领先与产品全栈优势,助推计算产业进入智能时代,服务我们的客户和合作伙伴,成就数字时代下的智慧创新。”
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。