生成式人工智能(AIGC)的兴起,掀起了一场席卷全球的“智算”热潮。从聊天机器人ChatGPT到AI绘画工具Midjourney,AIGC应用繁花绽放,展现出巨大的商业潜力。企业如何利用AIGC构建新质生产力提升企业核心竞争力,对其背后的算力基础设施提出了严苛的挑战。
“依托新华三在算力和联接上的核心优势,我们希望帮助企业构建面向未来的智算基础设施。”新华三集团联席总裁、首席技术官兼技术委员会主席尤学军表示:“其核心思想是通过多元化算力与标准化联接的乘数效应,充分挖掘企业的数据潜能,提升智算资源的利用效率,让百行百业利用AI重构其所在领域的商业核心竞争力。”

新华三集团联席总裁、首席技术官兼技术委员会主席尤学军
AIGC提质增效,企业面临三大难题
AIGC的出现让企业在智算方面面临三大难题:第一,AI为代表的新质生产力是企业新型的竞争力,然而AI算力资源紧缺让其成为产业内的竞争热点。
第二,大模型在不断更新迭代,训练的速度越来越快,推理准确度也越来越高,但大模型与业务的深度融合还需要一个过程,对于很多企业来说,利用大模型提质增效还有很高门槛。
第三、能耗治理问题凸显。支撑大模型的海量计算的同时,如何提高能耗治理水平,让算力产业高质量持续稳定发展成为重要挑战。
新华三升级六大能力 破局AIGC新挑战
新华三集团面向AI时代,提出以“算力×联接”带来倍增的技术整合优势和智算效率,将算力方案和联接方案进行最佳的调优和配合,通过两者的深度融合带来倍增的效益,满足不同规模和需求场景的算力联接要求。
首先,在算力紧缺的市场环境下,需要进一步提升算力资源利用率,为企业提供更多元、高效的算力联接解决方案。除了提供CPU和GPU多元化选择,还需要结合高效的算力调度和管理使能平台,一方面帮助企业解决GPU算力不足的问题,另一方面,积极推动联接标准化,通过服务器内、外部GPU联接标准化,实现异构GPU的智算集群,这可以帮助企业保护已有投资,充分调用现有算力资源,为企业创造更多价值。新华三傲飞算力平台3.0则全面拥抱“算力即服务”,结合G7系列模块化异构算力服务器,以多元开放、拥抱OAI、存算分离三大优势为AIGC提供澎湃算力支持,满足不同AI负载以及用户不同业务场景对算力的需求,以丰富的生态及模型适配,帮助客户减少产品开发周期、提升业务效率。
第二,应对大模型、海量数据的训练、推理为企业提供海量数据并行处理的解决方案。新华三推出了下一代AI存储——Polaris系列,通过软硬件协同创新为大模型训练提供超强的存储性能,实现checkpoint秒级写入,满足智算千万级小文件并发和TB级带宽需求。基于AI技术的加持,智能预测存储集群容量使用趋势、提供扩容和业务调整建议,通过智能分层算法实现冷热数据分层存储,提高用户命中率和热数据读取性能;同时,基于大语言模型提供灵犀助手,根据业务负载动态调整资源,极大地简化了用户运维难度,实现便捷、高效的管理体验
第三,大模型的推理、训练、微调需要高品质的网络与计算资源,全新的智算网络解决方案帮助解决万卡互联难题。新华三智算网络解决方案,以灵活多样的组网方式满足不同场景、不同规模的智算中心网络需求;通过负载均衡技术,提高网络带宽的利用率,消除网络瓶颈;通过自愈相关技术,将网络的故障收敛时间从毫秒级降低至微秒级。此外,作为方案核心产品支撑,新华三算力集群交换机H3C S12500 AI专为AI算力场景设计,突破传统框式设备端口容量上限,灵活横向扩展,具备强大生态解耦能力和优秀的算力网络性能,是异构GPU互联的最佳选择,具有信元级负载均衡、超大规模、原生无损的优势。
第四,保护企业重要数据资产,主动安全将为企业的大模型发展保驾护航。新华三新一代M9000-X旗舰防火墙,是业内首个内置大模型的防火墙,重新定义了一个新的防火墙纪元。通过内置的灵犀助手,结合AIGC大模型,实现自然语言交互和智能运维,自学习策略验证使运维成本降低5倍;同时,防火墙内置智能检测引擎,应对新型恶意文件及隐蔽攻击手段,提升整体防护效能。
第五,AI使能让运维更简单。内置灵犀大模型,重塑运维效率和体验。通过灵犀助手入口,提供知识问答、配置指导、智能运维、产品推荐等一站式服务;设备侧内置NAI原生技术,提供设备侧原生AI功能,形成云端协同的AI布局,助力全网络协同、全天候服务、多维度洞察、场景化增效的智能运维价值实现。
第六,算力需求的大幅增长带来的另一个问题就是能耗的急速上升,能耗治理成为不可忽视的问题,只有降低IT能耗,企业才能实现高质量可持续发展。
新华三能耗治理解决方案,专注于数字化旅程中端到端每比特/每瓦特的效率提升。AI能耗治理引擎可纳管对接从数据中心、广域网到园区等应用场景下的各类能耗治理手段和治理数据,包括数字能源云、液冷系统,光模块、园区物联网、无线感知等独立能耗方案,实现能耗治理效果可视、基础设施管理和巡检、节电自动处理策略管理。同时,能耗治理引擎可集成在U-Center统一运维平台,也可以在客户侧单独部署,助力百行百业全面实现“ALL in GREEN”。
正如紫光股份有限公司董事长、新华三集团总裁兼首席执行官于英涛所言:“在人工智能时代,新华三将重点做三件事:一、深化‘AI in ALL’,让产品和解决方案更智能;二、加速‘AI for ALL’,用自身技术、产品、解决方案赋能百行百业;三、充分发挥新华三在算力和联接领域的核心优势,激发乘数效应,放大智算资源价值,让算力更快、更强、更澎湃!”
新华三“算力×联接”将为AIGC产业发展提供新的思路。我们看到,新华三通过持续创新,不断提升“算力×联接”能力,为AIGC产业发展提供更强大的支撑。未来,新华三将与合作伙伴一起,共同推动AIGC产业的繁荣发展,为数字经济注入新的活力。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。