3月4日,中共中央政治局常务委员会召开会议,指出要加快5G网络、数据中心等新型基础设施建设进度。一时间,“新基建”成为热词。
对于国家定调的“新基建”,浪潮集团董事长兼CEO孙丕恕认为,“新基建”是发力科技端的基础设施建设。相较于传统的铁路、公路、桥梁等“老基建”,“新基建”涉及的5G网络、数据中心等领域,都是着眼于经济长远发展必须加快发展的科技领域。
虽然“新基建”是在疫情期间提出并受广泛关注,但实际上,“新基建”并不是一个新概念,在过去一年里,“加强新型基础设施建设”已被频繁提及。在孙丕恕看来,国家此时重点提出加快“新基建”,不仅能够减缓疫情对经济的负面冲击,推动5G、人工智能、工业互联网等新一代信息技术产业快速发展,促进传统行业转型升级,为实体经济高质量发展提供科技新动能,还将为提升社会治理能力和公共服务水平打下坚实基础。
孙丕恕强调,在这次疫情中,我们已经切身感受到基于云计算、大数据、AI等新一代信息技术打造的“新基建”起到的巨大作用。数字化、智能化发挥出的“无接触”效应,提升了疫情防控的全流程、多角色、多场景协同效率。数字化、智能化水平越高的工厂和企业,复工的进度和效率越高。在疫情防控和有序复工等关键时刻,数字“新基建”支撑了社会稳定运行与政府公共治理。
在孙丕恕看来,当前各国经济都在朝智能化、数字化、科技化的方向发展,我国加快以5G、云计算、AI等为代表的“新基建”,是在加速建设一条驶向科技强国的“数字高速公路”。
浪潮作为新一代信息技术领军企业,长期服务于政府和企业的数字化转型,赋能实体经济的高质量发展,在“新基建”相关技术领域都有深耕和布局。孙丕恕表示,浪潮将继续大力发展云计算、大数据、人工智能等新一代信息技术,全力投身“新基建”,深化向“云+数+AI”新型互联网企业转型,为经济高质量发展提供坚实的“数字底座”,这是浪潮的既定战略,也是责任和使命。
据公开数据显示,浪潮在打造数字“新基建”的主要业务领域处于领先的市场地位。作为大数据中心的核心产品,浪潮服务器蝉联全球前三、中国第一,国内市场占有率超37%,AI服务器市场占有率超过50%。作为“政务云”的开创者,浪潮已连续5年稳居政务云市场占有率第一。浪潮云In-Cloud工业互联网平台是国家级十大工业互联网双跨平台之一。此外,浪潮在大数据、区块链等技术领域也拥有较强的技术实力和领先市场地位。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。