4月10日,以“聚力共创,加速行业智能跃迁”为主题的华为云生态大会2025在安徽芜湖召开。会上,华为公司常务董事、华为云计算CEO张平安公布了AI基础设施架构突破性进展,推出CloudMatrix 384超节点,并宣布已在芜湖数据中心规模上线。
华为公司常务董事、华为云计算CEO 张平安
创新算力架构,推出最大规模超节点
当前,人工智能已成为推动行业变革的重要力量。如何让AI更好地从实验室走向产业落地,成为时代发展的“必答题”。
而CloudMatrix 384超节点,就是华为云给出的答案。
面向AI时代的海量算力需求,华为云基于“一切可池化、一切皆对等、一切可组合”的新型高速互联总线推出CloudMatrix 384超节点,实现从服务器级到矩阵级的资源供给模式转变。CloudMatrix 384具备“高密”“高速”“高效”的特点,通过全面的架构创新,在算力、互联带宽、内存带宽等方面实现全面领先。
CloudMatrix 384超节点
张平安表示,面向智能世界,华为云致力于做好行业数字化的“云底座”和“使能器”,加速千行万业智能化。依托AI全栈能力,华为云将坚定打造“自主创新、安全可信”的AI算力底座,依托昇腾AI云服务推动各行各业AI快速开发落地;坚定深耕行业,以盘古大模型为引擎,打造行业解决方案,重塑千行万业;坚定推进生态建设,和伙伴、客户共拓AI的星辰大海。
为打造百模千态的“黑土地”,华为云还对昇腾AI云服务进行持续优化,目前其已全面适配包含DeepSeek在内的160多个第三方大模型,为大模型训推提供可靠保障,支撑行业应用快速落地。
坚持盘古不动摇,为行业客户解难题做难事
在打造坚实算力底座的同时,华为云还持续聚焦行业解难题、做难事。通过不断沉淀行业Know-How,华为云盘古大模型已在30多个行业、400多个场景中落地,在城市治理、智慧金融、医疗健康、气象预测等领域广泛应用,加速重塑千行万业。
“我们耐得住寂寞,盘古大模型将会坚定走行业AI的道路,帮助各行各业的客户打造属于自己的大模型。华为并不发布面向C端的大模型应用,我们更关注的是怎么能让行业客户真正落地AI。”张平安表示。
如在终端,盘古大模型与华为终端的合作就焕发出了“云云协同”的崭新活力。华为终端云服务总裁朱勇刚在会上表示,华为云是数字世界的“黑土地”,以先进的AI算力、云原生架构和全球化的基础设施筑牢根基,而终端云则是连接亿万用户、开发者和生态伙伴的“桥梁”。
华为终端云服务总裁 朱勇刚
此前,华为推出的新一代折叠屏旗舰Pura X,正是华为云和终端云能力协同之作。其全新智慧助手小艺,得益于昇腾云算力的底座支持,盘古大模型与 DeepSeek双模型驱动,为用户带来智慧陪伴体验,也让大家清晰感受到了用户对鸿蒙AI功能的喜爱。
同心同行、做强生态,加速千行万业智能化
数字世界的话语权最终是由生态的繁荣决定。伴随行业智能化的深入,汇聚生态伙伴力量,共建产业新生态的重要性也日益显现。2024年,华为云与全球客户、伙伴及开发者携手共进、加速成长,生态“朋友圈”变得愈发繁荣。目前,华为开发者规模超1200万,伙伴数量超4.5万,云商店应用数量超1.2万。
华为云全球生态部总裁康宁表示,生态是广袤的沃土,只有生态伙伴的成长和成功,才有生态系统的枝繁叶茂。一直以来,华为云坚定投入生态建设,基于华为云打造统一开发者平台,构建以云为底座,围绕鲲鹏、昇腾、鸿蒙根技术的开发者生态体系,释放华为云核心技术势能,持续为开发者提供好用易用的工具和产品。
华为云全球生态部总裁 康宁
开放创新的产业生态体系,不仅为客户提供了更好的产品和服务,也为伙伴带来了价值。本次生态大会期间,科大讯飞、奇瑞汽车、硅基流动、面壁智能等客户伙伴,就分享了与华为云的生态合作历程、联合营销和商业落地等情况,展示了华为云生态体系的共建成果。
正如张平安所说:“在AI时代,并不是一家企业就能解决千行万业的问题,需要整个生态合力,比如AI算力提供商、技术提供商、大模型提供商等协同在一起,以开放的心态互相支持,才能够加速迎接AI时代,尽早享受到AI时代的红利。”
好文章,需要你的鼓励
这项来自麻省理工和滑铁卢大学的研究质疑了在AI文本排序中"思考过程"的必要性。研究者比较了三种文章重排模型:直接判断的StandardRR、先推理再判断的ReasonRR,以及禁用推理功能的ReasonRR-NoReason。实验结果表明,不仅推理过程没有提高排序质量,有时甚至会降低效果。主要原因是推理导致模型倾向于极端判断,难以表达"部分相关"这种微妙关系。即使应用"自洽性"等改进技术,简单直接的判断方式仍然更为高效有效。研究为信息检索系统设计提供了新视角:有时,少即是多。
TAGS是一种创新的医学问答框架,结合了泛医和专医两种视角,通过层次化检索和不确定性验证机制提升医学AI回答的准确性。该框架由穆罕默德·本·扎耶德人工智能大学等机构的研究团队开发,无需任何模型微调即可显著提升包括GPT-4o和DeepSeek-R1在内的大型语言模型在九个医学问答基准测试上的表现。TAGS通过模拟医疗专家协作、结构化知识检索和质量控制,解决了现有方法在复杂医学推理中的短板,为构建更可靠的医学AI系统提供了新思路。
这篇研究提出了时间抽象值学习(OTA)方法,解决离线目标条件强化学习中的长期规划问题。研究团队发现现有分层方法失败的关键在于高层策略无法生成合适子目标,原因是价值函数在长期规划中估计不准确。OTA通过"选项"概念实现时间抽象,有效缩短规划视野,使价值函数能提供更准确的优势信号。在复杂迷宫导航和视觉机器人操作任务中,OTA显著优于现有方法,证明了该方法在处理长期任务时的有效性。
这项研究探索了大语言模型内部可解释特征的形成过程,分析了它们在训练过程中(时间)、模型层级间(空间)和不同规模模型(尺度)的行为变化。研究团队使用稀疏自编码器技术,成功识别出特定语义概念在神经激活中出现的时间点和位置。研究结果显示,不同领域的知识概念在模型训练和规模扩展中存在明确的激活阈值,且在空间分析中发现了早期层特征会在后期层重新激活的现象,这挑战了对变换器模型表示动态的传统认知。