近日,首个以建立主权级大模型为目标的通用人工智能(AGI)企业“元神进化”在北京成立。中国智能计算产业联盟联合曙光智算、算力互联、并行科技、九方世纪、澎峰科技和华恒盛世等智算企业作为项目发起单位和“元神进化”公司签约。来自多所国内知名院校的专家团队提供技术支持。算力互联公司为主权级大模型项目的启动提供了算力支持,首个在训的主权级大模型采用自研的新一代多模态MoE架构。
两会热点:主权级大模型
人工智能(AI)大模型的发展日新月异。视频生成大模型Sora的热度尚未褪去,号称超越GPT-4的大模型Claude 3以及开源大模型Grok相继推出。在今年两会上,这一飞速发展、竞争激烈的领域成为不少代表委员的关注点,其中,全国政协委员、长期从事超级计算机研发与建设工作的中国科学院计算技术研究所研究员张云泉聚焦如何解决大模型算力瓶颈问题,首次提出要发展中国的主权级大模型。当前国内面临大模型训练用国产高端AI芯片供应不足等问题,应该整合优质科研和产业资源,尽快训练出我国的“主权级”大模型。发展主权级大模型需要两弹(智算+大模型)结合。
学术界响应,院士赞成,多位教授表示要提供技术支持
生物信息学专家,中国科学院院士陈润生对于“统一协调国内优质科研产业资源‘集中力量办大事’,以取得快速突破,避免低水平使用国外开源大模型的重复与‘内卷’,延误‘主权级大模型’研发”表示赞同。
超算领域专家,中国工程院院士郑纬民对于利用我国在超算研发建设中的丰富积累,设立能够支持“主权级”大模型训练的专用超算攻关专项,快速缓解国产“主权级大模型”训练的算力瓶颈等想法表示支持。
计算机科学家,中国科学院院士钱德沛对于发展主权级大模型的想法表示赞成,认为发展中国智算产业,研制出能够满足主权级大模型训练需要的十万卡甚至百万卡并行算力需求的AI芯片和系统尤为关键。
大模型领域专家,复旦大学自然语言理解实验室张奇教授表示,将和其他教授一起为‘主权级大模型’项目提供技术支持。“我们国家支撑大模型的智算技术和人才积累相当丰富,得到智能计算产业的支持,对于尽快缩小我国在‘主权级大模型’训练领域与美国的差距十分重要。目前中国院校全力投入大模型领域研究的顶尖人才众多,研发积极性非常高,但是受限于极高的算力门槛,很难单独开展通用大模型研发实践。通过‘主权级大模型’的共建形式和智能算力结合,有志于研发通用大模型的专家们完全能够参与进来为主权大模型事业的进步发挥出技术贡献。”张奇说。
智算产业支持,总签约合作算力超过20Eops
曙光智算、算力互联、并行科技、九方世纪、澎峰科技和华恒盛世等智算企业联合中国智能计算产业联盟作为项目发起单位和“元神进化”公司签约。
算力互联公司是中国科学院科技算力基础设施建设运营实践基础上由计算和通信产业链联合发起设立的高新技术企业,算力互联总经理唐德兵表示未来将依托算力互联ACLink+ACNet算力互联网体系,和“元神进化”共同开展1Eops级算力资源规模合作,构建有竞争力的通用人工智能算力基础设施。曙光智算未来将在国家级、地市级智算中心合作部署“元神进化”主权级大模型,形成通用AGI模型基础设施,帮助各智算中心对各类用户提供大模型技术服务和产品。
并行科技总经理陈健表示,作为国内领先的超算云服务和运营服务提供商和北交所上市公司,并行科技提供超算云、行业云、智算云、设计仿真云和计算资源建设及运营服务。未来将在“元神进化”主权级模型研发、赋能智能计算中心AGI服务商业化上开展合作。
九方世纪副总经理白洋表示,九方世纪在全国一体化算力网络内蒙古枢纽节点和林格尔数据中心集群建设九州智算中心,具备20E FLOPS FP16人工智能算力资源,将支持“元神进化”的主权级大模型项目研发和推广。
澎峰科技总经理张先轶表示,公司致力于打造国际领先的计算软件栈,从PerfMPL数学计算库,PerfXAPI异构计算框架,大模型推理框架PerfXLM,直至助力高级算力的PerfXCloud解决方案。正在积极参与到“元神进化”主权级大模型的软件基础建设当中去,持续赋能芯片、服务器、算力中心的AGI基础建设和应用生态发展。
华恒盛世总经理郑敏表示,作为国家高新技术企业、北京市专精特新企业华恒盛世专精于高性能计算领域的创新型科技。未来将围绕“元神进化”主权级大模型研发合作,通过智能算力调度、运维和优化等技术赋能通用AGI模型基础设施服务和模型商业化部署。
元神进化:打造主权级大模型研发主体
自美国OpenAI的ChatGPT横空出世以后,国内涌现出Moss等几百个大模型,智谱、百川智能、零一万物、minimax和月之暗面等5家头部大模型公司各自获得数十亿投资,知名投资人和机构纷纷点评大模型发展和商业化趋势,大模型市场竞争激烈。
“元神进化”要打造的主权级大模型和之前的大模型有什么区别,面对采访,“元神进化”创始人阐述了他思考的三个问题。
一、智算智能是一体的产业,从美国市值超过1万亿美元的几家公司看,我认为现在已经进入“智算智能”时代。主权级大模型首先要服务于智算产业,让智算用的好,更好用。
二、大模型技术发展日新月异,只有让在技术创新中最广泛的活跃群体加入进来,一起参与,才有可能创造最好的大模型。然而目前真正能参与通用大模型研发的教授团队少之又少,这种不平衡现象需要解决。“人工智能女王”李飞飞教授近日提出堪比登月计划的‘建立“美国国家级算力与数据集仓库”构想’——即使是算力供给充沛的美国也面临类似的问题,Meta可以为模型训练采购高达35万个GPU,而斯坦福大学的自然语言处理小组,总共却只拥有68个GPU。
三、大模型技术是遵循互联网模式发展成一个超级APP还是作为一个核心技术催生一个全新产业?我认为需要时间检验,目前国内单个大模型投入普遍只有数亿元级别,大模型产业投入上至少要追平芯片产业的投入才能看到完整的反馈。“元神进化”主权级大模型项目采用开放的生态合作方式,让全社会参与进来投入足够资源,顶层设计下边干边看,让投资人做判断题,企业家做选择题,科学家做证明题。”
该创始人浓浓的中科系话语以及背后智算行业的资深背景,揭示了他来自上一波硬科技科创潮龙头智算企业的身份。近年来,科研人员群体成功创业后又回到学界,新的沉淀积累之后,在新质生产力发展浪潮感召下,纷纷开启二次创业,深鉴科技创始人姚颂二次创业投身东方空间加入火箭事业就是其中非常成功的案例。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。