2022世界人工智能大会期间,亚信科技首席科学家叶晓舟在亚信科技和清华大学智能产业研究院主办的“智能算网与绿色计算”论坛上指出,新型算力将是数字经济时代新的生产力,是支撑千行百业数字经济发展的坚实基础。
叶晓舟以算力网络的第一个十年为题。他谈到,现代计算和通信系统已经逼近了摩尔定律和香农定理的极限。在计算方面,人们通过多核、众核的方式来突破摩尔定律与物理规律的相互作用;在单通道通信系统已经无线接近香农极限的条件下,人们通过多通道的方式来实现通信系统容量的倍增,甚至通过更高层次的语义通信来突破信息传输的桎梏。
叶晓舟指出,已经八十年的冯诺依曼体系结构推动了计算机的大发展,但在面向数据处理时存在瓶颈,新的存算一体技术在保障数据处理效率的同时也提高了计算效率;五十年的TCP/IP是以主机为中心,推动了互联网的浪潮,在数字时代,我们更期待一个以计算为中心的新网络协议出现。“我们认为在以人工智能、元宇宙等密集计算应用为代表的数字时代,计算机网络与通信将回归本质,由“信息的传递系统”进化为无处不在的“计算服务系统”。”
基于此,叶晓舟提出我们需要“新型算力”,新型算力由算力、运力、存力和原力构成。传统“算力”是指CPU通用算力、GPU智能算力、超算算力等,“运力”是指网络资源和网络质量和网络性能指标等所刻画网络传输能力,“存力”是指网络的存储规模、IO、效能等存储能力,“原力”是指大数据时代的AI、数字孪生、区块链、PaaS等基础支撑能力和原始驱动力。
2022年是算网的元年,整个产业界都在关注如何构建算力网络。叶晓舟表示,算力网络分为三大组成部分:
一、搭建算网的基础设施,要构建云边协同、布局合理、架构先进的算力基础设施,通过SRv6、确定性网络、新型协议等实现网络对算力的感知、承载与调度。
二、搭建算网大脑,算网大脑基于通信人工智能、数字孪生技术,实现对算网的统一感知、智能决策、编排、调度,是算力网络的核心。算网引擎则是算网大脑的决策中枢,要在算网全局图谱下,实现算网目标SLA与算网资源组合的联合最优解。
三、搭建算网运营交易中心,支撑算网业务管理、成本分析、竞价排名、算网通证和算力运营。这里的关键技术是要基于区块链的技术,实现算网交易撮合、全程溯源,吸纳和构建多方可信算网交易平台。
要搭建完善的算力网络,绝不是一蹴而就,需要长期耕耘。叶晓舟也提出了对算力网络演进的思考。他说,算力网络第一个十年的演进会经历三个阶段;
第一个阶段是算网协同阶段,到2022年底,可以通过算力和网络的分别调度及协同,实现两者的协同编排和调度管理。
第二个阶段是到2025年实现算力网络的统一调度和管理,这就需要算网的智能引擎,能够自动化实现算网的资源编排和调度。同时,我们在这个阶段要构建一个可信的交易平台来实现算和网的融合。
第三个阶段是到2030年,我们可预期实现算网的一体,真正实现算即是网、网即是算。在这个阶段,基于数字孪生可以实现算网自治,以及通过建立合理运营交易市场,可以实现整个异构的算力和异构的网络,接入到算网一体的体系中来。
在2022年之前,我们更多的是在进行算力网络的场景和需求的标准化工作,到2025年可以完成架构模块的定义、完成算网模块的接口和定义,到2030年实现算网一体的下一代标准体系的演进。
“算力网络作为6G关键核心技术,到2030年希望算力网络能够顺利实现6G的商用。”叶晓舟说,“在此期间,亚信科技非常愿意配合和支持运营商、合作伙伴、客户的算力网络建设,产学研用一体加速推动算力网络的商用落地。”
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。