“一带一路”建设的倡议,对中科曙光这样的中国超算领先品牌而言意味着什么?
“中国超算已经整体进入国际超算领域第一阵营,习近平主席提出建设‘一带一路’的倡议,对曙光而言意味着重大机遇:把中国超算这张新名片,输送到更远、更多的发展中国家去。”在“一带一路”国际合作高峰论坛上,中科曙光总裁历军表示,作为中国信息技术领域的“国家队”,中科曙光有责任也有信心让“中国超算”成为中国下一个名片。
中国超算有实力成为新名片
当前,人工智能的快速发展正对人类社会带来巨大改变,而其核心要素正是计算能力、数据和算法。在这一趋势下,超级计算机将成为未来智能社会的重要基础设施,其发展水平与能力关乎社会发展、民生改善与文明进步。
与此同时,中国超算近年来取得了举世瞩目的成就。2016年,“神威·太湖之光”蝉联世界最快超级计算机,中国超算应用首度摘得“戈登贝尔奖”,最近一期的全球超级计算机TOP500榜单上,中国超算上榜总数首次超越美国……中国超算已跻身世界超算先进水平之列。
作为亚洲第一、中国最大的超算研制企业,中科曙光背靠中国科学院这一科研“国家队”,始终坚持自主创新,不断在市场变化中提高服务水平,积累了深厚的技术和市场经验。历军表示,自习近平主席提出“一带一路”建设倡议之初,中科曙光即以“一带一路”信息技术开拓、建设和创新的先锋之姿,积极响应倡议,用中国超算这张响亮的品牌,将数字“一带一路”建设付诸于实际行动。
中国超算为“一带一路”国家带来“新增长”
将数字经济视作新的增长极、加快信息化进程促进传统产业升级,正成为越来越多国家的选择。“大到石油勘探、智能制造,小到数据检索、电影特效,都离不开超级计算的支撑。”历军介绍说,超级计算可以解决很多现实难题,可以提升研究能力、缩短技术升级进程,对提升国家竞争力,促进经济社会发展、改善民生,都具有十分重要的现实意义。
此外,历军指出,作为科学发展的“第四范式”,超级计算基础设施及相关技术在高端材料、生命科学、深海探测、空间技术等各领域均扮演着不可或缺的角色,提高超算建设水平对于致力于科学发展的国家而言势在必行。
“科技进步是可持续发展的重要保障,超算作为促进科技发展‘第四范式’,是一国发展重要的基础设施。‘一带一路’国际合作峰会迎来了各国融合发展的良好局面,也给了中国超算这张名片走出去的良好机遇。”历军表示。
曙光的“一带一路”实践
作为我国高性能计算的开拓者,曙光曾经为我国超算领域填补了多项空白。参与国家重大科学项目、带动科研成果转化、助力“智造”国之重器……曙光一直用技术和产品深入参与到我国的信息化建设。近年来,曙光又把以超算为代表的新一代信息技术带到了更多国家,目前,在亚洲、欧洲、非洲、美洲等地区展开了不同层面的国际合作。
2016年,中科曙光与斯洛文尼亚ICT企业Arctur公司合作建设的数据中心落成。凭借斯洛文尼亚在欧洲地理中心的区位优势,曙光信息产业产品将进一步登陆欧洲;2017年2月,中科曙光、曙光易通、云南能投等赴老挝考察,就中科曙光等企业参与老挝巴松新城智慧城市建设达成初步合作意向。此外,泰国曼谷东盟创新中心、埃及国家实验室、斯里兰卡 LOLC 公司、约旦政府信息中心等众多“一带一路”沿线国家的科研机构、企业集团都是曙光的合作伙伴。
“超算具有巨大的创新驱动作用。”历军解释说,随着超算技术的不断成熟和更新,它将在海量数据应用与高速处理中发挥越来越重要的作用,并连同其他新一代信息技术,共同促进沿线国家的科学研究探索、产业经济发展,在此基础上展开全面信息化建设,打造数字“一带一路”。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。