11月11日到16日,全球超算领域的年度盛会——全球超级计算大会(SC18)在美国得克萨斯州达拉斯市拉开帷幕。本届大会以“HPC Inspires”为主题,点燃起业界人士对于高性能计算机(HPC)巨大潜力的期待。作为中国超算领域领导者品牌,中科曙光在SC18上预发布了集多项最新技术于一体的新一代硅立方高性能计算机,为未来超算技术和应用发展打开更多想象空间。这是该产品首次在国际上亮相。
曙光新一代硅立方高性能计算机是全球首款采用了浸没式液体相变冷却技术刀片服务器的HPC系统。曙光高性能计算产品事业部总经理李斌介绍说,曙光新一代硅立方高性能计算机整合了曙光在计算、网络、存储、制冷散热、管理等方面的最新技术,其技术发展水平和工程化实现程度全球领先,可广泛支持对超算设备计算密度、能效、存储等有更高要求的场景应用。
过去几十年来,超级计算机的性能保持着高速增长,计算速度几乎每10年提高1000倍。但最近几年来,HPC在从P级迈向E级的过程中,增速明显放缓。李斌认为,这主要是因为超级计算机的功耗、系统规模已经接近极限,遇到了功耗墙、扩展性墙和可靠性墙等壁垒。
“未来超级计算机通过增加系统规模和功耗来提高机器性能的方式已经难以走通,超算性能提升将更依赖于系统能效比的提升。”李斌说,曙光认为未来超算的发展趋势是能效提升、应用扩展、架构升级和智能演化进这4个方面。
在此背景下,中科曙光将发展新一代高性能计算机的目标聚焦在新技术革新之上。特别是在提高能效比、升级系统架构等方面,曙光经过多年技术积累和产品打磨,取得了卓有成效的进展,这些新技术也在新一代硅立方高性能计算机上得到淋漓尽致地体现。
李斌介绍说,曙光新一代硅立方高性能计算机全面采用异构计算体系结构,这一方面提升了系统的能效比,同时还增强了系统对人工智能应用的支撑。同时,该系统采用最先进的6D-Torus高速网络技术,进一步提升系统网络I/O性能和系统的容错性和可扩展性。
采用浸没式液冷相变冷却技术,是曙光打造HPC系统的首创,也是新一代硅立方高性能计算机最大亮点之一。李斌表示,该技术的应用使得系统的PUE小于1.04,系统性能提升5%。目前,曙光在液体冷却技术发展水平和工程化产品实现程度上达到全球领先。
中国超算制造商在国际舞台上扮演日益重要的角色,11月12日在美国达拉斯刚刚发布的“全球超级计算机500强榜单”中,中科曙光的表现可圈可点。
始于1993年的全球超算500强榜单由国际组织“TOP500”编制,每半年发布一期,是给全球已安装的超级计算机排座次的知名榜单。最新发布的TOP500榜单前100名中,来自中国地区的机器共有10套入围,其中曙光独揽5套,神威、天河、曙光位列中国前三甲。值得一提的是,中国厂商申报的用于科学计算、工程计算等领域的超算系统中曙光占比最高。近年来,超算更加强调绿色节能,曙光成为唯一入围按系统能效排名的“绿色超算500强(Green500)”TOP10的中国厂商。
中科曙光首席运营官叶健表示,曙光作为中国最早、也是最大的高性能计算平台提供商,始终坚持立足技术创新前沿、注重产品迭代落地,致力为中国乃至全球高性能计算事业添砖加瓦。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。