11月11日到16日,全球超算领域的年度盛会——全球超级计算大会(SC18)在美国得克萨斯州达拉斯市拉开帷幕。本届大会以“HPC Inspires”为主题,点燃起业界人士对于高性能计算机(HPC)巨大潜力的期待。作为中国超算领域领导者品牌,中科曙光在SC18上预发布了集多项最新技术于一体的新一代硅立方高性能计算机,为未来超算技术和应用发展打开更多想象空间。这是该产品首次在国际上亮相。
曙光新一代硅立方高性能计算机是全球首款采用了浸没式液体相变冷却技术刀片服务器的HPC系统。曙光高性能计算产品事业部总经理李斌介绍说,曙光新一代硅立方高性能计算机整合了曙光在计算、网络、存储、制冷散热、管理等方面的最新技术,其技术发展水平和工程化实现程度全球领先,可广泛支持对超算设备计算密度、能效、存储等有更高要求的场景应用。
过去几十年来,超级计算机的性能保持着高速增长,计算速度几乎每10年提高1000倍。但最近几年来,HPC在从P级迈向E级的过程中,增速明显放缓。李斌认为,这主要是因为超级计算机的功耗、系统规模已经接近极限,遇到了功耗墙、扩展性墙和可靠性墙等壁垒。
“未来超级计算机通过增加系统规模和功耗来提高机器性能的方式已经难以走通,超算性能提升将更依赖于系统能效比的提升。”李斌说,曙光认为未来超算的发展趋势是能效提升、应用扩展、架构升级和智能演化进这4个方面。
在此背景下,中科曙光将发展新一代高性能计算机的目标聚焦在新技术革新之上。特别是在提高能效比、升级系统架构等方面,曙光经过多年技术积累和产品打磨,取得了卓有成效的进展,这些新技术也在新一代硅立方高性能计算机上得到淋漓尽致地体现。
李斌介绍说,曙光新一代硅立方高性能计算机全面采用异构计算体系结构,这一方面提升了系统的能效比,同时还增强了系统对人工智能应用的支撑。同时,该系统采用最先进的6D-Torus高速网络技术,进一步提升系统网络I/O性能和系统的容错性和可扩展性。
采用浸没式液冷相变冷却技术,是曙光打造HPC系统的首创,也是新一代硅立方高性能计算机最大亮点之一。李斌表示,该技术的应用使得系统的PUE小于1.04,系统性能提升5%。目前,曙光在液体冷却技术发展水平和工程化产品实现程度上达到全球领先。
中国超算制造商在国际舞台上扮演日益重要的角色,11月12日在美国达拉斯刚刚发布的“全球超级计算机500强榜单”中,中科曙光的表现可圈可点。
始于1993年的全球超算500强榜单由国际组织“TOP500”编制,每半年发布一期,是给全球已安装的超级计算机排座次的知名榜单。最新发布的TOP500榜单前100名中,来自中国地区的机器共有10套入围,其中曙光独揽5套,神威、天河、曙光位列中国前三甲。值得一提的是,中国厂商申报的用于科学计算、工程计算等领域的超算系统中曙光占比最高。近年来,超算更加强调绿色节能,曙光成为唯一入围按系统能效排名的“绿色超算500强(Green500)”TOP10的中国厂商。
中科曙光首席运营官叶健表示,曙光作为中国最早、也是最大的高性能计算平台提供商,始终坚持立足技术创新前沿、注重产品迭代落地,致力为中国乃至全球高性能计算事业添砖加瓦。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。