还有几天,一年一度的全球规模最大的超算盛会—ISC2019就将在德国法兰克福召开,会上将公布全球超算TOP500排行榜。近年来,中国超算取得了举世瞩目的进步,不仅有“天河二号”“神威·太湖之光”连续5年雄踞全球超算Top500榜首,还在2016~2017年连续两年摘得“戈登贝尔奖”。但在取得辉煌成绩的背后,我们也应清醒的意识到,中国距离真正意义上的超算强国还有相当长的一段路要走。
细究超算技术及产业化现状,我国在超算能耗、软件应用、人才等方面,有一系列待补齐的短板,如果不能克服这些挑战,在超算领域,都不能算作真正意义的强大。
我国超算系统曾因耗电量巨大陷入争议漩涡:一个十万亿亿次的超算中心能耗甚至相当于一个小型核电站;国内某超算中心的年耗电量约为2亿度,电费超过1亿元。
未来,随着数据量不断激增,计算力进一步提升到百亿亿次、千亿亿次超算,“功耗墙”更将是一道难以逾越的挑战,降低能耗成为HPC发展的趋势。
国外的专家曾经质疑过中国超算“仅仅为了跑分”、“用不起来”,此观点有失偏颇。
在国家相关政策支持下,我国先后重点支持了物理化学、天文、气候气象、生物医药、新能源、流体仿真、大飞机、石油勘探地震成像等领域的超级计算应用,推动并研制出一批知识产权的行业应用软件。近年来,受惠于“互联网+”政策和国内几家互联网大厂的资金人才优势,互联网、物联网、人工智能领域的超算应用也发展迅猛。
但整体而言,我国超算软件应用领域还是较窄,民用商业软件发展滞后,广泛的民生领域应用有待开发。超算应用“阳春白雪”问题仍然有待解决,超算的社会效益和社会贡献还没有充分发挥出来。
超算人才严重不足,成为我国超算发展路上一大掣肘。据HPC wire近期报道,“高性能研究计算机的专业性人才需求量很大,一些以大学为中心的研究所,职位空缺几个月甚至几年”,中国超算行业面临同样的窘境。
超算领域人才“既要懂计算机编程、又要熟悉应用领域”的天然高门槛,让年轻后备人才望而却步。我国超算应用软件的研发人员大部分分散在一些小的实验室、研究所,或者依附在以硬件研发为主的国家重点实验室,仅在核物理、石油、气象、地球物理等个别领域建有专门的国家重点实验室,但是未形成合力。学科人才和资源发展不均衡,导致研发方向和人才队伍发展受阻。
罗马不是一日建成的,中国超算产业短板的弥补,也不能期待一蹴而就。目前,国内有部分单位、企业,在缺乏宏观规划的情况下,盲目投入大量人力物力财力发展超算,不仅不能解决问题,还会造成超算资源浪费。
正如人的成长,不能缺少生理发展的每个阶段一样,技术的发展,也需要每一步都稳扎稳打,不能急功近利。发展超算,是场“持久战”,应戒骄戒躁,不能抱希望于走捷径。广大地方单位及企业应加大发展关键领域核心技术打造,加强自主创新和开放创新,以创新技术实现超算中心性能提升,节能降耗;在软件应用层面,应以应用需求为主线,结合产业和用户迫切需求进行技术研发布局,与用户协同开展研发,拓展应用领域,让超算实现“平民化”,惠泽于民;高校、企业联合培育超算人才,加大课程体系建设和社会实践机会,以满足行业长远需求。
“不积跬步无以至千里”,只有中国超算企业、研究机构、高校等单位脚踏实地、共同集中精力克服超算短板,逐步完善中国高性能计算生态环境,才能够推动中国超算可持续发展,使中国成为真正的科技强国。
好文章,需要你的鼓励
这项研究探索了语言神经元视角下多语言对齐如何增强大语言模型(LLMs)的多语言能力。研究团队提出了一种更精细的神经元识别算法,将激活神经元分为语言特定、语言相关和语言无关三类,克服了现有方法的局限性。基于这种分类,研究将LLMs多语言处理过程划分为四个阶段:多语言理解、共享语义空间推理、多语言输出空间转换和词汇空间输出。通过分析对齐前后不同类型神经元的变化,发现多语言对齐促进了更多语言相关神经元的共享使用,减少了对语言特定神经元的依赖,这也解释了"自发多语言对齐"现象。
这项由弗吉尼亚大学与Adobe研究院合作的研究突破了传统图像到视频生成的空间限制,提出了"Frame In-N-Out"技术,使物体可以自然地离开画面或新物体能够进入画面。研究团队创建了专门的数据集和评估方法,并设计了一种融合运动控制、身份参考和无边界画布的扩散变换器架构。实验结果表明,该方法在生成质量和控制精度上显著优于现有技术,为电影制作和创意内容创作提供了新可能。
浙江大学研究团队开发了首个评估视觉语言模型多视角空间定位能力的综合基准ViewSpatial-Bench,并揭示了现有模型在视角转换理解上的严重缺陷。通过自动化3D标注流水线构建的大规模数据集,他们训练出的多视角空间模型(MVSM)实现了46.24%的性能提升,为人机空间交互提供了新的解决方案,使AI系统能更好地理解人类视角下的空间关系,促进更直观的人机交流。
ByteDance团队提出的DetailFlow是一种创新的图像生成方法,通过"下一细节预测"策略实现从粗到细的自回归生成。它将图像编码为仅需128个令牌的1D序列,比传统方法少5倍,却实现了更高质量(2.96 gFID)和更快速度(提速约8倍)。该方法巧妙地模拟人类创作过程:先勾勒整体结构,再逐步添加细节,并通过自我纠错机制解决并行推理中的错误累积问题,为高分辨率图像生成提供了高效解决方案。