2019年1月26日,国际高性能计算及人工智能咨询委员会(HPC-AI Advisory Council)宣布,将面向全亚太地区的大学生启动第七届RDMA编程挑战赛 (The Seventh Student RDMA Programming Competition) 招募,旨在为大学生提供学习RDMA的绝佳机会,并为行业挖掘最优秀的RDMA人才。
作为一种先进的网络数据传输方式,RDMA (远程直接内存访问) 技术在高性能计算、人工智能、深度学习、云计算、大数据及高频交易等领域均有广泛应用。和传统的网络相比,RDMA技术能显著提升原有应用的效率,近年来备受广大互联网公司的青睐。
自2013年首次举办,大赛就吸引了来自中国各地的20余家高校报名参加。在2018年举办第六届大赛时,更是吸引了全国50余所高校报名参加,并受到了来自国际顶尖高性能计算、云计算和大数据领域专家的广泛关注和媒体的争相报道。今年,比赛招募范围扩大至整个亚太地区,将有更多优秀的团队参与角逐,令人期待。
由HPC-AI咨询委员会主办的大学生RDMA比赛历经六届,已是硕果累累。因为注重技术创新及与行业结合,通过比赛培养了许多RDMA技术领域的专业人才,并通过学校输送给国内外各大企业及研究机构。据悉, 之前的多个RDMA编程比赛得奖者已经成为了国内外各大高科技企业的技术骨干,十分抢手。
今年,大赛将于5月在北京正式开赛,并在1月提前开放招募,以吸引更多优秀团队的加入。大赛还获得了包括中国计算机学会、中国大数据与智能产业联盟、清华大学、HPCTC、Mellanox、NVIDIA、Sensetime、 Excelero、 WekaIO和E8等公司等国内外多家知名机构及明星企业的大力支持。大赛评委由来自于国内外高性能计算和人工智能领域的权威专家组成,包括美国阿贡国家实验室(Argonne National Laboratory)、圣地亚哥超级计算中心(San Diego Supercomputer Centre)等。届时还将邀请资深的RDMA工程师及人工智能领域顶尖企业的研发人员前来进行在线培训和深入交流。
国际高性能计算及人工智能咨询委员会(HPC-AI Advisory Council)亚太区主席宋庆春
国际高性能计算及人工智能咨询委员会 (HPC-AI Advisory Council) 亚太区主席宋庆春表示:“无论是传统的高性能计算应用还是新兴的深度学习框架,RDMA通信方式都是其中的关键环节。随着RDMA技术的应用范围不断扩大,国内外顶尖企业越发重视这一技术所能创造的价值,对该领域人才的需求也愈发增加,这正是我们举办比赛的意义,为企业挖掘最优秀的RDMA技术人才,同时激发应用的最佳性能。
在2018年的RDMA编程竞赛发布仪式上, 中国计算机学会高性能计算专业委员会秘书长张云泉表示:“俗话说,美玉非天成,妙手巧雕琢。RDMA技术就像一块“美玉”,需要经过编程高手的精雕细琢,才能发挥更高的应用性能和效率。人才储备是超算发展的根本,历届RDMA编程挑战赛皆在选拔并培养高校中最顶尖的技术人才,推进RDMA在超算和AI领域的应用和下一代应用技术的开发。作为本届大赛的核心支持机构,高性能计算专业委员会将一如既往地为竞赛提供鼎力支持,共同助力中国超算的发展。”
来自清华大学的陈康副研究员表示:“高性能计算领域一直是新思想、新技术的孵化地,各种创新的成果以及应用都在这里产生。RDMA编程挑战赛已成为选拔RDMA相关技术达人的重要平台。通过参加竞赛,我们的学生能够深入接触HPC和AI领域最前沿的各项技术和计算工具,锻炼以技术实践解决热点问题的综合能力和协作沟通能力。不仅在实践中学以致用,还为他们的择业提供了颇有分量的砝码。希望未来有更多才华横溢的学子可以参与到比赛当中,培养创新精神和未来意识,加速推动RDMA技术的普及。”
在上届比赛中,清华大学1队以最突出的成绩摘取特等奖,清华大学2队与中国科学技术大学并列第一,二等奖则花落复旦大学和华中科技大学。
此次获胜队伍的论文将被发表在国际高性能计算及人工智能咨询委员会的官方网站,并有机会受邀参加国际高性能计算及人工智能咨询委员会在其他国家举办的国际研讨会分享成果。不仅如此,获胜队伍还将受到国内外顶尖企业的关注,有机会赢得心仪的职业机会。
访问第七届亚太区大学生RDMA编程挑战赛官方网站,了解参赛规则并注册报名。
http://www.hpcadvisorycouncil.com/pdf/rdma-read-and-write-with-ib-verbs.pdf
http://www.rdmamojo.com
国际高性能计算及人工智能咨询委员会(HPC-AI Advisory Council)是一家非盈利性国际组织,成立于 2008 年,拥有400多名成员,致力于HPC-AI技术的教育与推广。成员间共享专业知识,建立特殊兴趣小组,并通过技术中心宣传HPC和AI技术的优势与应用,探索未来发展方向。该咨询委员会主办了多次全球性年度会议和STEM挑战赛(包括中国的大学生RDMA编程竞赛和德国的大学生集群竞赛)。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。