来自亚太区各国的20支队伍共同挑战世纪难题 – 关键应用中的计算和通信重叠

美国西部桑尼维尔时间 / 中国北京时间 – 2022年11月15日。2022中国超级算力大会。 今天,国际高性能计算和人工智能咨询委员会(HPC-AI Advisory Council)在2022中国超级算力大会宣布2022年第十届亚太区RDMA编程竞赛结果,来自中国古城西安的西北工业大学凭借其在竞赛过程中的优异表现获得了本次竞赛的冠军,无论从他们的代码实现和国际评委的面试结果都展示出了其强大的实力;中国科学技术大学和北京大学也表现不俗,获得了本次竞赛的二等奖;中国南方科技大学和沙特阿拉伯国王阿卜杜拉科技大学(The Saudi Arabia King Abdullah University of Science and Technology)联队,湖南大学和南京大学获得了本次大赛的三等奖。值得一提的是,这是我们第一次在RDMA编程竞赛中看到了来自中东的大学参与竞赛并进入了前三名,这标志着RDMA编程技术的普及已经走的更远。
通过RDMA (Remote Direct Memory Access) 技术在计算单元和计算单元之间通信,或者在计算单元和存储单元之间通信,正在变成对于各种分布式应用提升性能的标准和必选方案。RDMA技术可以将通信操作由主机计算设备卸载到网络上来,大幅降低通信的延迟、提升通信的效率和应用的扩展性。
第十届亚太区RDMA编程课和竞赛由国际高性能计算和人工智能咨询委员会(HPC-AI Advisory Council)举办,这项竞赛举办十年以来,一直得到了中国中科院计算所、美国俄亥俄州立大学(The Ohio State University)和清华大学的大力支持。本次活动一共包含了五天的RDMA编程课程、两天的Hackathon竞赛和一天的国际评委面试。
本次竞赛的任务是利用先进的UCC(Unified Collective Communications)
集合通信库在基于DPU(Data Processing Unit)的平台上实现对于iAllgather通信的异步操作,并对其性能进行优化,最后实现通信和计算重叠率最高和通信性能最优的队伍将获胜。在整个竞赛过程中,来自中国的西北工业大学队凭借其创新的想法,杰出的代码实现和优化达到了将近100%的计算和通信的重叠率,并在通信性能上得到了最高分,最终获得本次竞赛冠军。
关于本次竞赛,国际高性能计算和人工智能咨询委员会(HPC-AI Advisory Council)主席Gilad Shainer先生表示“RDMA技术已经被全球各大数据中心、云服务中心和人工智能计算中心广泛使用,但是当前的RDMA编程人才还远远不能满足市场的需求,全球对于RDMA编程人才的需求正在呈指数级增长。国际高性能计算和人工智能咨询委员会作为一个国际化非盈利性组织,一直致力于在全球范围内培养教育和培养面向未来各种高性能业务的编程人才,无数的曾经参加过RDMA编程课和竞赛的同学们已经成为了全球各大数据中心和政府科研机构的核心编程人才和技术骨干,我们非常高兴看到这个结果。”
欲知更多详情, 欢迎光临国际高性能计算和人工智能委员会网站。
www.hpcadvisorycouncil.com
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。