2022年1月5日,2022 ASC世界大学生超级计算机竞赛(ASC22)初赛正式开启。来自全球五大洲的300多支参赛队伍将在接下来的近两个月中,挑战“源”AI语言大模型、2020年戈登·贝尔奖获奖应用DeePMD-kit等尖端应用赛题。

报名参加ASC22的高校队伍中,不乏在上一个国际超算赛季表现突出的队伍,如ISC21和SC21冠军清华大学、ASC20-21现场决赛总冠军及ISC21季军暨南大学、ASC20-21线上决赛总冠军台湾清华大学、SC21 IndySCC超算竞赛冠军中山大学,以及SC21亚军上海科技大学、SC21最高计算性能奖得主南方科技大学、SC21 IndySCC季军瑞士苏黎世联邦理工学院等。此外还有中国科学技术大学、美国德州A&M大学、俄罗斯乌拉尔联邦大学、澳大利亚蒙纳什大学、哥伦比亚EAFIT大学等强队。
在ASC22初赛中,所有大学生队伍需要完成两道极具挑战性的尖端应用赛题,分别是“源”AI语言大模型和AI+Science代表性软件DeePMD-kit。
今年的AI赛题聚焦当前业界前沿AI大模型。“源”是2021年发布的一个面向中文的巨量语言模型,参数量达2457亿,刷新了业界多个中文榜单的记录,且在众多的语言处理任务场景中表现出了广阔的应用前景。AI大模型的训练面临着计算量和并行策略设计的双重挑战,因此也是参赛队展示超算性能优化能力的绝佳试验场。ASC22组委会提供了100GB的高质量中文数据集,要求参赛队基于这一数据集实现一个47亿参数的小号“源”模型。值得一提的是,组委会并没有提供模型设计的参考代码,这意味着参赛队需要自行完成模型结构构建和全部训练过程,并合理设计模型训练策略,以期得到最佳的计算性能。
DeePMD-kit赛题将引导大学生进行一场人工智能+科学研究(AI+Science)的前沿探索。科学研究与人工智能结合被视为当前最值得期待的创新趋势之一,机器学习分子动力学DeePMD-kit的出现成功推动了相关领域的跨越式发展。而高性能计算的加入将机器学习分子动力学的潜力持续释放:DeePMD-kit在超级计算机顶点(Summit)上达到了双精度91P的峰值性能,到解时间快于之前基线水平1000倍以上,相关成果获得了2020年戈登·贝尔奖。可以说DeePMD-kit的出现定义了科学研究+机器学习+高性能计算的新范式。本次赛题聚焦DeePMD-kit的训练效率优化,通过高性能优化提升训练速度对于用户来说至关重要。参赛选手将对DeePMD-kit的模型构建过程有一个直观认识,并可以使用高性能优化的手段优化整个训练过程。
ASC22世界大学生超算大赛的启动会将于1月19日在北京召开,届时权威专家学者、东道主高校、参赛队代表将共同开启ASC22序幕,会上将公布总决赛东道主等重磅信息。
为帮助各参赛队伍高效备战,ASC22竞赛集训营将于1月20日-21日在线上举行。来自英特尔、英伟达、中国科学院、深势科技、高效能服务器和存储技术国家重点实验室的HPC及AI专家将详解竞赛规则、集群搭建及优化、赛题等内容,进行参赛指导。往届大赛获奖团队也将现身集训营分享参赛经验。
ASC 世界大学生超级计算机竞赛是由中国发起组织,并得到亚洲及欧美相关专家和机构支持,旨在通过大赛平台推动各国及地区间超算青年人才交流和培养,提升超算应用水平和研发能力,发挥超算的科技驱动力,促进科技与产业创新。ASC超算大赛迄今已举行至第十届,吸引超过万名世界各国大学生参赛,是全球最大规模的超算竞赛。
内容来源:亚洲超算协会
好文章,需要你的鼓励
英国宠物慈善机构PDSA数据显示,超过半数宠物主担心无法承担兽医费用。科技公司正通过AI和物联网技术解决这一市场需求。在伦敦兽医展上,多家初创公司展示了创新技术:AI for Pet利用视觉AI分析宠物眼部、皮肤等图像提供健康洞察;Sylvester.ai开发AI模型识别猫咪疼痛表情;VEA整合患者数据自动化诊断。此外,智能项圈等物联网设备可追踪宠物健康症状。这些技术有助于宠物主采取预防措施,降低兽医费用。
卡内基梅隆大学联合Adobe开发出革命性的NP-Edit技术,首次实现无需训练数据对的AI图像编辑。该技术通过视觉语言模型的语言反馈指导和分布匹配蒸馏的质量保障,让AI仅用4步就能完成传统50步的编辑任务,在保持高质量的同时大幅提升处理速度,为图像编辑技术的普及应用开辟了全新道路。
北欧国家启动统一人工智能产业计划,旨在通过合作在全球舞台上竞争,获得微软和谷歌支持。10月成立的新北欧AI中心获得350万英镑初始预算,但谷歌和微软是唯一提供资金支持的科技公司,具体金额保密。该中心将开发生成式AI系统并建设应用AI服务的系统。北欧教育部长承诺追加资金开发大型北欧语言生成AI模型。尽管资金有限,但北欧国家希望通过联合力量在AI竞赛中提升地位。
复旦大学团队突破AI人脸生成"复制粘贴"痛点,开发WithAnyone模型解决传统AI要么完全复制参考图像、要么身份差异过大的问题。通过MultiID-2M大规模数据集和创新训练策略,实现保持身份一致性的同时允许自然变化,为AI图像生成技术树立新标杆。