新闻要点
在2019年超级计算大会上,英特尔全面展示了引领高性能计算与人工智能融合的愿景,并宣布其以数据为中心的芯片产品组合增添新的品类。同时,针对异构架构在高性能计算中越来越普遍的应用,英特尔宣布了一类专为高性能计算和人工智能融合优化的全新独立通用GPU,以进一步扩展现有的技术产品组合,让数据传输、存储和处理更加高效。
英特尔的芯片产品组合由部署在各类芯片平台上的多种架构组成。英特尔至强可扩展处理器是英特尔以数据为中心战略的基石,支持着目前全球超算500强中超过90%的超级计算机。英特尔至强可扩展处理器同时也是唯一一款内置人工智能加速的x86处理器,并针对高性能计算工作负载中大量数据集的分析进行了优化。
在此次大会上,英特尔展示了一款基于英特尔Xe架构的全新类别的通用GPU。这款兼具高性能、高灵活性的独立通用GPU,研发代号为“Ponte Vecchio”,专为高性能计算建模、模拟工作负载以及人工智能训练而设计。Ponte Vecchio将采用英特尔7纳米工艺进行制造,并将成为英特尔首款基于Xe架构的GPU,可为高性能计算和人工智能工作负载进行优化。它采用英特尔Foveros 3D和嵌入式多芯片互连桥接(EMIB)创新封装技术,以及多种其它技术,如高带宽存储器、CXL互连技术以及其它专利技术。
英特尔以数据为中心的芯片产品组合和oneAPI计划,为阿贡国家实验室“极光”(Aurora)系统中百亿亿次级计算的高性能计算和人工智能工作负载奠定了基础。采用英特尔至强可扩展平台和基于Xe架构的GPU,以及英特尔傲腾数据中心级持久内存和其它连接技术,“极光”(Aurora)将成为美国首个全面采用英特尔以数据为中心技术产品组合的百亿亿次级计算系统。“极光”(Aurora)的计算节点架构将由两个10纳米英特尔至强可扩展处理器(代号“Sapphire Rapids”)和六个Ponte Vecchio GPU共同组成。该系统同时还将支持超过10PB的内存和超过230PB的存储容量,并能通过Cray Slingshot技术连接超过200个机架的节点。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。