新闻要点
在2019年超级计算大会上,英特尔全面展示了引领高性能计算与人工智能融合的愿景,并宣布其以数据为中心的芯片产品组合增添新的品类。同时,针对异构架构在高性能计算中越来越普遍的应用,英特尔宣布了一类专为高性能计算和人工智能融合优化的全新独立通用GPU,以进一步扩展现有的技术产品组合,让数据传输、存储和处理更加高效。
英特尔的芯片产品组合由部署在各类芯片平台上的多种架构组成。英特尔至强可扩展处理器是英特尔以数据为中心战略的基石,支持着目前全球超算500强中超过90%的超级计算机。英特尔至强可扩展处理器同时也是唯一一款内置人工智能加速的x86处理器,并针对高性能计算工作负载中大量数据集的分析进行了优化。
在此次大会上,英特尔展示了一款基于英特尔Xe架构的全新类别的通用GPU。这款兼具高性能、高灵活性的独立通用GPU,研发代号为“Ponte Vecchio”,专为高性能计算建模、模拟工作负载以及人工智能训练而设计。Ponte Vecchio将采用英特尔7纳米工艺进行制造,并将成为英特尔首款基于Xe架构的GPU,可为高性能计算和人工智能工作负载进行优化。它采用英特尔Foveros 3D和嵌入式多芯片互连桥接(EMIB)创新封装技术,以及多种其它技术,如高带宽存储器、CXL互连技术以及其它专利技术。
英特尔以数据为中心的芯片产品组合和oneAPI计划,为阿贡国家实验室“极光”(Aurora)系统中百亿亿次级计算的高性能计算和人工智能工作负载奠定了基础。采用英特尔至强可扩展平台和基于Xe架构的GPU,以及英特尔傲腾数据中心级持久内存和其它连接技术,“极光”(Aurora)将成为美国首个全面采用英特尔以数据为中心技术产品组合的百亿亿次级计算系统。“极光”(Aurora)的计算节点架构将由两个10纳米英特尔至强可扩展处理器(代号“Sapphire Rapids”)和六个Ponte Vecchio GPU共同组成。该系统同时还将支持超过10PB的内存和超过230PB的存储容量,并能通过Cray Slingshot技术连接超过200个机架的节点。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。