美国能源部(U.S. Department of Energy)将与英特尔合作打造一台新的大型超级计算机,并且该计算机在计算能力方面将超越目前现有最强大的系统。
英特尔今天表示,这套还在计划中的系统名为Aurora,将在2021年上线时,全面发挥其性能表现。
1 exaflop用于表示一百亿亿次浮点运算,也就是10的18次方。这是目前全球最快的超级计算机(也是由美国能源部运营的)每秒计算性能的5倍。
美国能源部已经拿出5亿多美元预算用于打造Aurora。英特尔将与超级计算机制造商Cray合作开发该系统,使用尚未发布的下一代处理器作为构建块。
英特尔将把自己下一代至强CPU作为Aurora超级计算机的核心,此外还计划为该系统配备预计在明年发布的Xe系列GPU。目前我们对Xe系列GPU知之甚少,除了该芯片将采用10纳米架构。
美国能源部决定在Aurora系统中采用英特尔GPU,代表了该机构对英特尔公司难得的支持。明年上市发布时,Xe系列将面对来自Nvidia和AMD产品的竞争,因为这些产品已经在图形卡市场保持了长达二十年的双巨头垄断。全球最强大的超级计算机将采用Xe芯片,这一事实可能会帮助英特尔更容易说服潜在买家。
除了采用英特尔即将推出的芯片之外,Aurora还将采用另外两款尚未发布的英特尔技术。一个是Optane DC永久性内存的未来迭代,而另一个是英特尔在去年12月预览的Intel One API,该API旨在简化那些同时使用CPU和GPU的应用开发过程。
英特尔将把Aurora交付给美国能源部位于芝加哥的阿贡国家实验室。该机构计划将该系统用于各种研究应用,从测试药物的有效性,到“极端规模”宇宙学模拟。
美国并不是唯一一个打算打破百亿亿次计算极限的国家。日本RIKEN研究所和富士通公司都把目光瞄准了在2021年之前打造采用ARM芯片的百亿亿次级超级计算机系统。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。