源讯、戴尔科技,技嘉科技、慧与、浪潮、联想和超微成为首批将基于NVIDIA Grace的HGX系统用于HPC和AI的制造商
NVIDIA于今日宣布,多家全球领先的计算机制造商正在采用全新NVIDIA Grace™超级芯片打造新一代服务器,为超大规模时代的AI和HPC工作负载提速。
源讯、戴尔科技,技嘉科技、慧与、浪潮、联想和超微计划部署基于NVIDIA Grace CPU 超级芯片和NVIDIA Grace Hopper™超级芯片的服务器。
所有这些新系统都得益于刚刚发布的NVIDIA HGXTM平台中的Grace和Grace Hopper设计。制造商根据这些设计所提供的蓝图,能够构建出可以提供最高性能,并且内存带宽和能效两倍于当今领先的数据中心CPU的系统。
NVIDIA超大规模和HPC副总裁Ian Buck表示:“超级计算已进入到超大规模AI时代。NVIDIA正与OEM合作伙伴一道助力研究者攻克此前无法解决的巨大挑战。从气候科学、能源研究、太空探索、数字生物学到量子计算等领域,NVIDIA Grace CPU超级芯片和Grace Hopper超级芯片为全球最先进的HPC和AI平台奠定了基础。”
早期采用者引领创新
美国和欧洲的领先超级计算中心都将率先采用这两款超级芯片。
洛斯阿拉莫斯国家实验室(LANL)于今日宣布,其新一代系统Venado将成为美国首个采用NVIDIA Grace CPU技术的系统。Venado是使用HPE Cray EX超级计算机构建而成的异构系统,同时将配备Grace CPU超级芯片节点和Grace Hopper超级芯片节点,满足各类新兴应用需求。该系统建成后的AI性能预计将超过10 exaflops。
LANL模拟和计算副总监Irene Qualters表示:“借助NVIDIA Grade Hopper强大性能的支撑,Venado将帮助LANL研究人员继续履行自身的承诺,即在科学领域取得新突破。NVIDIA的加速计算平台和广阔的生态系统能够解决性能瓶颈,助力LANL开展有望造福整个国家和社会的新研究。”
瑞士国家计算中心的新系统Alps同样由慧与基于HPE Cray EX超级计算机而构建。该系统将使用Grace CPU超级芯片,以支持众多领域的开创性研究。Alps将作为一个通用系统,向瑞士及其他国家的研究者开放。
NVIDIA Grace为计算密集型工作负载提速
NVIDIA Grace CPU超级芯片搭载两个基于Arm®的CPU,它们通过高带宽、低延迟、低功耗的NVIDIA NVLink®-C2C互连技术连接。这项开创性的设计内置多达144个高性能Arm Neoverse核心,并且带有可伸缩矢量扩展和1 TB/s的内存子系统。
Grace CPU超级芯片支持最新的PCIe Gen5协议,可实现与GPU之间最高性能连接,同时还能连接NVIDIA ConnectX®-7智能网卡以及NVIDIA BlueField®-3 DPU以保障HPC及AI工作负载安全。
Grace Hopper超级芯片在一个集成模块中通过NVLink-C2C连接NVIDIA Hopper GPU与NVIDIA Grace CPU,满足HPC和超大规模AI应用需求。
基于NVIDIA Grace的系统将运行NVIDIA AI和NVIDIA HPC软件产品组合,实现全栈式集成计算。
好文章,需要你的鼓励
据《华尔街日报》报道,在马斯克针对OpenAI的诉讼失败后,OpenAI正加速推进IPO计划。CEO萨姆·奥特曼希望公司最快于今年9月上市,目前已与高盛、摩根士丹利合作,并可能在数日或数周内秘密提交上市申请。与此同时,马斯克旗下SpaceX的IPO文件也预计近期公开。两家公司的上市竞争,标志着马斯克与奥特曼的博弈从法庭转移至资本市场。
KAIST团队提出策略助推方法,通过强制分配解题方向引导AI探索多样思路,仅用八份样本就超越了消耗八倍资源的传统方法。
调查显示,51%的专业人士认为AI生成的低质量内容(即"workslop")正在降低生产效率,45%的人因此对职场使用AI更加谨慎。这类内容表面精致却缺乏准确性和实质价值。专家建议两步应对:一是重塑AI生产力思维,推行"AI先行、人工复核"的工作模式;二是保持持续投入,深入掌握AI工具的有效用法。企业领导者强调,真正从AI中受益需要坚持与学习,而非浅尝辄止。
要理解这项研究,先得明白现在的AI是怎么"画"图的。 可以把AI生成图片的过程想象成一个特殊的厨房。当AI要学会画图时,它不会像人类画家那样一笔一画地描绘,而是采用一种叫做"自回归"的方式——简单说就是"一个食材接一个食材地添加"。但问题在于,AI厨房处理的"食材"不是真实的图像像素,而是一种被压缩过的"标准化食材包"。 这个压缩过程,叫做"离散分词",由一个叫"分词器"(tokenizer)的设备完成。打个比方,分词器就像一台高级的食材切片机,它把一整张图片切成很多小块,然后给每一小块贴上一个"编号标签",对应到一本"标签字典"(也就是研究者口中的"码本")里的某个条目。比如,标签001可能代表"蓝天的一小块",标签002代表"绿草的一小块"。 这种做法的好处是大幅简化了AI的工作量——它不用记住几百万个像素,只需要记住一串编号就行了。这就是为什么如今像Chameleon、Emu3这些大名鼎鼎的多模态AI模型都用这种技术。 但问题也恰恰出在这里。当切片机以16倍的压缩率工作时(也就是说原本256个像素被压缩成1个标签),很多细节就被无情地丢弃了。蓝天少一些云彩、草地少几根草尖,人眼几乎看不出来。可一旦切到了文字或人脸,灾难就发生了——一个英文字母"e"和"c"的差别可能就在那么几个像素,一张脸上眉眼的位置稍微挪一挪,整个人就变了样。 研究团队发现,认知科学研究早就指出,人类的视线会不自觉地被文字和人脸吸引,对这两类内容的细节扭曲特别敏感。换句话说,AI画其他东西糊一点没关系,但文字和脸糊了,用户立马就能察觉。 之前的研究者也意识到了这个问题,他们的解决思路通常是"加大切片机的容量"——比如把标签字典从1万6千条扩展到26万条,或者让每张图用更多的标签。但这就像为了切好一根胡萝卜而把整个厨房改造成大型工厂,成本高得离谱,而且效果也不见得好。 清华和微软的团队提出了一个完全不同的思路:与其让切片机变得更大,不如教它学会"看重点"。 二、给切片机装上"火眼金睛"