DiRAC选择基于NVIDIA HDR InfiniBand 互连的 HGX平台加速其四大超算的科学研究
加利福尼亚州圣克拉拉——ISC——2021年6月28日——NVIDIA于今日宣布,其NVIDIA HGX™高性能计算平台将助力位于爱丁堡大学的 DiRAC 新一代超级计算机 —— Tursa。
Tursa超级计算机专为粒子物理计算进行了优化,是目前四台DiRAC新一代超级计算机中的第三台正式宣布将采用一或多个NVIDIA HGX平台技术进行加速,包括NVIDIA A100 Tensor Core GPU、NVIDIA HDR 200Gb/s InfiniBand网络和NVIDIA Magnum IO软件。最后一台DiRAC新一代超级计算机也将采用 NVIDIA InfiniBand网络。
研究人员能够使用Tursa对亚原子粒子的特性进行超高精度的计算,从而解析来自大型强子对撞机等大规模粒子物理学实验的数据。
NVIDIA网络事业部高级副总裁Gilad Shainer表示:“DiRAC正在帮助研究人员解开宇宙的奥秘。我们正在与DiRAC合作,充分利用NVIDIA GPU、DPU和InfiniBand网络计算加速引擎的顶尖性能加速前沿科学探索中的广泛应用。”
爱丁堡大学理论物理教授Luigi Del Debbio 表示:“Tursa将被用于挑战特殊的的研究领域,为科学建模和模拟开辟新的可能性。NVIDIA加速计算平台通过精确平衡网络带宽和每秒浮点计算次数,满足了我们研究所需要的超高性能的需求,并通过超大规模的服务能力推动新的研究。”
由Atos建造的Tursa超级计算机计划于今年投入运行,其将配备总共448个NVIDIA A100 Tensor Core GPU,并且每个节点带有4个NVIDIA HDR 200Gb/s InfiniBand网卡。加上NVIDIA Magnum IO GPUDirect RDMA技术,它能为使用晶格量子色动力学(LQCD - Lattice Quantum ChromoDynamics)的超大规模科学计算应用提供最高级别的节点间带宽和可扩展性。
DiRAC是英国面向天文学、宇宙学、粒子物理学及核物理学的理论建模和高性能计算(HPC)研究的综合超级计算系统管理机构,由其运营的各超算系统分别部署于剑桥大学、杜伦大学、爱丁堡大学和莱斯特大学。
剑桥大学的CSD3和杜伦大学的COSMA-8
NVIDIA 在2021年GTC大会上宣布,剑桥大学的面向数据驱动型研究的CSD3系统,将在全新的、每秒4千万亿次级浮点计算能力的Dell-EMC系统的加持下性能进一步增强,这套系统配备NVIDIA HGX A100 GPU、NVIDIA BlueField DPU和NVIDIA HDR 200Gb/s InfiniBand网络,将为英国国家科研界的各个领域提供安全的、多租户的、裸金属性能的HPC、AI和数据分析服务。预计CSD3将跻身世界超级计算机500强榜单。DiRAC在剑桥大学的数据密集型服务是CSD3系统的一部分。
NVIDIA 还在2021年GTC大会上宣布了英国杜伦大学的全新COSMA-8超级计算机,将基于戴尔的技术并由NVIDIA HDR 200Gb/s InfiniBand网络提供加速。这台超级计算机将被在英国的世界顶级宇宙学家们用于研究宇宙的起源。
关于位于莱斯特大学的第四个系统的更多细节,预计将在今年晚些时候公布。
好文章,需要你的鼓励
据《华尔街日报》报道,在马斯克针对OpenAI的诉讼失败后,OpenAI正加速推进IPO计划。CEO萨姆·奥特曼希望公司最快于今年9月上市,目前已与高盛、摩根士丹利合作,并可能在数日或数周内秘密提交上市申请。与此同时,马斯克旗下SpaceX的IPO文件也预计近期公开。两家公司的上市竞争,标志着马斯克与奥特曼的博弈从法庭转移至资本市场。
KAIST团队提出策略助推方法,通过强制分配解题方向引导AI探索多样思路,仅用八份样本就超越了消耗八倍资源的传统方法。
调查显示,51%的专业人士认为AI生成的低质量内容(即"workslop")正在降低生产效率,45%的人因此对职场使用AI更加谨慎。这类内容表面精致却缺乏准确性和实质价值。专家建议两步应对:一是重塑AI生产力思维,推行"AI先行、人工复核"的工作模式;二是保持持续投入,深入掌握AI工具的有效用法。企业领导者强调,真正从AI中受益需要坚持与学习,而非浅尝辄止。
要理解这项研究,先得明白现在的AI是怎么"画"图的。 可以把AI生成图片的过程想象成一个特殊的厨房。当AI要学会画图时,它不会像人类画家那样一笔一画地描绘,而是采用一种叫做"自回归"的方式——简单说就是"一个食材接一个食材地添加"。但问题在于,AI厨房处理的"食材"不是真实的图像像素,而是一种被压缩过的"标准化食材包"。 这个压缩过程,叫做"离散分词",由一个叫"分词器"(tokenizer)的设备完成。打个比方,分词器就像一台高级的食材切片机,它把一整张图片切成很多小块,然后给每一小块贴上一个"编号标签",对应到一本"标签字典"(也就是研究者口中的"码本")里的某个条目。比如,标签001可能代表"蓝天的一小块",标签002代表"绿草的一小块"。 这种做法的好处是大幅简化了AI的工作量——它不用记住几百万个像素,只需要记住一串编号就行了。这就是为什么如今像Chameleon、Emu3这些大名鼎鼎的多模态AI模型都用这种技术。 但问题也恰恰出在这里。当切片机以16倍的压缩率工作时(也就是说原本256个像素被压缩成1个标签),很多细节就被无情地丢弃了。蓝天少一些云彩、草地少几根草尖,人眼几乎看不出来。可一旦切到了文字或人脸,灾难就发生了——一个英文字母"e"和"c"的差别可能就在那么几个像素,一张脸上眉眼的位置稍微挪一挪,整个人就变了样。 研究团队发现,认知科学研究早就指出,人类的视线会不自觉地被文字和人脸吸引,对这两类内容的细节扭曲特别敏感。换句话说,AI画其他东西糊一点没关系,但文字和脸糊了,用户立马就能察觉。 之前的研究者也意识到了这个问题,他们的解决思路通常是"加大切片机的容量"——比如把标签字典从1万6千条扩展到26万条,或者让每张图用更多的标签。但这就像为了切好一根胡萝卜而把整个厨房改造成大型工厂,成本高得离谱,而且效果也不见得好。 清华和微软的团队提出了一个完全不同的思路:与其让切片机变得更大,不如教它学会"看重点"。 二、给切片机装上"火眼金睛"