至顶网服务器频道 05月13日 新闻消息: Cray新推出的CS风暴加速集群超级计算机包括Cray CS-风暴 500GT和Cray CS-风暴 500NX两个型号,CS风暴加速集群超级计算机利用大量图形处理器单元(GPU)加速器Nvidia Tesla阵列做超级深度机器学习用,大大 提升了人工智能(AI)功能。
影片连结:https://www.youtube.com/watch?list=PLirJ3rHY8PMwNKBgOfdYn_tx4uan_RZYu&v=48elFB19Oco
Cray为旗下超级计算机深度学习投入大量资源。
Nvidia GPU用于深度学习几乎可以达到线性加速的效果,高达35,840个Cuda GPU可用于AI应用程序的分割和征服法。 Nvidia加速器可以在500GT上与最新的英特尔Xeon“Skylake”处理器很好地整合在一起,而在500NX上则可以很好地与英特尔Xeon E5-2600 v4“Broadwell”处理器紧密整合。 Nvidia Tesla P40或P100 PCIe GPU加速器可用于500GT,而500NX则支持Nvidia Tesla P100 SXM2 GPU加速器。
新的Cray CS风暴 500GT和CS-风暴 500NX针对人造智能进行了优化,内置用于深度机器学习的大型Nvidia Tesla图形处理器加速器阵列。
Cray CS风暴系列运算速度高达每节点每秒187 TERA操作(TOPS),即是说每个用于深度机器学习应用的标准机架的运算速度高达2.618 TOPS。两台超级计算机都使用标准Cray编程环境、Sonexion横向扩展存储和集群管理算法。
Cray在旗下超级计算机用于深度机器学习应用方面投入了重大资源。Cray在不同型号上均提供提供Nvidia加速器和英特尔Xeon Phi加速器(尽管各型号都使用Intel Xeon作为主要处理器,除了较老的、基于CPU机器学习的Cray Urika-GX分析平台用的是Spark MLlib和Cray 图形引擎)。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。