至顶网服务器频道 05月13日 新闻消息: Cray新推出的CS风暴加速集群超级计算机包括Cray CS-风暴 500GT和Cray CS-风暴 500NX两个型号,CS风暴加速集群超级计算机利用大量图形处理器单元(GPU)加速器Nvidia Tesla阵列做超级深度机器学习用,大大 提升了人工智能(AI)功能。
影片连结:https://www.youtube.com/watch?list=PLirJ3rHY8PMwNKBgOfdYn_tx4uan_RZYu&v=48elFB19Oco
Cray为旗下超级计算机深度学习投入大量资源。
Nvidia GPU用于深度学习几乎可以达到线性加速的效果,高达35,840个Cuda GPU可用于AI应用程序的分割和征服法。 Nvidia加速器可以在500GT上与最新的英特尔Xeon“Skylake”处理器很好地整合在一起,而在500NX上则可以很好地与英特尔Xeon E5-2600 v4“Broadwell”处理器紧密整合。 Nvidia Tesla P40或P100 PCIe GPU加速器可用于500GT,而500NX则支持Nvidia Tesla P100 SXM2 GPU加速器。
新的Cray CS风暴 500GT和CS-风暴 500NX针对人造智能进行了优化,内置用于深度机器学习的大型Nvidia Tesla图形处理器加速器阵列。
Cray CS风暴系列运算速度高达每节点每秒187 TERA操作(TOPS),即是说每个用于深度机器学习应用的标准机架的运算速度高达2.618 TOPS。两台超级计算机都使用标准Cray编程环境、Sonexion横向扩展存储和集群管理算法。
Cray在旗下超级计算机用于深度机器学习应用方面投入了重大资源。Cray在不同型号上均提供提供Nvidia加速器和英特尔Xeon Phi加速器(尽管各型号都使用Intel Xeon作为主要处理器,除了较老的、基于CPU机器学习的Cray Urika-GX分析平台用的是Spark MLlib和Cray 图形引擎)。
好文章,需要你的鼓励
TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。
这项来自首尔国立大学的研究提出了状态机推理(SMR)框架,解决了大型语言模型在信息检索中的过度思考问题。研究者将推理过程从冗长的令牌生成转变为离散动作(精炼、重排序、停止),使系统能够高效地在状态间转换。实验结果表明,SMR在BEIR和BRIGHT基准测试中显著提高了检索性能,同时减少了74.4%的计算资源消耗,证明其在不同语言模型和检索器中的通用性。这种结构化方法不仅解决了冗余轨迹和误导性推理问题,还为构建更高效的信息检索系统提供了新思路。
Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。
REASONING GYM是GitHub团队开发的一个突破性推理环境库,为强化学习模型提供可验证奖励。与传统固定数据集不同,它能生成无限训练数据并调整难度,涵盖代数、算术、认知、几何等100多个领域的数据生成器。研究显示,即使顶尖AI模型在复杂任务上表现也不佳,而专门针对推理训练的模型明显优于通用模型。更重要的是,在一个领域学习的技能可以意外地迁移到其他领域,这为提升AI推理能力提供了新路径。