超级计算机公司Cray今天公布了它所谓的第一台“能够达到Exascale级”的Shasta超级计算机。据称,Shasta专为那些需要更多计算和网络技术选择的企业而设计,旨在通过提供能够运行高性能计算工作负载(如人工智能、数据分析和建模)的单一平台来简化性。
Cray表示,设计这个系统想法是取代目前常用来运行大部分工作负载的复杂异构集群系统。Cray认为,市场对这种单一系统的需求不断增长,因为这种系统有助于让一切更易于管理,并且消除了性能瓶颈,从而让企业可以大规模地运行高性能计算工作负载。
Shasta有一个特点就是,用户将能够砍掉并更改运行在Shasta内的基础设施以满足他们的需求。例如,用户可以自行选择处理器架构,例如英特尔和AMD的定制x86芯片、Nvidia的GPU、甚至是英特尔和Xilinx打造的针对特定任务重新编程的FPGA。
客户还可以选择不同的连接技术,用于连接Shasta的不同组件,包括英特尔Omni-Path和Mellanox InfiniBand产品。Cray表示,此外客户还可以选择Cray最新的Slingshot技术,该技术专为HPC和AI设计,带宽是传统互连技术的5倍。
Cray表示,Slingshot兼容以太网,可以实现拥塞控制、自适应路由和“高等级”服务质量。Cray方面称,用户使用Slingshot可以建立超过25万个端点的网络。
Cray高级副总裁、首席技术官Steve Scott在一篇博文这样写道:“Slingshot非常低的网络直径实现了极其灵敏的自适应路由;每个交换机都能很好地了解网络的整体状态,因此可以做出快速、明智的决策,以选择能够避免临时拥塞的最佳路径。这让我们即使是在大规模环境中也能够保持高达90%的利用率,让工作负载运转良好。”
Cray计划提供两个版本的Shasta:基础版本配备19英寸、基于空气或液体冷却的系统,可安装在标准数据中心机架内。另外一个支持液体冷却功能的更高级、更高密度版本,将采用64个计算刀片,每个刀片配置多个处理器。总体而言,Shasta预计比Cray目前最强大的超级计算机快10至100倍。
Constellation Research首席分析师Holger Mueller表示,虽然Shasta超级计算机是针对企业的,但大部分系统都可以部署在公有云中而不是企业自己的数据中心内。
Mueller说:“过去,Cray的设备会使用运行在企业数据中心内,且有相应的应用程序。但是看看下一代量子计算机,这种计算机更有可能只部署在公有云中。不过,这不仅仅是硬件,还有软件。未来Cray平台可以实现哪些新的应用,这一点值得期待。”
Cray表示,计划在2019年底之前实现商业化,显然还有一段时间。不过,Cray将在11月美国达拉斯举行的SC18超级计算活动期间首次展示Shasta。
不仅如此,Shasta被认为是面向未来的“Exascale级计算”,一旦所需的处理技术准备就绪,它就将在2021年或2022年被投入使用。Exascale级计算机将至少具有一个exaFLOPS的性能,这将是2008年推出的Petascale级计算机的数千倍增长。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。