Cray今天宣布已经与微软签订独家协议,将在微软Azure数据中心内提供专有的Cray系统,旨在把超级计算机的潜在客户群扩大到政府实验室和科研机构之外的领域。
超级计算机用于处理器密集型、甚至超过了高端大型主机的任务,典型应用包括基因测序、复杂化学相互作用的模拟、天气预报和大规模数据模型的处理。Infiniti Research预测说,到2021年全球超级计算机市场规模将增长到月50亿美元,年增长率为7%。
这个市场没有以更快的速度增长的原因之一,就是客户必须在存储、网络和环境设备上进行广泛投资,才能满足这种强大机器的需求。在与微软签约的条款下,Cray将在选定的微软Azure数据中心内安装XC和CS超级计算机,以及附加的Cray ClusterStor存储系统,直接连接到微软Azure网络。
Cray首席战略官Barry Bolding表示:“我们相信这将扩大向客户交付高质量超级计算机的能力,这些客户以前认为他们无法拥有和管理一台Cray超级计算机。”他说,这次合作不止是一个将数据中心以共享设施形式租赁出去的协议。“我们对于把客户需要Azure服务的工作负载聚合到一起很感兴趣。客户不需要再操心构建他们自己的数据中心。”
专有设备
然而与典型的云基础设施服务不同的是,Cray的设备对每个客户来说都是专有的,不是共享的。客户将为他们来自微软合同的设备单独谈一个多年许可。“不是说你一刷信用卡,就获得10个小时的使用时间。我们相信,专有的、单租户的系统是提供这些服务的最佳方式。”
双方的合作对于Cray的客户来说既可以获得某些Azure服务,例如虚拟机、数据湖存储和微软人工智能和机器学习平台,同时他们也可以使用Cray Urika-XC分析软件套件,以及用于混合高性能计算管理的CycleCloud。
Bolding表示:“Azure存储很适合备份、恢复和弹性。你可以获得来自Cray的高速文件系统,以及Azure数据湖中的长期存储,这对客户来说都是透明的。”
Bolding说,相比采购专有的Cray系统来说,这种方式将为大多数企业机构节约成本。“当你采购Cray设备的时候,你通常会采购符合你的最大需求的系统,你还需要相应的存储容量,长期保存数据。很多客户购买我们的高速存储用于归档,而这并不是这种系统的设计初衷。现在他们可以把Azure用于灾难恢复和长期访问。”
Bolding说,Cray有兴趣以共享的、多租户的方式提供服务,但要“随时间的推移,以不会影响系统能力的方式来做。把合适的工作负载放在合适的系统上,这可以优化总拥有成本,这就是我们所瞄准的任务关键型工作负载。”
他没有说Cray为什么选择了独家协议,只是称其为“公平且平衡的关系”。微软目前在全球有42个Azure数据中心,但是并非所有都支持超级计算机硬件。目前定价也是定制的。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。