超级计算机公司Cray今天公布了它所谓的第一台“能够达到Exascale级”的Shasta超级计算机。据称,Shasta专为那些需要更多计算和网络技术选择的企业而设计,旨在通过提供能够运行高性能计算工作负载(如人工智能、数据分析和建模)的单一平台来简化性。
Cray表示,设计这个系统想法是取代目前常用来运行大部分工作负载的复杂异构集群系统。Cray认为,市场对这种单一系统的需求不断增长,因为这种系统有助于让一切更易于管理,并且消除了性能瓶颈,从而让企业可以大规模地运行高性能计算工作负载。
Shasta有一个特点就是,用户将能够砍掉并更改运行在Shasta内的基础设施以满足他们的需求。例如,用户可以自行选择处理器架构,例如英特尔和AMD的定制x86芯片、Nvidia的GPU、甚至是英特尔和Xilinx打造的针对特定任务重新编程的FPGA。
客户还可以选择不同的连接技术,用于连接Shasta的不同组件,包括英特尔Omni-Path和Mellanox InfiniBand产品。Cray表示,此外客户还可以选择Cray最新的Slingshot技术,该技术专为HPC和AI设计,带宽是传统互连技术的5倍。
Cray表示,Slingshot兼容以太网,可以实现拥塞控制、自适应路由和“高等级”服务质量。Cray方面称,用户使用Slingshot可以建立超过25万个端点的网络。
Cray高级副总裁、首席技术官Steve Scott在一篇博文这样写道:“Slingshot非常低的网络直径实现了极其灵敏的自适应路由;每个交换机都能很好地了解网络的整体状态,因此可以做出快速、明智的决策,以选择能够避免临时拥塞的最佳路径。这让我们即使是在大规模环境中也能够保持高达90%的利用率,让工作负载运转良好。”
Cray计划提供两个版本的Shasta:基础版本配备19英寸、基于空气或液体冷却的系统,可安装在标准数据中心机架内。另外一个支持液体冷却功能的更高级、更高密度版本,将采用64个计算刀片,每个刀片配置多个处理器。总体而言,Shasta预计比Cray目前最强大的超级计算机快10至100倍。
Constellation Research首席分析师Holger Mueller表示,虽然Shasta超级计算机是针对企业的,但大部分系统都可以部署在公有云中而不是企业自己的数据中心内。
Mueller说:“过去,Cray的设备会使用运行在企业数据中心内,且有相应的应用程序。但是看看下一代量子计算机,这种计算机更有可能只部署在公有云中。不过,这不仅仅是硬件,还有软件。未来Cray平台可以实现哪些新的应用,这一点值得期待。”
Cray表示,计划在2019年底之前实现商业化,显然还有一段时间。不过,Cray将在11月美国达拉斯举行的SC18超级计算活动期间首次展示Shasta。
不仅如此,Shasta被认为是面向未来的“Exascale级计算”,一旦所需的处理技术准备就绪,它就将在2021年或2022年被投入使用。Exascale级计算机将至少具有一个exaFLOPS的性能,这将是2008年推出的Petascale级计算机的数千倍增长。
好文章,需要你的鼓励
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
这项由香港中文大学和AWS团队联合开发的研究推出了TALK2MOVE系统,实现了用自然语言精准操作图片中物体的位置、角度和大小。该系统采用强化学习训练方式,通过空间感知奖励机制和智能步骤采样技术,在移动、旋转、缩放三类操作上的准确率显著超越现有方法,同时大幅降低了对昂贵训练数据的依赖,为AI图像编辑领域带来重要突破。
研究人员对Claude、GPT-4、Gemini和Grok等商用AI模型进行测试,发现这些模型能够记忆并完整输出受版权保护的内容。其中越狱后的Claude 3.7 Sonnet能输出95.8%的《哈利波特与魔法石》内容,而Gemini和Grok在无需越狱情况下也能输出超过70%的内容。这一发现可能对正在进行的AI版权诉讼产生重要影响,目前多家AI公司面临超过60项相关法律诉讼。
斯坦福大学等知名机构联合研究发现,企业AI助手在执行组织政策时存在严重"偏科"问题:处理允许请求时成功率超95%,但拒绝违规请求时仅13-40%。研究团队开发的COMPASS评估框架通过8个行业5920个测试问题,揭示了AI助手普遍缺乏"拒绝技能"的问题,并提出了针对性训练解决方案。