Nvidia今天宣布推出了一款用于服务器的加速卡新品,并公布了最新用于自己内部研究集群中的超级计算机Selene,该集群也是目前全球排名第七的最强系统。
Nvidia是在ISC Digital线上高性能计算大会期间发布这些公告的。
首先,来看看这款服务器加速器,它其实是Nvidia旗舰产品A100 GPU的一个新版本(如图所示),结构更紧凑了。Nvidia在PCIe卡上配置了一个A100芯片,让企业可以将其接入服务器,从而为人工智能应用、科学模拟以及通常使用GPU的工作负载提速。
Nvidia此前已经在今年早些时候推出了一款基于A100的加速器,带有4个或者8个板载GPU。今天发布的单GPU PCIe卡可以轻松插入企业现有服务器中,从而让Nvidia更好地瞄准了一个关键市场领域:那些希望在GPU项目中利用现有基础设施的企业和组织。
如下图所示,就GPU核心规格而言,这款PCIe卡基本上和之前是类似的,主要区别有两点。首先,该产品的散热设计功率(衡量芯片热量散发的指标)降低了38%,使其运行的时候足够冷却,连接到服务器而无需专用风扇。此外,为了提高效率,这款PCIe卡在速度上做了一些权衡,性能是同类产品的90%。
相信搭载Nvidia的A100 GPU的服务器产品将很快上市。Nvidia表示,戴尔和HPE等十几家服务器厂商计划发布超过50款配置了A100的服务器系统,预计今年夏天就会有30款问世。
企业数据中心并不是Nvidia芯片唯一瞄准的领域。目前三大主流公有云厂商都已经采用了Nvidia的GPU,不仅如此,Nvidia GPU还被广泛用于超级计算机中。在此次ISC Digital大会上,Nvidia透露了有关这方面工作的最新信息,称全球TOP500榜单中前25强超级计算机中有20个都在后台使用了Nvidia GPU。
这其中就包括了Selene——Nvidia专门为自己内部研究集群打造的超级计算机。该系统是位列全球第七,性能相当于每秒27.5次万亿次运算,而且值得注意的是,Selene也是全球最节能的系统之一。
Nvidia高级产品营销经理Dion Harris在博客中详细介绍说,“Selene是TOP100系统中唯一一个打破了每瓦20 gigaflops的系统。”
除了用于扩展Nvidia的研究范围之外,Selene系统还可以作为Nvidia DGX设备系列的销售展示。Nvidia表示,通过组装DGX A100设备,仅用了4周时间就完成了整套超级计算机的组装,每个系统提供8个A100 GPU,而通常某些情况下建造大型超级计算机可能要花费一年多的时间,显然这么快的速度对潜在客户来说是很有吸引力的。
Nvidia子公司Mellanox也参与了ISC Digital大会演示。去年,Nvidia斥资69亿美元收购了这家网络设备制造商,一部分原因是Mellanox在高性能计算市场上占有举足轻重的地位,特别是TOP500超级计算机中有305套系统都采用了Mellanox的技术。Nvidia在ISC Digital上透露,Nvidia GPU和Mellanox产品现在联合起来为全球将近2/3的TOP500系统提供动力。
Nvidia还借此机会推出了新的网络监控设备Mellanox UFM Cyber-AI,该系统会扫描数据中心或者超级计算机的流量情况,发现潜在的组件故障、性能问题、以及表明存在潜在漏洞的可疑活动。
好文章,需要你的鼓励
无人机食品配送服务商Flytrex与全球知名披萨连锁品牌Little Caesars宣布合作,推出全新Sky2无人机,最大载重达4公斤,可一次配送两个大披萨及饮料,满足全家用餐需求。Sky2支持最远6.4公里的配送范围,平均从起飞到送达仅需4.5分钟。首个试点门店已在德克萨斯州怀利市上线,并实现与Little Caesars订单系统的直接集成。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
法国社会住房项目ViliaSprint?已正式完工,成为欧洲最大的3D打印多户住宅建筑,共12套公寓,建筑面积800平方米。项目由PERI 3D Construction使用COBOD BOD2打印机完成,整体工期较传统建造缩短3个月,实际打印仅用34天(原计划50天),现场操作人员从6人减至3人,建筑废料率从10%降至5%。建筑采用可打印混凝土,集成光伏板及热泵系统,能源自给率约达60%。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。