至顶网服务器频道 12月29日 新闻消息(文/邹大斌):临近2017年岁末,尽管IBM并为此做太多宣传,但IBM POWER9现身的新闻还是引起了业界广泛关注。IBM宣布推出搭载有最新设计的POWER9处理器的新一代服务器Power Systems AC922。IBM称,基于Linux的AC922采用了一系列创新的技术,旨在大幅提升Chainer、TensorFlow及Caffe等各大人工智能框架的性能,并加速Kinetica等数据库,从而可以加速深度学习,可将深度学习框架的训练时效提高近四倍。POWER9到底有哪些创新之处,搭载POWER9的这台服务器又有哪些神奇之处?就此问题记者采访IBM的专家。
IBM全新POWER9处理器采用14纳米技术,嵌入80亿个晶体管
IBM的Power服务器现在的主流芯片是POWER8,发布于四年前。应该说,四年间IT市场发生了重大变化,云计算、大数据逐渐成为主流,同时AI势头也不可阻挡,市场增长态势非常明显。这对服务器芯片提出了新的要求。在这一背景下推出的POWER9自然不会忽视市场的最新变化。这一次,对AI的强力支持或将成为POWER9最大卖点之一,IBM甚至称其为”为AI而生”。
众所周知,AI应用的一大特点是数据量特别巨大,这一方面要求服务器具有强悍的计算力,同时也对数据的输入输出能力提出新的要求,需要能把海量的数据及时送达CPU。POWER9在两个方面都有非常好的表现,尤其是I/O上。
据IBM杰出工程师、大中华区硬件系统部首席技术官李永辉介绍,POWER9同时支持四种连接接口,包括最新的PCIe 4.0扩展总线、NVIDIA NVLink 2.0高速互连、CAPI以及OpenCAPI,和基于PCIe Gen 3的x86系统相比,这种组合能让其数据传送性能提升近10倍。
“AI应用大多数时候都需要处理海量的数据,为了让数据能更快地送达CPU,POWER9做了很多工作,这让服务器在AI应用上具有非常好的表现。” 李永辉表示。
以NVLink为例。这是NVIDIA推出的一种新的、高速的、节点内的互联技术,基于这一连接技术可以在GPU-GPU以及GPU-CPU之间实现高速大带宽直连通讯,从而加快AI应用的学习训练过程。同样,IBM的CAPI在数据加速上也非常有特色。CAPI(Coherent Accelerator Processor Interface)本质上是让I/O的加速器可以跟CPU共享它的内存、缓存,基于这个接口,I/O板卡可以更快速地与CPU交换数据。CAPI在POWER8中首次应用,到POWER9中升级到了CAPI 2.0。
当然,除了支持更多I/O加速能力之外,POWER9本身在计算能力上也有很大的提升,比如采用14纳米的制程工艺,具有更高的晶体管密度,其最多可达24个核心,这比POWER8的12个核心多出一倍。
“图像的处理(如4K、8K的视频处理)和语音的处理,都需要很大的网络吞吐量,传统架构无法满足,IBM看到这种需求,在POWER中做了针对性的设计,从而实现了数据的加速能力。”李永辉表示。
正是得益于POWER9的这些创新,搭载POWER9的AC922 Power Systems才具有了独特的AI支持能力。顺便提一句,“AC922”中的“AC”就是加速计算的意思,可见这台服务器原本就是为AI而专门设计的。
AC922 Power Systems是一个2U的机柜,采用2个POWER(CPU可选16或 20个核)处理器,每个CPU最多可接3个NVIDIA Tesla V100的GPU,一共可接6个GPU,CPU与GPU通过6个NVLink 2.0接口相连。据悉,NVLink 2.0 提供CPU与GPU或GPU与GPU间通信性能高达到每秒100GB/s到150GB/s的连接,这是PCIe 3.0速度的7到10倍。因为AI依赖于数千次反复进行的深度学习训练,所以NVLink 的采用可以明显改进系统性能。
李永辉透露,POWER9是美国能源部正在建的Summit及Sierra超级计算机的核心,这两台超级计算机建成后将成为世界上性能最强的数据密集型超级计算机。
目前,在服务器市场的竞争格局是英特尔和AMD代表的x86阵营主导,而IBM、甲骨文所代表的RISC阵营一直处于守势。一直以来,在与x86阵营的竞争,IBM的POWER主打的高性能、高可靠以及更低功耗,从而在一些关键任务应用场景中拥有不少高端客户。这些特点在POWER9中还会有,比如,李永辉提到,跟x86相比POWER9拥有1.8倍的带宽、2.6倍的容量以及更快更大的内存系统。但很显然,与以往相比这些数字的对比似乎已经不是重点,IBM现在更愿意展示POWER在一些应用场景中的优势。
IBM大中华区科技合作部副总裁Mary Coucher就告诉记者:“在过去可能大家都更多的是关注于芯片,关注内核、线程、内存,而现在我们更关注于不同的工作负载,关注芯片如何为这些负载提供最大程度的支持,并针对不同的负载推出不同系列的产品。”
正因为此原因,Mary Coucher透露,与POWER8相比,POWER9将会有更多的产品类型,比如,将会细分出主打Scale-out场景的POWER9和主打Scale-up应用场景的POWER9。
IBM副总裁、大中华区硬件系统部总经理侯淼也告诉记者,这一调整的背后是因为客户在服务器架构平台选择中的决策重心已经发生了改变。“十年前,很多客户在选型的时候会首选RISC架构的服务器,五年前会首先考虑x86。但是今天,很多客户选型时会优先看应用。比如,我要做一个人脸识别的系统或者一个钢厂的残次品诊断系统,然后看哪些平台能够帮助我实现这个目标。”
侯淼说,现在是应用驱动,而不是技术驱动。IBM发布AC922这样的产品,也是希望能够推动客户购买行为的改变,同时,也能够在新的时代里脱颖而出。
截止目前,IBM并没有做大规模的POWER9发布,关于POWER9透露的信息并不多。采访中, Mary Coucher 告诉记者,围绕POWER9有一系列系统计划在2018年公布,更多产品也将在2018年上市。届时用户是否认可POWER9的这些创新答案也会揭晓,我们将密切关注。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。