在日前举行的GTC CHINA 2016大会上, NVIDIA与IBM共同宣布最新合作项目,全新 POWER8 家族将通过NVLINK与NVIDIA Tesla P100实现强势组合。NVIDIA的科技在IBM的服务器中,能加速人工智能、深度学习和数据分析这类高度融合的工作,为企业更快获得人工智能。
数据中心的工作负载在不断发生变化,加速数据中心的需求也在不断增强。不久之前,这些系统主要用于处理存储和提供网页,而现在它们越来越多地需要负责人工智能领域的工作,比如理解语音、文字、图片和视频或者分析大数据以提供见解。数十亿的消费者希望即刻获得许多问题的答案,而企业公司需要分析激增的数据来更好地满足客户需求。这些问题都将由数据中心提供解决方案。
作为服务器系统领域的领导者,IBM 在几年前便注意到了这种趋势,并与NVIDIA合作,加快新数据中心工作负载的处理速度。经过四年的研发,备受关注的POWER8服务器联合了NVIDIA的Tesla P100 GPU 和 NVLink互联技术,实现了更高的数据性能分析和深度学习能力提升。
该系统使用了两个 IBM POWER8 CPU 和四个 NVIDIA Tesla P100 GPU,并通过 NVLink 高速接口使其互联互通。这是一款定制的 GPU 加速器服务器,其中 NVLink 接口集成在主板路由上,并且使用 NVIDIA的Tesla P100 GPU。
技术联合,合力树立行业标杆
IBM Power System S822LC 采用了两个 IBM POWER8 CPU 和四个 NVIDIA Tesla P100 GPU,并通过 NVLink 实现互联。
IBM 和 NVIDIA 技术如此紧密的结合使得数据流动速度比使用 PCIe 快了 5 倍,从而加快了目前诸如高级分析、深度学习和人工智能等极其重要的应用提供见解的速度。
IBM Power Systems 的总经理 Doug Balog 表示:“企业能通过高级分析、机器学习和人工智能提供的用户见解和商业价值越来越多地受到性能的制约。加速计算能够显著加快大数据工作负载的处理速度,并将成为这个认知时代的基础。凭借我们与 NVIDIA 等合作伙伴联手推动的 OpenPOWER 创新,搭载 POWERAccel 技术的全新 OpenPOWER Linux 服务器将为这些工作负载树立新标杆。”
通往 Summit 和 Sierra 之路
IBM 已经收到了多个客户的订单,其中包括一家大型跨国公司以及美国能源部橡树岭国家实验室 (ORNL) 和劳伦斯利福摩尔国家实验室 (LLNL) 等研究机构。
ORNL 和 LLNL 两个实验室将把新系统用作开发平台来优化应用,以充分利用 NVIDIA NVLink 技术。这些系统将用作为新一代超级计算机 Summit 和 Sierra 开发应用的试验台,IBM 公司预计将于 2017 年把 Summit 和 Sierra 分别交付给 ORNL 和 LLNL。
橡树岭国家实验室领导计算设施项目总监 Arthur S. (Buddy) Bland 提到:“在 Power 平台上采用 NVLink 技术能够确保 CPU 和 GPU 中多个内存层次结构的一致性。作为 GPU 的长期用户,我们认为它将提升我们的应用性能,使用户能够更容易地获得重大的科学发现。
好文章,需要你的鼓励
随着沃尔玛电商部门年化GMV突破1000亿美元,AI驱动的商务正在加速发展。Onton获得由Footwork领投的种子轮融资,定位为电商决策的起点。该平台通过神经符号引擎解决传统电商搜索痛点,在家居装饰领域快速扩张,月活用户从5万增长至100万。沃尔玛和好市多等零售巨头已在运用AI重塑购物体验,消费者期望正在发生根本性转变。
JetBrains Research团队发现,让AI理解项目级代码补全并不需要海量数据和复杂方法。通过调整OpenCoder模型的位置编码参数,仅用10亿token数据就达到了与使用数千亿token训练的顶级模型相当的性能。研究还发现,不同的上下文组织策略对最终效果影响很小,真正的关键是模型架构的调整。这为资源有限的团队开发高质量代码AI工具提供了新路径。
卫星连接领域领军企业星链与BICS达成战略合作,指定Proximus Global为其在欧洲直连手机卫星服务的首选IPX提供商。该合作将使星链利用现有IPX网络连接移动运营商,并为能够向智能手机提供宽带服务的下一代网络铺平道路。星链直连手机服务拥有超过650颗低轨卫星,可在移动信号盲区提供数据、语音、视频和消息服务,连接五大洲超800万用户。
德国ELLIS研究所团队开发扩散强制采样器,通过借鉴图像生成技术,将递归深度AI模型的推理速度提升5倍。该技术采用"对角线并行化"策略,同时处理多个文本位置而非串行等待,在保持相同准确率下大幅提升效率。关键是可直接应用于现有模型无需重训练,为AI实时应用带来突破,在数学推理、编程等复杂任务中表现优异。