至顶网服务器频道 01月08日 新闻消息(文/李祥敬):在过去的2017年,芯片行业的新闻不断,各种新品、技术革新不断涌现。在此,我们对于过去一年的芯片行业进行盘点,透过盘点我们也能对2018年的芯片市场有个大致的预测。
总的来看,在2017年,服务器芯片、AI芯片贯穿了全年。主流芯片厂商在技术革新、生态构建等多个维度进行了拓展,为整个行业奉献了丰富多彩的产品。
在2017年,服务器芯片市场仍然热闹非凡。不管是英特尔还是AMD这些传统的服务器芯片厂商,还有高通、IBM等都为服务器市场提供了多样化的产品。
2017年7月,英特尔宣布推出英特尔至强可扩展处理器。号称是“业界十年来的最大进步”的英特尔至强可扩展处理器采用了全新的Mesh网格式架构设计,取代以往的环形总线,可以更高效地将多达28个CPU核心以及功能模块组合在一起,大大降低延迟。
英特尔至强可扩展处理器针对不断演进的数据中心和网络基础设施而特别设计,为企业提供突破性的性能,以处理需要大量计算的任务,其中包括实时分析、虚拟化基础设施以及高性能计算。
针对英特尔的芯片新品,相关服务器厂商也推出了搭载最新芯片的服务器产品。比如浪潮新一代M5服务器产品,内置英特尔至强可扩展处理器之后,产品性能提升达到了100%,峰值性能提升达到125%。
华为也推出了基于英特尔至强可扩展处理器的全新一代FusionServer V5服务器,从业务负载、部署方式等方面持续提升计算效率,满足企业IT混合部署、增效降本的需求,并提供了领先业界的易管理、高能效等特性,持续降低运维成本。
英特尔发布至强可扩展处理器之后,联想紧扣“芯”命题,发布了10款全新的ThinkSystem服务器产品,产品类型覆盖塔式、机架、刀片、高密度服务器等,满足不同类型的客户对于产品的不同需求,帮助企业更好地拥抱AI时代的机遇与变革,“让计算更智慧”。
除了英特尔,AMD和IBM也更新了各自的芯片产品。在2017年,AMD正式发布了全新的EPYC霄龙系列服务器处理器。AMD EPYC(霄龙)和消费级的锐龙一样基于14nm制程Zen架构,但针对服务器、数据中心等高性能计算做了很对性的加强和优化设计,尤其是注重性能(整体性能及内存带宽与IO)、优化(资源平衡以适合各种计算负载)、安全(行业领先的x86嵌入式芯片级安全)三个方面。
EPYC的应用范围很广,高性能计算、云计算、大规模分布式、虚拟化、机器学习、大数据与分析、存储等等,几乎任何企业和数据中心应用都不是问题。毫无疑问,EPYC(霄龙)处理器宣告AMD正信心满满地杀回x86服务器处理器市场。
在2017年,IBM POWER9也被推出。POWER9同时支持四种连接接口,包括最新的PCIe 4.0扩展总线、NVIDIA NVLink 2.0高速互连、CAPI以及OpenCAPI,和基于PCIe Gen 3的x86系统相比,这种组合能让其数据传送性能提升近10倍。
据悉,POWER9是美国能源部Summit及Sierra超级计算机的核心,这两台超级计算机建成后将成为世界上性能最强的数据密集型超级计算机。此外,谷歌公司也采用了POWER9处理器。
需要注意的是在2017年,主攻消费级市场的高通也杀入到服务器芯片市场。高通Centriq 2400处理器系列采用三星10纳米FinFET制程,设计为单芯片(SoC)平台级解决方案。目前,微软云端平台已经采用Centriq 2400处理器加快数据中心领域的创新。这应该说是ARM服务器生态系统的重大突破。毕竟ARM芯片进入数据中心环境的消息我们已经“听”了很多年。
如果说上面,我们看到是清一色的国外芯片厂商,那么国产芯片厂商在2017年也没有等闲,龙芯就是典型代表。龙芯3A3000/3B3000处理器在2017年上半年正式发布,并被中国航天科工集团应用在终端与服务器设备中。国产处理器大规模应用对于提升我国信息化建设的自主安全可控水平的重要意义不言而喻。
说完服务器芯片市场,我们谈谈最热的AI芯片。在2017年,人工智能技术横扫整个业界,Nvidia公司更是受到追捧。
作为GPU加速计算的领导者,Nvidia发布了新一代Tesla V100 GPU加速器。它基于最新的NVIDIA Volta GV100 GPU平台和各种突破性技术创新,可以为各种超级计算系统提供一个强大的运算平台,不论在以科学仿真为主要手段的计算科学领域,还是在以洞悉数据奥秘为目标的数据科学领域,Tesla V100都能为相关应用提供强大的算力支持。
NVIDIA Tesla V100无疑是目前世界上最先进的数据中心GPU,专门用于处理需要强大计算能力支持的密集型HPC、AI、和图形处理任务。搭载640个Tensor cores,使得Tesla V100成为了目前世界上第一款突破100TFLOPS算力大关的深度学习GPU产品。再加上新一代NVIDIA NVLink技术高达300GB/s的连接能力,现实场景中用户完全可以将多个V100 GPU组合起来搭建一个强大的深度学习运算中心。
为了抢占未来AI芯片市场,在服务器芯片市场有着上佳表现的英特尔也在拓展AI市场。在整合了Nervana的技术之后,英特尔AIPG计划推出Crest家族系列产品线。首先亮相的是一款叫做Lake Crest的芯片,它是专为训练DNN而深度定制的ASIC解决方案(第一代神经网络处理器Neural Network Processor)。
目前流行的大型、深度神经网络面临的问题是,它们的计算能力非常强,但这也使得它们很难快速地进行测试和部署。神经网络处理器的设计目的是为了快速解决AI应用遇到的数学问题,特别是神经网络,它是目前比较流行的机器学习技术分支。
除了主流的芯片巨头,很多AI芯片创新公司也涌现出来,比如寒武纪、地平线等。寒武纪科技发布了新一代智能处理器IP产品,与寒武纪此前发布的1A处理器相比,三款新品在功耗、能效比、成本开销等方面进行了优化,性能功耗比再次实现飞跃,适用范围覆盖了图像识别、安防监控、智能驾驶、无人机、语音识别、自然语言处理等各个重点应用领域。
中科曙光也推出了搭载寒武纪AI芯片的服务器产品——Phaneron,这款服务器可在4U空间中部署20个人工智能前端推理模块,服务器中用于推理应用的强大计算支持就源于寒武纪的人工智能专用芯片。因此,其也成为了世界首款搭载寒武纪高性能机器学习处理器芯片(MLU系列)的推理服务器。
地平线则发布了中国首款嵌入式人工智能视觉芯片,它的两个系列“征程”和“旭日”将围绕智能驾驶、智慧城市、智能商业三大应用场景落地。
其实,AI芯片的出现代表了业界发展的趋势,那就是分布式和专属计算力的出现。随着移动互联网、物联网等的发展,边缘计算与云计算互为补充,为我们提供了丰富的计算力选择。很显然适用于云端计算的通用芯片无非匹配边缘计算,于是AI芯片以及大量的物联网芯片产品涌现出来。
不管是服务器芯片还是AI芯片,都是计算力推进的结果。在当今整个时代,我们面临多样化的计算力,而为了适配计算力,芯片也需要多样化,所以我们看到了x86、GPU、Power、ARM、FPGA等芯片的发展。所以说,这些芯片产品的大量涌现是市场需求的驱动。
透过2017年芯片市场的表现,我们可以看到2018年的芯片市场会一如既往地快速发展,多样化的态势仍将延续,Power、ARM、FPGA等“小众”芯片继续在x86、GPU等“主流”芯片的包围中顽强生存,由此我们将会面对一个更为多样化的芯片市场,我们的计算力选择也将更为更丰富。
同时,这些“非主流”芯片产品能否在市场中取得一席之地,取决于能否满足客户的需求以及自身生态圈的建设。但不可否认,正是这些丰富多彩的芯片产品驱动了整个行业的发展。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。