扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在2004年5月IBM公司推出了最新研发的POWER 5处理器,它是一款新一代的64位微处理器,适用于64位计算系统,同时还向下兼容32位系统。它除了在性能方面得到明显提高外,在可扩展性、灵活性和可靠性方面也有所加强。POWER5芯片具有27,600万个晶体管,比最初的POWER4芯片(具有17,400万个晶体管)多10,000万个。芯片面积为389平方毫米,包括2313个信号I/O和3057个电源I/O。
POWER5内核结构
基于Power 4及Power 4+的设计,POWER 5增加了并发多线程能力(SMT),可以将一个处理器转变为两个处理器,从而允许一个芯片同时运行两个应用,由此大大降低了完成一项任务所需要的时间。一个POWER5系统最终将支持多达64个处理器,这样从
POWER5处理器实物
据测试POWER 5比他的前任POWER4在性能上提高了40个百分点,POWER5具有和超线程类似的Simultaneous Multithreading功能,所以在软件层面上,系统会把芯片识别为4个同时工作的逻辑处理器,这样系统不论是浮点还是整数运算能力都会提高比原来提高超过50个百分点。POWER5处理器另一个值得注意的是其超大容量的CPU缓存,除了具有1.9MB的片载二级缓存外,POWER5还同时配备了惊人的36MB板载三级缓存,这对提高CPU执行效率和内部带宽有着直接和明显的好处。构架上POWER5处理器还具有硬件层面上的虚拟机技术,通过POWER5的虚拟引擎,多
power6采用IBM的65纳米绝缘硅(SOI)工艺、10层金属片而制造。与90纳米工艺相比,在一定的功率下,性能提高了30%,这主要是由于使用了应变硅技术。IBM的65纳米工艺提供了0.65微米的高性能SRAM单元和0.4微米的单元以提高密度。存储阵列单元使用了与逻辑元件相比较低的电压,以减少功耗。
与前两代产品一样,Power6着重于系统架构事关重大的大系统环境。每个Power6微处理器单元(MPU)作为2路单芯片多处理器(CMP)设计来实现,340平方毫米的一块芯片上集成了两个同步多线程处理器以及每个核心都有的专用二级高速缓存。至于高档型号,四个Power6 MPU将封装在一个多芯片模块(MCM)内,另外还有四个三级全相联高速缓存(victim cache),每个大小是32MB。
Power6在5GHz下,每个MPU都有300GB/s的带宽,大约80GB/s来自三级高速缓存、75GB/s来自内存、80GB/s来自MCM内总线、50GB/s来自远程处理器、20GB/s来自本地I/O。Power6的带宽通常比Power5+系统增加了一倍,这是由于频率提高、添加了一些新接口。Power6的非核心功能其运行频率都是核心频率的一半,2GHz到2.5GHz之间;而各种Power5+处理器的频率大约为0.8GHz到1.15GHz。
Power6另外还有一个内存控制器和MCM内的结构线路,从而把I/O频率从cpu 频率的三分之一提高到了二分之一。每个内存控制器使用IBM的第三代同步内存接口连接到内存。与全缓冲DIMM一样,这些共存内存接口(SMI)芯片能够配置更大的内存空间、使用不同类型的内存(通常是款式较老的DDR提供容量,或者较新的DDR2/3提供带宽)。内存控制器和三级高速缓存都有不同的地址和数据总线,而互连结构和GX+ I/O总线复用寻址和数据总线。
Power6的系统架构完全经过了重新设计,比前几代产品先进得多。用于大系统的Power5使用两条单向环(uni-directional ring)实现MCM内通信,而MCM间通信通过二维网状结构来进行。Power6则使用了两层架构和新的一致性协议进行配对。每个Power6 MCM组成了一个“单元”,全连接网络中最多可以排列8个单元。新的系统架构拥有比较低、比较稳定的时延。虽然低时延对提高性能而言必不可少,但稳定时延大大方便了操作系统(特别是Linux)进行管理。就Power6系统而言,有三级时延:MPU本地、MCM本地和远程。相比之下,在大尺寸的Power5+系统中,远程读取可能需要经历1到4个MCM间中继段(hop)、0到2个MCM内中继段。
从一开始,IBM设计的Power6系统就具有极强的可配置性。通常每个周期传送8个字节的节点内总线可分成低端系统每个周期传送2个字节,而节点间总线也能每个周期传送4个字节。同样,两个集成的内存控制器每个周期都可以传送一半的字节,其中一个可以完全移除。外部的三级高速缓存是可选的,或者出现在MCM中,或者出现在外部配置中。IBM声称,所有这些选件旨在提供不同性价比的型号,以便更好地服务于客户。显然,有些工作负载可能根本无法放在高速缓存里面进行处理,客户可以订购功能精简的部件来节省费用。另一个因素可能是,IBM正试图通过重复使用遇到生产故障的设备来提高产量。譬如说,如果三级高速缓存不正确地接合到了MCM上,它可以作为“有价值的”产品重新封装。
核心方面的变化
虽然Power6的微架构不同于前几代产品,但毫无疑问它承袭了最初在 2000年宣布的Power4核心。IBM声称,Power6的性能大约比POWER5提高了一倍。实现手段是,将频率和带宽翻一番,同时保持了同样的流水线深度,另外对微架构作了许多逐步改进。
Power6的基本流水线其级数与Power5一样多,不过针对不同阶段重新进行了平衡。最重要的是,相关的算术逻辑单元(ALU)操作如今可以持续执行,这就消除了原先的POWER4/5架构存在的一个缺陷。这就简化了无序调度,可能是指令发送/分派阶段在Power6里面使用2个周期(Power5使用4个周期)的原因。McCredie博士略带提到了其他变化,但没有进一步详细介绍。
正如去年ISSCC上透露的那样,Power6的一级数据高速缓存(L1D)增加了一倍,增至64KB;联合并行处理也增加到了8路。因而, L1D时延增加到了4个周期,而Power5及大多数其他高性能MPU却是3个周期。正如前文猜测的那样,Power6包括两个4MB大小的专用二级高速缓存。尽管高速缓存是专用的,却有一个快速输出缓冲器(cast-out buffer),这便于两者之间快速通信,而不涉及三级高速缓存或者主内存。众所周知,如果一切都一样,共享高速缓存可以提供更高性能。不过在 Power6的情况下,并非一切都一样。尤其是,物理设计方面的因素比微架构的巧妙性来得重要。8MB的二级高速缓存太大了,在所需的带宽下,无法在目标存取时间内探测到它。因而,高速缓存被一分为二。三级高速缓存也得到了改进,因为它抛弃了POWER5+里面使用的分区技术;这就加大了三级高速缓存的实际尺寸,只需要极小成本。高速缓存的许多这些细小改进,尤其是提高了联合并行处理能力,对多线程执行极其有利,并且帮助IBM对Power6里面的同步多线程(SMT)实现了比前几代产品更大幅度的提升。
Power6似乎保留了前一代产品的所有功能部件,不过也添加了对二进制编码的十进制数(BCD)和Altivec扩展指令集的硬件支持。据IBM声称,一半多点的用户数据采用BCD形式。考虑到IBM的System i和p用户的常见工作负载,这似乎相当合理。大多数RISC架构把BCD支持功能添加到了系统厂商提供的软件库里面,这与801、MIPS和RISC- 1/2等早期项目所信奉的理念相一致。然而,IBM的POWER架构比与之竞争的架构更像CISC。为了支持即将推出的管理BCD的IEEE 754R标准,IBM添加了大约50条新指令以及十进制浮点处理单元(FPU)。包括所有的基本指令:加、乘、除,以及比例缩放、转换及其他重要功能。
新的十进制功能部件共享浮点寄存器、浮点状态和控制寄存器。该部件实际上是四倍精度,可在144位中提供多达36位准确性,不过结果被压缩成了128位,以适合两个浮点寄存器,然后在使用之前进行解压缩。基本操作有点慢于ALU操作,拥有单一周期吞吐量,但有2个周期时延。虽然IBM在性能上没有提供任何有明确量值的好处,但就电信计费基准而言,与Java、C/C#或者汇编库相比,BCD支持功能估计可以把性能分别提高7倍、4倍或者2倍。同样, AltiVec执行部件已添加到了POWER6上,不过PPC970及其他处理器里面的微架构的这个部分有比较齐全的文档说明。
注重可靠性、可用性及可服务性
对IBM而言,可靠性、可用性及可服务性(RAS)必不可少。Power6使用了检验点系统来保持正确性、从容地校正及容许故障。这就需要恢复部件、错误记录器和重启动机制。处理器状态保存在恢复部件里面,用错误校正编码法(ECC)来保护。凡是会引起状态变化的操作,譬如寄存器或者高速缓存写入操作,都会检验奇偶性以及/或者ECC故障。
如果出现可校正的错误(或者未出现错误),变化通常传送到处理器状态寄存器里面。不可校正的错误,如阵列奇偶性或者控制故障,就会触发记录器,记录错误类型,然后从已知的正确状态重新开始执行。这时候,任何临时错误都会得到正确解决。一再出现的错误会上报,然后已知的正确状态被传送给另一个CPU,随后该CPU开始执行。这可以透明地发现任何硬错误,然后隔离到单一处理器,但进一步的问题可能需要软件干预。除了这些注重MPU的改进外,另外还有前面提到的可改进RAS的系统改变。
在管理方面,IBM也在改进Power6里面的虚拟化功能。在某些产品中,一个处理器就能存放2到300个虚拟实例,不过从理论上来说最多有可能使用1024个虚拟机。还添加了内存分区和迁移功能,这缩短了用于修复的系统停运时间。IBM还将为基于Power6的新系统提供Power Executive管理工具。Power Executive最近在英特尔的开发者论坛上进行了展示,这款管理工具用于处理评估功率、系统运行状态,并使用该信息作出决策,譬如关闭不需要的风扇或者限制功耗。
IBM服务器产品分类包括x系列、p系列、i系列和 z系列等产品;x系列是基于Intel构架服务器,p系列则是UNIX服务器,i系列是集成的商用服务器,z系列则是企业级服务器。目前基于POWER5的eServer系统包括IBM eServer pSeries和iSeries以及IBM TotalStorage企业存储服务器。
eServer i5服务器,使用的是IBM的POWER5处理器。i5服务器不仅继承了以前i系列产品对数据库、中间件、系统管理软件的高度集成性,又增加了对AIX的支持,成为业界唯一能够在一台服务器中同时运行多种不同操作系统的计算机。
作为业界第一种基于高级 IBM POWER5微处理器技术的服务器,IBM i系列服务器能减少复杂性、简化基础结构并可通过服务器整合来提高生产率。将 IBM POWER5 处理器整合到i系列服务器中,这标志着第9代 IBM 64位处理器技术的引入。POWER5处理器经证实的、开放的、灵活的设计充分利用了i系列在集成、虚拟化和卓越系统管理技术方面的传统,为当今随需应变的世界提供了新层次的功能和简单性。此外,有了新的 POWER系统管理程序功能,i系列服务器目前能够支持以本机方式运行的 AIX 5L 操作系统。POWER 系统管理程序还通过引入未使用的分区来提供自动的处理器平衡功能。
目前IBM推出的eServer i5服务器有eServer i5 520 Express Edition、eServer i5 520、eServer i5 550、eServer i5 570、eServer i5 595等系列产品。
信息化建设提升包钢整体实力
1999年,包钢实现了全面的财务电算化,2000年,包钢以重轨质量跟踪为核心建立的质量管理信息系统解决了从原料质量到产品质量的管理问题。
2003年,包钢对原有销售信息系统进行更新改造,增强了对客户预付款、合同签订、发货、结算和价格管理等销售业务尤其是对外埠公司进销存管理的效率。无论是客户预付款、合同签订,还是发货、结算和价格管理等一系列工作全部都井井有条。实现了全国14个销售分公司的联网销售和集中式管理,当年实现直接经济效益超过5000万元,集团领导每天一上班就可以拿到完整的销售报表。该项目也因此被评为全国企业管理创新成果二等奖、自治区科技进步一等奖。
物资供应公司运用现代物流管理理论开发了新的“供应商管理系统和价格查询系统”,通过按照业务重新调整管理思路,面向外部供应链建立了完备的供应商管理档案,记录和跟踪供应商的交易情况,建立了供应商评价体系,最终实现合理控制资源、营建稳定的供应商队伍。
白云铁矿抓住资源、成本两大核心内容开发实施了“矿产资源及采拨计划管理系统”和“物资管理系统”,库存资金从2003年的7920万元下降到2004年的6492万元,减少材料备件资金占用18%,流动资金周转天数由121天降至94天。
包钢集团医疗保险信息网络管理系统解决了17万参保职工、数百家参保企业、17个定点医疗机构的就医和医保基金的联网管理,投用后的当月与上年同期费用支出减少了110万元。
此外,包钢还先后建成了集团的企业网站以及包钢下属白云鄂博铁矿、建安、稀土高科、稀土研究院等单位的一批网站,对宣传包钢、开放市场和推进生产经营起到了很好的作用。
2.OA作为深化的突破口
按照信息化整体规划的要求,包钢选择办公自动化(OA)作为包钢管理信息化的突破口。包钢OA从实施的规模以及面临的管理复杂性和难度来说,都是信息化建设中前所没有的。开发出一套既能针对包钢的现实情况,又能够满足未来变化的OA系统是其具备生命力的关键所在。实施过程中,包钢打破传统软件开发思路,选用IBM先进的Lotus软件平台,基于B/S架构建立分层门户化的体系结构,通过引用知识管理理念,形成了具有工作流设计功能的OA平台。
张华俭演示了包钢集团的办公自动化系统。根据不同的授权,用户可随时获取从财务数据、销售数据、生产统计数据到企业内部公告、会议通知、行业信息、产品价格、销售调价等在内的各种信息;即使在出差的情况下,只要具备接入条件,就可以通过专用网络安全地访问。
最近,包钢又把炼钢车间工业视频等监控信息也集成进了企业门户网站,有关领导可随时了解工业现场的情况。此外,信息管理处还以短信的形式为集团领导定制了专业化的信息。
2005年实施完成的OA是包钢信息化二期工作的一个重要内容。它不仅帮助包钢结束纸质公文转递历史,提高了办公效率,更重要的是提高了各级领导的认识水平,增强了企业员工在网络电子化环境下的工作能力,为下一步实施ERP打下良好的基础。
3.全面实现生产过程自动化
2000年,包钢引进了具有国际先进水平的薄板坯连铸连轧工艺生产线和冷轧薄板工艺生产线以及自动化控制技术,产销全程采用三级计算机管理与过程控制,真正实现了自动化、智能化和现代化,吸引了众多国内外同行参观、学习和培训,并实现了技术的对外输出。
2003年投入运行的包钢炼钢厂三级系统仅通过稳定生产节奏降低电耗一项,获得年效益386万元,计划排定时间由原来4小时减少到现在的20分钟,收集和汇总生产信息由原来的8小时缩减到现在10分钟,所有科室的文件、报表、工位图表、交接班日志都在网上传递,纸质文档、图表减少70%,年节约费用近20万元。
在包钢新的发展时期,特别是在产品结构调整、对老设备更新改造和新建项目中,包钢将信息化与自动化有机地结合起来,有力地提升了包钢的核心竞争能力。信息化装备的投入占整体工艺设备投入资金的30%以上。与此同时,管理信息化建设也奠定了坚实基础。
4.基础设施着重眼长远
包钢一、二期工程万场后,建成了全公司范围内具有大容量、高速率,具有数据、语音和视频通信能力的主干光纤网,不仅实现了信息大楼内部的网络通讯,而且还与生产楼、电子楼和销售公司办公楼实现了光纤互联。
包钢中心机房分为3个工作区域:网络核心区、小型机应用区和网站服务器区。其中,小型机是机房的核心区域,清一色地全部采用IBM公司p系列UNIX小型机,包括RS 6000系列、eServer p系列和最新采用POWER5处理器的System p系列服务器。
六台三种类型的IBM小型机惹人注目:两台F85(RS 6000)运行生产调度系统,两台eServer p650运行OA系统,两台System p5 550支持销售系统,它们之间互为双机热备,并通过SAN(存储区域网络)实现外部存储系统集中共享(主要产品是日立数据公司的HDS 9500V型产品)。F85最早用来运行OA系统,p650安装到位之后,前者就被用于生产调度了。可以看出,IBM公司的产品为最大实现用户ROI(投资回报)方面取得了明显的成绩。
包钢之所以选用IBM的UNIX服务器,最主要的因素缘于产品的稳定性和可靠性,加上此前双方建立起的互信合作基础。包钢有关产品的选型和配置主要根据应用软件厂商结合用户的业务需求而推荐的。
尽管IBM UNIX系统可以提供虚拟化分区、可用于集成更多的应用,考虑到安全和稳定性等因素,目前包钢还没考虑投入实际应用中,但在关键业务应用领域不会考虑采用IA产品。很显然,Windows不稳定,一段时间之后需要重装系统,而UNIX几乎不存在类似的情况。
可以说,包钢信息化建设在技术应用层面在国内同行业处于领先水平,突出地表现在能够充分发挥了后发优势,在网络基础建设坚持选用成熟可靠、同时具有高性能、可扩展、易于管理的网络技术,确保信息网络平台5年内不落后、不淘汰,10年内可升级扩展。
通过上面介绍我们可以看到包钢采用了IBM公司的一整套完整的解决方案,包括硬件、软件和服务,另外从上面的介绍中我们还可以看到通过采用完整的解决方案之后包钢的财政收入有了明显的降低,资金流动时间减少,在保证员工福利的情况下降低了维护成本。在文章中我们可以看到包钢采用的全部是IBM公司的P系列UNIX小型机,并采用了双机热备等先进技术,在整个网络的建设中包钢已经为今后的升级和ERP系统的建筑做好了充分的准备,如果POWER 6处理器推出,相信包钢已经做好了随需应变的准备,由此我们可以看到IBM不仅是一家硬件公司,还是一家软件公司。
中国国家网格启用基于Cell BE的IBM BladeCenter QS20集群
2007年4月,中国科学院(CAS)计算机网络信息中心和IBM(NYSE: IBM)在国内合作的第一台基于Cell BE(Broadband Engine, 宽带引擎)的服务器系统开始投入运行。这一系统安装在位于北京的中国科学院超级计算中心内,中国科学院各院所、多所大学以及一些国内科研和商业机构将很快能够通过中国国家网格(CNGrid)使用这一系统。在早期的系统测试中,CNGrid和IBM联合组建的测试团队通过进行一系列优化软件和Cell BE的硬件潜力开发,将地震应用的计算速度提高了60倍。地震预报专家将可以在短短几分钟内得到以往需要数个小时才能得到的计算结果。此外,该系统在医疗图像处理领域也取得了同样非凡的成就,而且类似的成就也将有可能在金融模拟、多种类型的建模、航天计算、数字动画和网络通信等领域得到验证。
尽管IBM power6处理器还未正式发布,但按照以往的惯例IBM一定会推出基于POWER6微处理器的刀片服务器产品,设想一下如果采用了基于POWER6微处理器的刀片集群之后,地震应用的计算速度肯定会在原有基础上再提高一倍,这样就可以在原有相同的时间里更快、更准确地得到计算结果,从而可以降低因自然灾害给人们带来的不必要损失。
POWER6 展望
关于IBM POWER处理器的成功案例不仅限于像包钢、中国科学院这两家,在国内还有中国石化、大庆油田、韶关钢铁、江苏高速公路、三峡电力等在内一些国内企业在使用,在国外更是数不胜数。通过硬件、软件、服务的完美结合使IBM的三驾马车可以完美的奔驰,透过POWER处理器的真实应用使行业用户了解了哪些产品更适合他们是实际需求,更有益于帮助他们降低投资成本,保障投资回报率。此次发布的POWER 6处理器从一定程度上将会给竞争对手带来压力,有了竞争用户才能找到更适合自己的产品,希望在不久的将来我们可以看到更多的基于POWER 6处理器的产品为我们的工作、生活带来更为密切的帮助。
作为用户他们需要了解产品可以满足他们怎样的发展需求,作为
谈到产品对比往往就离不开技术层面上的,在Power5与Power6处理器技术对比之前,我们先来简单地回顾一下从1997年开始到现在IBM所采用的一些新技术。
1.铜芯片(Copper),1997年9月——出于很多技术原因,大多数人认为在芯片中取代铝线布线基本不可能。但IBM的工作小组克服了这些技术问题,很快地将铜线投入到生产中,其结果使芯片性能立刻得到提高。现在,IBM的开创性技术仍然是行业的标准。
2.绝缘硅(SOI),1998年8月——绝缘硅(Silicon on Insulator)技术通过在现代芯片上绝缘隔离数以百万计的晶体管,从而实现了功耗的降低和性能的提高。在IBM开发出这项技术前,半导体行业对绝缘硅技术的研究已经进行了15年。
4.双内核微处理器(Dual-Core Microprocessors),2001年10月——全球第一个双内核微处理器POWER4作为Regatta的一部分发布,Regatta是一款System p服务器
5.浸没式光刻(Immersion Lithography ),2004年12月——IBM宣布在全球首次采用这项新的制造技术,即可以使芯片尺寸可以做得更小的技术,来生产商用微处理器。
7.高电介质(High-k),2007年1月——IBM宣布推出一种解决方案来解决业界最头痛的问题之一,即晶体管电流泄漏问题。通过采用新的材料,IBM将制造出具有“高电介质金属门(High-k metal gates)”的芯片,从而使产品的性能更好、尺寸更小、能源效率更高。
8.嵌入式动态随机访问存储器(eDRAM),2007年2月——通过在微处理器芯片上采用创新的新型快速动态随机访问存储器(DRAM)取代静态存储器(SRAM),IBM能够实现三倍以上容量的嵌入式内存,并使性能得到极大提高。
9.三维芯片堆叠(3-D Chip Stacking),2007年4月——IBM宣布采用“穿透硅通道(through-silicon vias)”技术制造三维芯片,穿透硅通道使半导体可以垂直叠放,而原来只能接近水平依次排放,这样就可以将关键线路路径的长度缩短最高达1000倍。
10.Airgap,2007年5月——使用“自组装”纳米技术,IBM在Power架构的微处理器内数英里长的线路之间创造出一种真空状态,这样就减少了不必要的电容,提高了性能和能源效率。