扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共2页)
ZDNet至顶网服务器频道 11月23日 评论分析(文/王涛): 大数据是一个庞杂又笼统的概念,因为包含大量的非结构化数据,这时处理传统结构化数据的技术已经难以应对。但是万变不离其宗,在基础架构层面,支持大数据处理的硬件必定还会以处理器为核心,也正是看到了其中的机遇,英特尔正着力布局大数据领域,早在至强E5处理器发布时,英特尔就强调对数据库高可用、高性能要求的满足,并且强有力地支撑企业进行大数据分析和处理。
大数据的火热也为一批新的产品和技术提供了更广阔的施展空间,这其中,数据库一体机和分布式计算系统Hadoop就是最明显的代表,因为将计算、存储硬件以及应用软件进行集成,在简化部署的同时降低应用和管理难度,一体化集成系统已经成为了各大IT供应商抢占的新高地,主流厂商相继推出面向数据库应用的一体机,包括Oracle三大数据处理集成系统、惠普AppSystem for Hadoop以及IBM的PureData System,而这些集成系统都选择了共同的平台——英特尔x86架构。
英特尔x86平台成主流集成系统基石
首先,我们来看一看Oracle Ex系列集成系统的配置,熟悉Oracle的朋友都知道,甲骨文公司近几年陆续推出了多款x86架构的软硬集成系统,分别是数据库云服务器Exadata、中间件云服务器Exalogic和商务智能云服务器Exalytics,在2011年底推出的大数据机(Big Data Appliance)在硬件上依然基于英特尔x86架构。
通过Oracle产品信息可以清晰的知道,Oracle大数据机中运行Oracle Linux操作系统,采用18台Oracle Sun Fire X4270 M2全机架服务器配置,每台机架服务器配备两个六核英特尔至强X5675处理器以及48G内存,因此整套系统总共具有216个CPU内核、864 GB内存以及648 TB原始磁盘存储空间。此外,节点和其他Oracle集成化系统之间可采用40 Gb/s的InfiniBand网络以及10 Gb/s的以太网进行连接,通过InfiniBand网络连接多个机架进行横向升级扩展。
Oracle Exadata数据库云服务器硬件架构
除了Oracle大数据机,按照高低配置,Oracle Exadata数据库云服务器分别采用英特尔六核或八核处理器,并整合了Oracle 11g R2数据库及其它软件系统;而Oracle Exalytics商务智能云服务器配置了40个英特尔x86处理器内核,1TB内存和TimesTen实时分析软件。
事实上,Oracle一直是一家关键的数据库软件供应商,在收购了SUN之后,SUN的RISC架构处理器SPARC也使Oracle在高端服务器市场占有一席之地,但对于最新推出的数据库一体机,Oracle无一例外地选择了英特尔x86平台,除了性价比的考虑,背后的原因当然与英特尔x86性能不断提升有关,在处理诸如数据库、OLTP等关键应用业务中,英特尔至强处理器的性能已经能够胜任,在这些关键领域中x86服务器已开始博得更多原本采用RISC处理器的用户的青睐。此外,近几年x86市场不断壮大,并成为业界的开放标准,在用户接受度上,x86无疑更有优势,对供应商而言,要想让其新系统迅速获得用户认可,基于x86平台无疑是最好的选择。
这一点在惠普AppSystem for Hadoop系统上同样得到体现,AppSystem for Hadoop是惠普面向大数据分析领域的最新集成解决方案,目前支持主流的三大Hadoop版本:Cloudera、Hortonworks、MapR,方便用户根据自己的需要来部署相应的版本。
关于Hadoop,本文在后半部分将会有更详尽的介绍,这里就不做详述。单从硬件角度来说,Hadoop的诞生与x86系统就有着非常密切的关系,它的出现使得在基于x86这种要求较低的硬件系统上运行复杂的分布式集群运算成为可能,从这种意义上来说,Hadoop本身就是为x86系统而量身定制的平台。
在处理器方面,这些系统无一例外的,全部都基于英特尔至强平台。惠普AppSystem for Hadoop采用最新至强E5-2600处理器平台,以获得最佳的性能表现。此外,在AppSystem for HANA的集成系统中,也是全面采用英特尔至强E7处理器平台(ProLiant DL580 G7)来提供最高的内存计算性能。
以AppSystem for Hadoop的Cloudera部署版本为例,AppSystem for Hadoop的Cloudera部署版本的计算节点包括HP ProLiant 360p Gen8与380p Gen8两款服务器,分别配备了E5-2600处理器。
AppSystem for Hadoop的Cloudera部署版本单机柜配置
如图,一个单机柜的AppSystem for Hadoop的Cloudera部署中,标配采用2台DL360p Gen8作为NameNode,1台DL360p Gen8作为Management Node,18台DL380p Gen8为WorkNode。
在Terasort基准测试中,18节点的DL380p Gen8的10TB数据排序用时为5128秒(约1个半小时),合1.99GB/s,对于100GB数据量,排序时间为55秒,合1.82GB/s。而16节点至强X5670服务器集群的100GB排序速度是236.3秒,合433.3MB/s,20节点至强E5650服务器集群的100GB数据排序速度为130秒,合787.7MB/s。由此可见,基于新一代至强E5-2600平台的Hadoop集群的威力。
除了Oracle和惠普,还有一家厂商我们不得不提,那就是IBM,在今年4月份IBM发布了全新的专家集成系统(Pure Systems),其中即将在中国发布的PureData System就是针对数据库应用的一体化系统。
从计算节点来看,PureData System配备了IBM全新的服务器x240,x240是一款基于Intel处理器、针对虚拟化的可扩展服务器,在配置方面,x240最多可配备两路Intel E5-2600处理器,内存容量最高可达768GB。
PureFlex System x240计算节点
以上主流的大数据处理集成系统中,英特尔x86架构正在成为一种新的标准平台,英特尔至强处理器这一坚实基石也使众多的软硬集成解决方案如虎添翼,并得以彰显最大的威力。另一方面,除了已经成为传统计算领域中的开放标准,英特尔也正在大数据这股新浪潮中打造一个新的标准化硬件生态系统。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者