您的位置: 网界网 > 周报全文 > 正文

[周报全文]四色分解服务器技术英雄2002

2002年12月23日 00:00:00 | 作者:佚名 | 来源:$page.getBroMedia() | 查看本文手机版

摘要:四色分解服务器技术英雄2002

标签
我们等待改变世界的英雄,
看谁最后成功!
英雄需要被歌颂,
因为他改变了世界
还有你我他!

四色分解服务器技术英雄2002
本报记者  江波

    红色:

    永不停顿的“芯”跳!

    高端系统和应用从32位走向64位,这是计算机问世以来最重要的变革之一,而这项变革是从计算的核心—处理器开始的。2002年,“芯”的跳跃无疑集中在了“64位计算”与“0.13微米”工艺上,红色代表的跳动与生生不息刚好诠释了永不停顿的“芯”跳!

    首先是IBM的Power4 CPU以及在接近年底时推出的Power4+。在采用Power4 CPU的p690高端机型上,其中几项技术是最引人注目的: 一是铜导线、SOI、双核、四芯片封装代表的CPU设计技术; 二是片内二级缓存、片外三级缓存、CPU内置SMP支持、板间CC-NUMA互连组成的多级内存结构; 三是AIX 5.1操作系统,它代表了64位内核、分区、支持Linux界面、海量文件系统等操作系统技术。

    Power 4有很多先进的特性: 专为SMP处理进行了优化; 将处理器技术与进程技术、封装和微架构相结合,设计了从处理器到内存和I/O桥接芯片的整个系统,提高了整体性能; 同时使用新的晶体管级工具改进了芯片设计,并将复杂的控制逻辑转换为常规的数据流结构,解决了主频提升时保持系统平衡的问题,可以处理多种不同的负载,在一个单一的系统设计中同时满足高性能计算(要求高带宽)环境和商业环境(要求数据共享和SMP扩展)的需要; 使用一种能够消除停机并在错误无法消除时能够提供冗余的方法,在可能的情况下,尽力使硬机器中断(检查中断)转换为软件的同步机器中断,使软件尽可能地避开故障;在硬件上保持了32位和64位的双向兼容。 

    而在年底IBM新的eServer p650型服务器中,IBM首次采用了其代号为“Power4+”的下一代服务器芯片。Power4+芯片是Power4系列芯片的0.13微米版本,Power4系列芯片是采用0.18微米技术制作的。据IBM公司介绍,Power4+芯片的尺寸比Power4芯片小35%,面积是267平方毫米,拥有1.84亿个晶体管,内置1.5MB L2缓存和32MB L3缓存,运行速度为1.2GHz至1.45GHz。1.2GHz芯片的耗电量是70瓦。 

    SUN在9月份发布的1.2 GHz的 SPARCⅢ同样采用0.13 微米技术,功耗上从75 瓦降低到53瓦。SPARCⅢ基于Sun第二代64位SPARC V9结构,为了实现高性能的设计目的,UltraSPARCⅢ结合了新的结构特性来降低延迟。内部64位的数据寻址能力使处理器、应用和操作系统可以充分利用更大的存储容量,大容量2级缓存和内置的存储控制器设计则可以降低数据的延迟。

    接下来是安腾(Itanium)2。Intel公司在2002年7月9日正式推出其第二代64位处理器——安腾2,直接导致现有高端IA服务器全面升级换代。安腾2处理器延续了第一代安腾处理器所具有的EPIC(显示并行指令运算)体系架构,其内部结构上的变化包括:3MB片内L3缓存; 数据位宽从安腾的64位、266MHz提升到了128位、400MHz,从而将安腾的2.1GB/s系统总线带宽提升到6.4GB/s; 比第一代安腾处理器增加了两个整数单元和输出端口,主频也从800MHz提高到了1GHz,总体性能提高了1.5~2倍。 EPIC计算模式是专门为实现高效并行性而设计的,旨在同时处理多个指令或进程。并行性可以增加每处理器时钟周期内可完成的工作量,从而加速应用的处理。值得关注的是,从软件方面看,编译器在为并行吞吐量优化软件代码方面将会日益改进;从硬件方面看,安腾处理器的开发工作将会继续侧重于提高每时钟周期能处理的指令数量,目前安腾2已经能同时处理6条指令,而EPIC技术还能更灵活地提高未来处理器的并行性。在安全性上,安腾2支持一种先进的机器检查结构,广泛地管理硬件、固件和操作系统中的错误,从而有效减少宕机和崩溃时间。同时安腾2还支持服务器归并的大型SMP系统和可横向扩充的高度集群配置,可扩展性得到了极大的提高。

    与上一代产品相比,安腾2不但能够在二进制代码上与后代产品兼容,而且在硬件接口上也能兼容,客观上也保护了客户的投资。支持Intel安腾2的芯片组也有了多款产品,包括Intel自家的E8870、HP的ZXL以及IBM的EXA-64(支持64位的Summit版本),不再像安腾一代那样,只有Intel 460孤家寡人。

    根据计划,Intel将于2003年早些时候开始推出新一代产品Madison。Madison将采用0.13微米加工工艺,三级缓存的容量将增加至6MB,工作频率将超过2GHz。

    内核昵称Hammer的AMD 64位CPU Opteron被一些专家认为是服务器领域的希望之星。令人印象深刻的有两大技术: 一是2.0GHz的64位CPU,二是HyperTransport 芯片互连技术。HT点到点互连技术,用于芯片之间的互连,尤其是CPU互连以支持SMP,是很好的技术创新,它突破了单点内存控制器(俗称北桥)的限制, 每个CPU都可以通过内置的内存控制器存取内存,或通过HT通道访问远地内存,在2~4 CPU的SMP系统上是很好的。

    从IA架构处理起来看,Intel 停止开发新的PⅢ内核,只是推出更高主频的产品来满足服务器厂商的需要,典型应用只停留在工作组级服务器层面。取而代之的是主流服务器的处理器从PIII转变到了Xeon。而为了填补IA64暂时没有大量企业级应用的空白,Intel MP版本的Xeon芯片也随之出现,其更大的缓存和4路以上的并行处理能力使得高端4~8路企业级服务器有了澎湃的计算性能。


    白色:

    刀片服务器没有尴尬!

    白色本身就具有两面性!服务器的每次重大变革都伴随着其外形的巨大变化。现在,刀片服务器的形状似乎预言着整个未来,其高密度的计算能力和空间,给了我们无限的遐想与可能,但是今天,它仍然面临着诸如散热、性能方面的缺陷,好在巨头们正着手应对这些!

    刀片服务器在年中曾经热闹过一阵,以IDC、.com为市场目标的高密度、低功耗、易管理的刀片服务器的市场空间狭窄,在PⅢ时代,可以在一个机箱内放置20~40个刀片,但在Xeon时代,在7U机箱内只能放置14个刀片,由于散热的原因,高密度优势不明显。但它若与网络存储结合,并解决低功耗问题,将大有所为。其中隐含的三项技术值得注意: 一是CPU密集技术,若能将CPU附近的风扇、硬盘、光盘、软盘都拿掉,将大大提高服务器的稳定性;二是数据集中技术,通过存储区域网,将存储集中管理,动态部署;三是管理集中技术,将操作系统引导、系统管理、应用部署都集中操作,将大大提高好用性。

    用户对刀片服务器多数持观望态度,原因无它,第一代的刀片服务器在可管理性方面仍旧存在较大的缺陷,计算能力也不是足够密集。IBM 和HP在今年相继推出了有更高处理能力的新一代刀片服务器。刀片服务器从提出到现在其基本架构部分仍旧在继续变化,各个厂家都有自己的背板和接口标准。通过刀片服务器上捆绑的软件管理工具来重新配置服务器的工作将变得更加容易、更加迅速。

    HP既是刀片服务器的先驱者也是倡导者,它的ProLiant BL P Class是其开发的第二代综合型刀片式系统,也是目前该领域内部结构组合优化程度非常大的多处理器刀片式服务器。目前惠普BL P Class包括有两款产品:BL 20P Class和BL 40P Class,分别为两路处理器和四路处理器系统。BL 20P Class主要应用于动态的Web/ASP主机服务、计算集群、终端服务器、多媒体数据流等,采用的是英特尔PⅢ处理器(1.4GHz),前端总线速度为133MHz。BL 40P Class主要是应用于数据库服务器、邮件服务器和HA集群节点等。它采用的英特尔Xeon MP Gallatin 处理器(2GHz),前端总线速度为400MHz。这两款产品均采用的是低功耗处理器,以确保高密度运行环境下的系统稳定性,非常适宜IDC、Call Center等大信息量的应用需求。

    IBM今年的新款“刀片” BladeCenter采用的是Intel新的至强DP处理器,它不是一个单纯的产品,而是IBM为用户新的IT基础架构所建立的完整的跨平台解决方案和企业级数据中心的核心。IBM非常看重BladeCenter,因为它将会是未来的网格计算的硬件平台。IBM认为整个IT系统在未来的3到5年将会整合成一个统一的平台,所有的处理器都会在刀片服务器上做整合。基于BladeCenter,上面会是一个开放性的操作系统。通过这样的开放硬件平台和操作系统,人们可以在系统中的任何节点上取任何资源来进行运算,也就是网格计算。IBM还有一个概念是“自主运算”,会对整个系统进行自我监测、自我诊断、自我修复等。这是IBM对未来整个IT架构以及对未来电子商务的构想。

    在过去的一年中,刀片服务器是业界的一个亮点,但是可以看到,许多评论都认为刀片服务器仅仅是一个产品、是机柜服务器更好的替代品,这使得刀片服务器诞生的意义显得单薄,而且硬件标准的统一也是一个很大的问题。IBM刀片服务器产品的推出,给整个刀片服务器领域制定了新的标准,把刀片服务器的诞生意义提到了一个更高的境界。同时IBM的BladeCenter联盟计划广泛联合业界软硬件厂商,还与Intel联手推动刀片服务器的发展。

    相信在各厂商的共同努力下,刀片服务器会有一个美好的前景。 


    绿色:

    “总线”在田野深处蔓延!

    千兆应用的觉醒与推广很大程度上取决于总线技术的发展,我们欣喜地看到,在2002年,PCI-X像一股绿色的旋风刮进了几乎所有厂商的服务器产品中,也正是它的到来,给CPU和主存之间的这条高速的系统总线带来了一次巨大的飞跃!

    如果说过去ISA 总线后PCI总线的引进是一个革新的话,那么今天PCI-X的出现无疑是一个巨大的飞跃!PCI-X是由HP、原Compaq、IBM等公司所提出的一种新的I/O接口和总线标准。PCI-X既可使用32位也可使用64位宽度的总线,其工作频率提升到133MHz,允许的最大带宽达1066MB/S。同时,以往的PCI总线必须频繁地在目标设备和总线之间交换数据,而PCI-X则允许目标设备仅于单个PCI-X设备间进行交换。另外,如果PCI-X设备没有任何数据传送,总线会自动将PCI-X设备移除,以减少PCI设备间的等待时间。所以,在相同的频率下,PCI-X将能提供比PCI高14%~35%的性能。PCI-X另一有利因素就是它有可扩展的频率,也就是说,PCI-X的频率将不再像PCI那样是固定的,而是可随设备的变化而变化。比如某一设备工作于66MHz,那么它就将工作于66MHz,而如果设备支持100MHz的话,PCI-X就工作于100MHz。PCI-X可以支持66/100/133MHz这些频率,而在未来,它还将提供更多的频率支持。据PCI-SIG(PCI特殊兴趣组)11月13日宣布,他们正在制定一个可将连接速度翻倍的新标准,这个标准可能把PCI-X的并行架构提高到另一个速度水平,再一次使带宽翻倍,把PCI-X技术提高到一个新的台阶,并确保为那些担心向下兼容和投资风险的设计厂商提供稳定的发展蓝图。因此PCI-X可以说是PCI的希望,也是服务器带宽提升的有利保障。

    可以说,PCI-X的采用使传统通用服务器的网络性能从百兆走向了千兆,也使IA32服务器具备了高宽带吞吐的先进特性,为向高度应用领域进军提供了支持。新兴的Xeon平台抛弃了传统的PCI总线体系而转向多段式PCI-X结构(+本站微信networkworldweixin),多达6段的PCI-X总线可以同时支持6种高带宽I/O设备互不影响地工作在各自特定的频率上,这无疑为千兆网络环境打下了良好的基础,再加上Intel等千兆网卡芯片价格的下调,共同促进了千兆网卡入驻服务器,促进了千兆应用脚步的加速。 


    橙色:

    服务器技术跋涉的底色!

    除了上述几项重大的技术突破外,2002年,诸如先进内存保护技术、动态分区技术等更具体的技术给跋涉中的服务器技术以及应用带来了更大的灵活性、更高的稳定性,还有更浓重的绚烂底色!橙色看起来绚烂夺目,而服务器技术正是在这样的底色中演绎花样年华!

    先进内存保护技术

    提到热拔插,我们不能不说它对于服务器来说的确是一种非常实用的技术,因为所有人都明白服务器的工作连续性对于任何使用者都是至关重要的。为了在硬件发生故障的时候不影响服务器其他功能的正常运行,促进了热拔插技术的发展与应用。最早服务器可以热拔插的硬件设备只是硬盘、电源和内部的风扇,但发展到如今,HP的服务器已经使内存也可以进行热拔插更换!以后做到CPU的热拔插也未必是件难事。

    HP的先进内存保护技术是今年“热插拔”技术的一个亮点,包括3种容错内存保护技术:在线备份内存、热插拔镜像内存和热插拔RAID内存。

     在线备份内存用户可以将一个指定的内存区作为在线备份内存(Memory Back),剩下的内存区则为系统内存,在设定服务器时可进入BIOS设置Online Spare Support选项。

    对于不能承受因内存错误造成停机且无法等到预定的停机维护时再更换故障内存的情况,热插拔镜像内存技术可以让有这样需求的用户直接受益。这项技术同样是有两个内存区,数据同时写入这两个由工业标准内存模块组成的内存区,数据由其中一个内存区读出,另外一个内存区则对数据作镜像。当读取内存模块发生错误或内存模块达到预设错误条件时,数据会改由原来作镜像的内存区读出。热插拔镜像内存技术,顾名思义,就是可以让用户在不停机的情况下更换故障的内存模块,提供足够的冗余功能,当新的内存模块被重新插入,系统立即恢复镜像模式。

    热插拔内存阵列使用5个内存控制器控管5个由工业标准内存模块组成的内存区,阵列运算引擎负责算出存于第5个内存区的奇偶校验值。系统内存以单一缓存线(cache line)为单元供CPU及输入/输出设备访问,内存阵列将单一缓存线切割成4个由分开的内存控制器提供的64 bit数据字,第5个奇偶校验数据字根据实际的4个数据字产生,实际的4个数据字中任何单一数据字皆可由奇偶校验及其他3个实际的数据字推算和还原。需要强调的是,5个内存控制器中的任何一个皆可在系统运行中移除,缺少的数据由剩下的内存控制器提供的数据推算补上。

    三种新技术,给我们带来的不仅仅是对服务器内存的保护,更重要的是他们减少了停机维护的时间成本,减少了硬件故障带来的一系列的问题,这种“极度保护”对于今天这样注重保证关键业务的稳定可靠运行的情况来说,无疑是一个重要的开创。

    DLPAR

    今年,IBM发布了最新的AIX 5.2版。AIX 5.2最大的特点是可以支持动态逻辑分区(Dynamic Logical Partition, DLPAR)。在原有的逻辑分区(LPAR)基础上,用户将不用重新启动或设置分区,就可以在正在运行的各个分区之间自由调动如I/O、CPU、内存等资源。这对用户来讲,将使其获得前所未有的灵活性。

    DLPAR能允许在不要求系统或受到影响的分区执行重新引导的情况下,将分区资源从一个分区转移到另一个分区。在一个LPAR(逻辑分区)配置中,个体处理器、256MB内存和I/O适配器插槽资源都将处在一个指定逻辑分区的专有控制之下。LPAR实现的一个主要优势是它能够对这些个体资源进行分配控制,允许以几乎任何数量和组合方式将这些个体资源组合在一起,创建一个逻辑分区。DLPAR对这些功能进行了扩展,不仅允许在激活一个逻辑分区时进行良好的资源分配,而且允许在分区的运行当中进行这种分配。个体处理器、内存区和I/O适配器插槽可以被释放到一个“自由池”中,从该自由池中可以获得这些资源,或将这些资源直接从一个分区转移到另一个分区,同样,可以是几乎任何数量或采用任何组合方式。

    DLPAR在处理不断变化的负载需求和服务器部署时能够提供更大的灵活性:在需求高峰期将测试分区的处理器转移到一个工作分区,随后当需求降低时再将它们转移回去;将内存转移到正在过度执行内存页面调度的分区;在分区之间转移不经常使用的I/O设备,如用于软件安装的CD-ROM,或用于备份的磁带驱动器;将一系列处理器、内存和I/O资源释放到“自由池”中,这样就可以使用这些资源创建新的分区。

    64位操作系统

    这里不得不提到hp-ux 11i 64位操作系统,它提供了领先的可用性、可扩展性和安全性,可满足苛刻的应用程序对大内存和大文件的要求。此外,hp-ux 11i仍保留优化的32位选项,支持现有的32位系统和应用软件。 hp-ux 11i包括四个操作环境,其中三个专门用于商业用户,另一个技术计算操作环境适用于惠普工作站和技术服务器。其主要特点是,核心参数可动态调节;核心模块可动态加载;快速重启对修改最频繁的核心参数的动态优化,所以可最大限度地减少停机时间;保持修改值,有计划的系统重启可减少管理工作。

    微软计划发布数据中心级Windows.Net Server 2003操作系统,这种64位的操作系统能够为大量的交易处理提供更大的寻址能力。另外,与32位代码的版本相比,其性能将提高25%。此外,Linux也开始支持64位操作系统,如IBM的ThinkBlue/64 Linux操作系统,Penguin64中文Linux操作系统(简称中文Penguin64 1.0)。

    Cluster风起云涌

    由于大规模计算如基因数据的分析、气象预报、石油勘探等需要极高的计算性能,应用规模的发展使单个服务器难以承担负载,不断增长的需求需要硬件有灵活的可扩展性并且关键性的业务需要可靠的容错机制。这就要求一个切实可行的解决方案,于是提出了由一组相互独立的、通过高速网络互联的计算机以单一系统的模式加以管理,这就有了集群的概念。今年的Cluster(集群)有三大技术值得关注,一是COTS和Beowulf技术,前者商品化部件技术使得高性能计算机变成了开放式系统,选择部件的余地大了,后者意味着可以方便地拿到连接这些部件的软件技术;二是IA+Linux技术,它在RISC+UNIX之外,增加了一种廉价的高性能计算机方案,这一点尤其要感谢Intel Xeon和Linux2.4,使这一架构得以在性能、价格和稳定性上拿到了入场券;三是应用技术,我们今天看到了除科研领域科学计算以外的许多Cluster应用,这才是根本。

    IA集群系统可以采用现成的通用硬件设备或特殊应用的硬件设备,例如专用的通信设备,通过特殊软件支持,例如支持集群技术的操作系统或数据库等等,实现单一系统映像,即操作控制、IP登录点、文件结构、存储空间、I/O空间、作业管理系统等等的单一化并且在集群系统中可以动态地加入新的服务器和删除需要淘汰的服务器,从而能够最大限度地扩展系统以满足不断增长的应用的需要。IA集群服务器能够为用户提供不间断的服务,由于系统中包括了多个节点,当一个节点出现故障的时候,整个系统仍然能够继续为用户提供服务,因此具有极高的性能价格比,同时和传统的大型主机相比,具有很大的价格优势。而RISC架构服务器采用的主要是封闭的发展策略,即由单个厂商提供垂直的解决方案,从服务器的系统硬件到系统软件都由该厂商完成。尽管它具有高稳定性等优点,但集群技术应用的前景并没有IA集群那样明朗! 


[责任编辑:程永来 cheng_yonglai@cnw.com.cn]