您的位置: 网界网 > 周报全文 > 正文

[周报全文]寻求价值与投资的平衡——信息生命周期管理(ILM)的启示

2004年07月26日 00:00:00 | 作者:佚名 | 来源:$page.getBroMedia() | 查看本文手机版

摘要:寻求价值与投资的平衡——信息生命周期管理(ILM)的启示

标签

    第三桶金:

    淘金工具:ILM

    用户各类应用中,数据的类型区别巨大,同时,它们又都具有着不同的数据生命周期。在不同数据类型的不同生命周期内,数据的价值发生了改变,如果不区别对待就会造成巨大的浪费。信息生命周期管理对各类数据进行评估、分类,将信息作为一个整体进行统一管理。

    寻求价值与投资的平衡——信息生命周期管理(ILM)的启示

    ■ 本报记者 谌力

     “信息有自己的生命周期,会随着所处的不同阶段而起起落落。”—这是企业在拥有大量信息,并对信息管理的认识逐渐提高后产生的想法。

    就像一年中有生机盎然的春季、如火如荼的夏季、硕果累累的秋季和万物凋零的冬季一样,自然界的规律作用于信息,体现出来就是信息的生命周期,信息也会经历不同的阶段。

    1 数据管理的难题

    “数据管理不只是买几块磁盘那么简单”

    在企业需要管理的信息不断增长时,企业面临的烦心事也与日俱增。数据增长的速度超过磁盘降价的速度,企业的预算永远不足;信息对企业的运作愈来愈重要,而管理信息/存储的人才却愈来愈缺乏;现有存储资源的使用率低,但又需要不断投资采购新设备;存储资源不能共享,形成多个存储孤岛;存储管理策略缺乏战略性规划,采购存储设备犹如采购耗材,缺一点买一点。

    在当今的社会里,信息机构需要管理和使用的信息量非常庞大,而且还在继续增长。这些信息不但需要保存更长的时间(保存期超过任何一台服务器、存储设备或者任何一个操作系统或应用软件的寿命),更加频繁地进行修改(修改频率通常不可预测),还需要提供更多的机会,以前所未有的方式推动企业发展。与此同时,新法规还规定了与业务相关的电子邮件和互联网通信的保留时间,以及这些信息的恢复速度。随着信息价值的变化,有必要将信息转移到不同的联机存储介质上,以最低的成本提供适当级别的保护、复制和恢复。

    例如,当医生初次给病人看病时,病人的病史对医生很有帮助。数月或数年之后,当病人在抢救室里接受抢救,或者医生正在拟定后续治疗措施时,病史将变得非常有用。

    企业中有各式各样的信息,她们有不同的生命周期,处于不同的周期阶段,造成了企业信息纷繁复杂的状态。对于目前大部分有IT系统的企业来说,有信息就需要存储,但对于企业来说,只从存储的角度来看待信息的价值似乎有些偏颇和狭隘。

    2 ILM的概念和策略

    “ILM是对信息价值与存储投入的重新思考”

    信息生命周期管理是一种信息管理模型,对信息进行贯穿其整个生命的管理,从创建和使用到归档和处理。信息生命周期管理的目的在于帮助(客户)在信息生命的各个阶段以最低的整体拥有成本获得最大的价值。

    信息有自己的生命周期,那么信息处于不同的周期位置对企业而言就会有不同的价值。信息的生命周期可以划分为6个阶段:生成、保护、存取、迁移、归档、清理。信息在自己生命周期不同阶段的特点,对于一个企业而言,通常情况是: 数据生成后,随着时间的推移其访问频率将逐步下降,与此同时,数据被保留的时间越来越长,被删除的数据越来越少。

    统计显示: 磁盘上的数据有90%在90天之后从来或几乎没有再被访问过; 90% 的数据被存放在可移动的存储介质上; 80%的数据是被复制的数据。预计到2005年全球的数据量将达到99.5EB,磁盘的使用率低至 35%~45%。

    企业数据虽然数量众多,但由于不同的数据所处的生命周期阶段不同,其价值也是不同的,所以不同的数据应该采取不同的管理策略和方案。信息的价值在不断变化,长期对其进行储存和管理需要花费成本,理想的状态是达到价值和成本之间的平衡。

    “今天企业的数据中心非常复杂,数据保护是其关键。但是,并非所有的数据都具有同样的价值;并非所有的企业都具有同样的需求。”IDC存储研究部副总裁John McArthur这样认为。

    事实上,对于不同的数据进行不同的管理,正是对信息生命周期最本质的思考,由此出发,对信息进行分类管理就是信息生命周期管理的核心策略。 ILM包括根据数据应用重要性来对信息分类的能力,以及根据分类的信息进行管理的能力。比如,关键的业务数据需要随时可用,并且需要最高水平的保护与性能;ILM必须将这些数据以镜像卷保存在高性能、高可靠的磁盘阵列中。

    信息生命周期六个阶段的概况

    3 ILM的价值

    “ILM看重的是总体拥有成本的下降,投资回报率和资源利用率的上升”

    让用户降低总体拥有成本(TCO)是ILM的出发点,但作为一个企业级的整体商业策略的实现,ILM让企业用更高的视野看待存储和信息管理,除了着意降低企业在信息管理时所需要的总体拥有成本,还要提高投资回报率和资源利用率。

    目前,企业的存储系统通常都是因为一个生产项目的投产而采购,在完成生产系统的同时,存储资源的利用率和投资回报率并没有得到重视,但在数据信息不断膨胀,存储预算紧张的普遍情况下,ILM带给用户一种可以看得见的结构性成本降低,同时也就提高了投资回报率和资源利用率。

    目前,许多人仍把存储看成“外设”,是辅助性设备;偏重存储的硬件成本而忽略存储管理的隐性成本。如果对这类看法进行反思的话,我们可以认为信息生命周期是一种信息管理策略,是一种信息管理的方案。同时,信息生命周期的管理是对存储资源的管理。

    为以最低的成本实现信息价值最大化,各机构已经开始将自动网络存储基础设施与综合服务和解决方案结合在一起,然后以此为基础制定新的信息管理战略。这种新方法被称为信息生命周期管理,其目标是以完全支持机构业务目标和服务水平的方式管理信息。这样做意味着根据信息和应用对企业的价值进行分类,然后制定相应的策略,确定最优服务水平和最低成本。然后,在自动网络存储基础设施中将信息转移到相应的服务等级,以满足企业要求。借助信息生命周期管理,各公司不但能够在信息的整个生命周期内充分发挥信息的潜力,还可以按照业务要求快速对突发事件作出反应。

    具体而言,ILM可以给企业带来以下几方面的收益。

    ● 服务等级细分

    ● 运营效率提升

    ● 信息保护

    ● 信息完整性

    ● 信息便携性

    ● 归档/保存

    不同数据的存储需求表

    4 ILM的主要技术

    “由于ILM对企业的数据提出新管理理念,从而需要更适合的技术来支持其实现。分级化存储、动态迁移、非结构化信息管理、集中化管理这些技术构成了ILM的主要技术。”

    1.分级化存储

    分级化存储技术是实现信息生命周期管理最基本的技术,也是目前业内厂商普遍支持的技术,其主要方法就是根据数据信息重要程度的不同采取不同的存储介质和方案,从而做到既能有效地存储信息,又不必花费太多的投资。

    分级化存储按照存储时间的要求可分为:在线(On-line)存储、联线(In-line)存储、近线(Near-line)存储、离线(Off-line)存储。最重要的信息需要实时的存储和最高级别的恢复(+本站微信networkworldweixin),对应的是在线存储;次要一些信息,则可以用ATA DISK这类的大容量磁盘进行联线的存储,在时间和安全性的要求上低于在线存储;所谓近线存储的划分,则是通过磁带库进行批量定期的存储,存储的时间要求则更低一些;离线存储则是保存不经常使用的数据,通常使用磁带库和光盘库存储。

    根据企业内信息的利用状态,一些厂商也把分级化存储建立在两个基本的信息存储系统之上,即运营信息存储以及参考信息存储系统。企业的运营信息存储包括动态数据,它是活动的、变化的以及经常被业务利用的关键数据。运行信息的存储技术利用快速的、简单的数据恢复技术,以确保高水平的服务。而参考信息存储系统保存的则是静态信息,它并不经常被使用,处于相对静态。由于数据的快速增长,参考信息存储系统应具有高扩充以及高可靠的环境,由一系列的广泛设备组成,包括磁盘阵列、光盘库、磁带设备等。

    在分级化存储实现的过程中,磁带库技术和磁盘技术发展是一个有力促进因素,以IDE/ATA磁盘驱动器为基础的高容量磁盘系统已经出现,这样的磁盘系统相较于以往的光纤磁盘驱动器或SCSI磁盘驱动器为基础的磁盘具有更高的容量、更低的成本,适于成为在线储存设备。磁带库技术是实现分级化存储一个必不可少的技术。高速、高成本的磁盘存储可以用于使用率高,处于生命周期中价值最高阶段的那部分数据信息。而作为一些已经使用不多,或者是处于存档阶段的数据信息,使用磁带库作为存储是一个经济的选择。经由自动化磁带库系统及高容量磁带技术的配合,近线储存设备也已成熟,例如,StorageTek的T9X40系列的load-thread-to ready的时间更可快达12~18秒。

    2.动态数据迁移技术

    由于信息价值及服务等级的要求在其整个生命周期内不断变化,各种企业必须具有一个能够动态地将信息迁移到提供适当服务等级的存储资源的基础设施,并且对使用它的应用程序和业务过程以透明的方式完成此操作。

    目前,EMC正在投资能够透明地、基于预置策略和数据特征且无需人工干预的迁移数据的技术。HP正在致力于交付复制和介质管理、备份到磁带/MO、基于HP-UX的HSM以及基本磁盘备份,改进的复制,HSM,真正的磁盘备份等方面。

    3.内容管理技术

    内容分两种,一种是结构化的资料,一种是非结构化的资料。结构化的资料就是放在一般的数据库里。据调查表明,企业内80%~85%的信息是非结构性的,包括企业的内容管理、文档、语音、图像、X光片都是没有结构的; 银行客户的支票、贷款表格也都是非结构性的;还有半结构性的,比如E-mail和通讯内容。

    内容管理的主要方法就是通过非结构化的数据库,在资料共享的状况下,可以把所有的内容制作在统一的平台上,可以让不同的应用软件调用这些信息,或者把系统放在别的服务器上,让别的软件使用这些信息。

    4.信息集中化的管理技术

    目前,企业的存储环境已经不是那么简单了。不同存储厂商的异构硬件平台,以及不同功能的存储软件实现数据的存储、备份、恢复、归档;企业内不同分支机构地理位置的差异;不同生产系统的纵向划分;这些因素导致了企业内数据的分散和平台的不统一。信息集中化的管理技术是ILM中不可或缺的技术,它能够让企业整体管理自己的存储资源。信息集中化管理的第一步是准确地了解现有多少存储资源,只要是存储区域环境里的设备,就应该把它管理好,做到有效、有序、低成本的管理; 还要很灵活地去调配存储资源以及安全性,在任何一个存储设备上新增加信息都可以方便、快速地使用,并能对存储资源进行监控;然后是对整个业务的变化和发展做出迅速的反应。

    目前,EMC公司的 Control Center让系统管理人员可以对整个企业存储网络上的各种存储部件进行集中化、直观性的管理。EMC Control Center提供的检测、配置、控制、调节和规划功能大大简化了对信息基础架构的管理,同时又可以让系统管理人员跟踪系统的变化。

    IBM TotalStorage Data Retention 450系统可以作为一个中央控制点,帮助管理和满足客户日益增长的数据一致性和保留的需求。同时,集成在同一安全机柜中的强大系统能够确保数据信息在整个生命周期内不会被改变。

    “用户在实施ILM时,需要根据自己企业的商业特征确定具体的实施步骤和策略。”

    StorageTek公司大中国区市场总监 老丞尉

    “现在用户使用存储产品都是为了某个具体的项目,我们希望引导用户从整个企业存储资源的角度来看待信息和存储。”

    EMC公司中国区产品和解决方案市场经理 罗建

[责任编辑:程永来 cheng_yonglai@cnw.com.cn]