您的位置: 网界网 > 周报全文 > 正文

[周报全文]实现主存储优化的6个措施

2009年06月10日 14:35:32 | 作者:CNW.com.cn | 来源: | 查看本文手机版

摘要:当企业着手进行主存储数据缩减时,了解主存储优化所需要的条件对他们来说十分重要。

标签
主存储优化

当企业着手进行主存储数据缩减时,了解主存储优化所需要的条件对他们来说十分重要。

【CNW.com.cn 专稿】目前市场上并不缺少提高数据存储效率的新技术,然而这些新技术绝大多数都是关注备份和存档的,而非主存储。当企业开始进行主存储数据缩减时,对他们来说,了解主存储优化所要求的必要条件十分重要。

主存储,常常被称为1级存储,其特征是存储活跃数据,即经常被存取并要求高性能、低时延和高可用性的数据。主存储一般用于支持关键任务应用,如数据库、电子邮件和交易处理。大多数关键应用具有随机的数据取存模式和不同的取存要求,但它们都生成大量的数据以支持企业运营其业务。因此,企业制作数据的许多份拷贝,复制数据供分布使用,库存数据,然后为安全保存备份和存档数据。

绝大多数数据是起源于主数据。随着数据存在的时间增加,它们通常被迁移到二级和三级存储保存。因此,如果企业可以减少主数据存储的占用空间,将能够在数据生命期中利用这些节省下来的容量和费用。换句话说,更少的主存储占用空间意味着更少的数据复制、库存、存档和备份。

试图减少主存储占用空间的存储管理人员可以考虑两种减少数据的方法:实时压缩和数据去重[注]

由于性能问题,数据压缩一直没有在主存储应用中得到广泛应用。不过,Storwize等厂商已开始提供实时、随机存取压缩/解压技术,可将数据占用空间压缩15:1。更高的压缩率和实时性能,使压缩解决方案成为主存储数据缩减的可行性选择。

在备份应用中广泛采用的数据去重技术也在被应用到主存储。目前为止,数据去重面临着一大挑战,即数据去重处理是离线处理。这是因为,确定数量可能多达数百万文件中的多余的数据块,需要大量的时间和存储处理器做大量的工作,因此非常活跃的数据可能受到影响。当前,推出数据去重技术的主要厂商包括NetAppData DomainOcarina Networks。其中,Data Domain正在成为NetAppEMC竞购的目标。

部署主存储优化解决方案有以下六项要求:

1. 零性能影响

与备份或存档存储不同,活跃数据集的性能比以某种形式的数据缩减技术节省的存储容量更为关键。因此,用户选择的数据缩减技术必须不影响性能,必须有效和简单,必须等价于“拨动一个开关,就消耗更少的存储”。

目前,活跃存储缩减解决方案只在需要去重的数据达到非活跃状态时,才为活跃存储去重。换句话说,这意味着实际上只对不再被存取但仍保存在活跃存储池中的文件,近活跃存储级,进行去重。

去重技术只对轻I/O工作负载去重来避免性能瓶颈。因此,IT基础设施的关键组件存储没有得到优化。数据库排在关键组件清单之首。由于它们是1级存储和极其活跃的组件,且几乎始终被排除在轻工作负载之外,去重处理从来不分析它们。因此,它们在主存储中占据的空间没有得到优化。

另一方面,实时压缩系统实时压缩所有流经压缩系统的数据,在节省存储容量之外还带来一个意外好处:存储性能的提高。当所有数据都被压缩时,每个I/O请求提交的数据量都能有效地增加。硬盘空间增加了,每次读写操作就变得效率更高。实际结果是占用的硬盘容量减少,总体存储性能显著提高。

主存储去重的第二个好处是所有数据都被减少,这实现了包括数据库在内的所有数据的容量节省。尽管Oracle环境的实时数据压缩可能造成一些性能问题,但迄今为止的测试表明其性能提高了。

另一个问题是对存储控制器本身的性能影响。人们要求今天的存储控制器要做很多事情,包括管理不同的协议,执行复制和管理快照。再向这些功能增加另一个功能,可能会超出控制器的承受能力,即使它能够处理额外的工作负载,增加了一个可能成为潜在I/O瓶颈的过程。将压缩工作交给外部专用设备去做,可从性能问题中消除一个变数,而且不会给存储控制器造成一点影响。

2. 高可用性

许多关注二级存储的数据缩减解决方案不是高可用的。这是由于它们必须立即恢复的备份或存档数据,不像一级存储中那样关键。但是在二级存储中,这种概念也逐渐被淡化(+微信关注网络世界),高可用性被作为一种选择,添加到许多二级存储系统中。

可是,高可用性在主存储中并不是可选的选项。从数据缩减格式(被去重或被压缩)中读取数据的能力必须存在。在数据缩减解决方案中(其中去重被集成到存储阵列中),冗余性几乎总是高可用的存储阵列的必然结果。

在配件市场去重系统中,解决方案的一个组件以数据的原始格式向客户机提供去重的数据。这个组件就叫做读出器(reader)。读出器也必须是高可用的,并且是无缝地高可用的。一些解决方案具有在发生故障时在标准服务器上加载读出器的能力。这类解决方案经常被用在近活跃的或更合适的存档数据上,不太适合非常活跃的数据集。

多数联机压缩系统被插入系统中和网络上,放置(逻辑上)在交换机与存储之间。因此,它们由于网络基础设施级上几乎总是设计具有的高可用性而取得冗余性。沿着这些路径插入联机专用设备,实现了不需要IT管理人员付出额外努力的无缝故障切换。

3. 节省空间

部署这些解决方案之一,必须带来显著的容量节省。如果减少占用容量的主存储导致低于标准的用户性能,它就没有价值。

主数据不具有备份数据通常具有的高冗余存储模式,这直接影响到总体容量节省。这里也有两种实现主数据缩减的方法:数据去重和压缩。

数据去重技术寻找近活跃文件中的冗余数据,而能取得什么水平的数据缩减将取决于环境。在具有高冗余水平的环境中,数据去重可以带来显著的ROI(投资回报),而另一些环境只能取得10%20%的缩减。

压缩对所有可用数据都有效,并且它在可以为高冗余数据节省更多的存储容量的同时,还为主存储应用常见的更随机的数据模式始终带来更高的节省。

实际上,数据模式冗余度越高,去重带来的空间节省就越大;数据模式越随机,压缩带来的空间节省就越高。

4. 独立于应用

真正的好处可能来自所有跨数据类型(不管产生这些数据是什么应用或数据有多活跃)的数据缩减。虽然根据去重数据的水平或数据压缩率的不同也会有所不同,但所有数据都必须合格。

当涉及存档或备份时,应用特有的数据缩减具有明确的价值,并且有时间为这类数据集定制缩减过程。但是对于活跃数据集,应用的特殊性将造成性能瓶颈,不会带来显著的容量缩减的好处。

5. 独立于存储

在混合的厂商IT基础设施中,跨所有平台使用同样的数据缩减工具,不仅将进一步增加数据缩减的ROI好处,而且还简化了部署和管理。如果每一个存储平台使用不同的数据缩减方法,将需要进行大量的培训,并会造成管理上的混乱。

6. 互补

在完成上述所有优化主存储的工作后,当到了备份主存储时,最好让数据保持优化的格式(被压缩或去重)。

如果数据在备份之前必须扩展恢复为原始格式,这将是浪费资源。为备份扩展数据集将需要:

使用存储处理器或外部读出器资源解压数据;扩展网络资源,以把数据传送给备份目标;把额外的资源分配给保存备份数据的备份存储设备。

即便备份存储设备,也执行像数据去重这样的数据缩减,但以优化的格式向这种设备传送数据,将使去重系统变得效率更高。

任何主存储优化都必须与备份优化解决方案互补。(美国《Network World》供本报专稿,更多内容详见http://www.cnw.com.cn/P/1411

参考资料

1.重复数据删除:是一种数据缩减技术,通常用于基于磁盘的备份系统,旨在减少存储系统中使用的存储容量。它的工作方式是在某个时间周期内查找不同文件中不同位置的重复可变大小数据块。重复...详情>>

[责任编辑:程永来 cheng_yonglai@cnw.com.cn]