您的位置: 网界网 > 周报全文 > 正文

[周报全文]如何制定最优闪存投资策略?

2014年08月28日 14:22:31 | 作者:CNW.com.cn | 来源:网界网 | 查看本文手机版

摘要:闪存,作为近两年风头最盛的存储名词之一,正在逐渐席卷整个IT行业。但数据中心用户在选择闪存产品时切勿盲目跟风,只有通过合适的评估手段,选择最适合自身工作负载的闪存解决方案才是正解。

标签
闪存

闪存存储,也就是通常所说的固态硬盘(SSD),预计会在未来的十年内遍布每一个数据中心,阻碍闪存发展的最主要因素应该就是其高昂的价格。根据各个厂商发布的产品价格来看,闪存盘价格大约是传统HDD旋转磁盘的3倍到10倍之间。而本文在以下内容中将向读者提供两种面向存储架构师的方法,读者可以依据这两种方法来分析他们现有和未来的需求中,哪些工作负载最能够从闪存部署中受益。

其中,理解现有部署需求最好的一种方法,就是针对现有存储I/O环境创建一个比较准确的模型。这个模型可以用于测试新的架构、产品,以及工作流程。目的就是通过部署这个与真实环境相差无几的工作负载模型去对不同的技术、设备、配置,甚至是软件和固件的不同版本进行测试,以达到与现有环境最高的匹配度。

针对工作负载进行有效建模的第一个步骤,就是了解具有最大潜在性能影响的关键存储流量特征,因此对任何部署来说,理解峰值工作负载、特殊工作负载,比如备份和年/月末结束模式,还有登入/登出风暴等有影响力的事件都非常关键。

对一个工作负载进行特征化的时候,需要考虑三个基本的领域。第一是对环境本身的大小、范围和配置进行描述;第二是需要理解数据访问的频率和方法,也就是访问模式;第三就是根据时间的推移,时刻保持对负载类型的理解。

文件(NAS)和块(SAN)存储环境具有不同的特征,只有对这两种环境区别对待,才能够创建一个准确的工作负载模型。例如,在NAS环境之下,用户需要确定:客户端和服务器的有关数量;每个服务器上的客户端的数量;文件大小分布;子目录的分布和树的深度等等。

对于SAN环境来说,用户需要确定:物理启动器(HBA/NIC)的数量;每个物理启动器中虚拟启动器的平均数量;每个物理端口上活跃虚拟启动器的平均数量;每个HBA上的逻辑单元数量,以及服务器HBA或iSCSI LUN上的队列深度设置等。

访问模式对于理解存储访问频率和访问方式来讲,同样非常重要,对不同的用户类型进行不同的考虑也非常重要。比如平均、峰值、特殊业务事件的工作负载等。对于文件和块存储来说,访问模式的正确表述同样有所不同。

NAS环境

在NAS环境之下,每个文件的信息都与文件、目录和计算机有关,这些数据包括:文件名称、存放位置、创建时间、最后写入时间、访问权限,以及备份状态等。这些数据被叫做元数据,通常会占用大量的数据访问命令和存储流量。

一些应用的访问模式中包含有90%以上的元数据,只剩不到10%的容量会被用于写和读。对于文件访问来说,理解每个命令所占的平均比率非常重要。一些免费的软件工具,比如Iometer(许多闪存厂商都用来测试IOPS)在文件存储环境中作用就不那么大了,因为Iometer不能对元数据命令进行建模。对这些元数据指令进行建模,可以帮助理解一个应用如何对存储架构造成压力,以及每个计算机上的工作流程,而不仅仅只是关注文件系统。

另外,测试还应该正确地反映数据的可压缩性、访问模式,以及可重复数据删除[注]的能力。为了更好地理解访问模式识别在环境中的操控能力,测试的内容必须把那些代表正在使用文件存储应用的数据类型囊括进来。

SAN环境

在SAN环境中,每个应用都要维护其自身的元数据。从存储流量的角度来看,元数据访问看起来就像应用访问,元数据区域通常是个热点区域,该区域的访问频率比应用数据的存储位置要高很多。

为了正确地对块数据进行表述,必须要了解的一点就是基本的命令结构、数据是被顺序访问还是随机访问、I/O大小,以及所存储数据的热点访问区域、可压缩性和可重复数据删除能力。上述因素对于闪存存储部署来讲非常关键。因为压缩和线内重复数据删除的能力,对于闪存存储是否可被采纳是基本的考虑因素。工作负载模型必须考虑这些技术类型(+微信关注网络世界),因为这些技术对性能有显著的影响。这是由于每个厂商对于上述功能的部署方式都有所不同。

最后,负载模式可以帮助用户确定哪些需求和负载会随着时间变动。为了建立一个真实的工作负载模型,理解以下特征会随着时间变化是至关重要的:比如每个NIC/HBA的IOPS、每个应用的IOPS、读写IOPS、元数据的IOPS、读写和总带宽、数据可压缩性和打开文件的数量等都是关键的指标。

现在市场上也有一些产品和厂商供应的工具来从存储中抽取上述的关键信息,也有一些是根据网络流量的监测来获取以上信息。这些数据构成了创建一个真实表征工作负载模型的基石。

运行和分析工作负载模型

一旦用户创建好了一个准确代表工作负载的模型,下一个阶段就是明确需要评估的各个应用场景。第一步可以是直接比较运行在不同供应商或不同配置之下的相同工作负载。例如,大多数的混合云[注]存储系统允许用户将一定容量的闪存换成HDD硬盘。在运行中,通过一个负载生成设备,可以对一个5%闪存+95% HDD配置的环境和一个20%闪存+80% HDD配置的环境进行延迟和吞吐量的对比,这种对比往往会产生一些比较惊人的结果。

在决定评估哪种产品和配置之后,用户接下来就可以对比访问模式、负载模式和环境特征。例如,在登入/启动风暴时会对性能有什么影响?在日/月结束模式时会有什么情况发生?如果文件大小分配有变化了会发生什么?如果典型的块大小从4KB变为8KB了怎么办?元数据指令组合变得更加密集了会如何?以及高速缓存未命中会产生什么影响?等等以上的问题,用户都可以进行评估。

所有上述因素都可以在一个自动化的方法中去进行建模和仿真,这个方法中包括了对每种工作负载的IOPS、吞吐量和延迟的直接对比。利用这些信息,用户可以了解到可能对响应时间带来潜在影响的不同断裂点。

总结一下,在部署任何闪存系统之前,用户需要一种主动识别达到性能至高点的时机,以及如何去评估能够最佳迎合应用工作负载需求的技术选择。单纯地依靠厂商提供的标准,一般都不会太公正,因为他们无法确定闪存如何针对用户的具体应用进行最优化。工作负载模型,结合负载生成设备,从目前来讲,是帮助用户制定智慧的闪存投资策略的最为经济有效的方法之一。这种方法可以根据具体的性能需求来调整部署策略。(《网络世界》 柴莎莎编译,更多内容详见: http://www.cnw.com.cn/P/5901)

参考资料

1.混合云:(Hybrid cloud)由两个或更多云端系统组成云端基础设施,这些云端系统包含了私有云、社群云、公用云等。这些系统保有独立性,但是借由标准化或封闭式专属技术相互结合,确...详情>>

2.重复数据删除:是一种数据缩减技术,通常用于基于磁盘的备份系统,旨在减少存储系统中使用的存储容量。它的工作方式是在某个时间周期内查找不同文件中不同位置的重复可变大小数据块。重复...详情>>

[责任编辑:孙可 sun_ke@cnw.com.cn]