您的位置: 网界网 > 周报全文 > 正文

[周报全文]OLAP立方体开始瓦解

2008年07月16日 16:26:37 | 作者:CNW.com.cn | 来源: | 查看本文手机版

摘要:BI(商业智能)实际上是构建回答业务问题模型的最佳实践集合。然而,今天的BI最佳实践可能并不最适合许多企业的决策支持需求。

标签
BI
商业智能
OLAP
在线分析处理

BI商业智能)实际上是构建回答业务问题模型的最佳实践集合。然而,今天的BI最佳实践可能并不最适合许多企业的决策支持需求。

【CNW.com.cn 专稿】对大多数用户而言,BI是其他人预先确定和计划的旅程,遵循标记清楚的路线穿越海量的数据集合。通常情况下,必须由专家预先构建的数据模型产生或创建对查询、报告和仪表盘等关键BI元素的设计。实际上,每个BI应用是数据建模者对用户希望询问有关基础数据集市问题类型的预测。有时,这些预测仅仅是根据事实或经验所做出的猜测,并不总是十分准确。

BI最普遍的数据建模方式,是所谓的“立方体”在线分析处理OLAP)结构。OLAP立方体实际上是非正规化的关系型数据库,它处在大多数BI数据集市的中心。通常以多维“星型”或“雪花型”模型实现的OLAP立方体,使得庞大的记录集合可以被迅速、高效地概括、分类、查询和分析。

但无论哪个立方体内的立体数据模型设计得有多好,用户都最终将突破这些限制,需要以没有构建在基础数据结构中的新方式,下钻、上钻和横钻表格记录集合。

多维OLAP立方体的主要缺点是它们不够灵活。立方体是通过预先将关系型数据表连接构成固定、特定主题的结构来构建的。绕过这些限制的途径之一是所谓的关系型OLAP方式。这种方式在保持基础的、正规化的关系存储方式的同时,通过“预测”加快多维查询的访问速度。但是,关系型OLAP也受到对存在于基础表格数据结构之内和之间关系的、显式的、预先建模的限制。

从一般用户观点看来,所有这些都只是“地下管线”,不可见而且乏味。OLAP立方体缺乏灵活性的一个不幸的结果是,对新BI应用的要求不可避免地导致IT项目的大量积压,而这些项目可能需要数周或数月的时间来完成。

那些在用户看来无足轻重的工作,例如向已有报告添加一个新的域或新的计算,对数据建模专业人员而言,可能意味着一次耗费时间的工作。在幕后,这种简单的决策支持请求可能还会超出前端BI小改动的范畴,需要对数据集市的OLAP星型模型重新建模,重新索引数据仓库,修改ETL(抽取/转换/装载)脚本,以及从不同的事务处理应用中检索数据。

没有人预测OLAP立方体会完全从BI世界中消失,但是在过去几年间,它在许多决策支持环境中的作用每况愈下,厂商越来越强调新的实现方式。当在范围更大的背景中进行分析时(+本站微信networkworldweixin),这些新方式似乎在放松OLAP对主流BI和数据仓库技术的控制。

但不幸的是,这些新的决定支持范例还没有言简意赅的名称或一致的最佳实践。如果我们把它叫做“后OLAP”范例(具体如色块内文所示),这将给人们造成一种OLAP立方体已经过时的虚假印象。而事实上,它们才刚刚被虚拟化和嵌入在更为灵活的Web 2.0SOA框架中。我们可以把它称为新“超立方体”范例,但这也可能造成我们中间的数学纯粹主义者的消化不良。

无论我们选择该如何称呼这个新的时代,环顾四周,新时代的确已经到来了。但到目前为止,没有几家企业将这些“后OLAP”方式组合在一个一致的BI架构框架中。但毫无疑问,这一天正在迅速降临到主流的BI和数据仓库环境之中。OLAP僵硬的、基于立方体的方式正在这个更灵活、以用户为中心的决策支持新时代中缓慢而稳步地消融。(美国《Network World》供本报专稿)

相关链接

OLAP实现方式

即兴、灵活、多维、用户驱动的决策支持新兴范例包含以下重要的实现方法:

■ 通过无处不在的元数据层自动发现和正规化分散的、异构的数据集合。

■ 语义学虚拟化中间件。这种中间件支持对来自异构、分散数据源的数据按需的、逻辑上集成的查看和查询,不需要数据仓库或任何其他集中式的存留(persistence)节点。

■ 即时创建报告、查询和仪表盘。这种创建依赖于动态汇集数据,组织相关数据层次中的数据,以及对一直根据用户或会话环境来定制指标的表达。

■ 交互式数据可视化工具。这类工具使对异构数据集合的、完全天然维度的、用户驱动的探测成为可能,从而消除了对手工数据建模和将数据转换为通用模型的需要。

■ 制导分析工具。这类工具支持用户驱动的、即兴创建包括用于可定制决策支持场景的数据、可视化和导航模型的可共享、扩展的模型。

■ 反向索引存储引擎。这种引擎支持更灵活、即时的组装结构化数据来响应即兴查询。而这种组装是利用传统的、基于行或列的数据仓库存留层不可能实现的。

■ 分布式的内存处理。这种处理使实时提取由起源于众多、分散数据源中的数百万行数据的情报成为可能。

[责任编辑:程永来 cheng_yonglai@cnw.com.cn]