您的位置: 网界网 > 周报全文 > 正文

[周报全文]大数据治理多管齐下

2012年04月22日 11:03:30 | 作者:网界网记者 于翔 | 来源:网界网 | 查看本文手机版

摘要:有关大数据的话题正在变得更大、更热,大数据的治理也演变出更多的技术维度,以应对来自现实环境的应用挑战。

标签
大数据治理

什么是大数据[注]?维基百科的定义是那些无法在一定时间内使用常规数据库管理工具对其内容进行抓取、管理和处理的数据集。通常来说,大数据具备大数据量、多结构化、增长速度快和价值密度低的特点,这为大数据的治理带来了诸多挑战。

“现实的情况是,当企业用户希望对大数据加以利用时,他们发现大数据在捕获、组织、提取、分析和决策等环节都存在着现实的挑战。”近日甲骨文公司副总裁及大中华区技术总经理喻思成在接受记者采访时总结道。

以大数据的捕获为例,企业不仅需要处理大数据量的低密度信息,还需要频繁更改应用程序,以及实施横向扩展,以满足急剧扩张的部署计划。针对这些数据捕获需求,甲骨文正通过Oracle NoSQL数据库向用户交付分布式、高度可扩展数据采集的能力。喻思成表示,Oracle NoSQL数据库帮助企业存取非结构化数据,并可横向扩展至数百个高可用性节点,同时还支持广泛的工作负载。

大数据组织方面,企业要在现有数据仓库之上对大数据进行分析,同时还不允许对数据仓库的SLA(服务水平协议)产生负面影响。针对此情况,甲骨文开发出了分析沙盒。通过它,企业可以获得分析工作区,控制对资源和数据的访问(+微信关注网络世界),同时不会对生产系统产生影响。

为了满足企业用户避免编写大量Hadoop代码、数据快速载入Oracle数据仓库的需求,甲骨文在其集成系统Oracle大数据机中提供了Oracle数据集成Hadoop应用适配器、Oracle Hadoop装载器、Oracle Direct Connector。“这些工具降低了Hadoop的应用复杂度,还支持从Oracle数据库直接访问Hadoop分布式文件系统上的数据。”喻思成说。

另外,在大数据的分析与决策方面,甲骨文还为用户提供企业级的R语言分析工具和集成化的大数据分析设备。其中,Oracle R Enterprise实现了R开源统计环境与Oracle数据库11g的集成,分析师和统计人员可以运行现有的R应用,并利用R客户端直接处理Oracle数据库11g中的数据。Oracle Exalytics商务智能云服务器则提供了新型分析应用,能够存取和分析来自多种关系型、OLAP或非结构化数据源的数据。

参考资料

1.大数据:(Big Data),研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 ...详情>>

[责任编辑:孙可 sun_ke@cnw.com.cn]