载入中…
公告栏:
当前位置: 中国商业智能网 >> 资讯 >> BI资讯 >> 文章正文
看2012年大数据分析的趋势
作者:中国商业智能网    来源:本站原创    点击数:    时间:2012-3-30
【摘要】在过去的几年中,在大数据分析上的浓厚兴趣正在高涨,而它为企业的企业信息管理和决策提供了开创性的机会。

在过去的几年中,在大数据分析上的浓厚兴趣正在高涨,而它为企业的企业信息管理和决策提供了开创性的机会。大数据分析不再是尖端科技公司的一种专业解决方案,而是发展成为各种行业都可行的、经济有效地存储和分析大量数据的方式。但如何转化成对这些新技术的采用呢? 企业将如何在他们的现有商业智能BI)和数据仓库 (DW) 中融入大数据呢? 用户又该如何充分利用大数据所带来的优势呢?

什么是大数据?

像Apache Hadoop这样的大数据技术为在成百上千的网络计算机集群间的大规模、分布式数据存储和处理提供一种框架。总目标是在保持合理的处理时间的情况下,为大量的数据(TB/PB/EB字节) 提供一种可扩展的解决方案。这些系统非常有效地存储和分析大量的结构化和非结构化以及半结构化的数据,如文本、网络或应用程序日志,电子邮件,网页,文件,和图片。

企业中的大数据

企业正比以往任何时候都更多地在捕捉和数字化信息。据IDC称, 全世界在2010年产出了一ZB字节 (1,000,000,000,000GB字节) 的数据。 推动这样的数据爆炸的有五十多亿的手机, 每月300亿块共享在Facebook上的内容, 每月200亿的互联网搜索,数以百万计连接到手机、电能表、汽车、集装箱、零售包装以及更多上的网络化传感器。大数据是将所有这些数据转化为商业决策中可实施项目的一种平台。

进入大数据分析的障碍迅速地减少着。像亚马逊的Elastic MapReduce和微软Windows Azure的Hadoop分布这样的大数据云服务使得企业在无需投资前期基础设施的情况下加速了大数据项目,并使他们能对超规模的需求做出迅速反映。来自Cloudera这样的商业供应商的支持可以加速开发和从大数据项目中交付更多价值。绑定服务器选项,例如Oracle的大数据设备提供快速安装和向外扩展的解决方案。最后, 模块化数据中心设计正成为硬件管理的一种有效方式并能迅速向外扩展而且经济实惠。

企业可能从大数据分析中获得最大利用的部分包括:

1. 供应链、物流、制造 — 利用RFID传感器、手持式扫描仪和车载GPS车辆和货物跟踪、物流和制造生产提供的大量信息,为路径最佳化,节约成本和运营效率提供重要洞察力。

2. 在线服务和网络分析 — 网络公司发明的大数据处理特别用于在互联网的规模上处理信息。这些分析平台的实施现在对于小型的在线服务公司优于竞争者提供广告、客户智能、产能计划以及更多是可行的。那些不提供在线服务却有电子商务或其他在线形式的企业通过点击流,人口特性分析及其它高极分析来理解客户行为和购买模式而受益匪浅。

3. 金融服务 — 金融市场产生的大量的股票市场和银行交易数据,在各种其它用途之外,可以帮助企业使交易机会最大化或确定潜在的欺诈费用。新规定也要求更长期地保留详细的财务记录。

4. 能源和公用事业 — 智能仪表如“智能电网”和电子传感器连接到机械、石油管道和设备产生源源不断的数据,这些数据必须迅速地存储和分析,以便在潜在的问题引起昂贵甚至灾难性的失败之前发现并修复它们。

5. 媒体和通讯 — 世界各地不断增长地捕获流媒体、智能手机、平板电脑、浏览行为和短信,它们代表着用户行为和品味方面潜在的知识宝库。

6. 医疗保健和生命科学 — 电子病历系统可以说是世界上数据最为密集的系统,而使得所有这些数据有意义于为病人治疗提供选择并为临床研究分析数据,无论对患者个人还是公共卫生事业管理和政策都有极大的效果。

7. 零售和消费品 — 零售商可以分析大量的销售交易数据以挖掘用户行为模式并用社交网络的数据监测品牌意识和感情。

数据仓库整合

为有效运用这种新技术,弄清楚大数据的角色以及何时怎样与数据仓库环境中的其它组件相整合是很重要的。在大多数情况下,大数据并不能代替数据仓库。Hadoop的建立是为了快速和灵活性跨越巨大的通常是非结构化的数据集,但最好用于很简单的工作上,如排序、合计、转换和过滤。Hadoop也不用于管理模式结构、引用完整性或安全上。因此数据库管理系统仍然是整体解决方案构架的一个重要部分。那么,如何将大数据分析与现有的商业智能(BI)和和数据仓库(DW)投资相整合呢?

Hadoop为大数据存储和合计以及跨越传统ETL的现场分析和即时分析时业务规则的采用上提供适应性和稳健的解决方案。大数据处理结果自动化并载入数据仓库以进一步转移、整合和分析也很常见。这使得大数据可以与其它来源的数据进行整合并通过商业智能(BI)工具、仪表盘和报表让用户接触。从Hadoop中提取数据到数据仓库有几种选择。IBM、Informatica、微软、Oracle 和SAP 发布或公告了在Hadoop和关系型数据库管理系统之间的接口工具。

大数据的用户友好工具

像Apache Pig 和 Apache Hive这样的工具为直接针对储存在Hadoop中的数据运行的高极数据分析提供类似于SQL这样的框架

它能有效地定向,一次性分析,执行探索性数据挖掘或开发查询,可随后被自动化载入数据仓库。然而,这些工具需要专业技术而并没考虑到最终用户。

幸运的是,2012年会有一些令人兴奋的用户工具。Tableau对Hadoop报表的拖放支持目前处于测试阶段,微软最近宣布的Hive ODBC驱动器和Excel的Hive插件允许用户通过Excel 、PowerPivot和 Analysis Services访问Hadoop中的数据。允许最终用户在Hadoop中切片、切块和可视化数据的工具在未来几年中在企业大数据分析的兵器库中将成为日益重要的组成部分。

大数据的采用将继续受到自动化和数字化业务流程捕获的大的和/或快速增长的数据所推动。成功采用该技术需要在整个企业中将原始信息转变成可用的知识。为了实现这一目标,企业需要明智地将大数据与他们现有的信息管理系统进行整合,并利用好整合和分析工具的开发生态系统。随着大数据时代的步入,能够让这一技术服务于他们的企业更能发现显著的收益产出和成本节约的机会,从而超越竞争者而在下一个十年更好地把自己推向成功。

责任编辑:朱莉   
 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    ChinaBI版权、投稿与免责申明:
    1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明稿件来源:中国商业智能网,违者本网将依法追究责任。
    2)本网注明“本站来源处不写本站原创”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    最新热点
    娱乐资讯
    最新推荐
    网站合作、内容监督、商务咨询、投诉建议 电话:0512-62861389  邮箱:chianbi@126.com
    Copyright 2004-2014 中国商业智能网版权所有   |    苏 ICP 备 13004727 号