载入中…
公告栏:
当前位置: 中国商业智能网 >> 专家 >> 杜号权 >> 文章正文
朝着数据湖扩展的Hadoop
作者:中国商业智能网-杜号权    来源:本站原创    点击数:    时间:2015-6-9
【摘要】数据湖越来越成为Hadoop吸引力的一个方面。指在某些情况下作为一个“企业数据中心”,现在所吸引的不仅来自Hadoop的现有用户,而且有更广泛的潜在受益者。这种单一的综合数据池愿景,由Hadoop管理,而且根据不同的应用,如Spark,Storm,和 Hive的需要进行访问, 提供减少重复数据的机会,提高效率,并创建一个环境,让来自不同数据源的数据可以一起有意义进行分析。

数据湖越来越成为Hadoop吸引力的一个方面。指在某些情况下作为一个“企业数据中心”,现在所吸引的不仅来自Hadoop的现有用户,而且有更广泛的潜在受益者。这种单一的综合数据池愿景,由Hadoop管理,而且根据不同的应用,如Spark,Storm,和 Hive的需要进行访问, 提供减少重复数据的机会,提高效率,并创建一个环境,让来自不同数据源的数据可以一起有意义进行分析。

完全接受综合数据湖所能有的机会需要转变态度和谨慎与Hadoop经常增进,而不是取代的现有系统和工作流整合。现有的企业治理和安全的担忧当然不会消失,所以合适的工作流必须开发用于维护数据,同时使它可用于分析的新的可行形式。

早期采用者的行业已经设法利用他们的数据湖的潜能、用更多既定的批处理任务实施内部分析流程和整合丰富的实时分析。他们将Hadoop整合到现有的企业工作流并解决完整性,清洁,有效性方向的挑战,并保护他们的数据。

我们探索的一系列关键问题经常会标识为作为这些成功实现数据湖的重要意义。在这份报告中关键的发现包括:

 随着Hadoop继续超越其基于MapReduce的起源,可能作为多个应用程序和工作的数据源(一个数据湖)的潜力,越来越有说服力

 运行工作负载,是大多数大型企业的数据处理需求的一个重要方面的,对IT基础设施提出相比传统与Hadoop有关的分析批处理职责不同的需求。

 即使完全实现,基于Hadoop的数据湖是增强而不是替换现有的IT系统记录,如企业数据仓库

 >Hadoop的代码被硬化和增强,以应对越来越严格的安全、合规和审计功能相关的要求。所有这些领域的进展在商业采用之前就需要完成,尤其是在严格管制的行业,如金融和医疗保健,才能在重点工作负载上舒心部署Hadoop。

中国商业智能网(BI )

责任编辑:朱莉   
 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    ChinaBI版权、投稿与免责申明:
    1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明稿件来源:中国商业智能网,违者本网将依法追究责任。
    2)本网注明“本站来源处不写本站原创”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    最新热点
    最新推荐
    网站合作、内容监督、商务咨询、投诉建议 电话:0512-62861389  邮箱:chianbi@126.com
    Copyright 2004-2014 中国商业智能网版权所有   |    苏 ICP 备 13004727 号