载入中…
公告栏:
当前位置: 中国商业智能网 >> CIO >> 数据仓库 >> 文章正文
数据仓库设计原则
作者:中国商业智能网    来源:本站原创    点击数:    时间:2012-5-10
【摘要】采取务实的态度部署一个完备的企业数据仓库 ― 我的意思是一个准确、有效、更具生产力的企业数据仓库 ― 涉及到一个完善的设计原则。这些原则具体到于每一个部门的参考架构;每一个都有具体的能力和服务于特定的功能。在这里,我想列出信息仓库层标准中央存储器(记录系统)的原则。
无标题文档

采取务实的态度部署一个完备的企业数据仓库 ― 我的意思是一个准确、有效、更具生产力的企业数据仓库 ― 涉及到一个完善的设计原则。这些原则具体到于每一个部门的参考架构;每一个都有具体的能力和服务于特定的功能。在这里,我想列出信息仓库层标准中央存储器(记录系统)的原则。

信息仓库层被设计作为一种已在“上游”处理过的数据的标准数据存储器。它已经进行了清洗、转化和主数据处理,并在这里被合并成一个“记录系统”。数据标准化重构的原则是,将它从源系统单一视角中移出,放到整个企业的多角度中。数据建模是根据其“本质”而不是“使用”。

这个流程的设计对数据加上一种严格的秩序以提升数据的完整性,并且保持高度的灵活性。数据被分散到单独的表中的方式对查询是一种挑战,但这不是它的主要目的。数据完整性和灵活性是主要目标,而且性能调整主要是朝向加载的速度而不是数据的访问的速度。

1. 数据完整性

以积极的姿态来保护引用完整性和减少冗余实体或不一致的可能。

2.可扩展性

允许数据量的增加或已有信息的额外数据源,无论在主题区域 (例如:发行者、同行)还是在核心概念上(如发行者、供应商)。

3.灵活性

允许额外数据源或现有源的变更,使设计不拘泥于一个给定的源或源的镜相。设计将主要考虑到再利用,然后是扩展 ,最后是对现有结构的修正。

4.一致性

采用数据仓库设计标准以促进数据仓库和ETL设计的效率。决策过程将会和数据建模工作和ETL的开发一样加快。

5.效率

关注三个方面的效率

1.安装

可重复使用的数据设计的模式将最大限度地减少数据建模和ETL的工作量。

2.操作

保持最小的数据组和保持一致的标准以便维护易于进行,运用逻辑结构以方便导航和使用。

3.加载性能

优先考虑ETL加载流程的性能;包括那些使用记录系统作为一种源加载数据集市的部分。

6.从企业的角度

为所有的数据对象、保留和维持对各种实体间已有的和潜在的关系的开放,以确保数据反映了整个企业,而不是不限于任何特定的项目需求。

这些基本原则通过影响存储历史、层次结构、标准化程度、分类、代理键和许多其他方面的设计的策略进行实施。设计原则是判断在一个特定的情况中采取的最好方法的标准。它并不总是直截了当的,就算有适当的原则,有时候也会对多项原则有所侧重(例如, 侧重灵活性多于加载性能),但以上列项提供了对数据仓库设计方法的指导。

正如之前所建议的那样,我不提倡盲目符合一套规则,但是,在我的经验中,高效开发的一个最大的障碍是决策过程。用智慧设计原则来减少讨论的参数可使决策过程更快更正确。

 

责任编辑:朱莉   
 
  • 上一篇文章:

  • 下一篇文章:
  • 发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
    ChinaBI版权、投稿与免责申明:
    1)凡本网署名文字、图片和音视频稿件,版权均属中国商业智能网所有。任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明稿件来源:中国商业智能网,违者本网将依法追究责任。
    2)本网注明“本站来源处不写本站原创”的文章均为转载稿,本网转载出于传递更多信息之目的。如本网转载稿涉及版权等问题,请作者速来电或来函与本网联系。
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    最新热点
    娱乐资讯
    最新推荐
    网站合作、内容监督、商务咨询、投诉建议 电话:0512-62861389  邮箱:chianbi@126.com
    Copyright 2004-2014 中国商业智能网版权所有   |    苏 ICP 备 13004727 号