e-works数字化企业网  »  文章频道  »  管理信息化  »  BI

数据仓库设计原则

2017/10/13    来源:中国商业智能网    作者:佚名      
关键字:数据仓库  数据仓库设计  
一个准确、有效、更具生产力的企业数据仓库―涉及到一个完善的设计原则。

    采取务实的态度部署一个完备的企业数据仓库―我的意思是一个准确、有效、更具生产力的企业数据仓库―涉及到一个完善的设计原则。这些原则具体到于每一个部门的参考架构;每一个都有具体的能力和服务于特定的功能。在这里,我想列出信息仓库层标准中央存储器(记录系统)的原则。

    信息仓库层被设计作为一种已在“上游”处理过的数据的标准数据存储器。它已经进行了清洗、转化和主数据处理,并在这里被合并成一个“记录系统”。数据标准化重构的原则是,将它从源系统单一视角中移出,放到整个企业的多角度中。数据建模是根据其“本质”而不是“使用”。

    这个流程的设计对数据加上一种严格的秩序以提升数据的完整性,并且保持高度的灵活性。数据被分散到单独的表中的方式对查询是一种挑战,但这不是它的主要目的。数据完整性和灵活性是主要目标,而且性能调整主要是朝向加载的速度而不是数据的访问的速度。

    1.数据完整性

    以积极的姿态来保护引用完整性和减少冗余实体或不一致的可能。

    2.可扩展性

    允许数据量的增加或已有信息的额外数据源,无论在主题区域(例如:发行者、同行)还是在核心概念上(如发行者、供应商)。

    3.灵活性

    允许额外数据源或现有源的变更,使设计不拘泥于一个给定的源或源的镜相。设计将主要考虑到再利用,然后是扩展,最后是对现有结构的修正。

    4.一致性

    采用数据仓库设计标准以促进数据仓库和ETL设计的效率。决策过程将会和数据建模工作和ETL的开发一样加快。

    5.效率

    关注三个方面的效率

    1)安装

    可重复使用的数据设计的模式将最大限度地减少数据建模和ETL的工作量。

    2)操作

    保持最小的数据组和保持一致的标准以便维护易于进行,运用逻辑结构以方便导航和使用。

    3)加载性能

    优先考虑ETL加载流程的性能;包括那些使用记录系统作为一种源加载数据集市的部分。

    6.从企业的角度

    为所有的数据对象、保留和维持对各种实体间已有的和潜在的关系的开放,以确保数据反映了整个企业,而不是不限于任何特定的项目需求。

    这些基本原则通过影响存储历史、层次结构、标准化程度、分类、代理键和许多其他方面的设计的策略进行实施。设计原则是判断在一个特定的情况中采取的最好方法的标准。它并不总是直截了当的,就算有适当的原则,有时候也会对多项原则有所侧重(例如,侧重灵活性多于加载性能),但以上列项提供了对数据仓库设计方法的指导。

    正如之前所建议的那样,我不提倡盲目符合一套规则,但是,在我的经验中,高效开发的一个最大的障碍是决策过程。用智慧设计原则来减少讨论的参数可使决策过程更快更正确。

责任编辑:程玥
本文来源于互联网,e-works本着传播知识、有益学习和研究的目的进行的转载,为网友免费提供,并以尽力标明作者与出处,如有著作权人或出版方提出异议,本站将立即删除。如果您对文章转载有任何疑问请告之我们,以便我们及时纠正。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。
e-works
官方微信
掌上
信息化
编辑推荐
新闻推荐
博客推荐
视频推荐