数据仓库之数据模型-k6k4.com

关于数据仓库的概念，这里不再累赘。先看下面的图（数据仓库建设的7个主要环节）：

本文，主要针对第三块数据仓库模型设计来讨论交流，尤其是互联网行业。

一、关于数据仓库数据模型

1. 数据仓库数据模型是指使用实体、属性及其关系对企业运营和逻辑规则进行统一的定义、编码和命名；是业务人员和开发人员之间沟通的一套语言。

2. 数据仓库数据模型的作用：

统一企业的数据视图；
定义业务部门对于数据信息的需求；
是构建数据仓库原子层的基础；
支持数据仓库的发展规划；
初始化业务数据的归属；

3. 数据仓库数据模型与业务系统数据模型设计的区别：

4. 数据仓库数据模型设计的先后次序

概念模型设计（业务模型）：界定系统边界；确定主要的主题域及其内容；
逻辑模型设计：维度建模方法（事实表、维度表）；以星型和雪花型来组织数据；
物理模型设计：将数据仓库的逻辑模型物理化到数据库的过程；

二、关于维度模型和关系模型

关系建模又叫ER建模，是数据仓库之父Inmon推崇的，其从全企业的高度设计一个3NF模型的方法，用实体加关系描述的数据模型描述企业业务架构，在范式理论上符合3NF，其是站在企业角度进行面向主题的抽象，而不是针对某个具体业务流程的，它更多是面向数据的整合和一致性治理，正如Inmon所希望达到的“single version of the truth”。