数据仓库的数据建模
数据建模是指在数据仓库平台内处理和设计数据模型的过程。它包括制定适当的数据库模式,以便传输可存储且对用户有用的数据。使用数据仓库建模有两个原因,首先,仓库数据中的关系可以通过模式可视化;其次,借助精心设计的模式可以降低成本并提高效率,从而实现有效的数据仓库结构。数据仓库中的数据建模与操作数据库系统中的数据建模不同。因此,它可以有效地处理复杂的查询
数据建模生命周期
在此生命周期中,我们将看到将业务需求转换为实现在 IT 系统内处理数据的目标的逐步过程。目的是为业务创建一个存储区域,逻辑和物理数据建模有助于实现该存储区域。数据建模生命周期中使用的三个步骤如下 -
概念数据模型
概念数据模型是指关系的有组织的视图,即在实体之间找到最高级别的关系。目的是建立实体及其之间的关系。
概念数据模型的特点 −
仅显示实体及其关系等数据
实际数据库中几乎不存在其他数据。
未指定任何属性和主键。
主要用于商业受众。
逻辑数据模型
它以结构形式显示信息,但不知道它们的物理外观。主要目的是通过使用业务数据结构、流程和关系来创建单一视图。
逻辑数据模型的特征 −
每个实体都有属性。
实体与关系一起存在。
存在关键和非关键属性。
属性名称对用户友好。
比概念数据模型更详细。
存在主键和外键关系。
FK 关系(指定了引用完整性)。
物理数据模型
它指的是数据库结构的可视化,即在复制表结构、列、数据类型、键、约束和关系后,模型在数据库中的外观表之间的关系。其主要目的是在数据仓库托管的关系数据库系统的物理结构中显示逻辑数据模型。它还使用新的数据结构提高了查询性能。
物理数据模型的特征 −
实体和属性分别称为表和列。
数据类型、长度和值对于列必须是准确的。
主键和外键用于定义表之间的关系。
所有表和列的规范。
结论
本文包括数据仓库中的数据建模,用于处理和设计数据仓库中的数据模型。模式用于可视化关系并提高效率,从而降低成本。数据建模生命周期由三部分组成。首先是概念数据模型,它指的是组织关系视图。第二种是逻辑数据模型,它创建单一视图和结构信息,但没有物理外观。第三种是物理数据模型,它将逻辑数据模型可视化为物理数据模型,从而提高查询性能。