数据仓库 - OLAP
联机分析处理服务器(OLAP)基于多维数据模型。 它允许经理和分析师通过快速、一致和交互式的信息访问来深入了解信息。 本章内容包括OLAP的类型、OLAP的操作、OLAP之间的区别以及统计数据库和OLTP。
OLAP 服务器的类型
我们有四种类型的 OLAP 服务器 −
- 关系型 OLAP (ROLAP)
- 多维 OLAP (MOLAP)
- 混合 OLAP (HOLAP)
- 专用 SQL 服务器
关系型OLAP
ROLAP服务器放置在关系型后端服务器和客户端前端工具之间。 为了存储和管理仓库数据,ROLAP 使用关系型或扩展关系型 DBMS。
ROLAP 包括以下内容 −
- 实现聚合导航逻辑。
- 针对每个 DBMS 后端进行优化。
- 其他工具和服务。
多维OLAP
MOLAP 使用基于数组的多维存储引擎来实现数据的多维视图。 对于多维数据存储,如果数据集稀疏,则存储利用率可能较低。 因此,许多MOLAP服务器使用两级数据存储表示来处理密集和稀疏数据集。
混合OLAP
混合 OLAP 是 ROLAP 和 MOLAP 的组合。 它提供了 ROLAP 更高的可扩展性和 MOLAP 更快的计算。 HOLAP 服务器允许存储大量数据的详细信息。 聚合单独存储在 MOLAP 存储中。
专用 SQL 服务器
专用 SQL 服务器为只读环境中星型和雪花模式的 SQL 查询提供高级查询语言和查询处理支持。
OLAP操作
由于 OLAP 服务器基于多维数据视图,因此我们将讨论多维数据中的 OLAP 操作。
这里是 OLAP 操作的列表 −
- 汇总
- 向下钻取
- 切片和切块
- 绕轴旋转
汇总
汇总可以通过以下任意一种方式对数据立方体进行聚合 −
- 通过爬升维度的概念层次结构
- 通过降维
下图说明了汇总的工作原理。
通过爬升维度位置的概念层次结构来执行汇总。
最初概念层次结构是 "国家》省份》城市》街道"。
汇总时,通过将位置层次结构从城市级别提升到国家/地区级别来聚合数据。
数据按城市而不是国家/地区分组。
执行汇总时,数据立方体中的一个或多个维度将被删除。
向下钻取
向下钻取是向上钻取的逆操作。 通过以下任一方式执行 −
- 通过逐步降低维度的概念层次结构
- 引入新维度。
下图说明了向下钻取的工作原理 −
向下钻取是通过逐步降低维度时间的概念层次结构来执行的。
最初,概念层次结构是"年》季度》月》日"。
向下钻取时,时间维度从季度级别下降到月份级别。
执行向下钻取时,会添加数据立方体中的一个或多个维度。
它将数据从不太详细的数据导航到非常详细的数据。
切片
切片操作从给定的多维数据集中选择一个特定维度并提供一个新的子多维数据集。 考虑下图,它显示了切片的工作原理。
此处使用条件 time ="Q1"对维度"time"执行切片。
它将通过选择一个或多个维度来形成一个新的子立方体。
骰子
Dice 从给定的多维数据集中选择两个或多个维度并提供一个新的子多维数据集。 请考虑下图,该图显示了骰子操作。
基于以下选择标准对立方体进行的骰子操作涉及三个维度。
- (location = "Toronto" or "Vancouver")
- (time = "Q1" or "Q2")
- (item =" Mobile" or "Modem")
枢轴
枢轴操作也称为旋转。 它在视图中旋转数据轴,以提供数据的替代表示。 请考虑下图,该图显示了透视操作。
OLAP 与 OLTP
Sr.No. | 数据仓库(OLAP) | 操作数据库 (OLTP) |
---|---|---|
1 | 涉及信息的历史处理。 | 涉及日常处理。 |
2 | OLAP 系统由高管、经理和分析师等知识工作者使用。 | OLTP 系统由文员、DBA 或数据库专业人员使用。 |
3 | 有助于分析业务。 | 对经营业务很有用。 |
4 | 它专注于信息输出。 | 它专注于数据输入。 |
5 | 基于星型模式、雪花型、模式和事实星座模式。 | 基于实体关系模型。 |
6 | 包含历史数据。 | 包含当前数据。 |
7 | 提供汇总和整合的数据。 | 提供原始且高度详细的数据。 |
8 | 提供数据的汇总和多维视图。 | 提供详细且平面的数据关系视图。 |
9 | 数量或用户数为数百。 | 用户数量以千为单位。 |
10 | 访问的记录数以百万计。 | 访问的记录数为数十。 |
11 | 数据库大小为 100 GB 到 1 TB | 数据库大小为 100 MB 到 1 GB。 |
12 | 高度灵活。 | 提供高性能。 |