数据仓库 - 系统管理器
系统管理对于数据仓库的成功实施是必需的。 最重要的系统管理器是 −
- 系统配置管理器
- 系统调度管理器
- 系统事件管理器
- 系统数据库管理器
- 系统备份恢复管理器
系统配置管理器
系统配置经理负责数据仓库的设置和配置的管理。
配置管理器的结构因操作系统而异。
在 Unix 配置结构中,管理器因供应商而异。
配置管理器具有单一用户界面。
配置管理器的界面允许我们控制系统的各个方面。
注意 − 最重要的配置工具是 I/O 管理器。
系统调度管理器
系统调度经理负责数据仓库的成功实施。 其目的是安排临时查询。 每个操作系统都有自己的调度程序和某种形式的批处理控制机制。 系统调度管理器必须具备的功能列表如下 −
- 跨集群或 MPP 边界工作
- 处理国际时差
- 处理作业失败
- 处理多个查询
- 支持工作优先事项
- 重新启动或重新排队失败的作业
- 作业完成时通知用户或流程
- 在系统中断期间维护作业计划
- 将作业重新排队到其他队列
- 支持队列的停止和启动
- 记录排队作业
- 处理队列间处理
注意 − 上面的列表可以作为评价一个好的调度器的评价参数。
调度程序必须能够处理的一些重要工作如下 −
- 每日和临时查询调度
- 执行定期报告要求
- 数据加载
- 数据处理
- 创建索引
- 备份
- 聚合创建
- 数据转换
注意 − 如果数据仓库运行在集群或MPP架构上,那么系统调度管理器必须能够跨架构运行。
系统事件管理器
事件管理器是一种软件。 事件管理器管理数据仓库系统上定义的事件。 由于数据仓库的结构非常复杂,我们无法手动管理数据仓库。 因此我们需要一个能够自动处理所有事件而无需用户干预的工具。
注意 − 事件管理器监视事件的发生并处理它们。 事件管理器还跟踪这个复杂的数据仓库系统中可能出现的各种问题。
事件
事件是由用户或系统本身生成的操作。 可能会注意到,事件是定义操作的可测量、可观察的发生。
下面给出了需要跟踪的常见事件的列表。
- 硬件故障
- 某些关键磁盘上的空间不足
- 进程死亡
- 返回错误的进程
- CPU 使用率超过 805 阈值
- 数据库序列化点的内部争用
- 缓冲区缓存命中率超出或低于阈值
- 表格达到其最大尺寸
- 内存交换过多
- 由于空间不足,表格无法扩展
- 磁盘存在 I/O 瓶颈
- 临时或排序区域的使用量达到特定阈值
- 任何其他数据库共享内存使用情况
事件最重要的是它们应该能够自行执行。 事件包定义预定义事件的过程。 与每个事件关联的代码称为事件处理程序。 每当事件发生时就会执行此代码。
系统和数据库管理器
系统和数据库管理器可能是两个独立的软件,但它们执行相同的工作。 这些工具的目标是自动化某些流程并简化其他流程的执行。 选择系统和数据库管理器的标准如下 −
- 增加用户配额。
- 为用户分配和取消分配角色
- 为用户分配和取消分配配置文件
- 执行数据库空间管理
- 监控并报告空间使用情况
- 整理碎片和未使用的空间
- 添加并扩展空间
- 添加和删除用户
- 管理用户密码
- 管理摘要表或临时表
- 为用户分配或取消分配临时空间
- 回收旧的或过时的临时表的空间
- 管理错误和跟踪日志
- 浏览日志和跟踪文件
- 重定向错误或跟踪信息
- 打开和关闭错误和跟踪日志记录
- 执行系统空间管理
- 监控并报告空间使用情况
- 清理旧的和未使用的文件目录
- 添加或扩展空间。
系统备份恢复管理器
备份恢复工具方便运营和管理人员备份数据。 请注意,系统备份管理器必须与所使用的计划管理器软件集成。 备份管理所需的重要功能如下 −
- 调度
- 备份数据跟踪
- 数据库意识
进行备份只是为了防止数据丢失。 以下是需要记住的要点 −
备份软件将保留某种形式的数据库,记录备份数据的位置和时间。
备份恢复管理器必须有一个良好的数据库前端。
备份恢复软件应该能够识别数据库。
了解数据库后,软件就可以用数据库术语进行处理,并且不会执行不可行的备份。