数据挖掘 - 系统
有多种可用的数据挖掘系统。 数据挖掘系统可以集成以下技术 −
- 空间数据分析
- 信息检索
- 模式识别
- 图像分析
- 信号处理
- 计算机图形学
- 网络技术
- 商业
- 生物信息学
数据挖掘系统分类
数据挖掘系统可以根据以下标准进行分类 −
- 数据库技术
- 统计数据
- 机器学习
- 信息科学
- 可视化
- 其他学科
除此之外,数据挖掘系统还可以根据以下类型进行分类:(a) 挖掘的数据库、(b) 挖掘的知识、(c) 所使用的技术和 (d) 改编的应用程序。
根据挖掘的数据库进行分类
我们可以根据挖掘的数据库类型对数据挖掘系统进行分类。 数据库系统可以根据数据模型、数据类型等不同标准进行分类,数据挖掘系统也可以进行相应的分类。
例如,如果我们根据数据模型对数据库进行分类,那么我们可能会拥有关系型、事务型、对象关系型或数据仓库挖掘系统。
根据挖掘的知识类型进行分类
我们可以根据挖掘的知识类型对数据挖掘系统进行分类。 这意味着数据挖掘系统根据功能进行分类,例如 −
- 特征描述
- 关联和相关分析
- 分类
- 预测
- 异常值分析
- 演化分析
根据所使用的技术进行分类
我们可以根据所使用的技术类型对数据挖掘系统进行分类。 我们可以根据涉及的用户交互程度或所采用的分析方法来描述这些技术。
根据适配的应用进行分类
我们可以根据所适应的应用程序对数据挖掘系统进行分类。 这些应用如下 −
- 财务
- 电信
- DNA
- 股票市场
- 电子邮件
将数据挖掘系统与 DB/DW 系统集成
如果数据挖掘系统没有与数据库或数据仓库系统集成,那么就没有系统可以与之通信。 该方案称为非耦合方案。 在该方案中,主要重点是数据挖掘设计和开发高效且有效的算法来挖掘可用数据集。
整合方案列表如下 −
无耦合 − 在该方案中,数据挖掘系统不使用任何数据库或数据仓库功能。 它从特定来源获取数据并使用某些数据挖掘算法处理该数据。 数据挖掘结果存储在另一个文件中。
松耦合 − 在该方案中,数据挖掘系统可以使用数据库和数据仓库系统的一些功能。 它从这些系统管理的数据呼吸中获取数据,并对这些数据执行数据挖掘。 然后,它将挖掘结果存储在文件中或数据库或数据仓库中的指定位置。
半紧耦合 − 在该方案中,数据挖掘系统与数据库或数据仓库系统链接,除此之外,数据库中还可以提供一些数据挖掘原语的高效实现。
紧密耦合 − 在这种耦合方案中,数据挖掘系统平滑地集成到数据库或数据仓库系统中。 数据挖掘子系统被视为信息系统的一个功能组件。