数据分析 - 概述
数据分析是检查、清理、转换和建模数据的过程,目的是发现有用的信息、提出结论并支持决策制定。
数据分析类型
存在多种数据分析技术,涵盖商业、科学、社会科学等各个领域,名称各不相同。 主要的数据分析方法是 −
- 数据挖掘
- 商业智能
- 统计分析
- 预测分析
- 文本分析
数据挖掘
数据挖掘是对大量数据的分析,以提取以前未知的、有趣的数据模式、异常数据和相关性。 请注意,目标是从大量数据中提取模式和知识,而不是提取数据本身。
数据挖掘分析涉及人工智能、机器学习、统计学和数据库系统交叉领域的计算机科学方法。
从数据挖掘中获得的模式可以被视为输入数据的总结,可用于进一步分析或决策支持系统获得更准确的预测结果。
商业智能
商业智能技术和工具用于获取和转换大量非结构化业务数据,以帮助识别、开发和创造新的战略业务机会。
商业智能的目标是让人们能够轻松解读大量数据,从而发现新的商机。 它有助于根据可以为企业提供竞争性市场优势和长期稳定性的洞察力实施有效战略。
统计分析
统计学是对数据的收集、分析、解释、呈现和组织的研究。
在数据分析中,主要使用两种统计方法 −
描述性统计 − 在描述性统计中,来自整个总体或样本的数据用数值描述符(例如 −
连续数据的均值、标准差
分类数据的频率、百分比
推断统计 − 它使用样本数据中的模式来推断所代表的总体或说明随机性。 这些推论可以是 −
回答有关数据的是/否问题(假设检验)
估计数据的数值特征(估计)
描述数据内的关联(相关性)
对数据内的关系建模(例如回归分析)
预测分析
预测分析使用统计模型来分析当前和历史数据,以预测(预测)未来或其他未知事件。 在业务中,预测分析用于识别有助于决策的风险和机会。
文本分析
文本分析,也称为文本挖掘或文本数据挖掘,是从文本中获取高质量信息的过程。 文本挖掘通常涉及结构化输入文本、使用统计模式学习等方法在结构化数据中导出模式以及最终对输出进行评估和解释的过程。
数据分析过程<
数据分析在1961年被统计学家John Tukey定义为 "分析数据的程序、解释此类程序结果的技术、计划收集数据以使其分析更容易、更精确或更准确的方法,以及适用于分析数据的(数学)统计的所有机制和结果。"
因此,数据分析是从各种来源获取大量非结构化数据并将其转换为对我们有用的信息的过程 −
- 回答问题
- 检验假设
- 决策制定
- 推翻理论
用Excel进行数据分析
Microsoft Excel 提供了多种方法来分析和解释数据。 数据可以来自各种来源。 可以通过多种方式转换和格式化数据。 可以使用相关的 Excel 命令、函数和工具对其进行分析 - 包括条件格式、范围、表格、文本函数、日期函数、时间函数、财务函数、小计、快速分析、公式审计、查询工具、假设分析、 求解器、数据模型、PowerPivot、PowerView、PowerMap 等
您将在两部分中学习这些使用 Excel 的数据分析技术 −
- 使用 Excel 进行数据分析
- 使用 Excel 进行高级数据分析