Excel 数据分析 - 流程

数据分析是一个收集、转换、清理和建模数据的过程,目的是发现所需的信息。 交流由此获得的结果,提出结论并支持决策制定。 数据可视化有时用于描绘数据,以便于发现数据中的有用模式。 术语数据建模和数据分析含义相同。

数据分析过程由以下几个阶段组成,这些阶段本质上是迭代的 −

  • 数据需求规范
  • 数据收集
  • 数据处理
  • 数据清理
  • 数据分析
  • 沟通
数据分析过程

数据需求规范

分析所需的数据基于问题或实验。 根据指导分析者的要求,确定作为分析输入的必要数据(例如,人口)。 可以指定和获取关于人口的特定变量(例如,年龄和收入)。 数据可以是数字的或分类的。


数据收集

数据收集是收集有关确定为数据要求的目标变量的信息的过程。 重点是确保准确和真实地收集数据。 数据收集确保收集的数据准确无误,从而使相关决策有效。 数据收集既提供了衡量基准,也提供了改进目标。

数据是从各种来源收集的,从组织数据库到网页信息。 这样获得的数据可能不是结构化的,可能包含不相关的信息。 因此,需要对收集到的数据进行数据处理和数据清洗。


数据处理

必须对收集到的数据进行处理或组织以供分析。 这包括根据相关分析工具的要求构建数据。 例如,数据可能必须放置在电子表格或统计应用程序中表格的行和列中。 可能必须创建数据模型。


数据清洗

经过处理和组织的数据可能不完整、包含重复项或包含错误。 数据清理是防止和纠正这些错误的过程。 有几种类型的数据清理取决于数据的类型。 例如,在清理财务数据时,可能会将某些总数与可靠的公布数字或定义的阈值进行比较。 同样,定量数据方法可用于随后将在分析中排除的异常值检测。


数据分析

经过处理、组织和清理的数据将为分析做好准备。 各种数据分析技术可用于根据需求理解、解释和得出结论。 数据可视化也可用于检查图形格式的数据,以获得有关数据中消息的更多见解。

相关性、回归分析等统计数据模型可用于识别数据变量之间的关系。 这些描述数据的模型有助于简化分析和传达结果。

该过程可能需要额外的数据清理或额外的数据收集,因此这些活动本质上是迭代的。


沟通

数据分析的结果将以用户要求的格式报告,以支持他们的决定和进一步的行动。 来自用户的反馈可能会导致额外的分析。

数据分析师可以选择数据可视化技术,例如表格和图表,这有助于向用户清晰有效地传达信息。 分析工具提供了在表格和图表中使用颜色代码和格式突出显示所需信息的便利。