分析软件测量数据
收集相关数据后,我们必须以适当的方式对其进行分析。选择分析技术时需要考虑三个主要事项。
- 数据的性质
- 实验的目的
- 设计注意事项
数据的性质
要分析数据,我们还必须查看数据所代表的较大总体以及该数据的分布。
抽样、总体和数据分布
抽样是从大量总体中选择一组数据的过程。样本统计数据描述并总结了从一组实验对象中获得的测量值。
总体参数表示如果测量所有可能的受试者,将获得的值。
总体或样本可以通过集中趋势度量(例如平均值、中位数和众数)和离散度量(例如方差和标准差)来描述。许多数据集呈正态分布,如下图所示。
如上所示,数据将均匀分布在平均值附近。这是正态分布的重要特征。
还存在其他分布,其中数据倾斜,因此平均值一侧的数据点多于另一侧。例如:如果大多数数据都位于均值的左侧,那么我们可以说分布向左倾斜。
实验的目的
通常,实验是按− 进行的
- 为了证实一个理论
- 为了探索一种关系
为了实现这些目标,目标应该以假设的形式正式表达出来,分析必须直接针对假设。
为了证实一个理论
调查必须旨在探索理论的真实性。该理论通常指出,使用某种方法、工具或技术会对受试者产生特定的影响,使其在某些方面优于其他方法、工具或技术。
需要考虑两种数据情况:正常数据和非正常数据。
如果数据来自正态分布,并且有两个组需要比较,则可以使用学生 t 检验进行分析。如果有两个以上的组需要比较,则可以使用称为 F 统计量的一般方差分析检验。
如果数据是非正态的,则可以使用 Kruskal-Wallis 检验对数据进行排序来分析数据。
探索关系
调查旨在确定描述一个或多个变量的数据点之间的关系。
有三种技术可以回答有关关系的问题:箱线图、散点图和相关性分析。
箱线图可以表示一组数据的范围摘要。
散点图表示两个变量之间的关系。
相关性分析使用统计方法来确认两个属性之间是否存在真正的关系。
对于正态分布的值,使用皮尔逊相关系数来检查两个变量是否高度相关。
对于非正态数据,对数据进行排序并使用斯皮尔曼等级相关系数作为关联度量。另一个非正态数据的度量是肯德尔稳健相关系数,它研究数据点对之间的关系并可以识别偏相关性。
如果排名包含大量并列值,则可以使用列联表上的卡方检验来测试变量之间的关联。同样,可以使用线性回归来生成方程来描述变量之间的关系。
对于两个以上的变量,可以使用多元回归。
设计注意事项
在选择分析技术时必须考虑调查的设计。同时,分析的复杂性会影响所选的设计。多组使用 F 统计量,而不是两组学生 T 检验。
对于具有两个以上因素的复杂因子设计,需要更复杂的关联和显著性检验。
统计技术可用于解释一组变量对其他变量的影响,或补偿时间或学习效应。