SAS - 卡方

卡方检验用于检查两个分类变量之间的关联。 它可用于测试变量之间的依赖程度和独立程度。 SAS 使用 PROC FREQ 和选项 chisq 来确定卡方检验的结果。

语法

在 SAS 中应用 PROC FREQ 进行卡方检验的基本语法是 −

PROC FREQ DATA = dataset;
TABLES variables 
/CHISQ TESTP = (percentage values);

以下是使用的参数说明 −

  • Dataset 是数据集的名称。

  • Variables 是卡方检验中使用的数据集的变量名称。

  • Percentage Values TESTP 语句中的代表变量水平的百分比。

示例

在下面的示例中,我们考虑对数据集 SASHELP.CARS. 中名为 type 的变量进行卡方检验。该变量有六个级别,我们根据测试设计为每个级别分配百分比。

proc freq data = sashelp.cars;
tables type 
/chisq 
testp = (0.20 0.12 0.18 0.10 0.25 0.15);
run;

当上面的代码执行时,我们得到如下结果 −

chi_square_1

我们还得到了显示变量类型偏差的条形图,如下面的屏幕截图所示。

chi_square_2

双向卡方

当我们将测试应用于数据集的两个变量时,使用两种方式卡方检验。

示例

在下面的示例中,我们对名为 type 和 origin 的两个变量应用卡方检验。 结果显示了这两个变量的所有组合的表格形式。

proc freq data = sashelp.cars;
tables type*origin 
/chisq 
;
run;

当上面的代码执行时,我们得到如下结果 −

chi_square_3