SPSS：卡方检验的实现过程及结果解读

2014/10/01来源：临床流行病学和循证医学评论949

本文将介绍“卡方检验”的主要应用和具体统计结果的选择原则。

先从遇到的临床问题说起。有不少临床医生问及这个问题：想分析两个不同的患者群体中，某病毒感染率的区别，能做吗?两组的感染率只有两个数值，怎么比较有没有统计学差异呢?

答案是肯定的。虽然是比较两个率，但是原始数据呢?原始数据肯定是群体1中有感染者n1人，有未感染者m1人，群体2中有感染者n2人，有未感染者m2人。这样大家都明白了，可以比较，所用方法是卡方检验。这是卡方检验最常见的用途：分析某无序分类变量(infection)各水平在两组或多组间的分布是否一致。以2×2四格表为例，数据视图如下：

SPSS：卡方检验的实现过程及结果解读-图片1

　　首先在“数据”中选择“加权个案”。如果数据以单个样本的原始数据形式展现，而未进行计数，则无需加权，如下图：

SPSS：卡方检验的实现过程及结果解读-图片2

　　然后按照下列操作进行分析：

SPSS：卡方检验的实现过程及结果解读-图片3

　　接着点击“Statistics…”，选择“卡方”：

SPSS：卡方检验的实现过程及结果解读-图片4

　　当两组总样本量<40时，需选择“精确”。本例中两组总样本量n=100，故无需选择此项。

SPSS：卡方检验的实现过程及结果解读-图片5

　　得到结果如下：

SPSS：卡方检验的实现过程及结果解读-图片6

　　结果中的第三个表格即为卡方检验结果，具体统计结果的选择原则：

1、对于2×2四格表

(1) 当两组总样本量n≥40,且所有单元格的期望计数(理论数，T)≥5时，选择Pearson卡方(第一行);若所得P≈0.05时，用Fisher精确检验(第四行)。

(2) 当n≥40但有1≤T≤5时，用连续校正。

(3) 当n<40或T<1时，用Fisher精确检验。

2、对于多行多列表，直接用Fisher精确检验。

此外，卡方检验还可用于分类变量间关联程度的测量、Kappa一致性检验和配对卡方检验以及分层卡方检验。卡方检验是一种用途很广的假设检验方法，统计分析常常用到。

发表评论