本文将介绍“卡方检验”的主要应用和具体统计结果的选择原则。
先从遇到的临床问题说起。有不少临床医生问及这个问题:想分析两个不同的患者群体中,某病毒感染率的区别,能做吗?两组的感染率只有两个数值,怎么比较有没有统计学差异呢?
答案是肯定的。虽然是比较两个率,但是原始数据呢?原始数据肯定是群体1中有感染者n1人,有未感染者m1人,群体2中有感染者n2人,有未感染者m2人。这样大家都明白了,可以比较,所用方法是卡方检验。这是卡方检验最常见的用途:分析某无序分类变量(infection)各水平在两组或多组间的分布是否一致。以2×2四格表为例,数据视图如下:
首先在“数据”中选择“加权个案”。如果数据以单个样本的原始数据形式展现,而未进行计数,则无需加权,如下图:
然后按照下列操作进行分析:
接着点击“Statistics…”,选择“卡方”:
当两组总样本量<40时,需选择“精确”。本例中两组总样本量n=100,故无需选择此项。
得到结果如下:
结果中的第三个表格即为卡方检验结果,具体统计结果的选择原则:
1、对于2×2四格表
(1) 当两组总样本量n≥40,且所有单元格的期望计数(理论数,T)≥5时,选择Pearson卡方(第一行);若所得P≈0.05时,用Fisher精确检验(第四行)。
(2) 当n≥40但有1≤T≤5时,用连续校正。
(3) 当n<40或T<1时,用Fisher精确检验。
2、对于多行多列表,直接用Fisher精确检验。
此外,卡方检验还可用于分类变量间关联程度的测量、Kappa一致性检验和配对卡方检验以及分层卡方检验。卡方检验是一种用途很广的假设检验方法,统计分析常常用到。