利用SPSS进行一致性检验并计算Kappa值

2014/12/13评论976

研究问题为：探讨两位警察对受试者行为判断的一致性，受试者行为的判定结果为“正常”或“可疑”。采用Cohen's kappa系数分析。

一、问题与数据

通过分析受试者进入超市后的行为，判断其是否存在盗窃嫌疑是警察的基本技能。现某研究者拟分析不同警察判断的一致性，随机抽取100段超市录像，每段分别记录1位受试者从进入超市到离开超市的全过程，再分别请两位警察观看这些录像，判断受试者的行为是“正常”(编码1)还是“可疑”(编码2)。这两位警察观看的是同一组录像，编号统一，部分研究数据如下：

利用SPSS进行一致性检验并计算Kappa值-图片1

　　二、问题的分析

在本研究中，研究者拟探讨两位警察对受试者行为判断的一致性，我们推荐使用 Cohen's kappa系数分析。一般来说，采用Cohen's kappa系数的研究设计需要满足以下5项假设：

假设1：判定结果是分类变量且互斥。如本研究中受试者行为的判定结果为“正常”或“可疑”，属于分类变量，并且相互排斥。

假设2：要求进行观测变量配对，即不同观测者判定的对象相同。如本研究中，两位警察观看的是同一组录像，编号统一。

假设3：每个观察对象可能被判定的结果种类相同。如本研究中每位受试者的行为都可能被判定为“正常”或“可疑”。

假设4：观测者之间相互独立。这要求不同观测者独立完成结果判定，相互不干扰。

假设5：由固定的两位观测者完成所有判定。如本研究中由两位警察分别观看100段录像，中途不换人。

根据研究设计，我们认为本研究符合Cohen's kappa系数的5项假设，可以采用该分析方法进行一致性评价。

三、SPSS操作

1. 在主菜单点击Analyze→DescriptiveStatistics→Crosstabs

利用SPSS进行一致性检验并计算Kappa值-图片2

　　出现下图：

利用SPSS进行一致性检验并计算Kappa值-图片3

　　2. 分别将Officer1和Officer2变量放入Row(s)和Column(s)栏

利用SPSS进行一致性检验并计算Kappa值-图片4

　　3. 点击Statistics

利用SPSS进行一致性检验并计算Kappa值-图片5

　　4. 点选Kappa

利用SPSS进行一致性检验并计算Kappa值-图片6

　　5. 点击Continue→Cells

利用SPSS进行一致性检验并计算Kappa值-图片7

　　6. 点击Observed→Continue→OK

注释：如果大家想要得到频率的预测值，可以点击Counts栏中的Expected;若大家还想得到百分比值，可以点击Percentages栏中的Row、Column和Total

利用SPSS进行一致性检验并计算Kappa值-图片8

　　四、结果解释

1. 一般结果

在分析Cohen's kappa系数之前，我们有必要了解一下研究数据的基本情况，如下：

利用SPSS进行一致性检验并计算Kappa值-图片9

　　从上表可以看出，本研究共有100对有效数据(Valid栏)，没有缺失(Missing栏)，总数据为100例(Total栏)。Officer1和Officer2的交叉表，如下：

利用SPSS进行一致性检验并计算Kappa值-图片10

　　SPSS根据数据录入情况，分别输出Officer1和Officer2认为“正常”和“可疑”的数量。其中，左上和右下的数据是经Officer1和Officer2判断一致的，如下标黄的部分：

利用SPSS进行一致性检验并计算Kappa值-图片11

　　从上表可以看出，两位警察都认为其中85位受试者行为“正常”，7位受试者行为“可疑”，即这两位警察在92位受试者的行为上判断一致。从另一个角度来说，Officer1认为87位受试者行为“正常”，而Officer2认为91位受试者行为“正常”，如下标黄部分：

利用SPSS进行一致性检验并计算Kappa值-图片12

　　同理，这个表也输出了Officer1和Officer2判断不一致的数据，如下标黄部分：

利用SPSS进行一致性检验并计算Kappa值-图片13

　　从上表可知，在本研究中，两位警察对6 2=8为受试者的行为判断不一致。根据这些数据，我们可知Officer1和Officer2在对92÷100×100%=92%的受试者行为判断上一致。但是这种一致率没有考虑机遇因素的影响，我们还要依据Cohen's kappa系数具体分析。

2. Cohen's kappa系数

与直接计算的一致率不同的是，Cohen's kappa系数考虑了机遇一致率对结果的影响。具体来说，在本研究中即使两位警察并不依据专业经验，而是随意评价受试者的行为，他们也会在对一些判断上出现一致结果。但是，这些由于机遇因素导致的一致结果并不是我们想要的，会高估实际一致率。因此，我们需要在计算Cohen's kappa系数时，剔除机遇一致率，公式如下：

利用SPSS进行一致性检验并计算Kappa值-图片14

　　经过之前的SPSS操作，SPSS输出的Cohen's kappa结果如下：

利用SPSS进行一致性检验并计算Kappa值-图片15

　　Value栏提示Cohen's kappa系数值，如下标黄部分：

利用SPSS进行一致性检验并计算Kappa值-图片16

　　从上表可知，本研究的Cohen's kappa=0.593。一般来说，Cohen's kappa系数分布在-1到1之间。若Cohen's kappa系数小于0，说明观察一致率小于机遇一致率，在实际研究中很少出现。若Cohen's kappa系数等于0，说明观察一致率等于机遇一致率，结果完全由机遇因素导致。若Cohen's kappa系数大于0，说明研究对象之间存在一定的一致性，Cohen's kappa系数越接近1，一致性越大。

那么，本研究中Cohen's kappa系数为0.593，说明一致性如何呢?Cohen's kappa系数值反映的一致性强度，如下：

表1. Cohen's kappa系数的一致性含义

利用SPSS进行一致性检验并计算Kappa值-图片17

　　从上表可知，本研究中Cohen's kappa系数0.593，说明具有中等强度一致性。但是，值得注意的是，我们并不能轻易地根据表1直接对比不同研究的Cohen's kappa系数。因为Cohen's kappa系数在计算过程中剔除了机遇一致率，也因此受到研究数据边际分布程度的影响。所以，我们只能比较具有相同边际分布数据的Cohen's kappa系数，而不能直接对比数据边际分布不同的研究。

此外，SPSS输出Symmetric Measures表格，提示Cohen's kappa系数的统计检验结果，如下标黄部分：

利用SPSS进行一致性检验并计算Kappa值-图片18

　　提示，本研究的Cohen's kappa系数与0的差异具有统计学意义(P<0.001)。同时，我们也可以根据该表格计算Cohen's kappa系数的95%置信区间，如下标黄部分：

利用SPSS进行一致性检验并计算Kappa值-图片19

　　可见，本研究中Cohen's kappa系数的标准误为0.129。鉴于本研究样本量较大，我们认为研究数据接近正态分布。从而计算Cohen's kappa系数的95%置信区间为0.593±1.96×0.129=0.593±0.253。即，本研究Cohen's kappa系数为0.593(95% CI为0.340 -0.846)。

五、撰写结论

本研究采用Cohen's kappa系数分析两位警察对100位受试者行为判断的一致性。结果显示，这两位警察都认为其中85位受试者行为“正常”，7位受试者行为“可疑”。但同时有6位受试者被警察1认定为“可疑”，而被警察2认定为“正常”;也有2位受试者被警察1认定为“正常”，而被警察2认定为“可疑”。

总的来说，这两位警察判断结果的Cohen's kappa系数为0.593(95% CI为0.340 -0.846)，P<0.001，具有中等强度一致性。

发表评论