非参数检验的SPSS操作

2013/03/01来源：一统浆糊评论12,819

总体分布已知，对总体参数进行推断用到是参数检验（Parametric test），比如t检验、方差分析等。当前提条件不满足时应改为非参数检验（Nonparametric test），非参数检验常常对总体位置（中位数M）较为敏感，H0假设一般也是总体分布位置相同。通常来说，非参数检验的检验效能低于参数检验，但满足参数检验的条件时首选参数检验。

不论是计量资料还是分类资料都有可能会使用非参数检验。

不满足正态和方差齐性等条件的计量资料
分布分布未知的计量资料
一端或两端为不确定值（如<0.5、>0.1等）的资料
反应变量为等级资料

非参数检验有很多方法，如秩和检验、游程检验、符号检验等。其中秩转换的非参数检验（秩和检验）是非参数检验中检验效能较高的方法。

【1】两独立样本的非参数检验

对应计量资料的两独立样本的t检验、计数资料的两独立样本的卡方检验。两独立样本常用Wilcoxon秩和检验和Mann- Whitney U检验。Wilcoxon秩和检验检验统计量为秩和T，当n1≤10和n2-n1≤10时需要查专用T界值表，但当n1＞10或n2-n1＞10时，可用正态近似法做μ检验（Z检验）。同样Mann- Whitney U检验当样本量较小时（两样本量之和≤30）需要专门的U界值表，样本量大时，可用正态近似法做μ检验（Z检验）。另外SPSS中还提供了Kolmogorov-Smirnov Z、Moses extreme reactions及Wald-Wolfowitz runs法。

示例1：反应变量有序的等级资料会用到非参数检验，具体示例及分析步骤可参见分类资料的差异比较常用统计方法选择及SPSS实现一文中的【3.3 分组变量无序、反应变量有序资料的非参数检验】

示例2：采用“两样本PK之t检验”中Labe和Meto降压效果的基线比较。

①数据录入：Group：1=Labe，2=Meto；Dbl：舒张压基线血压。变量窗口及数据窗口如下

非参数检验的SPSS操作-图片1

非参数检验的SPSS操作-图片2

②正态性检验和方差齐性检验参见两样本PK之t检验。两组都不满足正态性（Labe：W=0.931,P=0.022<0.05；Meto:W=0.924,P=0.013<0.05），方差相等（F=1.648，P=0.203>0.05）,两组基线方差相等。本示例仅演示操作步骤，实际上本例呈近似正态分布，使用参数检验（两独立样本的t检验）也是可以的。

③分析>>非参数检验(Nonparametric Tests)>>独立样本(Independent Samples)…

检测字段(Test Fields)：选入Dbl
分组变量(Groups):选入Group

两独立样本非参数检验默认的使用的方法是Mann- Whitney U检验，如想改用或使用多种方法可在设置（Setting）选项卡中选中自定义检验方法（Customize tests），选中需要的方法即可。如采用旧对话框，步骤如下：

分析>>非参数检验(Nonparametric Tests)>>旧对话框(Legacy Dialogs)>>两独立样本(2 Independent Samples)…

检测变量列表(Test Variable List)：选入Dbl
分组变量(Grouping Variable):选入Group。定义组(Define Group)…组1:1；组2:2

主要统计结果及解读：

新对话框首先给出的是模型假设，Mann- Whitney U检验：P<0.001，两组患者的舒张压在治疗前有统计学意义。

非参数检验的SPSS操作-图片3

双击查看到更详细的结果：Labe组舒张压基线平均秩（58.28）高于Meto组（34.50），还可以查看Mann- Whitney U检验统计量U、Wilcoxon W统计量W及标准检验统计量Z，Z=-4.402，P<0.001，两组患者的舒张压在治疗前有统计学意义。另外还可以通过右框下方的View来选择查看字段信息。

非参数检验的SPSS操作-图片4

旧对话框的呈现结果如下，跟以上结果是相同的。

非参数检验的SPSS操作-图片5

【2】两配对样本的非参数检验

类似参数检验中的配对t检验。两配对样本的非参数检验常用方法为Wilcoxon符号秩检验（Wilcoxon Signed Rank Test），检验统计量为T（也有用W表示的）。当有效对子数n≤50时需要查专用T界值表，但当n＞50可用正态近似法做μ检验（Z检验），检验统计量为Z（也计做μ）。另外SPSS中还提供了符号检验（Sign）、两分类资料的配对卡方检验（McNemar）以及McNemar向多分类（有序分类）资料扩展的Marginal Homogeneity法。

示例仍采用“两样本PK之t检验”中使用Labe和Meto前后降压效果的比较。

①数据录入：Group：1=Labe，2=Meto；Dbl：舒张压基线血压；Dw13：用药13周后的舒张压水平。变量窗口和数据窗口见【1】两独立样本的非参数检验中的示例2

②按组分割文件：数据>>分割文件，本例按Group分割文件

③计算两组数据的差值，差值的正态性检验：目的为是否符合参数检验的条件，本例结果可参见两样本PK之t检验，两组结果（近似）呈正态，可以使用两配对样本的t检验。本例仅做演示。

④分析>>非参数检验(Nonparametric Tests)>>相关样本(Related Samples)…

检测字段(Test Fields)：选入Dbl、Dw13

两相关样本非参数检验默认的使用的方法是符号秩检验（Wilcoxon Signed Rank Test），如想改用或使用多种方法可在设置（Setting）选项卡中选中自定义检验方法（Customize tests），选中需要的方法即可。如采用旧对话框，步骤为：分析>>非参数检验>>旧对话框(Legacy Dialogs)>>两相关样本(2 Related Samples)…

将Dbl和Dw13分别放入检测对（Test Pais）中的变量1和变量2。可同时进行多组检测

结果显示：使用Labe和Meto前后降压效果的比较均有统计学差异（Labe：Z=-5.392，P<0.001；Meto：Z=-5.392，P<0.001）

使用Labe治疗前后降压效果的比较：

非参数检验的SPSS操作-图片6

使用Meto治疗前后降压效果的比较：

非参数检验的SPSS操作-图片7

旧对话框结果：

非参数检验的SPSS操作-图片8

【3】多个立样本的非参数检验

类似于参数检验中完全随机设计的方差分析。多个独立样本非参数检验常用Kruskal-Wallis H检验，检验统计量为H或Hc（修正H），当样本个数（分组）g=3和每个样本（组）的样本量（例数）n≤5时，可查H界值表获得P值。当g=3且最小样本n＞5或g＞3时，H或Hc近似服从χ²分布。另外SPSS中还提供了Median（中位数检验，统计效能最低）、Jonckheere-Terpstra。

示例：小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活天数有无差异

①数据录入：Type：1=9D，2=11C，3=DSC1；Day：存活天数

非参数检验的SPSS操作-图片9

②百分率资料、时间资料不服从正态分布

③分析>>非参数检验(Nonparametric Tests)>>独立样本(Independent Samples)…

检测字段(Test Fields)：选入Day
分组变量(Groups):选入Type

多个独立样本非参数检验默认的使用的方法是Kruskal-Wallis H检验，可在设置选项卡中改用其他方法。如采用旧对话框，步骤如下：

分析>>非参数检验(Nonparametric Tests)>>旧对话框(Legacy Dialogs)>>多个独立样本(k Independent Samples)…

检测变量列表(Test Variable List)：选入Day
分组变量(Grouping Variable):选入Type。定义组(Define Group)…最小(Minimum)：1；最大(Maximum):3

新旧统计学结果如下图：χ²=9.940，P=0.007<0.05，接种不同伤寒杆菌的小白鼠的存活天数是不同的。各组的平均秩和可在箱式图上查看，而在旧对话框结果中直接显示。

非参数检验的SPSS操作-图片10

非参数检验的SPSS操作-图片11

在考察3组总体有统计学差异后，接下来必然面临到底是哪两个总体有差异的问题，也就是多重比较的问题。Kruskal-Wallis H检验后可用Nemenyi法进行多重比较。SPSS软件中并未提供该方法，而是提供了另外两种方法进行检验：成对比较（Pairwise Comparisons）和齐性子集（Homogeneous Subsets），默认方法是成对比较。SPSS Statistics added the Dunn or Dunn-Bonferroni post hoc method following a significant Kruskal-Wallis test in the NPTESTS procedure (Analyze>Nonparametric Tests>Independent Samples in the menus) in Version 19. It is not available in earlier versions.

点击上图右框下方的View选框（红框），选择成对比较，结果如下图所示。节点距离的远近反应各组平均秩差异的大小，结果显示接种伤寒杆菌11C和DSC1后小白鼠的存活天数多于接种9D的小白鼠，但接种11C和DSC1后的存活天数没有明显的统计学差异。

非参数检验的SPSS操作-图片12

如要查看齐性子集的多重比较结果，在进入分析>>非参数检验>>独立样本…对话框后，在设置（Setting）选项卡中选择检验方法（Choose Tests），选择自定义检验（Customize tests），选中复选框（Kruskal-Wallis 1-way ANOVA(k samples)）,其下的多重比较（Multiple comparisons）选择框中改选为逐步降低（Stepwise step-down）。结果右框下方的View选框就会出现齐性子集（Homogeneous Subsets）的选项，结果按照同质亚组的方式输出（类似SNK的输出方法）：3个组被分为2个同质亚组，结果与成对比较相同。

非参数检验的SPSS操作-图片13

在统计学教材上普遍介绍的Nemenyi法进行多重比较，在SPSS中并未直接给出该方法的计算结果。可参照文献SPSS在完全随机设计多个样本间多重比较NEMENYI秩和检验中的应用（刘伟,林汉生.中国卫生统计,2009,26(2):214,216）在SPSS中结合编程来实现Nemenyi法检验。

①计算Hc以及各组平均秩r。可在Kruskal-Wallis H检验直接寻找：Hc=9.940（即检验统计量），r1=8.40，r2=18.78，r3=19.27（鼠标放在箱式图上可直接显示，就对话框结果直接显示），其后是总例数和各组例数。

②打开语句编辑器：File>>New>>Syntax，在语句编辑器中输入以下程序。选中所有程序代码，点击运行按钮

data list free/Hc r1 r2 r3 N n1 n2 n3.

begin data

9.94 8.40 18.78 19.27 30 10 9 11

end data.

COMPUTE H = (12*((r1*n1)**2/n1+(r2*n2)**2/n2+(r3*n3)**2/n3))/(N*(N+1))-3*(N+1).

compute C = H/Hc.

compute X12 = (r1-r2)**2/((N*(N+1)/12)*(1/n1+1/n2)*c).

compute X13 = (r1-r3)**2/((N*(N+1)/12)*(1/n1+1/n3)*c).

compute X23 = (r2-r3)**2/((N*(N+1)/12)*(1/n2+1/n3)*c).

compute P12 = 1-cdf.chisq(X12,2).

compute P13 = 1-cdf.chisq(X13,2).

compute P23 = 1-cdf.chisq(X23,2).

execute.

Nemenyi法检验统计量为χ²，结果会在新建的一个数据窗口中显示，可在其变量窗口中设置χ²和P的小数点位数，结果如下：

9D-11C：χ²=6.702，P=0.035<0.05

9D-DSC1：χ²=8.127，P=0.017<0.05

11C-DSC1：χ²=0.016，P=0.992>0.05

非参数检验的SPSS操作-图片14

【4】多个相关本的非参数检验

与参数检验中的随机区组设计方差分析类似。多个相关样本非参数检验常用Friedman M检验，检验统计量为M，当样本个数（分组）g≤15和每个样本（组）的样本量（例数）n≤15时，可查M界值表获得P值。实际上，当样本个数g＞4，或者g=4且n＞5，或g=3且n＞9时，可用χ²近似法。另外SPSS中还提供了Kendall's W和Cochran's Q检验。

示例仍采用“两样本PK之t检验”中使用Labe和Meto前、使用1周、使用13周的降压效果的比较。实际上本例是典型的重复测量设计，各时间点（区组）固定，彼此并不独立，处理在各个时间点上也不能随机，使用随机区组设计的方差分析并不恰当，如满足条件，则可采用重复测量设计的方差分析。本例仅做演示。注意配伍设计的数据并没发做进行常规的正态性和方差齐性检验，可参见群殴之方差分析。

①数据录入：Group：1=Labe，2=Meto；Dbl：舒张压基线血压；Dw1、Dw9和Dw13分别表示用药1周、9周和13周后的舒张压水平。变量窗口和数据窗口见【1】两独立样本的非参数检验中的示例2

②按组分割文件：数据>>分割文件，本例按Group分割文件

③分析>>非参数检验(Nonparametric Tests)>>相关样本(Related Samples)…

检测字段(Test Fields)：选入Dbl、Dw1、Dw9、Dw13

多个相关样本非参数检验默认的使用的方法是Friedman M检验，如想改用或使用多种方法可在设置（Setting）选项卡中选中自定义检验方法（Customize tests），选中需要的方法即可。如采用旧对话框，步骤为：分析>>非参数检验>>旧对话框(Legacy Dialogs)>>多个相关样本(K Related Samples)…

将Dbl、Dw1、Dw9、Dw13放入检测变量（Test Variables）中

分析结果（以Labe组为例）：

平均秩随治疗时间的延长逐渐下降，有明显的统计学意义（χ²=100.5，P<0.001）

非参数检验的SPSS操作-图片15

同Kruskal-Wallis H检验一样，Friedman M检验也在各组整体比较有统计学意义后，提供了两两多重比较的方法：成对比较（Pairwise Comparisons）和齐性子集（Homogeneous Subsets）。同Kruskal-Wallis H检验后的两两比较一样，可直接在结果对话框右下角View选框选择成对比较，也可以在进入相关样本分析对话框后，激活自定义检验，选中右下角复选框（Friedman's 2-way ANOVA by ranks(k samples)））,其下的多重比较（Multiple comparisons）选择框中改选为逐步降低（Stepwise step-down）。结果如下，一目了然，不再赘述。

非参数检验的SPSS操作-图片16

非参数检验的SPSS操作-图片17

另外，SNK-q法也可以对Friedman检验后的多重比较进行。SPSS软件中并未提供该方法，可以结合编程来实现，参考文献：Friedman M检验平均秩的多重比较在SPSS软件的实现（申希平等.中国卫生统计,2013,30(4):611-614）。

非参数检验的SPSS操作-图片18

END

发表评论