比如,前段时间,室友跟我聊起这么一个研究设计。20个人吃A药,20个人吃B药,分别在其听音乐和不听音乐时测定了疗效指标E(E为连续变量)。现在想搞明白1)听音乐和不听音乐对疗效有无差异;2)A药和B药对疗效有无差异。
这种情况如何处理呢?
那还不简单?1)分别针对A药组和B药组,听音乐和不听音乐之间做配对t检验,探讨音乐对疗效的作用;2)分别针对听音乐和不听音乐的,吃A药和吃B药之间做独立t检验,探讨A药和B药的差异。
先不说这方法正确与否,两次配对t检验和两次独立t检验,这么繁琐也是醉了,那可怎么办呢?这时候天空飘来几个字“两因素方差分析”,究竟这天降的是馅饼还是陷阱,我们还需从长计议。首先,如果我们要用两因素方差分析,那我们的研究设计必须有两个分组因素,同时,我们的观察指标是连续性变量。大概是下图所示:
乍一看这两种设计方案很像,比如说,都有两个分组因素:药物种类,听音乐与否;其次,观察指标E是连续变量。但细心的读者可能会发现,第一种设计存在重复测量的问题,不论我吃A药还是B药,我在听音乐时会被测一次,不听音乐时又被测一次。对,这就是传说中重复测量的数据,那我们肯定要选择重复测量方差分析了。通过重复测量方差分析,一方面可以检验不同条件下的变化,放在这里,也就是听音乐和不听音乐的差异;此外,还可以检验A药和B药是否存在统计学差异。
到这里,大家应该知道什么时候用两因素方差分析,什么时候用重复测量方差分析了。简单来说,选用两因素还是重复测量,取决于研究设计。如果您的方案中恰巧有两个分组因素,观察指标也是连续变量,这时候我们确认是否存在数据重复测量即可做出正确判断。比如,20人吃A药,20人吃B药,分别在其用药前和用药后测定了疗效指标E(连续变量),假设想探究1)用药前和用药后是否有差异;2)A药和B药是否有差异。您会选择两因素还是重复测量呢?
有比如,20人吃A药,其中10人口服,10人注射;20人吃B药,10人口服,10人注射。想探讨1)口服和注射对疗效的影响;2)A药和B药是否有差异。您又会怎么选择呢?