1、分析原理
协方差分析是回归分析与方差分析的结合。在作两组和多组均数之间的比较前,用直线回归的方法找出各组因变量Y与协变量X之间的数量关系,求得在假定X相等时的修正均数,然后用方差分析比较修正均数之间的差别。
要求X与Y的线性关系在各组均成立,且在各组间回归系数近似相等,即回归直线平行;X的取值范围不宜过大,否则修正均数的差值在回归直线的延长线上,不能确定是否仍然满足平行性和线性关系的条件,协方差分析的结论可能不正确。
对于协变量的概念,可以简单的理解为连续变量,多数情况下,连续变量都要作为协变量处理。
2、问题
欲了解成年人体重正常者与超重者的血清胆固醇是否不同。而胆固醇含量与年龄有关,资料见下表。
正常组 | 超重组 | ||
年龄 | 胆固醇 | 年龄 | 胆固醇 |
48 | 3.5 | 58 | 7.3 |
33 | 4.6 | 41 | 4.7 |
51 | 5.8 | 71 | 8.4 |
43 | 5.8 | 76 | 8.8 |
44 | 4.9 | 49 | 5.1 |
63 | 8.7 | 33 | 4.9 |
49 | 3.6 | 54 | 6.7 |
42 | 5.5 | 65 | 6.4 |
40 | 4.9 | 39 | 6.0 |
47 | 5.1 | 52 | 7.5 |
41 | 4.1 | 45 | 6.4 |
41 | 4.6 | 58 | 6.8 |
56 | 5.1 | 67 | 9.2 |
3、统计分析
(1) 建立数据文件
变量视图:建立3个变量
数据视图:
先要分析两组中年龄与胆固醇是否有线性关系,且比较回归洗漱是否相等,比较粗略的做法是画散点图,选择菜单:图形 -》旧对话框 -》散点图,如图:
进入图形对话框:
将胆固醇、年龄、组分别选入Y轴、X轴、设置标记:
点击确定开始画图
可以看出,大致呈直线关系。
更为精确的作法是检验年龄与分组之间是否存在交互作用,即年龄的作用是否受分组的影响。
接下来开始协方差分析,首先进入菜单:
进入对话框
将胆固醇选入“因变量”,组选入“固定因子”,年龄选入“协变量”,见图:
点击右边“模型”按钮,在“构建项”下拉菜单中选择“主效应”,将“组”和“年龄”选入右边框中,然后在“构建项”下拉菜单中选择“交互”,同时选中“组”和“年龄”,一并选入右边的框中,见图:
点击“继续”按钮回到“单变量”主界面:
单击“选项”按钮,进入如下对话框:
选中“描述性分析”:
点击“继续”按钮回到主界面,单击“确定”即可。
4、结果解读
这是各组的描述性统计分析。
这是主要的统计分析结果,一个典型的方差分析表,解释一下:
1、表格的第一行“校正模型”是对模型的检验,零假设是“模型中所有的因素对因变量均无影响”(这里包括分组、年龄及他们的交互作用),其P<0.001,拒绝零假设,说明存在对因变量有影响的因素。
2、表格的第二行是回归分析的常数项,通常无实际意义。
3、表格的第三行、第四行是对组和年龄的检验,P均<0.05,有统计学意义,说明分组和年龄对胆固醇的影响均有统计学意义。
4、表格的第五行是对分组和年龄的交互作用的检验,其P=0.935>0.05,说明分组和年龄无交互作用,也就是说,年龄对胆固醇的影响不随分组的不同而不同,这也是协方差分析的基本条件之一。这里是满足的。