本例通过几个自变量预测是否有高血压,2个分类变量,一个性别,一个吸烟;3个连续性变量。
需要生成一个分组变量,用于区分训练集以及验证集。我们这个样本70%用于训练。通过计算变量,生成分组变量。
参数设置
点击分区,选择生成的分组变量:
点击输出,选择如下参数:
点击保存,勾选预测值和预测概率
点击导出,可以保存相应模型,用于新数据的预测。
结果浏览:
首先是对训练集合检验集的描述
网络信息对神经网络的输入层,隐藏层以及输出层进行描述。
下图为程序运行后的神经网络图,线条的粗细代表了权重的大小。
模型摘要以及分类对具体的分类结果以及预测模型的分类结果进行了比较
校准箱型图
ROC曲线下面积评估模型好坏
自变量对模型的重要性排行