作为机器学习从业者,你需要知道概率分布相关的知识。这里有一份最常见的基本概率分布教程,大多数和使用 python 库进行深度学习有关。 一 概率分布概述 共轭意味着它有共轭分布的关系。 在贝叶斯概率论...
置换检验(Permutation test)
置换检验 置换检验,是Fisher提出的一种基于大量计算(computationally intensive),利用样本数据的随机排列(置换检验的核心思想,故名Permutation test),进行...
理解ROC和AUC
ROC和AUC平时用的比较多,但是其真正的原理和计算过程却了解的不多,因此做个整理 照抄自网上的一个例子,加深下理解: 比方说在一个10000个人的数据集中,有100个人得了某种病症,你的任务是来预测...
ROC曲线
在分类预测中,我们一般比较关注准确率,但是,混淆矩阵也是非常重要的。尤其是当我们都其中的某一类别特别感兴趣的时候,通常要单独的看这个类别的召回率和精度,比如在癌症诊断过程中,我们宁愿错误的认为一个人是...
科普决策树(Decision Tree):通俗易懂
决策树是一种机器学习的方法。决策树的生成算法有ID3, C4.5和C5.0等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果...
关于ROC曲线,IDI和NRI
(一)缘起 这几天,连续碰到多人咨询了两个同样的问题,这两个都是非常有意思的话题: 如何比较两个模型的预测效果?ROC的AUC值比较?IDI、NRI如何计算? 如何做危险因素评分预测模型?怎样将回归...
应用Graphpad Prism制作多组ROC曲线图
ROC 曲线(receiver operating characteristic curve,简称 ROC 曲线),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。横纵坐标可由...
SPSS:一致Vs不一致?配对卡方到底解决什么问题
我们在研究中常常遇到这样的问题,用两个不同的检测方法评价同一群人,看看两种检测方法的判断是否有差异。举个例子,比如有新旧两台B超机器,用这两台B超机分别对100名体检者进行是否有脂肪肝;希望评价一下新...
SPSS实操:一元线性回归
一、临床问题&科学问题 一组高血压患者数据,其中患者体重指数以及腰臀比数据进行了收集。数据如下。所以回归分析,预测是其终极目的。现想知道体重指数为34的患者腰臀比为多少? 二、统计分析前的...
利用SPSS实现数据转换
在进行数据分析时,常需要对原始数据进行适当的转换。也许需要将连续变量转换为分类变量(比如:将年龄转换为<30岁组和≥30岁组),或者将分类变量重新编码(比如:将血型A、B、O、AB转换为A型和其...