本文讲述了数据分析师应当了解的五个统计基本概念:统计特征、概率分布、降维、过采样/欠采样、贝叶斯统计方法。 从高的角度来看,统计学是一种利用数学理论来进行数据分析的技术。象柱状图这种基本的可视化形式,...
对连续性变量进行分类转换的一种方法—-最大选择检验
在临床研究中我们会遇到如下问题:如果x指标的测量值是连续的,对于结局指标y来说,如何将x指标进行分类(分为两组),才能够获得y指标在两组间差异最大。 这个问题其实是一个对连续性指标x找切点的问题。很多...
SPSS统计中多重线性回归、Logistic回归及Cox回归分析的联系与区别
如何区分常见回归模型?在什么情况下,应该用什么回归模型呢? 本文将汇总三种最常用的回归模型:多重线性回归、Logistic回归、Cox回归,更直接比较它们间最基本的联系与区别。 三者联系: 它们都属于...
混合方法研究(Mixed Methods Research)简介
临床研究是在复杂的临床环境中开展简单的科学研究,科学性与可行性之间矛盾突出,从研究方法角度获得理论、方法和技术支持尤为重要。虽然目前现有的定量研究方法在临床研究中解决了很多问题,但有些问题单用定量研究...
因果推断中反事实思维是什么
我们的研究多数都在做因果推断,一种重要的因果推断方法是反事实方法(counterfactual method)。貌似我们做过很多研究,但怎么没听说用这么个方法呢?小编给你解释一下定义,你就会知道你不仅...
诊断试验中正确率和患病比例有关系么
诊断试验判断诊断方法准确性的评价指标很多,我们常听说的有灵敏度(sensitivity)、特异度(specificity)、阳性/阴性预测值(positive/negativepredict valu...
神经网络训练过程中不收敛或者训练失败的原因
在面对模型不收敛的时候,首先要保证训练的次数够多。在训练过程中,loss并不是一直在下降,准确率一直在提升的,会有一些震荡存在。只要总体趋势是在收敛就行。若训练次数够多(一般上千次,上万次,或者几十个...
SPSS—描述性统计分析—探索性分析
SPSS描述性统计分析菜单 除了可以计算基本的统计量之外,也可以给出一些简单的检验结果和图形,有助于用户进一步的分析数据。使得用户能够从大量的分析结果之中挖掘到所需要的统计信息。 适用范围 对资料的性...
SPSS进行方差分析(ANOVA)-单因素方差分析的注意点
方差分析基本原理 样本要求 独立性 各样本必须是相互独立的随机样本 样本含量尽可能相等或相差不大 可比性 样本均值不相同,可比较 正态性 样本的总体符合正态分布,偏态分布不适用于方差分析。 对偏态分布...
常用的Git命令及其用法
以下是一些常用的Git命令及其用法: 1. **git init**: 在当前目录初始化一个新的Git仓库。 - 用法:`git init` 2. **git clone**: 克隆一个远程Git仓库...