Spearman相关系数和Pearson相关系数是用于衡量两个变量之间相关性的常用统计指标,它们之间的主要异同点如下: 相同点: 1. 都用于衡量两个变量之间的相关性,并且取值范围都是-1到1之间。 ...
SPSS:病例-对照匹配(case-control matching)的实现过程
匹配(Matching)又称配比,是指为每一个处理组的研究对象选择在某些特征上一致的对照组对象。匹配的目的是控制某些因素对处理效应的影响,从而评价处理因素对结局的真实作用。经典的匹配方式是首先选定一些...
SPSS中如何对多个选项的结果进行计数
对于数据的统计分析来说,有很多人觉得做出p值那一步比较高深。其实不然,数据整理和数据清洗才是吃力不讨好的事情,也能体现出数据处理人员的能力。数据整理与清洗既花费时间,又不出成果,因为大家往往觉得“差异...
Gini Index For Decision Trees (决策树中特征的基尼指数计算方法)
Before starting with the Gini Index, let us first understand what splitting is and what are the meas...
利用Bioconductor实现scRNA-seq数据的分析
Bioconductor提供了完成单细胞转录组分析所需的大量软件包,本综述向我们展示了如何利用Bioconductor实现整个分析流程 Introduction Bioconductor 是一个基于 ...
单细胞转录组数据轨迹预测方法的比较
单细胞转录组学数据能够用于推断轨迹,从而对细胞动态变化过程进行无偏倚研究。本文中,作者对45种轨迹预测方法进行了评估,并为研究者选择合适的软件方法提出了实质性的指导意见。 Introduction 单...
生存分析中生存率的计算
近日连续遇到好几个同事在写临床研究论文时问及生存率的问题,有人还是对生存率的计算有点儿理不清楚,本期就这一问题作一讨论。当然这一讨论仅限于简单的临床研究数据中的Kaplan-Meier法。对于流行病学...
加入GeneDock,一起玩生物信息云
传统生物信息分析是件苦逼的差事:维护服务器,安装系统,配置升级软件,调试脚本,传输数据,调整参数执行workflow,搜集实验数据,查询数据库,做图表,攒报告…… 日复一日,重复数百遍。 软件和网络正...
SPSS:二元Logistic回归中自变量的处理和解读——无序多分类变量的处理
在实际进行Logistic回归的过程中,我们会遇到很多现实问题,尤其是在自变量的处理上经常拿不准。比如自变量是否一定是二分类变量?多分类变量作为自变量如何处理?连续变量是否可以当做自变量?多分类变量和...
SPSS:多重共线性理论及检验处理方法
本文介绍多重共线性的定义、理论、产生原因、影响及利用SPSS进行检验处理的具体过程。 一 、定义及理论 多重共线性是指线性回归模型中的解释变量之间由于存在高度相关关系而使模型估计失真或难以估计准确。 ...