分层回归是咋回事?是按照变量的水平数就行分割,然后进行分析嘛?其实不是,分层回归是对若干个自变量x进行分群组分析,主要用于模型的比较,或者说对变量重要性进行判定? 1、案例 某高校随机抽取600名大学...
预测模型稳定性的验证方法有哪些?
预测模型稳定性的验证方法有哪些?在近期的咨询工作中,许多大夫想在统计分析之后做一个预测模型,以logistic回归分析为例,通常的做法是将回归模型的预测值保存后,用预测值和结果(因变量)做一个ROC(...
一维数组的聚类
在学习聚类算法的过程中,学习到的聚类算法大部分都是针对n维的,针对一维数据的聚类方式较少,今天就来学习下如何给一维的数据进行聚类。 方案一:采用K-Means对一维数据聚类 Python代码如下: f...
Fine-Gray检验与竞争风险模型
题记:本文主要介绍生存资料处理的Fine-Gray检验与竞争风险模型,在生存资料处理中,这种方法目前应用越来越广泛。 1. 背景知识 在观察某事件是否发生时,如果该事件被其他事件阻碍,即存在所谓“竞争...
生存分析中连续型自变量截断值的确定方法
题记:本文重点讲解在生存分析中如何合理设置连续型自变量的截断值,将连续型自变量转换为二分类变量。 1. 背景知识 对于结果变量为二分类资料的数据,连续型自变量截断值的确定一般通过ROC分析,我们通常选...
使用FGAP进行补洞
1. FGAP简介 FGAP利用BLAST将contigs序列比对到基因组草图序列上,寻找重叠到gap区间的最优序列,从而进行补洞。其参考文献:Piro, Vitor C., et al. “FGAP...
使用 GCE 进行基因组大小评估
1. GCE 简介 GCE(Genome Characteristics Estimation) 是华大基因用于基因组评估的软件,其参考文献为:Estimation of genomic charac...
通过WIG格式将转录组数据展示到Gbrowse2中
1. WIG格式介绍 WIG格式(Wiggle Track Format),可用于将转录组数据进行可视化展示。bigWig格式则是WIG格式的二进制方式,可以使用wigToBigWig将WIG格式转换...
blast进行重复序列屏蔽
1. 构建数据库的时候屏蔽参考序列的重复 segmasker 屏蔽氨基酸的低复杂序列 dustmasker 屏蔽核算序列的低复杂序列 windowmasker 按照序列重复的次数来屏蔽 convert...
GO分析代码库
这一篇文章中主要是使用David进行GO分析的数据处理流程和简单的代码,具体GO分析的原理就不再涉及。 导出基因列表 #基因列表的导出 gene_cluster <- rownames(as.m...