传统生物信息分析是件苦逼的差事:维护服务器,安装系统,配置升级软件,调试脚本,传输数据,调整参数执行workflow,搜集实验数据,查询数据库,做图表,攒报告…… 日复一日,重复数百遍。 软件和网络正...
SPSS:二元Logistic回归中自变量的处理和解读——无序多分类变量的处理
在实际进行Logistic回归的过程中,我们会遇到很多现实问题,尤其是在自变量的处理上经常拿不准。比如自变量是否一定是二分类变量?多分类变量作为自变量如何处理?连续变量是否可以当做自变量?多分类变量和...
SPSS:多重共线性理论及检验处理方法
本文介绍多重共线性的定义、理论、产生原因、影响及利用SPSS进行检验处理的具体过程。 一 、定义及理论 多重共线性是指线性回归模型中的解释变量之间由于存在高度相关关系而使模型估计失真或难以估计准确。 ...
SPSS:多重线性回归中的自变量筛选方法
我们在进行多重线性回归分析时,往往需要选择自变量的筛选方法,如进入法、前进法、后退法和逐步法等。这些方法之间有什么区别呢?它们是如何工作的呢,本文就来跟大家聊聊这一问题。 计算机就是一台没有思想的算法...
odds、OR和RR的计算公式和实际意义
1. Odds Odds 的意思为机率、可能性,是指某事件发生的可能性(概率)与不发生的可能性(概率)之比。假如某药物有疗效的比例为p1,则无效的比为1-p1,则odds的计算公式为: 对于如下表所示...
OR(Odd Ratio) – 比值比
R值的全称是odd ratio, OR值是相对危险度,又称比值比,对于发病率很低的疾病来说,它是OR值即是相对危险度的精确估计值。 计算公式如下: Odd ratio, 95% CI 假定我们要鉴别一...
怎么区分OR和RR?
一、先举个例子回顾下RR 之前,医咖会专门发了文章讲相对危险度(Relative Risk, RR)。队列研究中,研究者前瞻性地观察“暴露组”和“非暴露组”的发病情况,之后通过RR来评价暴露组研究对象...
从课题设计到文章发表——临床医生的基因组学科研管家
为全程协助临床医生开展基因组学科研项目,千年基因专门针对临床医生推出了全方位的基因组学项目解决方案,从最初的课题设计、经费申请开始,到提供专业测序分析及结果验证,并最终至科研文章的发表提供全程支持...
碱基平衡性与barcode选择
碱基平衡性 碱基复杂度与碱基多样性是一个意思;复杂度高,碱基即平衡。低多样性(low diversity)即碱基不平衡,指碱基的组成太单纯了,种类少。碱基复杂度本来无关紧要,从前除了设计PCR的时候考...
用awk进行简单的编程
# 用awk进行简单的编程 # 我们之前已经做过这个了,但是为了让大家我们了解我们正在做什么,我们来再做一遍。 # 提取埃博拉基因组的编码特征、基因以及编码序列。 efetch -db nucleot...