前言 L1/L2正则化的目的是为了解决过拟合,因此我们先要明白什么是过拟合、欠拟合。 过拟合:训练出的模型在测试集上Loss很小,在训练集上Loss较大 欠拟合:训练出的模型在测试集上Loss很大,在...
如何做生存分析?
生存分析是医学领域常见的分析方法,也可以拓展到其他专业领域。这篇帖子的目的就是介绍怎么做生存分析,希望能对临床医学的同学提供一定帮助。 简明扼要地讲,生存分析的目的无外乎六个字:描述、比较、关系。 1...
Illumina测序数据的质量控制
我们先来看一下不同平台数据格式: 1. 产出数据格式 Solexa—fastq 2. 产出数据格式 454—fasta 测序读长即每条测序读断的长度,所有平时大家叫的read...
没有root管理员权限安装常用群体遗传学分析软件
由于生物信息的大部分工作都是在没有 root 权限的集群上进行的,本期主要介绍一下非 root 用户怎么安装群体遗传常用的软件。工欲善其事,必先利其器! 准备工作 1、首先我们建一个文件夹,用来存储我...
测序结果中的接头序列来自哪里?
Illumina 测序原理 在进入本期的正题之前,我们需要了解一下 Illumina 的测序原理,在这里用一张图简单的展示一下: 图1 Illumina 测序原理 (图片来自https://www.i...
高通量测序数据质控神器—Trimmomatic
今天给大家推荐一个高通量测序数据质控神器——Trimmomatic。这个于 2014 年发表在 Bioinformatics 上的软件,至今为止在 Web of Science 上可以检索到 2,09...
meta分析森林图的解读
森林图是meta分析中hin重要又常见的元素,它以一条垂直的无效线为中心,用平行于横轴的多条线段表示每个被纳入研究的效应量和可信区间,用一个菱形描述合并的效应量及其可信区间。但,森林图具体怎么看呢?今...