Machine Learning

5种常见的聚类方法

人工智能很大程度上是对未知输入的分类判别, 聚类是一种将数据点按一定规则分群的机器学习技术。 这里介绍5种常见的聚类方法: ▌K-均值聚类 k均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所...
阅读全文
Genomics

基因组变异检测概述

首先,在开始之前我觉得有必要稍微科普缓冲一下,以便不使得不熟悉生物信息或基因组的客官们疑惑。 1.基因组:每个人都有一个基因组,这里的“基因组”并不只是“基因”的集合,基因是控制性状的遗传单元(什么是...
阅读全文
Statistics

置换检验(Permutation test)

Permutation test,也称置换检验,随机化检验或重随机化检验,是大牛Fisher首次提出的。由于Permutation test检验计算量大而限制了其应用和推广,以致不为人熟知。现在由于计...
阅读全文
Genomics

测序量估计

考虑这样一个问题,“如果要保证基因组上95%的区域其覆盖深度在30x以上的话,那么最低的平均测序深度应该是多少?”。 关于测序量的估计,对于做生物信息的人来讲应算是家常便饭了,多数时候我们都能直接根据...
阅读全文
Genomics

三代基因组测序技术原理简介

前言:首先,这一篇博文中的内容并非原创,而是对多篇文献中内容的直接摘录,有些图片和资料还来自身边的同事(在此深表谢意!),再夹杂自己的零星想法,写在这里分享与大家,同时也是为了方便自己日后若有需要能够...
阅读全文