Script

CONDA使用入门

  近来已经习惯使用 Continuum Analytics 公司的Conda产品作为我的主要开发工具箱. Conda提供比隔离环境包 virtualenv 和 python 版本切换包 p...
阅读全文
Machine Learning

K-Means聚类算法详解

前言 K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优...
阅读全文
Bioinformatics

R语言实现决策曲线分析

大家对ROC曲线都很熟悉,从方法的特异性和灵敏度出发反应一个方法的准确度。但是,在临床的应用中,往往仅通过以上标准得到的准确度是不可靠的。故早在2006年纪念斯隆-凯特琳癌症中心AndrewVicke...
阅读全文
Genomics

使用cnvkit来对大批量wes样本找cnv

cnvkit被设计来处理同一个批次的多个肿瘤配对样本测序情况,首先对所有的normal数据进行bin处理拿到背景值,然后就这个背景值来处理所有的tumor测序数据计算拷贝数变异情况。 该软件使用比较复...
阅读全文