Single Cell

单细胞转录组数据无监督聚类

背景 scRNA-seq 数据的计算分析包括质控,比对,定量,标准化,聚类,轨迹分析以及差异表达基因的鉴定等,其中聚类是给予转录组数据定义细胞类型的一个核心步骤,也是 scRNA-seq 最广泛的应用...
阅读全文
Machine Learning

5种常见的聚类方法

人工智能很大程度上是对未知输入的分类判别, 聚类是一种将数据点按一定规则分群的机器学习技术。 这里介绍5种常见的聚类方法: ▌K-均值聚类 k均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所...
阅读全文
Machine Learning

SAS聚类分析介绍

1 聚类分析介绍 1.1基本概念 聚类就是一种寻找数据之间一种内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作聚类。处于相同聚类中的数据实例彼此相同,处于不同聚类中的实例彼此不同...
阅读全文
Transcriptomics

差异表达基因的分析(2)

应学生及个别博友的要求,尽管专业博文点击率和反应均很差,但在去San Diego参加PAG会议之前,还是抽时间给出【R高级教程】的第二专题。专题一给出了聚类分析的示例,本专题主要谈在表达谱芯片分析中如...
阅读全文
Transcriptomics

表达谱芯片的聚类分析

【在国际上,R软件的应用是数据分析的主流发展趋势之一,但我发现在国内R软件的使用远不如SPSS、SAS等软件那么流行。为推广R软件的使用,本博客将陆续推出“R高级教程”系列专辑,希望对生命科学领域的科...
阅读全文
Bioinformatics

利用Weka做K-means聚类

聚类分析中的“类”(cluster)和分类的“类”(class)是不同的,对cluster更加准确的翻译应该是“簇”。聚类的任务是把所有的实例分配到若干的簇,使得同一个簇的实例聚集在一个簇中心的周围,...
阅读全文
Script

K-MEANS 算法

输入聚类个数 k ,以及包含 n 个数据对象的数据库,输出满足方差最小标准的 k 个聚类。 k-means 算法接受输入量 k ;然后将 n 个数据对象划分为 k 个聚类以便使得所获得的聚类满足:同一...
阅读全文