聚类 | Public Library of Bioinformatics

确定最佳聚类数目的10种方法

在聚类分析的时候确定最佳聚类数目是一个很重要的问题，比如kmeans函数就要你提供聚类数目这个参数，总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过，看了很多博客，大多泛泛带过。今天把看到的这么多方...

01/025,3691

K-means算法通俗原理及Python与R语言的分别实现

K均值聚类方法是一种划分聚类方法，它是将数据分成互不相交的K类。K均值法先指定聚类数，目标是使每个数据到数据点所属聚类中心的总距离变异平方和最小，规定聚类中心时则是以该类数据点的平均值作为聚类中心。 ...

12/203,855评论

一维数组的 K-Means 聚类算法理解

刚看了这个算法，理解如下，放在这里，备忘，如有错误的地方，请指出，谢谢需要做聚类的数组我们称之为【源数组】需要一个分组个数K变量来标记需要分多少个组，这个数组我们称之为【聚类中心数组】及一个缓存...

11/083,724评论

利用R语言heatmap.2函数进行聚类并画热图

数据聚类然后展示聚类热图是生物信息中组学数据分析的常用方法，在R语言中有很多函数可以实现，譬如heatmap,kmeans等，除此外还有一个用得比较多的就是heatmap.2。最近在网上看到一个笔记文...

08/2745,8292

Bioinformatics

Kmeans聚类K值如何选，以及数据重抽样方法Bootstrapping

本文出自Bin的专栏blog.csdn.net/xbinworld。技术交流QQ群：433250724，欢迎对算法、技术感兴趣的同学加入。我的博客写一些自己用得到东西，并分享给大家，如果有问题欢迎留...

03/204,188评论

R语言聚类分析–cluster, factoextra

对于有很多(成百上千)研究对象时，把对象分组是最常用的研究手段。而通过观察值进行聚类是非常有效的方法，可以按事物观察值有效的合理分组，再进一步分析各组的相同、与不同，可以很好的发现其中的规律。本文将...

03/107,949评论

六大聚类算法快速了解

在机器学习中，无监督学习一直是我们追求的方向，而其中的聚类算法更是发现隐藏数据结构与知识的有效手段。目前如谷歌新闻等很多应用都将聚类算法作为主要的实现手段，它们能利用大量的未标注数据构建强大的主题聚类...

03/093,145评论

一维数组的聚类

在学习聚类算法的过程中，学习到的聚类算法大部分都是针对n维的，针对一维数据的聚类方式较少，今天就来学习下如何给一维的数据进行聚类。方案一：采用K-Means对一维数据聚类 Python代码如下： f...

05/188,005评论

聚类算法——k均值和层次聚类

看看下面这张图，有各种各样的虫子和蜗牛，你试试将它们分成不同的组别？完成了吗？尽管这里并不一定有所谓的「正确答案」，但一般来说我们可以将这些虫子分成四组：蜘蛛、蜗牛、蝴蝶/飞蛾、蜜蜂/黄蜂。很简单...

03/095,056评论