Statistics

阶梯设计(the stepped-wedge design)

前几天有位大夫过来咨询,他的问题是这样的:现在有一种已经在早期研究中被证明有效的提高妇科大夫技能的某种培训,现在想在更多医院开展这样的培训,并评价其效果。 如果您也碰到这种情况,您会考虑什么样的研究设...
阅读全文
Machine Learning

KMeans中自动K值的确认方法

1  前言 聚类常用于数据探索或挖掘前期,在没有做先验经验的背景下做的探索性分析,也适用于样本量较大情况下的数据预处理等方面工作。例如针对企业整体用户特征,在未得到相关知识或经验之前先根据数据本身特点...
阅读全文
Machine Learning

聚类算法——k均值和层次聚类

看看下面这张图,有各种各样的虫子和蜗牛,你试试将它们分成不同的组别? 完成了吗?尽管这里并不一定有所谓的「正确答案」,但一般来说我们可以将这些虫子分成四组:蜘蛛、蜗牛、蝴蝶/飞蛾、蜜蜂/黄蜂。 很简单...
阅读全文
Machine Learning

聚类分析:k-means和层次聚类

尽管我个人非常不喜欢人们被划分圈子,因为这样就有了歧视、偏见、排挤和矛盾,但“物以类聚,人以群分”确实是一种客观的现实——这其中就蕴含着聚类分析的思想。 前面所提到的机器学习算法主要都是分类和回归,这...
阅读全文
Bioinformatics

使用K-means进行颜色量化

在这篇文章中,我想谈谈颜色量化以及如何使用k-means聚类算法来执行它,以及优化其方法。 这里提供的代码是用python编写的,来自这个项目。 什么是颜色量化? 颜色量化是指一个减少在图像中的颜色数...
阅读全文