对于有很多(成百上千)研究对象时,把对象分组是最常用的研究手段。而通过观察值进行聚类是非常有效的方法,可以按事物观察值有效的合理分组,再进一步分析各组的相同、与不同,可以很好的发现其中的规律。 本文将...
深度学习中使用的batchsize, step(iteration), epoch 含义以及其关系
在深度学习中,常常会遇到batch size, step(iteration), epoch等词。对于很多新手不太清楚这些词之间的关系是什么。这里做一个简单介绍。 名词 定义和含义 epoch 一个e...
关于学术论文Figures,你不能不知道的秘密
做完实验, 又要苦逼地整理数据, 绘制学术图表了? 今天让我们一起学习下 那些关于论文Figures, 你不能不知道的秘密 科技研究资料经过整理和计算各种必要的统计指标后,所得的结果除了使用适当的文字...
R语言添加p-value和显著性标记
提了一下如何通过ggpubr包为ggplot图添加p-value以及显著性标记,本文将详细介绍。利用数据集ToothGrowth进行演示 #先加载包 library(ggpubr) #加载数据集Too...
详解motif的PFM矩阵
在之前的文章中,对motif的几个基本概念进行了简单介绍。一致性序列采用IUPAC碱基表示标准来描述motif的序列信息,sequence logo是结合碱基分布频率和一致性序列的一种直观展示形式。本...
GSEA富集分析 – 界面操作
GSEA定义 Gene Set Enrichment Analysis (基因集富集分析)用来评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的贡献。其输入数据包...
全面了解ROC曲线
初识ROC曲线 1. ROC的前世今生: ROC的全称是“受试者工作特征”(Receiver Operating Characteristic)曲线,首先是由二战中的电子工程师和雷达工程师发明的,用...
决策曲线分析法(Decision Curve Analysis,DCA)曲线
我们都知道,评价一种诊断方法是否好用,一般是作ROC曲线,计算AUC。但是,ROC只是从该方法的特异性和敏感性考虑,追求的是准确。而临床上,准确就足够了吗?患者就一定受益吗? 比如我通过某个生物标志物...
六大聚类算法快速了解
在机器学习中,无监督学习一直是我们追求的方向,而其中的聚类算法更是发现隐藏数据结构与知识的有效手段。目前如谷歌新闻等很多应用都将聚类算法作为主要的实现手段,它们能利用大量的未标注数据构建强大的主题聚类...
手推公式带你轻松理解L1/L2正则化
前言 L1/L2正则化的目的是为了解决过拟合,因此我们先要明白什么是过拟合、欠拟合。 过拟合:训练出的模型在测试集上Loss很小,在训练集上Loss较大 欠拟合:训练出的模型在测试集上Loss很大,在...