一、引子————边界检测 我们来看一个最简单的例子:“边界检测(edge detection)”,假设我们有这样的一张图片,大小8×8: 图片中的数字代表该位置的像素值,我们知道,像素值越大,颜色越亮...
基于pytorch代码了解transformer的自注意力机制
import torch import torch.nn as nn import torch.nn.functional as F class MultiHeadAttention(nn.Modul...
机器学习之特征选择(Feature Selection)
1 引言 特征提取和特征选择作为机器学习的重点内容,可以将原始数据转换为更能代表预测模型的潜在问题和特征的过程,可以通过挑选最相关的特征,提取特征和创造特征来实现。要想学习特征选择必然要了解什么是特征...
R语言画图、数据分析、机器学习快速参考手册
在做生物信息数据分析中,R的使用是非常普遍。利用R来做数据处理和画图几乎是家常便饭。这里跟大家分享各种R package使用手册的简要版手卡,其中包括ggplot画图、R中数据操作、机器学习等等。下面...
WGCNA的全自动安装方法
随着现在测序价格不断走低,转录组数据爆炸式增长,WGCNA被广泛应用于基因共表达网络分析。这里介绍一下WGCNA的全自动安装方法。 前提: 在电脑或者服务器中安装R version 3.0.0或更高的...
GSEA分析结果详细解读
在解读传统的富集分析结果时,经常会有这样的疑问,一个富集到的通路下,既有上调差异基因,也有下调差异基因,那么这条通路总体的表现形式究竟是怎样呢,是被抑制还是激活?或者更直观点说,这条通路下的基因表达水...
怎么分析关注的功能基因集在转录组结果中表现如何?
拿到转录组数据之后,很多人最关心的恐怕就是差异基因的富集分析了,它阐明了实验中样本差异在基因功能上的体现。 但有时候,我们在设计实验的时候就已经对某些特定功能的基因集特别关注了,那么如何分析这些基因集...
GSEA结果解读
1 Enrichment score(ES) ES是GSEA最初的结果,反应全部杂交data排序后,在此序列top或bottom富集的程度。 ES原理:扫描排序序列,当出现一个功能集中的gene时,增...
利用GEM-library创建基因组Mappability文件
现在测序应用越来越广泛,各种Seq满天飞,譬如ChIP-Seq, DNase-Seq等等。在align完测序的reads后,有些位置reads多有些位置reads 少。除了本身的生物特性外是否还与其他...