lazy-img
Script

使用mamba加快conda安装软件速度

conda 是⼀个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。但是使用conda时经常会发现安装很慢,除了最基本的网络问题可以换成国内镜像来解决,c...
阅读全文
Script

Linux命令解释工具

很多同学刚接触生物信息的时候,对linux的命令多少存在一些恐惧和障碍。不知道为什么要敲这一对命令,他们的参数是什么意思。这里跟大家分享一个有趣的linux命令学习网站。它能够帮助大家很好地去理解li...
阅读全文

Machine Learning

深度学习参数优化和训练技巧总结

寻找合适的学习率(learning rate) 学习率是一个非常非常重要的超参数,这个参数呢,面对不同规模、不同batch-size、不同优化方式、不同数据集,其最合适的值都是不确定的,我们...

Single Cell

scRNA-seq单细胞转录组数据分析流程

为了确保单细胞转录组分析工具的可用性,许多开发人员已经做出了相当大的努力。到2021年5月28日,已经开发并提供了近1000种不同的生物信息学工具。 01 数据预处理 单细胞转录组原始测序数...

Bioinformatics

WGCNA的全自动安装方法

随着现在测序价格不断走低,转录组数据爆炸式增长,WGCNA被广泛应用于基因共表达网络分析。这里介绍一下WGCNA的全自动安装方法。 前提: 在电脑或者服务器中安装R version 3.0....

Genomics

gggenes绘制多物种基因结构比较

gggenes是ggplot2的扩展包,用于绘制基因结构图、多物种基因比较图的很好玩的工具。https://wilkox.org/gggenes/ 安装 一种是安装稳定版本的gggene i...

Transcriptomics

DESeq2差异基因分析和批次效应移除

基因表达标准化 不同样品的测序量会有差异,最简单的标准化方式是计算 counts per million (CPM),即原始reads count除以总reads数乘以1,000,000。 ...

Epigenetics

各种染色体元件鉴定方法比较

最近有人问我关于ATAC-Seq与ChIP-Seq的区别。刚好在分析ATAC-Seq和DNase-Seq的数据,于是做了个简单介绍。在六六_ryx的博客里面看到下面的介绍,做了简单修改放在这...

Script

R语言画图、数据分析、机器学习快速参考手册

在做生物信息数据分析中,R的使用是非常普遍。利用R来做数据处理和画图几乎是家常便饭。这里跟大家分享各种R package使用手册的简要版手卡,其中包括ggplot画图、R中数据操作、机器学习...

Statistics

深度学习必须掌握的 13 种概率分布

作为机器学习从业者,你需要知道概率分布相关的知识。这里有一份最常见的基本概率分布教程,大多数和使用 python 库进行深度学习有关。 一 概率分布概述 共轭意味着它有共轭分布的关系。 在贝...

Evolution

Evoview:进化树的装饰与美化

在之前的Evolview系列文章已为大家介绍过进化树与条形图、点图、热图以及蛋白结构域组合绘制,今天重点介绍进化树的装饰以及按簇进行分组美化。比如,学习绘制Evolview最美的一个展示案例...

Glossary

HiC术语图解与分析软件汇总

序 言 接触HiC数据有一些时日了,想着总结一下关于HiC的一些特定术语以及数据分析的相关软件,做为备忘录的同时也可以方便后来的人。 先从概念开始,下面的示意图基本完美地展示了那些耳熟能详的...