2017 | Public Library of Bioinformatics

Transcriptomics

如何按照热图中的顺序输出表达量文件

大家在用热图软件，例如，pheatmap绘制热图的之后，经常要面临一个问题就是：图是画出来了，但如果想从图对应到基因，并查询对应基因的表达量就非常麻烦。因为热图聚类功能会打乱样本和基因的顺序，原来的...

03/107,207评论

阅读全文

Machine Learning

backbone、head、neck等深度学习中的术语解释

我们在阅读文章的时候，经常看到backbone head neck 这一类的术语，但是我们可能并不知道是什么意思，这篇文章就是对这些术语进行解释： backbone：翻译为主干网络的意思，既然说是主...

03/08754评论

阅读全文

Machine Learning

Transformer模型详解

Transformer 是 Google 的团队在 2017 年提出的一种 NLP 经典模型，现在比较火热的 Bert 也是基于 Transformer。Transformer 模型使用了 Self-...

03/04950评论

阅读全文

Machine Learning

如何选择神经网络的超参数

1. 神经网络的超参数分类神经网路中的超参数主要包括: 1. 学习率 η 2. 正则化参数 λ 3. 神经网络的层数 L 4. 每一个隐层中神经元的个数 j 5. 学习的回合数Epoch 6. 小批...

03/043,555评论

阅读全文

Genomics

Browse基因浏览器介绍

日常工作的窘境谈基因浏览器的必要性，不需要扯“各种基因组序列以及高通量测序数据爆炸性增长，满足基因组可视化、大规模基因组数据分析和应用需要”这些有的没的，只需要从日常实际需求出发就可以。在日常数据...

02/286,681评论

阅读全文

Genomics

从零开始完整学习全基因组测序（WGS）数据分析：第5节理解并操作BAM文件

经过了第四节的长文，我想大家基本上已经知道了一个WGS流程该如何构建起来了吧。但在那一节中限于篇幅有两个很重要的文件我没能展开来讲，分别是：BAM和VCF文件。这篇我们先说BAM文件。什么是BAM ...

02/2713,088评论

阅读全文

Genomics

从零开始完整学习全基因组测序（WGS）数据分析：第4节构建WGS主流程

这篇文章很长，超过1万字，是本系列中最重要的一篇，因为我并非只是在简单地告诉大家几条硬邦邦的操作命令。对于新手而言不建议碎片时间阅读，对于有一定经验的老手来说，相信依然可以有所收获。在开始之前，我想先...

02/2728,07513

阅读全文

Genomics

从零开始完整学习全基因组测序（WGS）数据分析：第3节数据质控

从这一节开始详细讲述正式流程的搭建，我将结合具体的例子努力争取将这个系列写成比GATK最佳实践更加具体、更具有实践价值的入门指南。整个完整的流程分为以下6部分：原始测序数据的质控 read比对，排序...

02/2714,0851

阅读全文

Genomics

从零开始完整学习全基因组测序（WGS）数据分析：第2节 FASTA和FASTQ

在WGS数据的分析过程中，我们会接触到许多生物信息学/基因组学领域所特有的数据文件和它们特殊的格式，在这一节中将要介绍的FASTA和FASTQ便是其中之一二。这是我们存储核苷酸序列信息（就是DNA序列...

02/2717,7293

阅读全文

Genomics

从零开始完整学习全基因组测序（WGS）数据分析：第1节测序技术

前言基因测序已是时下热门，目前除了华大基因之外，其他分布于全中国的大型测序平台（HiSeq X 10）还有约10个，每个每年大概能完成1.8万人的高深度全基因组测序，加起来就是18万人，如果加上华大...

02/2731,2711

阅读全文