在上一篇数据上传指南中,我们为大家介绍了GEO上传操作指南,今天小编就来介绍另一种重要的NCBI数据库SRA,它可用于存储测序的原始数据,实现资源共享。小编将SRA数据库的提交过程做一个简单概述,希望...
对Protein序列进行InterPro注释
使用EBI的InterPro数据库,能对蛋白序列通过结构域方法进行基因家族分类注释。InterPro数据库整合了13个基因家族、结构域和功能位点的数据库,包括Pfam和CDD等。此外,InterPro...
生物信息常见文件的格式以及查看方式
生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式。在分析的过程中还会有众多中间文件的生成,如bed、bed12、...
GEO数据上传操作指南
科研工作者在发表paper的时候,如果文章中涉及高通量测序数据分析,就需要提前向NCBI上传数据获得登录号。然而,如何向NCBI提交这些序列?今天就来介绍一种重要的NCBI数据库GEO,它可用于存储测...
WGCNA加权基因共表达网络分析
序章 这个工具现在很火,高分文章用到很多。 加权基因共表达网络分析(WGCNA,Weighted gene co-expression network analysis) WGCNA能够从复杂数据中(...
下载NCBI的SRA数据: pysradb
这里推荐一个下载NCBI SRA数据的神器,pysradb。这是一个基于python开发的软件,支持从命令行运行,也可以作为python的package直接在python代码中调用。 命令行下所有参数...
怎样预测Hi-C测序数据量
细胞核内的染色质构像一般分以下几个层级 Chromosome Territories Compartment A/B Topologically Associating Domains (TADs) ...
用GEOquery从GEO数据库下载数据
Gene Expression Omnibus database (GEO)是由NCBI负责维护的一个数据库,设计初衷是为了收集整理各种表达芯片数据,但是后来也加入了甲基化芯片,甚至高通量测序数据! ...
HGNC数据库简介
人类基因命名委员会(HUGO Gene Nomenclature Committee);人类基因组命名委员会! 其实有了NCBI的entrez ID,然后还有refseq里面的ID,还有ensembl...
生物信息聚类分析方式汇总
1 定义 聚类分析(Cluster Analysis)是一类将数据所对应的研究对象进行分类的统计方法,它是将若干个个体集合,按照某种标准分成若干簇,并且希望簇内的样本尽可能地相似,而簇与簇之间要尽可能...