这个软件(也有在线服务器,见其官网http://www.bioinformatics.org/cd-hit/)是中国人(Weizhong Li)写的,很好用,最大的特点就是快。基本思路是首先对所有序列...
DDBJ/EMBL/GenBank Accession的命名规则
The format for GenBank Accession numbers are: GenBank Accession numbers命名的规则是: Nucleotide: 1 letter ...
NCBI RefSeq命名格式的详细说明
NCBI RefSeq (美国国立生物技术信息中心参考序列库) 是目前世界上最具有权威性的序列数据库。NCBI的参考序列计划(RefSeq)将为中心法则中自然存在的分子,从染色体到mRNA到蛋白提供参...
将比对好的fasta序列转换成relaxed phylip格式
有时,在推断进化树的过程中,我们希望phylip格式的文件能够将序列的名称完整得保留下来。通常情况下,我们的名称会超过10字符, 而ClustalX和MUSCLE等软件给出的phylip文件是严格的p...
NCBI/DDBJ/EMBL序列的标识符:GI number和Accession.Version
GI number及Accession.Version就像是序列的身份证号码一样。通过这个号码,我们能在NCBI/DDBJ/EMBL等数据库查到该序列的数据。 问题: 为什么会有两种类型的序列标识符(...
GenBank数据库格式的说明
GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。这些文件按类别分为几组:有些按照系统发...
Perl常见特殊变量
1. $_ $ARG,常常是一个默认变量 2. @_ @ARG,子例程参数表 3. {row.content} $PROGRAM_NAME,本程序的名字 4....
在R语言绘图中标注带参数的公式
在以往R语言的教材、帮助示例和各类读书笔记中,有关图形中标注公式的介绍只有指定符号和数字的介绍。如何像SPSS那样在计算结束后将带参数的模型计算公式一并绘制在图形中呢?其实提取模型参数很简单,关键是如...
推荐一个利用R语言画图的网站
在做生物信息数据挖掘、分析之后为了可视化,我们常常需要画各种图。这里给大家推荐一个很不错的网站。http://addictedtor.free.fr/graphiques/ 这个网站里面包含了大量的利...
测序数据分析工具大全
目前有不少用于基因组装配和比对的程序和算法,但是该选哪一个呢?许多序列分析的专家认为,这取决于基因组的大小、读取有多长,以及采用的是哪种测序技术。通常,软件还需要优化,以满足每个实验室的独特需求。在此...