在WGS数据的分析过程中,我们会接触到许多生物信息学/基因组学领域所特有的数据文件和它们特殊的格式,在这一节中将要介绍的FASTA和FASTQ便是其中之一二。这是我们存储核苷酸序列信息(就是DNA序列...
生物信息常见文件的格式以及查看方式
生信分析过程中,会与很多不同格式的文件打交道,除了原始测序数据fastq之外,还需要准备基因组文件fasta格式和基因注释文件gtf格式。在分析的过程中还会有众多中间文件的生成,如bed、bed12、...
快速计算fasta序列长度的方法
最近看了一下进入PLoB的网页来路分析,看到有同学搜索计算fasta序列长度。其实自己在之前的数据分析中也遇到过相关的问题,这里给大家分享两种我常用的方法。 方法一:linux下用awk计算fasta...
Bioperl:从本地文件中获取fasta序列
从NCBI上下载一个fasta格式的文件,20条WRKY家族基因的蛋白序列,wrky.fasta 文件准备好了,我们想知道它的名称、描述和序列内容!有了这些信息,我们就可以做别的事情,比如判断它是DN...
Phd2Fasta
简介 Phd2fasta 是 phred\phrap 软件包的一部分,phred\phrap 软件包由华盛顿大学分子生物技 术学院的 Phil Green 和 Brent Ewing 开发,主要用于学...
DNA测序峰图转化成Phred格式
简介 Phred是 phred\phrap 软件包的一部分,phred\phrap 软件包由华盛顿大学分子生物技术学院的 Phil Green 和 Brent Ewing 开发,主要用于学术科研活动。...
将比对好的fasta序列转换成relaxed phylip格式
有时,在推断进化树的过程中,我们希望phylip格式的文件能够将序列的名称完整得保留下来。通常情况下,我们的名称会超过10字符, 而ClustalX和MUSCLE等软件给出的phylip文件是严格的p...
DNA各种序列格式介绍
1.Plain格式 A sequence in plain format may contain only IUPAC characters and spaces (no numbers!). Not...
FASTX-Toolkit
FASTX-Toolkit是一款用于处理Short-Reads FASTA/FASTQ文件的程序,里面包含了丰富的FASTA/FASTQ文件格式转换、统计等命令。 下面是其功能介绍: FASTQ-t...
Fasta格式说明
序列的Fasta格式是最经常看到的格式之一。下面简介说明一下什么是FASTA格式。 Fasta格式开始于一个标识符:">",然后是一行描述,下面是一行行的序列。每一行最好不要超过80个字母。 如...