1. tRNAscan-SE 简介
tRNAscan-SE 能在基因组水平上进行 tRNA 扫描。该软件实际上是一个 perl 脚本,整合了 tRNAscan、 EufindRNA 和 Cove 这 3 个独立的 tRNA 检测软件。tRNAscan-SE 首先调用 tRNAscan 和 EufindRNA 鉴定基因组序列中的 tRNA 区域,然后调用 Cove 进行验证。这样既保证了前者的 sensitivities, 又保证了后者较低的假阳性概率,同时在搜索速度上提升了很多。
有关 tRNAscan-SE 的详细说明,参考其本地化软件包中的 man 文档。
tRNAscan-SE 的网页版:http://lowelab.ucsc.edu/tRNAscan-SE/。但一次最多只能进行 5M bp 序列的 tRNA 预测。
2. tRNAscan-SE 本地安装
$ wget http://lowelab.ucsc.edu/software/tRNAscan-SE.tar.gz $ tar zxf tRNAscan-SE.tar.gz $ cd tRNAscan-SE-1.3.1 $ perl -p -i -e 's#\$\(HOME\)#/opt/biosoft/tRNAscan-SE-1.3.1#' Makefile $ make && make install $ make testrun $ echo 'PATH=$PATH:/opt/biosoft/tRNAscan-SE-1.3.1/bin/' >> ~/.bashrc $ echo 'PERL5LIB=$PERL5LIB:/opt/biosoft/tRNAscan-SE-1.3.1/bin/' >> ~/.bashrc $ source ~/.bashrc
3. tRNAscan-SE 的使用
常用例子与主要参数:
$ tRNAscan-SE -o tRNA.out -f rRNA.ss -m tRNA.stats genome.fasta -A 适合于古细菌。该参数选择了古细菌特异性的协方差模型,同时稍微放宽了 EufindtRNA 的 cutoffs。 -B 适合于细菌。默认情况下,不选择,-A -B -G 或 -O 参数,则适合于真核生物。 -G 适合于古细菌,细菌和真核生物的混合序列。该参数使用 general tRNA 协方差模型。 -O 适合于线粒体和叶绿体。选择该参数,则仅使用 Cove 进行分析,搜索速度会很慢,同时也不能给出 pseudogenes 检测。 -i 使用 Infernal cm analysis only。该参数设置后,需要 cmsearch 命令,但是 tRNAscan-SE 软件包中貌似没有该程序,最终无法运行。 -C 仅使用 Cove 进行 tRNA 分析。虽然从一定程度上提高了准确性,但是会极慢,当然不建议了。 -o <file> 将结果保存到文件。 -f <file> 将 tRNA 的二级结构结果保存到文件 -m <file> 将统计结果保存到文件。
4. tRNAscan-SE 的结果说明
在真核生物中,tRNA 由 RNA 聚合酶III 在核内转录生成 pre-tRNA, 再进行加工生成有功能的 tRNA 分子(特别是一些 tRNA 序列还含有内含子)。若 tRNA 存在内含子,则结果文件中第 7 8 列会给出内含子区间,否则其值为 0 。
tRNAscan-SE 的结果中, 如果 begin 比 end 的值大,则表示 tRNA 在负义链上。
有些结果中第 5 列为 pseudogene, 这表示其一级或二级结构比较差。
最后一列是 Cove Score,该分值最低阈值为 20 。该值是一个 log ratio值。ratio 是符合 tRNA 协方差模型概率与随机序列模型概率的比值。
当然,最后最好是将表格格式结果转换为 GFF3 结果,以利于在基因组上的可视化。
原文来自:http://www.chenlianfu.com/?p=2177