Inparanoid是一个寻找物种间直系同源基因的软件,同时相应的网站目前包含了100 organisms, 1687023 sequences。
Inparanoid单机版程序是一款非常优秀的寻找直系同源基因(orthologs)的工具,目前已经开发到4.1版本,可以在线获取(http://software.sbc.su.se/cgi-bin/request.cgi?project=inparanoid)。
软件的基本用法:
1. 输入数据:
两个物种的全部蛋白序列,分别以fasta格式存储,A.pep, B.pep
2.准备工作:
该软件需要调用系统中其他程序,如BLAST,使用前需要修改程序开头部分的BLAST路径设置。
该软件的相关参数也在程序源文件中修改
3.运行方法:
perl inparanoid A.pep B.pep
4.程序输出:
# Output options: #
$output = 1; # table_stats-format output #
$table = 1; # Print tab-delimited table of orthologs to file "table.txt" #
# Each orthologous group with all inparalogs is on one line #
$mysql_table = 1; # Print out sql tables for the web server #
# Each inparalog is on separate line #
$html = 1; # HTML-format output #
相关网站:http://inparanoid.sbc.su.se/cgi-bin/index.cgi
相关论文:
"InParanoid 7: new algorithms and tools for eukaryotic orthology analysis" Ostlund G, Schmitt T, Forslund K, Kostler T, Messina DN, Roopra S, Frings O and Sonnhammer ELL Nucleic Acids Res. 38:D196-D203 (2009) [PDF]
"InParanoid 6: eukaryotic ortholog clusters with inparalogs" Berglund AC, Sjolund E, Ostlund G and Sonnhammer ELL Nucleic Acids Res. 36:D263-266 (2008) [PDF]
"Inparanoid: A Comprehensive Database of Eukaryotic Orthologs" O'Brien Kevin P, Remm Maido and Sonnhammer Erik L.L NAR 33:D476-D480 (2005) [PDF]
"Automatic clustering of orthologs and in-paralogs from pairwise species comparisons" Maido Remm, Christian E. V. Storm, and Erik L. L. Sonnhammer J. Mol. Biol. 314:1041-1052 (2001) [PDF]
1F
请问输出结果中应该看哪个文件的结果?并且满足什么标准可以看为是同源基因?能解释一下不?谢谢~
B1
@ qqtwee 其实inparanoid程序的四个输出结果是同一个内容,只是四种不同的展现形式。我一般只输出$mysql_table=1这个,这样结果中会有一个以sqltable开头的文件,而且如果做多个物种分析的话,sqltable可以进一步直接用作multiparanoid的输入
B2
@ ybzhao 谢谢!还想请教一下sqltable中的所以结果都是所分析的两个物种的同源基因吗?还是说要对sqltable中的结果要再做一些限制?如果需要的话,需要做哪些限制条件?非常感谢站长的经验分享!谢谢!
B3
@ qqtwee sqltable中的结果不用再做限制了,在运行inparanoid的时候限制参数已经设定了嘛
2F
您好,我正在学习这个软件包,但是发现这个4.1的版本没有blast2faa.pl脚本,不知道该去哪里下载
B1
@ bingzt 我不太清楚blast2faa.pl这个脚本的作用是什么,我下载的程序里面也没有。
B2
@ ybzhao 非常感谢您的回复,我们再算bootsrap值,提示没有这个文件,不过影响似乎也不是非常大 :mrgreen:
3F
您好 我正在学习这个脚本,但是在打开文件过程中总是会提示
WARNING: the -C 3 argument is currently experimental 这是什么原因造成的呢,应该如何去除这个问题。
[blastall] FATAL ERROR: 1_g: Database /home/bliu/Gene/yyh16_protein.fa was not found or does not exist 每次读取序列会提示这个,但是刚才查找时发现有位师兄做的提示错误他说也出来结果了,是不是这个影响不是很大。
这个脚本的输出位置是什么,自动设置的吗?如果是直接在两个序列后面添加一个目录会不会当成序列读取,或者是用>表示输出就可以了。
因为我是新开始学习的,问题可能比较多,希望师兄可以给我指导一下
B1
@ Ben_Liu @Ben_Liu : @Ben_Liu,你好,你的问题解决了吗,如何解决的?
B2
@ rinaws 我也遇到[blastall]WARNING: the -C 3 argument is currently experimental,怎么解决
B3
@ bio 兄弟,你的blastall能不能分享一下
4F
您好
输入命令,建库完成后,提示我输入新日期,输入以后运行不下去,这是怎么回事啊?
5F
confidence value 的cutoff是0.05,是不是太低了?
6F
请问这个软件怎么下载,怎么使用呢?
7F
楼主你好,请问一下这脚本的而在线网站,在调用blast时默认设置的E-value是多少?
8F
难道大家没发现这个软件调用的是已经不再使用的blast版本里面的blastall 和 formatdb命令吗。。。现在的blast已经是blast2.8+了。。然而,如果要想自己blast,就必须有4个blast output文件,但是这四个文件的正确格式示例,根据手册指南中所说,压缩包本应该有但是也找不到。。这个软件让人很难过啊。。。
B1
@ 雨太久 哥们,我也发现了。不知道它是用的那个blast。blastall倒是可以找到,但是formatdb已经被makedb取代了。你问题解决了吗?能交流一下吗?我qq2712655641
B2
@ 请输入您的QQ号 我没用这个软件了,导师帮忙在服务器上安装了orthmcl,这个软件也可以找到两个物种之间的直系同源基因