如果有一段序列,想找到其上下游基因,方法很多,发现用UCSC比较直观明了。
以下面这段人源序列为例,首先打开UCSC 的Blat界面,选择基因组为“Human”,版本选择最新的“Fed.2009(GRCh37/hg19)”,其它的采用默认的,在文本域中拷入下面的序列,点击文本域下的“submit”提交就可以了。
AGGAACAAGGGCCTCTGTCTGCCCAGCTGCCTCCCCCTTTGGGTTTTGCCAGACTCCACAGTGCATACGTGGGCTCCAACAGGTCCTCTTCCCTCCCAGTCACTGACTAACCCCGGAACCACACAGCTTCCCGTTCTCAGCTCCACAAACTTGGTGCCAAATTCTTCTCCCCTGGGAAGCATCCCTGGACACTTCCCAAAGGACCCCAGTCACTCCAGCCTGTTGGCTGCCGCTCACTTTGATGTCTGCAGGCCAGATGAGGGCTCCAGATGGCACATTGTCAGAGGGACACACTGTGGCCCCTGTGCCCAGCCCTGGGCTCTCTGTACATGAAGCAACTCCAGTCCCAAATATGTAGCTGTTTGGGAGGTCAGAAATAGGGGGTCCAGGAGCAAACTCCCCCCACCCCCTTTCCAAAGCCCATTCCCTCTTTAGCCAGAGCCGGGGTGTGCAGACGGCAGTCACTAGGGGGCGCTCGGCCACCACAGGGAAGCTGGGTGAATGGAGCGAGCAGCGTCTTCGAGAGTGAGGACGTGTGTGTCTGTGTGGGTGAGTGAGTGTGTGCGTGTGGGGTTGAGGGCGTTGGAGCGGGGAGAAGGCCAGGGGTCACTCCAGGATTCCAATAGATCTGTGTGTCCCTCTCCCCACCCGTCCCTGTCCGGCTCTCCGCCTTCCCCTGCCCCCTTCAATATTCCTAGCAAAGAGGGAACGGCTCTCAGGCCCTGTCCGCACGTAACCTCACTTTCCTGCTCCCTCCTCGCCAATGCCCCGCGGGCGCGTGTCTCTGGACAGAGTTTCCGGGGGCGGATGGGTAATTTTCAGGCTGTGAACCTTGGTGGGGGTCGAGCTTCCCCTTCATTGCGGCGGGCTGCGGGCCAGGCTTCACTGAGCGTCCGCAGAGCCCGGGCCCGAGCCGCGTGTGGAAGGGCTGAGGCTCGCCTGTCCCCGCCCCCCGGGGCGGGCCGGGGGCGGGGTCCCGGCGGGGCGGAGCCATGCGCCCCCCCCTTTTTTTTTTAAAAGTCGGCTGGTAGCGGGGAGGATCGCGGAGGCTTGGGGCAGCCGGGTAGCTCGGAGGTCGTGGCGCTGGGGGCTAGCACCAGCGCTCTGTCGGGAGGCGCAGCGGTTAGGTGGACCGGTCAGCGGACTCACCGGCCAGGGCGCTCGGTGCTGGAATTTGATATTCATTGATCCGGGTTTTATCCCTCTTCTTTTTTCTTAAACATTTTTTTTTAAAACTGTATTGTTTCTCGTTTTAATTTATTTTTGCTTGCCATTCCCCACTTGAATCGGGCCGACGGCTTGGGGAGATTGCTCTACTTCCCCAAAT
在接下来的页面选择第一个100%匹配的结果,如果你的序列有多个100%匹配的结果,那么说明此序列在基因组中多个位置存在。点击“browser”的链接就进入了浏览器模式,如果你想知道序列的详细情况可以点击旁边的“detail”。
在浏览器模式下,首先设置显示的内容,默认的太多了,没法看,如果只想找基因的话,只需要下图标出的两个就可以了,其它的都设为“hiden”,设置好一组后就点上面的“refresh”,马上就可以看到上面图形的变化。
下图显示了一些主要区域的说明,通过“zoom in”和“zoom out”放大缩小基因组的显示范围,通过左边”move”调整你的序列在图形在的位置,一个基因显示多排说明此基因有多个编码方式及对应多个accession num。
通过不断缩小就可找到你的序列上下游基因如下图,其它东东可以自己一个个慢慢研究。
原文来自:http://bioinformation.cn/?p=209