基因组注释分析主要包括哪些内容 ?

基因组注释包括以下方面的内容:

(1) 重复序列的预测。通过比对已知的重复序列数据库,找出序列中包含的重复序列,识别类型并转化为N或者X,统计各种类型重复序列的分布。

(2) 编码基因的预测。通过将转录组或EST数据比对到拼接后的基因组序列上,找出编码基因位置,预测编码基因结构。或者通过专业的外显子预测软件,预测编码基因的外显子结构。

(3) 小RNA基因的预测。通过比对已知的小RNA的数据库,或者通过生物信息学软件预测,找出这些小RNA基因,并进行分类。

(4) 调控序列和假基因的预测。

基因功能的注释,使用的数据库包括NT/NR, SwissProt/TrEMbl, InterPro, KEGG, COG, Gene ontology等,使用比对的方法,如blast,找出同源相近的基因,并注释功能。

基因组注释分析主要包括哪些内容 ?

 

    • suMMer 0

      :shock: 内容很笼统啊,而且几个点之间的内容还有重复;补充一下第三点的吧,应该是:(3)非编码RNA的注释~~

    发表评论

    匿名网友

    拖动滑块以完成验证