当克隆得到一个基因后,就需要对基因信息向NCBI提交,获得一个登录号,以后写文章就可以直接引用登录号,而不需要在文章中列出序列信息,这里主要介绍比较常见的提交DNA和cDNA信息。
1、打开NCBI的数据提交页面,DNA和cDNA就是第一个,有两种方式,Banklt是网页在线形式,Sequin是本地批量形式,网页形式的话应先点右上角的NCBI注册,注册好后再返回到这个页面点击Banklt,NCBI将保存你提交的数据在你的帐户,如果一次没完成,下次登录后可以继续提交,介而网络的原因,不推荐这种方式。第二种是用Sequin软件在本地生成提交信息文件,然后将文件通过邮件的形式发送给NCBI,这里主要介绍这种方式,Banklt注册的程序内容也和Sequin一样。
2、下载sequin,如果是windows系统就下载”sequin.win.exe“。
3、双击打开程序”sequin”,如果打不开的话,按“win+R”,输入”cmd”,进入sequin存放的位置。如放这个文件夹中“D:\Program Files\”,首先在刚打开的命令符窗口中输入”D:”,进入D盘后,输入”cd Program Files”,进入这个文件夹后,输入“sequin.exe”就可以了。
4、打开软件后,点第一行的”Start New Submission”,提交新的序列。
5、在文本域中输入序列的题目,如果是多序列的话就概括一下,这个关系不是很大,文章发表后可以修改这个题目为文章题目,但不填不行;上面有两个单选按钮,”Immediately After Processing”是提交后马上公布,”Release Date”是在规定的时间之后发布,如果你提交的序列还没有写文章,建议还是选”Release Date”,然后点”Next Page”进行下一步。
6、下一步填写通讯作者信息,注意中国人的名称的话,姓是“First Name”,名是”Last Name”,不填”M.I.”,电话和传真前面加上中国的区号”+0086″,填好后”Next Page”。
7、在接下来的这个页面填写作者信息,Consortium边的文本框可以不管它,然后点“Next Page”。
8、填写通讯作者联系地址,注意Country应填全称”P.R China”。
9、接下来的这部是”Preparing the Sequences”,选择”Use the normal submission dialog”,如果是特殊序列,就选择下面的选项。
10、接下来是”Sequence Format”,如果是提交基因,选择默认的可以了。
11、接下来是”Organism and Sequences”,将你的序列按照格式以FASTA格式保存一个文本文件,例如:
>A-0V-1-A [organism=Gallus gallus] [clone=C] TCACTCTTTGGCAACGACCCGTCGTCATAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTATTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT >A-0V-2-A [organism=Drosophila melanogaster] [strain=D] TCACTCTTTGGCAACGCGTCGTCACAATAAAGATAGAGGGGCAACTAAAGGAAGCTCTATTAGATACAGGAGCAGATGATACAGTATTAGAAGAAAT
如果知道功能,也可在后面加上描述信息,如”Homo sapiens superoxide dismutase 1, soluble (SOD1), mRNA”;
12、接下来选择测序方法,如果是单个基因测序,一般是”Sanger dideoxy sequencing”,具体的方法可以咨询测序公司,下面的选项可以先不管。
13、接下来页面都不要先填,一直点”Next Form”,最后那里填上蛋白名称和描述信息。
14、在接下来的页面在Annotate里注释详细的信息就可以了,一般如果是基因的话也只需要填CDS和exon信息就可以了。
15、填好后Save保存,会生成一个以sqn后缀的文件,将这个文件发给gb-admin@ncbi.nlm.nih.gov就可以了,邮件不需要写什么内容,写了别人也不会看,接下来就等着回复吧,一般五个工作日就会有结果。
原文来自:http://bioinformation.cn/?p=453
1F
请问如何知道基因的CDS和Exon信息?
来自外部的引用