重新开始更新我的博客。
这一周主要就在纠结怎么用HTSeq计算read count。最初尝试使用linux服务器,最后没安装成功。换过mac,还是不成功。最后只好选择在window下安装的方法。
安装HTSeq之前,需要先安装Python,numpy,matplotlib。这些软件都有windows版本,很多都是默认32bit系统。
所以在安装这些软件前,你要确认电脑的系统是32bit还是64bit。
Python,numpy,matplotlib,HTSeq这些软件的版本之间也需要相互匹配。如安装HTSeq你就只能安装Python2.7系列。
从网上找到以下组合,python-2.7.5,numpy1.6.2,matplotlib1.2.0以及HTSeq-0.5.4p2。(没有标明网址的软件,只需要在google中搜索以下就可以找到)
1.下载python-2.7.5.amd64.msi
2、下载numpy,从http://www.lfd.uci.edu/~gohlke/pythonlibs/下载numpy-unoptimized-1.7.1.win-amd64-py2.7.exe
3、下载matplotlib1.2.0
4、下载HTSeq-0.5.4p2.win-amd64-py2.7.exe
另外,找不到模块这个错误,需要安装vcredist_x64_2012.exe(HTSeq网页上的版本可能不对)
整个过程,最重要的是版本兼容,都需要x64版本。
=============================================================================================
现在开始使用HTSeq啦。
cmd
cd C:\Python27
python -m HTSeq.scripts.count -s no input.sam annotation.gtf >output.htseq.counts
开始计算----------------
最后,计算得到的output.htseq.counts就在C:\Python27这个文件夹中。
如果你打开output.htseq.counts,发现所有的count都为0,那是因为你的annotation.gtf与input.sam文件生成过程用到的gtf文件不同,换成input.sam用过的gtf文件就可以。
HTSeq的作者Simon Anders建议使用ENSEMBL的gtf文件。
原文来自:http://chenxindayangzhou.blog.163.com/blog/static/2809209220137234916786/