现有的基因芯片种类不要太多了! 但是重要而且常用的芯片并不多! 一般分析芯片数据都需要把探针的ID切换成基因的ID,我一般喜欢用基因的entrez ID。一般有三种方法可以得到芯片探针与gene的对应...
芯片探针注释基因ID或者symbol,并对每个基因挑选最大表达量探针
在R里面实现这个功能其实非常简单,难的是很多packages经常会出现安装问题,更有的人压根不看芯片平台是什么,芯片对应的package是什么,就开始到处发问,自学能力实在是堪忧! 我前面有写目前所有...
常用的数据分析方法汇总
一、描述统计 描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。 集...
SAM/BAM文件处理
当测序得到的fastq文件map到基因组之后,我们通常会得到一个sam或者bam为扩展名的文件。SAM的全称是sequence alignment/map format。而BAM就是SAM的二进制文件...
solexaQA对测序数据进行简单过滤
一.下载该软件 http://solexaqa.sourceforge.net/index.htm 下载解压开 现在已经把它的三个功能整合到一起啦 之前是分开的程序,我主要用它的两个perl 程序,我...
下载最新的蛋白相互作用数据库-STRING
string数据库是PPI领域里面最完备已经最受欢迎的数据库了。如果直接在谷歌里面搜索PPI,映入眼帘就是string的官网,它们的主页现在是html5啦,比较精美: http://string-db...
转录因子预测数据库JASPAR使用教程
JASPAR 数据库包涵了 9 个不同的子库,其中 JASPAR CORE 数据库属于高质量,非冗余转录因子数据库,包含的信息源于已经实验证实的真核生物转录因子结合位点。可供查找的物种有脊椎动物,线虫...
Cytoscape基础教程笔记
昨天开始学用Cytoscape,其tutorial分为两个部分,基础的和高级 的。基础教程又分成了四课:Getting Started、Filters & Editor、Fetching Ex...
可复现的计算科学研究十条简单规则,以及自己的一些经验
《Ten Simple Rules for Reproducible Computational Research》对做计算科学方面研究的同仁有非常好的借鉴意义,本文结合我自己的经验对其阐述。 科学研...
使用Trimmonmatic进行NGS reads的过滤与修剪
1. Trimmomatic Trimmomatic使用JAVA运行,速度快。同时该软件进行reads QC的原理非常好。因此,最推荐使用此软件进行NGS reads的QC。 参考文献:Lohse M...