Illumina全基因组SNP芯片不仅可以call snp,还可以call CNV和LOH等结构性的变异。对于结构性变异的鉴定是通过BAF和logRratio来计算。CNV和LOH的区别在于CNV中l...
高度重复序列简介
高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快。在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占20%。高度重复顺序又按其结构特点分为三种。 (1)倒位(反...
生物芯片与第二代测序技术丁香园答疑帖精选(上)
生物芯片与第二代测序技术是两种重要的高通量基因组学研究方法,在生命科学研究领域有着极其广泛的应用前景。经过近20年的发展,生物芯片技术逐渐成熟,正在向着 “高密度,灵活定制,微量样品” 的方向发展,从...
生物芯片与第二代测序技术丁香园答疑帖精选(下)
生物芯片与第二代测序技术是两种重要的高通量基因组学研究方法,在生命科学研究领域有着极其广泛的应用前景。经过近20年的发展,生物芯片技术逐渐成熟,正在向着 “高密度,灵活定制,微量样品” 的方向发展,从...
利用转录组测序如何研究选择性剪接规律?
利用转录组测序如何研究选择性剪接规律? 答:在真核生物中,选择性剪接现象普遍存在。基因转录形成的mRNA前体(pre-mRNA)在剪接过程中因去掉不同的内含子区域或保留不同的外显子区域,可形成不同的剪...
mpiBlast的安装和使用
之前一直在用NCBI新的blast+,速度不错。但是blast的线程是内存空享的,即只能单节点运算。手头能使用的计算资源只能达到单节点16 threads。动辄上万条的对比实在是太慢了。遂萌生用mpi...
将序列比对的结果保存为漂亮的图片
多序列比对在分子生物学中是一个基本方法,用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及在分子进化分析方面均有很大帮助,Clustal W(D...
主成份分析(PCA)在生物芯片样本筛选中的应用及在R语言中的实现
主成份分析方法可以对基因芯片的样本聚类情况进行可视化,可获得样本在实验组和对照组之间的直观分布情况,从而便于对异常样本进行检测和去除,否则异常样本的存在将会对差异基因的鉴定等后续分析造成不利影响。下面...
多重检验中的FDR错误控制方法与p-value的校正
数据分析中常碰见多重检验问题(multiple testing).Benjamini于1995年提出一种方法,通过控制FDR(False Discovery Rate)来决定P值的域值. 假设你挑选了...
PyMOL–一款强大的开源分子可视化系统
最近由于在课题中发现氨基酸序列在pfam中又有了新的预测结果(SMART中没有,看来pfam数据更新更频繁),于是又需要进行一些序列的二级及三级结构简单预测,并进行相关的观察,由于很久没有搞这些东西了...