主成分分析 基本思想: 实质上是将多个指标综合成少数几个指标的方法。 主成分分析是利用降维的方法,在确保数据信息损失最小的原则下,把多个指标转化为少数几个综合指标的一种对多变量数据进行最佳综合简化的多...
利用SPSS进行线性回归分析
文章结构 回归分析是通过建立统计模型研究变量间相关关系的密切程度、结构状态、模型预测的一种有效工具。 一元线性回归分析 一元线性回归是描述两个变量之间统计关系的最简单的回归模型。 1.数学模型 ...
ATAC-Seq分析教程:对ATAC-Seq/ChIP-seq的质量评估(一)phantompeakqualtools
ATAC-Seq分析教程系列 ATAC-Seq分析教程:ATAC-seq的背景介绍以及与ChIP-Seq的异同 ATAC-Seq分析教程:原始数据的质控、比对和过滤 ATAC-Seq分析教程:用MAC...
使用和解释P值的“六原则”
2014年2月,美国曼荷莲学院(Mount Holyoke College)数学与统计学教授George Cobb在美国统计学会(American Statistical Associa...
距离计算方法总结
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关...
Kmeans聚类K值如何选,以及数据重抽样方法Bootstrapping
本文出自Bin的专栏blog.csdn.net/xbinworld。 技术交流QQ群:433250724,欢迎对算法、技术感兴趣的同学加入。我的博客写一些自己用得到东西,并分享给大家,如果有问题欢迎留...
SPSS实用教程:决策树预测分类模型
本次使用的数据为银行的信用好坏情况数据。自变量包括了收入水平、信用卡数量、教育水平、贷款次数,年龄。 点击分类,决策树 将相应变量选入应变量以及自变量。点击自变量的类别,进行勾选bad,因为我们只...
Hi-C文库相关性分析
Hi-C分析需要的测序量比较高,1个样本往往需要测序很多的数据量,1个Hi-C文库可测序的数据量有限(一般情况下100-300G PE150,超出这个量,多测的数据可能含有较高的PCR dup),所以...
神经网络训练技巧汇总(Tricks)
前言 神经网络构建好,训练不出好的效果怎么办?明明说好的,拟合任意函数(一般连续)?可以参考:http://neuralnetworksanddeeplearning.com/ 说好的足够多的数据(h...
利用SPSS进行相关性分析
一、相关分析方法的选择及指标体系 (一)两个连续变量的相关分析 1、Pearson 相关系数 最常用的相关系数,又称积差相关系数,取值-1 到 1,绝对值越大,说明相关性越强。该系数的计算和检验为参数...