标准差与标准误的区别

2012/04/04评论8,343

在日常的统计分析中，标准差和标准误是一对十分重要的统计量，两者有区别也有联系。但是很多人却没有弄清其中的差异，经常性地进行一些错误的使用。对于标准差与标准误的区别，很多书上这样表达：标准差表示数据的离散程度，标准误表示抽样误差的大小。这样的解释可能对于许多人来说等于没有解释。

其实这两者的区别可以采用数据分布表达方式描述如下：如果样本服从均值为μ，标准差为δ的正态分布，即X～N(μ, δ²),那么样本均值服从均值为0，标准差为δ²/n的正态分布，即?～ N(μ,δ²/n)。这里δ为标准差，δ/n^1/2为标准误。明白了吧，用统计学的方法解释起来就是这么简单。

可是，实际使用中总体参数往往未知，多数情况下用样本统计量来表示。那么，关于这两者的区别可以这样表述：标准差是样本数据方差的平方根，它衡量的是样本数据的离散程度；标准误是样本均值的标准差，衡量的是样本均值的离散程度。而在实际的抽样中，习惯用样本均值来推断总体均值，那么样本均值的离散程度（标准误）越大，抽样误差就越大。所以用标准误来衡量抽样误差的大小。

在此举一个例子。比如，某学校共有500名学生，现在要通过抽取样本量为30的一个样本，来推断学生的数学成绩。这时可以依据抽取的样本信息，计算出样本的均值与标准差。如果我们抽取的不是一个样本，而是10个样本，每个样本30人，那么每个样本都可以计算出均值，这样就会有10个均值。也就是形成了一个10个数字的数列，然后计算这10个数字的标准差，此时的标准差就是标准误。但是，在实际抽样中我们不可能抽取10个样本。所以，标准误就由样本标准差除以样本量来表示。当然，这样的结论也不是随心所欲，而是经过了统计学家的严密证明的。

在实际的应用中，标准差主要有两点作用，一是用来对样本进行标准化处理，即样本观察值减去样本均值，然后除以标准差，这样就变成了标准正态分布；而是通过标准差来确定异常值，常用的方法就是样本均值加减n倍的标准差。标准误的作用主要是用来做区间估计，常用的估计区间是均值加减n倍的标准误。

以上内容来自：http://xiaofeng1982.blog.163.com/blog/static/315724582012948363445/

发表评论