方差(Variance)

http://wiki.mbalib.com/wiki/%E6%96%B9%E5%B7%AE

方差(Variance)

什么是方差

　　方差和标准差是测度数据变异程度的最重要、最常用的指标。

　　方差是各个数据与其算术平均数的离差平方和的平均数，通常以 $σ 2$ 表示。方差的计量单位和量纲不便于从经济意义上进行解释，所以实际统计工作中多用方差的算术平方根——标准差来测度统计数据的差异程度。

　　标准差又称均方差，一般用σ表示。方差和标准差的计算也分为简单平均法和加权平均法，另外，对于总体数据和样本数据，公式略有不同。

方差的计算公式

　　设总体方差为 $σ 2$ ，对于未经分组整理的原始数据，方差的计算公式为：

　　 $\sigma^2=\frac{\sum_{i=1}^N(X_i-\bar{X})^2}{N}$

　　对于分组数据，方差的计算公式为：

　　 $\sigma^2=\frac{\sum_{i=1}^K(X_i-\bar{X})^2 f_i}{\sum_{i=1}^K f_i}$

　　方差的平方根即为标准差，其相应的计算公式为：

　　未分组数据： $\sigma=\sqrt{\frac{\sum_{i=1}^N(X_i-\bar{X})^2}{N}}$

　　分组数据： $\sigma=\sqrt{\frac{\sum_{i=1}^K(X_i-\bar{X})^2 f_i}{\sum_{i=1}^K f_i}}$

[编辑]

样本方差和标准差

　　样本方差与总体方差在计算上的区别是：总体方差是用数据个数或总频数去除离差平方和，而样本方差则是用样本数据个数或总频数减1去除离差平方和，其中样本数据个数减1即n－1称为自由度。设样本方差为 $S_{n-1}^2$ ，根据未分组数据和分组数据计算样本方差的公式分别为：

　　未分组数据： $S_{n-1}^2=\frac{\sum_{i=1^n(x_i-\bar{x})^2}}{n-1}$

　　分组数据： $S_{n-1}^2=\frac{\sum_{i=1^k(x_i-\bar{x})^2 f_i}}{\sum_{i=1}^k f_i-1}$

　　未分组数据： $S_{n-1}=\sqrt{\frac{\sum_{i=1^n(x_i-\bar{x})^2}}{n-1}}$

　　分组数据： $S_{n-1}=\sqrt{\frac{\sum_{i=1^k(x_i-\bar{x})^2 f_i}}{\sum_{i=1}^k f_i-1}}$

　　例:考察一台机器的生产能力，利用抽样程序来检验生产出来的产品质量，假设搜集的数据如下：

3.43	3.45	3.43	3.48	3.52	3.50	3.39
3.48	3.41	3.38	3.49	3.45	3.51	3.50

　　根据该行业通用法则：如果一个样本中的14个数据项的方差大于0.005，则该机器必须关闭待修。问此时的机器是否必须关闭？

　　解：根据已知数据，计算 $\bar{x}=\frac{\sum x}{n}=3.459$

　　 $S^2=\frac{\sum(x-\bar{x})^2}{n-1}=0.002<0.005$

　　因此，该机器工作正常。

　　方差和标准差也是根据全部数据计算的，它反映了每个数据与其均值相比平均相差的数值，因此它能准确地反映出数据的离散程度。方差和标准差是实际中应用最广泛的离散程度测度值。

---------------------------------------------------------------------
http://zh.wikipedia.org/wiki/%E6%96%B9%E5%B7%AE

方差

维基百科，自由的百科全书

跳转到: 导航, 搜索

在概率论和统计学中，一个随机变量的“方差”描述的是它的离散程度，也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶距，恰巧也是它的二阶culmulent。方差的算术平方根称为该随机变量的标准差。

[编辑] 定义

设 $X$ 为服从分布 $F$ 的随机变量，则称 $V a r (X) = E (X - E X) 2$ 为随机变量 $X$ 或者分布 $F$ 的方差。

如果 $\mu = \operatorname{E}(X)$ 是隨機變數 X 的期望值 (平均數) , 則其變異數為: $\operatorname{var}(X) = \operatorname{E}( ( X - \mu ) ^ 2 ).$

[编辑] 特性

在样本空间Ω上存在有限期望和方差的随机变量构成一个希尔伯特空间： L^2(Ω, dP)，不过这里的内积和长度跟方差，标准差还是不大一样。所以，我们得把这个空间“除”常变量构成的子空间，也就是说把相差一个常数的所有原来那个空间的随机变量做成一个等价类。这还是一个新的无穷维线性空间，并且有一个从老空间内积诱导出来的新内积，而这个内积就是方差

[编辑] 一般化

如果X是一个向量其取值范围在Rⁿ空间，并且其每个元素都是一个一维随机变量，我们就把X称为随机向量。随机向量的方差是一维随机变量方差的自然推广，其定义为E[(X − μ)(X − μ)^T], 其中 μ = E(X) ，X^T是X的转秩. 这个方差是一个非负定方阵，通常称为协方差矩阵。

如果X是一个复随机变量，那么其方差定义则为E[(X − μ)(X − μ)^*], 其中X^*是X的复共轭向量。根据这个定义，方差为实数。

[编辑] 历史

方差这个词首先由Ronald Fisher在论文The Correlation Between Relatives on the Supposition of Mendelian Inheritance中引入.

[编辑] 参考出处

^ Press, W. H., Teukolsky, S. A., Vetterling, W. T. & Flannery, B. P. (1986) Numerical recipes: The art of scientific computing. Cambridge: Cambridge University Press. (online)

posted on 2009-03-12 22:51 donnie 阅读(10962) 评论(0) 编辑收藏所属分类: math

常用链接

留言簿

随笔分类(66)

随笔档案(79)

相册

收藏夹(11)

搜索

积分与排名

最新随笔

最新评论

阅读排行榜