统计学常用公式
公式一
1. 众数【MODE 】
(1) 未分组数据或单变量值分组数据众数的计算
未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。 (2) 组距分组数据众数的计算
对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。 下限公式: 1
012
M =L+
+i ???? 式中:0M 表示众数;L 表示众数的下线;1?表示众数组次数与上一组次数之差;2?表示众数组次数与下一组次数之差;i 表示众数组的组距。 上限公式:
2
012
M =U-+i ???? 式中:U 表示众数组的上限。
2.中位数【MEDIAN 】
(1)未分组数据中中位数的计算
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:
e N+M =X
1
()2
当N 为奇数
e N N +1221M =X +X 2????
? ?????????
?????? 当N 为偶数
(2)分组数据中位数的计算
分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:
式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。
3.均值的计算【AVERAGE 】
(1)未经分组均值的计算
未经分组数据均值的计算公式为: 112n ++=
=n
i
i x x x x x n n
=∑…
(2)分组数据均值计算
分组数据均值的计算公式为: 11221121
+++==+k
i i
k k i k
k
i
i x f x f x f x f x f f f f
==+∑∑L L +
4.几何平均数【GEOMEAN 】
几何平均数是N 个变量值乘积的N 次方根,计算公式为: 式中:G 表示几何平均数;∏表示连乘符号。
5.调和平均数【HARMEAN 】
调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数,它有简单调和平均数与加权调和平均数两种计算形式。 简单调和平均数: 211H=
=
111
+++n
i
n
i n n x x x x =∑1…
加权调和平均数: 2121
1211m
m +m ++m H==m m m m +++n i
n
i
n i n
n i
i x x x x ==∑∑…… 式中:H 表示调和平均数。
6.极差【Range 】
极差也称全距,是一组数据的最大值与最小值之差,即
式中:R 表示极差;()
max i x 和()
min i x 分别表示一组数据的最大值与最小值。
7.平均差【Mean Deviation 】
平均差是各标志值与其平均数的绝对离差的算术平均。
(1) 根据未分组资料的计算公式: 1
-AD=
i
n
i x x
n
=∑
(2) 根据分组资料的计算公式: 1
1
-AD=
i
n
i
i n
i
i x x
f f
==∑∑
式中:AD 表示平均差
8.方差【Variance 】和标准差【Standard Deviation 】
方差是各变量值与其均值离差平方的平均数。要求掌握方差和标准差的计算方法。
未分组数据方差的计算公式为: ()
2
21
n
i x x n
σ=-=
∑
分组数据方差的计算公式为: ()
2
21
1
i
n
i
i n
i
i x
x
f f
σ==-=
∑∑
式中:2σ表示方差。
方差的平方根即为标准差,其相应的计算公式为:
未分组数据:
σ=
分组数据:
σ=
式中:σ表示标准差。
9.离散系数
离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。
其计算公式为: V x
σσ
=
式中:V σ表示离散系数。
10.偏态【SKEW 】
偏态是对分布偏斜方向及程度的测度。利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。
EXCEL 中偏态系数的计算公式为: ()()3
1--1-2i n
i x x n
n n s =??
????
∑
11.峰值【KURT 】
EXCEL 中峰值系数的计算公式为: 式中:s 表示样本标准差。
公式二
1.
均值估计
(1)样本均值的标准差
样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样误差水平。
样本均值的抽样平均误差计算公式为: 重复抽样方式: (
)x σ==不重复抽样方式: (
)x σ=
通常情况下,当N 很大时,(N-1)几乎等于N ,样本均值的抽样平均误差的计算公式也可简化为:
在公式中,σ是总体标准差。但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S 代替。
(2)大样本均值的极限误差 ()x Z x ασ?= (3)大样本下总体均值的区间估计
总体均值的置信度为(1α-)的置信区间:
()()
22x z x x z x αασμσ-≤≤+ 即2x z x z ααμ-≤≤+(4)总体方差未知,小样本正态总体均值的区间估计
总体均值的置信度为(1α-)的置信区间: 即
2
2x t x t ααμ-≤≤+ 2.比例估计
(1)样本比例的抽样平均误差
样本比例的抽样平均误差为:
重复抽样下: ()p σ=
上式中,p 应为总体比例,实际计算时通常用样本比例p 代替。
不重复抽样下: ()p σ=≈(2)样本比例的抽样极限误差 (3)总体比率的区间估计
总体比例P 的置信度为(1α-)的置信区间为: 即 ()()22p Z p p p Z p αασσ-≤≤+
3. 总体均值检验
(1) 单一总体均值检验
①正态总体(总体方差已知)或大样本均值检验
检验统计量Z 为: x Z
=
②正态总体(总体方差未知)小样本均值检验
检验统计量t 为:
(2) 两个总体的均值检验
①两个正态总体均值检验——两个总体方差已知或大样本
Z 检验统计量为:
大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。
②两个正态总体均值检验(小样本)——两个总体方差未知但相等
T 检验统计量为:
其中: ()
12
2111111i n i s x x n ==--∑; ()
22
2
221
211i n i s x x n ==--∑ 4. 总体比例检验
(1) 单一总体的比例检验
Z 检验统计量:
Z =
(2) 两个总体比例的检验
检验的统计量为:
Z =
其中:112212
???n p
n p p
n n +=+,?p
为当12p p =时1p 和2p 的联合估计值。 5. 总体方差假设检验
(1) 单一正态总体方差的假设检验
检验统计量为:
()22
2
1n s χσ-=
其中:()
2
21
1
i
n
i x
x
s n =-=
-∑为2σ的估计量。
(2) 两个正态总体的方差假设检验
检验统计量为: 22
12F s s =
其中: ()
1
2
21
111i
n i x
x
s n =-=
-∑; ()
2
2
2
1
221
i
n i x
x
s n =-=
-∑。
公式三
1.单因素方差分析
设总体共分为k 种处理进行观察,第j 种处理试验了容量为j n 的样本。 (1) 计算各项离差平方和
在单因素方差分析中,需要计算的离差平方和有3个,它们分别是总离差平方和,误差项离差
平方和以及水平项离差平方和。
总离差平方和,用SST (Sum of Squares for Total )代表: 式中:x 表示全部样本观测值的总均值。其计算公式为: 误差离差平方和,用SSE (Sum of Squares for Error )代表:
式中:j x 表示第j 种水平的样本均值,1
j
n ij
i j j
x
x n ==
∑
水平项离差平方和。为了后面叙述方便,可以把单因素方差分析中的因素称为A 。于是水平项离差平方和可以用SSA (Sum of Squares for Factor A )表示。 SSA 的计算公式为: ()
2
11j
n k
j i j SSA x x ===-∑∑
(2) 计算平均平方
与离差平方和一样,SST 、SSA 、SSE 之间的自由度也存在着如下的关系:
n-1=(r-1)+(n-r )
对于SSA ,其平均平方MSA (组间均方差)为: 1SSA
MSA r =
- 对于SSE ,其平均平方MSE (组内均方差)为: SSE
MSE n r
=
- (3) 检验统计量F MSA
F MSE
=
2.两因素方差分析
设两个因素A 、B 分别有k 个水平和n 个水平,共进行nk 次试验。 (1) 计算各项离差平方和
在两因素方差分析中,需要计算的离差平方和有4个,它们分别是总离差平方和,误差项离差平方和以及水平A 、B 项离差平方和。
总离差平方和,用SST (Sum of Squares for Total )代表: ()
2
ij SST x x =-∑∑
式中:x 表示全部样本观察值的总均值,其计算公式为: 11
1n k
ij i j x x nk ===∑∑ 水平项离差平方和可以分别用SSA (Sum of Squares for Factor A )和SSB (Sum of Squares for Factor
B )表示。
SSA 的计算公式为: ()
2
11n
k
j i j SSA x x ?===-∑∑
式中: 1
1n
j ij i x x n ?==∑
SSB 的计算公式为: ()
2
11
n k
i i j SSB x x ?===-∑∑
式中: 1
1k
i ij j x x k ?==∑
误差离差平方和,用SSE (Sum of Squares for Error )代表: (2) 计算平均平方
为(n-1),这里n 表示水平B 的个数;对SSE 来说,其自由度为(n-1)(k-1)。这样,把各项离差平方和除以各自的自由度,即得到平均的离差平方和,简称为均方: (3) 检验统计量F
公式四
1.拟合优度的检验统计量:
式中:i f 表示类别i 的观察频数;e f 表示假设0H 为真时,类别i 的期望频数;k 表示类别总数。 注意:当所有种类的期望频数均大于或等于5时,检验统计量服从自由度为(k-1)的2 分布。