统计学常用公式

统计学常用公式
统计学常用公式

公式一

1. 众数【MODE 】

(1) 未分组数据或单变量值分组数据众数的计算

未分组数据或单变量值分组数据的众数就是出现次数最多的变量值。 (2) 组距分组数据众数的计算

对于组距分组数据,先找出出现次数最多的变量值所在组,即为众数所在组,再根据下面的公式计算计算众数的近似值。 下限公式: 1

012

M =L+

+i ???? 式中:0M 表示众数;L 表示众数的下线;1?表示众数组次数与上一组次数之差;2?表示众数组次数与下一组次数之差;i 表示众数组的组距。 上限公式:

2

012

M =U-+i ???? 式中:U 表示众数组的上限。

2.中位数【MEDIAN 】

(1)未分组数据中中位数的计算

根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置。设一组数据按从小到大排序后为12N X X X ,,…,,中位数e M ,为则有:

e N+M =X

1

()2

当N 为奇数

e N N +1221M =X +X 2????

? ?????????

?????? 当N 为偶数

(2)分组数据中位数的计算

分组数据中位数的计算时,要先根据公式N / 2 确定中位数的位置,并确定中位数所在的组,然后采用下面的公式计算中位数的近似值:

式中:e M 表示中位数;L 表示中位数所在组的下限;m-1S 表示中位数所在组以下各组的累计次数;m f 表示中位数所在组的次数;d 表示中位数所在组的组距。

3.均值的计算【AVERAGE 】

(1)未经分组均值的计算

未经分组数据均值的计算公式为: 112n ++=

=n

i

i x x x x x n n

=∑…

(2)分组数据均值计算

分组数据均值的计算公式为: 11221121

+++==+k

i i

k k i k

k

i

i x f x f x f x f x f f f f

==+∑∑L L +

4.几何平均数【GEOMEAN 】

几何平均数是N 个变量值乘积的N 次方根,计算公式为: 式中:G 表示几何平均数;∏表示连乘符号。

5.调和平均数【HARMEAN 】

调和平均数是对变量的倒数求平均,然后再取倒数而得到的平均数,它有简单调和平均数与加权调和平均数两种计算形式。 简单调和平均数: 211H=

=

111

+++n

i

n

i n n x x x x =∑1…

加权调和平均数: 2121

1211m

m +m ++m H==m m m m +++n i

n

i

n i n

n i

i x x x x ==∑∑…… 式中:H 表示调和平均数。

6.极差【Range 】

极差也称全距,是一组数据的最大值与最小值之差,即

式中:R 表示极差;()

max i x 和()

min i x 分别表示一组数据的最大值与最小值。

7.平均差【Mean Deviation 】

平均差是各标志值与其平均数的绝对离差的算术平均。

(1) 根据未分组资料的计算公式: 1

-AD=

i

n

i x x

n

=∑

(2) 根据分组资料的计算公式: 1

1

-AD=

i

n

i

i n

i

i x x

f f

==∑∑

式中:AD 表示平均差

8.方差【Variance 】和标准差【Standard Deviation 】

方差是各变量值与其均值离差平方的平均数。要求掌握方差和标准差的计算方法。

未分组数据方差的计算公式为: ()

2

21

n

i x x n

σ=-=

分组数据方差的计算公式为: ()

2

21

1

i

n

i

i n

i

i x

x

f f

σ==-=

∑∑

式中:2σ表示方差。

方差的平方根即为标准差,其相应的计算公式为:

未分组数据:

σ=

分组数据:

σ=

式中:σ表示标准差。

9.离散系数

离散系数通常是就标准差来计算的,因此,也称为标准差系数,它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标。

其计算公式为: V x

σσ

=

式中:V σ表示离散系数。

10.偏态【SKEW 】

偏态是对分布偏斜方向及程度的测度。利用众数、中位数和均值之间的关系就可以判断分布是左偏还是右偏。显然,判别偏态的方向并不困难,但要测度偏斜的程度就需要计算偏态系数了。

EXCEL 中偏态系数的计算公式为: ()()3

1--1-2i n

i x x n

n n s =??

????

11.峰值【KURT 】

EXCEL 中峰值系数的计算公式为: 式中:s 表示样本标准差。

公式二

1.

均值估计

(1)样本均值的标准差

样本均值的标准差,即为样本均值的标准误差,又称为样本均值的抽样平均误差,它反映的是所有可能样本的均值与总体均值的平均差异程度,反映了所有可能样本的实际抽样误差水平。

样本均值的抽样平均误差计算公式为: 重复抽样方式: (

)x σ==不重复抽样方式: (

)x σ=

通常情况下,当N 很大时,(N-1)几乎等于N ,样本均值的抽样平均误差的计算公式也可简化为:

在公式中,σ是总体标准差。但实际计算时,所研究总体的标准差通常是未知的,在大样本的情况下,通常用样本标准差S 代替。

(2)大样本均值的极限误差 ()x Z x ασ?= (3)大样本下总体均值的区间估计

总体均值的置信度为(1α-)的置信区间:

()()

22x z x x z x αασμσ-≤≤+ 即2x z x z ααμ-≤≤+(4)总体方差未知,小样本正态总体均值的区间估计

总体均值的置信度为(1α-)的置信区间: 即

2

2x t x t ααμ-≤≤+ 2.比例估计

(1)样本比例的抽样平均误差

样本比例的抽样平均误差为:

重复抽样下: ()p σ=

上式中,p 应为总体比例,实际计算时通常用样本比例p 代替。

不重复抽样下: ()p σ=≈(2)样本比例的抽样极限误差 (3)总体比率的区间估计

总体比例P 的置信度为(1α-)的置信区间为: 即 ()()22p Z p p p Z p αασσ-≤≤+

3. 总体均值检验

(1) 单一总体均值检验

①正态总体(总体方差已知)或大样本均值检验

检验统计量Z 为: x Z

=

②正态总体(总体方差未知)小样本均值检验

检验统计量t 为:

(2) 两个总体的均值检验

①两个正态总体均值检验——两个总体方差已知或大样本

Z 检验统计量为:

大样本下对两个总体均值进行检验时,在总体标准差未知的情况下,可用样本标准差代替总体标准差进行计算,检验统计量不变。

②两个正态总体均值检验(小样本)——两个总体方差未知但相等

T 检验统计量为:

其中: ()

12

2111111i n i s x x n ==--∑; ()

22

2

221

211i n i s x x n ==--∑ 4. 总体比例检验

(1) 单一总体的比例检验

Z 检验统计量:

Z =

(2) 两个总体比例的检验

检验的统计量为:

Z =

其中:112212

???n p

n p p

n n +=+,?p

为当12p p =时1p 和2p 的联合估计值。 5. 总体方差假设检验

(1) 单一正态总体方差的假设检验

检验统计量为:

()22

2

1n s χσ-=

其中:()

2

21

1

i

n

i x

x

s n =-=

-∑为2σ的估计量。

(2) 两个正态总体的方差假设检验

检验统计量为: 22

12F s s =

其中: ()

1

2

21

111i

n i x

x

s n =-=

-∑; ()

2

2

2

1

221

i

n i x

x

s n =-=

-∑。

公式三

1.单因素方差分析

设总体共分为k 种处理进行观察,第j 种处理试验了容量为j n 的样本。 (1) 计算各项离差平方和

在单因素方差分析中,需要计算的离差平方和有3个,它们分别是总离差平方和,误差项离差

平方和以及水平项离差平方和。

总离差平方和,用SST (Sum of Squares for Total )代表: 式中:x 表示全部样本观测值的总均值。其计算公式为: 误差离差平方和,用SSE (Sum of Squares for Error )代表:

式中:j x 表示第j 种水平的样本均值,1

j

n ij

i j j

x

x n ==

水平项离差平方和。为了后面叙述方便,可以把单因素方差分析中的因素称为A 。于是水平项离差平方和可以用SSA (Sum of Squares for Factor A )表示。 SSA 的计算公式为: ()

2

11j

n k

j i j SSA x x ===-∑∑

(2) 计算平均平方

与离差平方和一样,SST 、SSA 、SSE 之间的自由度也存在着如下的关系:

n-1=(r-1)+(n-r )

对于SSA ,其平均平方MSA (组间均方差)为: 1SSA

MSA r =

- 对于SSE ,其平均平方MSE (组内均方差)为: SSE

MSE n r

=

- (3) 检验统计量F MSA

F MSE

=

2.两因素方差分析

设两个因素A 、B 分别有k 个水平和n 个水平,共进行nk 次试验。 (1) 计算各项离差平方和

在两因素方差分析中,需要计算的离差平方和有4个,它们分别是总离差平方和,误差项离差平方和以及水平A 、B 项离差平方和。

总离差平方和,用SST (Sum of Squares for Total )代表: ()

2

ij SST x x =-∑∑

式中:x 表示全部样本观察值的总均值,其计算公式为: 11

1n k

ij i j x x nk ===∑∑ 水平项离差平方和可以分别用SSA (Sum of Squares for Factor A )和SSB (Sum of Squares for Factor

B )表示。

SSA 的计算公式为: ()

2

11n

k

j i j SSA x x ?===-∑∑

式中: 1

1n

j ij i x x n ?==∑

SSB 的计算公式为: ()

2

11

n k

i i j SSB x x ?===-∑∑

式中: 1

1k

i ij j x x k ?==∑

误差离差平方和,用SSE (Sum of Squares for Error )代表: (2) 计算平均平方

为(n-1),这里n 表示水平B 的个数;对SSE 来说,其自由度为(n-1)(k-1)。这样,把各项离差平方和除以各自的自由度,即得到平均的离差平方和,简称为均方: (3) 检验统计量F

公式四

1.拟合优度的检验统计量:

式中:i f 表示类别i 的观察频数;e f 表示假设0H 为真时,类别i 的期望频数;k 表示类别总数。 注意:当所有种类的期望频数均大于或等于5时,检验统计量服从自由度为(k-1)的2 分布。

相关主题
相关文档
最新文档