心理统计公式汇总

心理统计公式汇总
心理统计公式汇总

心理统计公式汇总

心理学考研分为:心理学学硕和心理学专硕(又称“应用心理硕士”、“心理专硕”)。心理学学硕和心理学专硕考试科目不同,但是都会考察到心理学统计,(部分自主命题院校不考察心理学统计,考生需要提前了解院校信息。)无论是对本专业还是跨专业心理学考研的同学而言,心理学统计始终是比较难懂的一块。博仁教育老师为考生分章节整理出心理学统计公式,方便考生进行复习与记忆。

第三章集中量数

1、几个集中量数的公式计算一览表

平均数(M)

算术平均数

(M)

未分组:1

=

n

i

i

X

X

n

=

分组数据:i ci

i

f X

M

f

?

=

加权平均数

(单位权重不相

等的情况)

i

i

i

W X

Mw

W

?

=

几何平均数

(解决增长率的

问题)

lg

lg i

X

Mg

N

=

;1

1

N

N

X

Mg

X

-

=;

1

,,

N

N

Mg X X

=

调和平均数

(解决速度的问

题)

倒数的算术平均数的倒数:

1

H

i

N

M

X

=

中数(Md)

未分组:

无重复值

N=奇数:中数即

1

2

N+

位置的数;

N=偶数:中数即中间两个数的平均数;

有重复值

若重复值没有位于中间,则求法与无重复值时

一致;

若重复值位于中间,则(P62):

图示:

思路:①连续性数字,不是一个点,是一个区

间;

②有几个重复的,则将组距除以几;

分组d()

2

b b

Md

N i

M L F

f

=+-?

众数(Mo )

1、直接观察法。

2、公式法。(皮尔逊经验法&金式插补法)

①皮尔逊经验法:o 32M Md M =-; ②金式插补法:a

b a b

f Mo L i f f =+

?+ ;

【组中值的计算】

第四章 差异量数

百分位数(点) 100b

p b

P

N F P L i f

?-=+?; 百分等级

未分组:(10050)

100R R P N

-=-

分组:()100

[]b R b f X L P F N i

-=

?+ 四分位差

31

=

2

Q Q Q -; (Q3与Q1即P25与P75) 平均差

未分组:..i

i

X

A D n

n

X x

-=

=

∑∑

分组:..f

x

A D n

=

∑;(IxI 为各组中点值对平均数离差的绝对值)

方差与 标准差

未分组:①

2

2

2

()s

X X N

N

x

-=

=

∑∑;

②原始数据代入:

2

2

2

2

2

2

()

()s N N

X X X X N

N

-=

-=

∑∑∑∑

分组:2

2

2

()c f X X f N

N

x

s

-=

=

2

2

s ()f i N

fd d N

=

-?∑∑

总方差与总标准差:

22

2;()

i i i i

T i T i

i

N s N d

s d X X

N

+

==-

∑∑

标准差的应用差异

系数

100%

s

CV

X

=?

标准

分数

X X x

Z

s s

-

==

第五章相关关系

相关系数适用资料公式

积差相关(皮尔逊)①成对的数据(≥30对);

②连续变量;③正态双变

量;④线性关系;

r

x y

xy

N s s

=

(N为成对数,x、y为离均差);

原始值代入:

22

22

()()

X Y

XY

N

r

N N

X Y

X Y

-

=

-?-

∑∑

∑∑

∑∑

等级相关斯皮尔曼

等级相关

(两列)

两列具有线性关系的等级

或顺序变量;

1、等级差数法:

2

2

6

=1

(1)

r R

N

D

N

-

-

(D为对偶等级之差)

2、等级序数法:

4

3

=(1)

1(1)

r X Y

R

N

N N N

R R

??

?-+

??

-+

??

3、出现相同等级时:

2

22

2

2

2

r RC

y

x D

y

x

+-

=

??

∑∑∑

∑∑

其中,

3

2

-N

=

12X

N

x C

-

∑∑;2(1)

12

X

n n

C-

=

∑∑

(N为成对数据数目,n为各列变量相同等级数)

肯德尔等级相关(多列)肯德尔W系数(和谐系数):

①K个评分人评N个对象,

分析K个评分人的一致性

程度;

②同一个人先后K次评价

N个对象,分析其前后一致

性;

1、基本公式:

23

s

1

()

12

W

K N N

=

-

;(K为评价者数,N

为被评对象数)

2

i

22

123(1)

(1)1

N

W

K N N N

R+

=-

--

; (

i

R为评价对象获得的K

个评价者给的等级之和,

22

2

()

()i i

i i

R R

s R R

N N

=-=-

∑∑

∑∑);

2、相同等级时:

23

s

=

1

()

12

W

K N N K T

--∑

;其中,s的意义同上,T如

下:

3

12

n n

T

-

=

∑∑;(n为相同等级数)

肯德尔U系数(一致性系

数):

对偶比较法:将N个事物

两两配对,可配成

N(N-1)/N对,然后对每一

对进行比较,择优选择,

优者记1,非优者记0;

2

ij

8

=1

(1)(1)

ij

r K r

U

N N K K

-

+

-?-

∑∑

()

;

N为被评价对象数目(即等级数),K为评价者数目,

ij

r为对偶比较表中i>j(或i<j)格中的择优分数。(几

个评价者认为i比j好,则为几)

质与量的相关点二列相关

正态连续变量

&二分名义变

量(真正的)

【用于非类测验(得分只

有两种结果,答对得分,

答错不得分)的测验内部

一致性,每道题与总分的

相关等问题;】

r p q

pb

t

X X

pq

s

-

=?;

(其中,p、q二分称名变量两个值所占比例,

p

X与

q

X为

二分称名变量各自对应值的平均数,

t

s为连续变量的标准

差);

二列相关

①两列数据均正态

②一列为连续变量,一列

为二分变量(人为划分);

r p q

b

t

X X pq

s y

-

=?;或t

r p

b

t

X X p

s y

-

=?;

其中,y为标准正态曲线中p值对应的高度,查正态分布

表可知。

多列相关适用于两列正态变量,其

中一列为连续变量,另一

列被人为地划分为多种类

别(名义变量);

2

[()]

r

()

L H i

s

L H

t

i

y y X

y y

s

p

-?

=

-

;其中,

Pi为每系列的次数比率,yL与yH分别为每一名义变量下

(上)限的正态曲线高度,可由pi差正态表得知;

品质相关

四分相关

两列都是连续正态变量,

且都人为地被划分为两个

类别。相关资料可以整理

成四格表;

180

r cos()

1

t ad

bc

=

+

;或cos()

t

bc

r

ad bc

π

=

+

φ系数

(列联系数)

两列变量均为真正的二分

变量;(四格表)

(与卡方检验联系)

()()()()

ad bc

r

a b a c b d c d

φ

-

=

++++

ad bc

Q

ad bc

-

=

+

ad bc

ad bc

γ

-

=

+

列联表相关

数据属于RC表的计数数

据,欲分析所研究的二因

素之间的相关程度时使用

皮尔逊定义的列联系数(常用):

2

2

C

n

χ

χ

=

+

另:

2

(1)(1)

T

R C N

χ

=

--

第六章概率分布

1、几个基本概念

(1)概率:表明随机事件出现的可能性大小的客观指标。

(2)后验概率(统计概率):

先验概率(古典概率):

(3)概率分布:对随机变量取值的概率分布的情况用数学方法(函数)描述。

2、概率的基本性质:

※概率的公理系统:

任何一个随机事件的概率都是非负的;

在一定条件下必然发生的必然事件概率为1;

在一定条件下必然不发生的事件,即不可能事件的概率为0.

※概率的加法定理

※概率的乘法定理

3、概率的分布类型划分

划分标准分类备注

依据随机变量是否具有连续性离散分布:离散随机变量的概率分布。

(如:二项分布)离散随机变量:随机变量只取孤立的值。

(即计数数据)

连续分布:连续随机变量的概率分布,

即测量数据的概率分布。

(如:正态分布)

依据分布函数的来源来分经验性:据观察或实验获得的数据而编

制的次数分布或相对频率分布。

理论性:一是随机变量概率分布的函数

(数学模型),二是按数学模型计算出

的总体的次数分布(总体分布)。

依据概率分布所描述的数据特征而划分基本随机变量分布。常用的有二项分布

和正态分布。

统计量(随机变量的函

数):平均数、平均数之

差、方差、标准差、相关

系数、回归系数等。

抽样分布:样本统计量的理论分布。

4、几个重要分布

★正态分布

(1)特征:

①正态分布的形式是对称的,对称轴是经过平均数的垂线。

②正态分布的中央点即平均数最高,然后逐渐向两侧下降;曲线形式先向内弯,再向外弯,拐点位于正负1个标准差处,曲线两端向基线无线靠近,但不相交。

③正态曲线下面积为1。

④正态分布是一族分布。平均数决定其位置,标准差决定其形态。标准差越小,曲线越狭高。

⑤正态分布中各差异量数值间有固定比率。

⑥正态曲线下,标准差和概率(面积)有一定的数量关系。

(2)正态分布表的利用

①已知Z分数求概率p,即已知标准分数求面积。

②已知概率P求Z分数。

③已知概率或Z求概率密度y,即曲线的高。【直接查表即可。注意已知的y是位于中间部分,还是

两尾。】

(3)次数分布是否为正态的检验方法 (4)正态分布理论在测验中的应用 ① 化等级评定为测量数据 ② 标准测验题目的难易度

③ 在能力分组或等级评定时确定人数 ④ 测验分数的正态化 二项分布(贝努里分布) (1)几个重要概念理解

二项试验:必须满足几个条件——任何一次实验恰好只有2个结果;共有n 次实验,n 是事先给定的一个正整数;某种结果出现的概率在任何一次实验中都是固定的。

二项分布:试验仅有两种不同性质结果的概率分布。(两个对立事件的概率分布)。

具体定义如下:设有n 次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p ,某事件不出

现的概率都是q,即(1-p ),则对于某事件出现X 次的概率分布为:(,,)x x n x

n b x n p C p q -=;

n !

!()!)

x n C x n x =

-

表示在n 次试验中有X 次成功,成功的概率为p 。 (2)二项分布的性质

① 二项分布是离散型分布,概率直方图是跃阶式。(p=q 与p ≠q ) ② 二项分布的平均数与标准差

当p ﹤q ,np ≥5,二项分布接近正态。此时有,μ=np ,e=npq (3)二项分布的应用

当p ﹤q ,np ≥5,二项分布接近正态。用其概率分布计算 当np <5,直接用二项分布函数计算

5、抽样分布一览表【样本分布:指的是样本统计量的分布。】

正态分布样本

平均

数的

分布

总体分布为正态,总体方差已知,样本平均数分布为正态分布。

【=

X

μμ;变异误

2

2=

n

X

σ

σ;标准误(SE)

X n

σ

σ=;】

总体分布为非正态,但总体方差已知,样本足够大(n>30),样本平均数渐进正态分

布。【=

X

μμ;

X n

σ

σ=】

T 分布含义

及基

本公

学生式分布。左右对称、峰态比较高狭,分布形态随样本容量n-1的变化而变化的一

族分布。【

/1

X

t

s n

μ

-

=

-

2

x

s=

N

分布

特点

1、平均值为0;

2、以平均值0左右对称分布,左侧t为负值,右侧为正值。

3、变量取值在

4、当n趋近于无穷大时,t分布为正态分布,方差为1;

当n-1>30,t分布接近正态分布,方差大于1,随n-1的增大而渐趋于1;

当n-1<30,t分布于正态分布相差较大。

分布

表的

使用

t0.05(双侧)=t 0.025(单侧)

样本

平均

数的

分布

总体分布为正态,总体方差未知时,样本平均数为t分布。

【1

1

n

X

s

s

s

n n

-

==

-

,其中,

2

11

n

x

s

n

-

=

-

总体非正态,总体方差未知,若n>30,则近似正态分布。

2χ分布概念

与公

随机变量平方和的分布;或随机变量转为标准分数,标准分数的平方和的分布也服从2

χ分布。

2

2

2

=

μ

χ

σ

∑(X-)

或用样本平均数估计总体总体平均数μ时为

22

i

2

22

=

X ns

χ

σσ

=

∑(X-)

分布

特点

1、正偏态分布。df趋近无穷大时,为正态分布。

2、2

χ值都是正值。

3、2

χ分布的可加性。即卡方分布的和也是2χ分布。

应用计数数据的假设检验;样本方差和总体方差差异是否显著的检验;

F 含义

分 布

与公式

【211222

//df F df χχ=; 1

2

22

112212s /s /n n F σσ--=; 1

2

21

2

1s s n n F --=;】 分布 特点 1、正偏态分布; 2、F 总为正值;

应用

F 检验:考察任意两个样本的方差是否取自同一整体;方差齐性检验与方差分析;

第七章 参数估计

1、几个重要概念

点估计、区间估计、置信区间、显著性水平(α)、置信度(置信水平即1-α)、 标准误(平均数的离散程度):=

n

X

σσ

2、参数估计步骤总结

(1)分析条件,选择方法,计算样本统计量; (2)计算样本平均数的标准误;【是关键!!】 (3)确定显著性水平,求置信区间; (4)查找Z 值或t 值; (5)计算置信区间; (6)结果解释。 正态分布表:/2/2X X X Z X Z αασμσ-?≤≤+?或

(1)/2(1)/2X X X Z X Z αασμσ---?≤≤+?

T 分布表:/2/2X X X t X t αασμσ-?≤≤+?或(1)/2(1)/2t X X X X t αασμσ---?≤≤+? 3、参数估计一览表 总

体平均

数的估计 总体方差已知

(正态估计法) ①总体正态分布。②总体非正态,n >30(近似正态估计法)。

标准误为X n

σσ= 总体方差未知(t 分布估计法)

①总体正态分布。②总体非正态,n >30(近似t 分布估计法)。 标准误采用样本的无偏方差作为总体方差的估计值即11n X s s

n n

σ-==- 标准差

与方差的

标准差 法1:采用总体方差估计区间的平方根。 法2:n >30(样本标准差的分布为渐进正态),

标准差的平均数为s X σ= ,标准差分布的标准差为2s n

σ

σ=

则置信区间为:

1/21/2n s n s s Z s Z αασμσ---?≤≤+?

区间

估计方差

自正态总体中,随机抽取容量为n的样本,其样本方差和总体方差的比值的分布为2

χ分布,故可直接查2χ表来确定2

/2

α

χ和2

(1)/2

α

χ

-

,置信区间为:

22

2

11

22

/2(1)/2

n n

n n

αα

σ

χχ

--

-

(-1)s(-1)s

二总体方差之

置信区间为11

22

22

2

11

1

/2

222

/2121

1n n

n n

s s

F

F s s

α

α

σ

σ

--

--

??

根据样本方差估计

2

1

2

2

σ

σ

在1上下一定区间内(即区间是否包含1),可推论二总体方

差相等。

若只关注两个总体方差是否相等则用单侧,若要比较二者谁大谁小则用双侧。

相关系数的区间估计积差

相关

【思

路:先

假设

ρ=0,

求出置

信区

间,若

不包含

0,说明

假设错

误,再

根据ρ

不为0

的情况

来解

题。】

总体

相关

系数

为0

即ρ=0时。样本相关系数分布为t分布,

2

1

2

r

r

n

σ

-

=

-

置信区间为:

/2/2

r

r r

t r t

αα

σμσ

-?≤≤+?;

总体

相关

系数

不为

当n>500,

2

1

1

r

r

n

σ

-

-

;置信区间为:

/2/2

r

r r

Z r Z

αα

σμσ

-?≤≤+?

利用费舍Z函数分布计算(应用广泛,不论ρ是否为0,不论样本容量n的大小)。

步骤:

①将样本相关系数转换为Z函数。

法1:公式法。

e

11

log

21

r

Z

r

+

=

-

10

1

1.1513log()

1

r

Z

r

+

=?

-

法2:查r-

r

Z转换表,直接由r值查

r

Z值。

②计算标准误:

1

=

n3

Z

SE

-

③计算

r

Z的置信区间:

r/2Z

Z Z SE

α

±?;

④将

r

Z的置信区间转换为相关系数。(公式法或查表)

等级相关(斯皮尔曼)①当9≤n≤20时,r

R

的分布近似为2

df n

=-,

2

1

2

R

r

r

SE

n

-

=

-

的t分布。置信区间为:

2

/2

1

r(2)

2

R

R

r

t df n

n

α

-

±?=-

-

②当n>20时,r

R

的分布近似正态分布,标准误为

2

1

2

R

r

r

SE

n

-

=

-

置信区间改为:

2

/2

1

r(2)

2

R

R

r

Z df n

n

α

-

±?=-

-

比率及比率差异的区间估计比率的区间估

n5

p ,标准误

p

σ或=

p

pq

SE

n

;置信区间为

/2/2

p p p

p Z SE p Z SE

αα

μ

-?+?

【ps:样本比率

p=x/n,是总体比率p的点估计值,可代替总体比率。故

p

pq

n

σ=

】当

5

n p≤,此二项分布不接近正态,此时置信区间的估计直接查二项分布计算的统计表。

比率差异的区

间估计

11

n5

p≥,

22

n5

p≥时,比率差异的置信区间可用正态分布概率计算。

12

p p

≠时,标准误为

12

1122

12

p p

p p

q q

n n

σ

-

=+

;置信区间为

12

/2

12

(p)

p p

p Z

α

σ

-

-±?

12

p p p

==时,标准误为

12

11221122

1212

()()

()

p

D p p

n p n p n q n q

n n n n

σσ

-

++

==

+

置信区间为

12

/2

12

(p)

p p

p Z

α

σ

-

-±?

12

p p p

==,总体比率之差为0,对于它的置信估计可理解为,样本比率之差(

12

p p

-

)在多大范围内可以认为是取自比率差为0的总体。

第八章假设检验

【假设检验】,即差异显著性的检验,包括总体和样本之间的差异以及样本和样本之间的差异。

1、几个重要概念

假设检验小概率原理、Ⅰ型错误&Ⅱ型错误、统计检验力(1-β)、双侧&单侧检验、

2、假设检验的步骤

①根据问题要求,提出H0和H1;②选择适当的统计检验量;③确定显著性水平α;

④计算检验统计量的值;(计算标准误,计算临界的Z或t值)⑤做出决策;

5、假设检验一览表(4种主要的检验方法:Z检验、t检验、F检验、2

χ检验)

平均数的显著性检验(样本是否来自总体)总

1、总体方差已知:【Z(μ)检验】临界值0

=

X

X

Z

SE

μ

-

(μ),其中,0

X X

SE

n

σ

σ

==;

2、总体方差未知:【t检验】临界值0

t=

X

X

SE

μ

-

,其中,1

1

n

X

s

s

SE

n n

-

==

-

1、当n≥30(样本容量足够大)

①总体方差已知可用Z检验。(因为是近似正态,故用Z’表示,公式方法同上)

②总体方差未知时,可直接用样本标准差s代替总体标准差

μ,其他不变)

2、当n<30,不可用Z或t检验,只能选择非参数检验。

平均数

差异的显著性检验(两个样本是否来自同一总体)两

两个

总体

方差

都已

知【Z】

1、独立样本:临界值

()()

1212X

X X

D

X

D D

D

X X

Z

SE SE

μ

μμ-

---

==

其中,

22

12

12

X

D

SE

n n

σσ

=+

2、相关样本:临界值同上为,

()()

1212X

X X

D

X

D D

D

X X

Z

SE SE

μ

μμ-

---

==

其中,

22

1212

2

X

D

SE r

n n n n

σσσσ

=+-?

两个总体方差都未

知【t 】 1、独立样本。

①两个总体方差一致或相等。(齐性)临界值 12

12t=

(2)X

D X X df n n S

E -=+-

其中,2

12

11()X

D

p

SE s n n =+;其中,2p s 为联合方差,22

2

1122122p n s n s s n n +=

+- (联合方差2p s 是总体方差最好的估计值)

②两个总体方差不齐性。——柯克兰-柯克斯t 检验

121

2

1

112122

2

221

1

2

2t '11

n n n n X X X X s

s

s

s

n n n n ----=

=

+

+

--(用各自的无偏估计量)

1

212

221()2()'2

2X X X X SE t SE t t SE SE

ααα?+?=

+;(查t 值时,df=1)

【PS:若实际得到的t ’>'

t α,则认为两个样本的平均数在α水平差异显著】

2、相关样本。 ①相关系数未知。

12

X

D X X t S

E -=

(1df n =-);(用d 表示每一对数据对应的数据之差。)

其中,2

1

X

d D

s SE n =

-; 2

2

22

()()s d d d d d n n n --==∑∑∑; ②相关系数已知。

12

X

D X X t S

E -=(1df n =-);其中,22

1212s s 21X

D rs s S

E n +-=- 两 个 总 体 非 正 态

当样本容量足够大时:【Z 】

1、独立样本:

12

2

21

2

1

2

'X X Z n n σ

σ

-=

+

或12221

2

12

's X X Z s n n -=

+(方差未知时以样本方差代替各自的总体方差)

2、相关样本:

12

2212

12

'2X X Z r n

σσσσ-=

+-或12221

2

12

'2X X Z s s rs s n

-=

+-

方差的差异检验样本

与总

正态总体中样本,其样本方差与总体方差比值的分布为2

χ分布,即

2

2

2

n

=

s

χ

σ从2

χ表中查2

/2

α

χ、2

(1/2)

α

χ

-

(df=1,),当22

/2

α

χχ

或22

(1/2)

α

χχ

-

,差异显著。

样本

之间

1、独立样本:【F检验】

2

2

s

s

F=大

2、相关样本:【t检验】

22

12

222

12

t

4(1)

2

s s

s s r

n

-

=

-

-

((2)

df n

=-)

相关系数的显著性检验积差

相关

1、ρ=0(r的分布近似正态)【t检验】

2

t

1

2

r

r

n

-

=

-

-

(2)

df n

=-

2、ρ≠0,将r和ρ都转化为费舍

r

Z,然后再进行【Z检验】

1

3

r

Z Z

Z

n

ρ

-

=

-

【总结思路】:题目若未说明ρ是否为0,则先假定ρ为0,若计算得出要拒绝

H(=

ρ0),则必须重新再用ρ≠0的方法来算一遍。

其他

类型

相关

1、点二列相关

2、二列相关

3、多列相关

4、四格相关

5、斯皮尔曼等级相关

6、肯德尔W系数

相关

系数

差异

(仅

论积

差相

关情

况)

1、r1和r2分别由两组彼此独立的被试得到。

将r1、r2分别进行费舍

r

Z的转换。【Z检验】1r r2

12

=

11

33

Z Z

Z

n n

-

+

--

2、两个样本相关系数由同一组被试算得

12

ρ、

23

ρ、

13

ρ,检验

12

ρ与

13

ρ的差异。

首先计算3列变量的两两相关系数

12

ρ、

23

ρ、

13

ρ,然后进行【t检验】

121323

222

121323121323

()(3)(1)

t

2(12)

r r n r

r r r r r r

-?-+

=

---+???

(3)

df n

=-

比率的显著性检验

比率

的显著性

1、 n 5p ,【Z 检验】

00p p Z p q n

-=? 2、

5n p ≤,直接查表二项分布置信上下界限

比率差异的显著性检验

1、独立样本:

①若统计假设仅假设p1=p2,不涉及具体数值时,

临界比率 1

2

12

p p =p p

Z σ--;其中标准误 12

112211221212()()()

p D p p n p n p n q n q n n n n σσ-++==+

②若统计假设还假定了具体的比率时(12D p p p -=,D p 为正负1之间的任意数。) 12

12p =

D

p p p Z p σ--()-,其中标准误为12112212p p p p q q n n σ-=+ 2、相关样本:

步骤:①将实验结果整理成四格表,将其中前后两次不一致的项目的格内数字标以A 或D ; ②012:0H p p -= 112:0H p p -≠;③应用下式求临界比率(条件:A+D=k ≥10,kp ≥5)

=

A D Z A D -+或D A A D

-+;若不满足上面的条件,则用二项分布计算A p (或D

q )以上的概率和,若概率和小于0.005或0.025为差异显著(这是双侧。单侧为小于0.05及0.01)

第九章 方差分析

1、几个基本概念

【方差分析】即变异分析。本质仍然是假设检验。主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。

【方差分析的要求】①总体分布呈正态;②每个实验组的方差齐性;③变异具有可加性; 【方差分析依据的基本原理】即方差(或变异)的可加性原则

【方差分析目的】通过F 检验讨论组间变异在总变异中的作用,借以对两组以上的平均数进行差异检验。

【方差分析的步骤】

(1)齐性检验;(哈特莱最大F 比率法) (2)构建综合虚无假设;

(3)计算平方和;

(4)计算自由度;

(5)计算均方;

(6)确定检验统计量(计算F值);

(7)确定显著性水平的临界值(查F值表进行F检验);(8)做出统计决断;

(9)陈列方差分析表

2、方差分析一览表

完全随机设计的方差分析即单因素分析。

安排被试的一般格式

处理1 处理2 ……处理k

被试11 被试21 ……被试k1

被试12 被试22 ……被试k2

被试13 被试23 ……被试k3

……. ………………

需要计算的统计量基本公式一览表

计算平方和计算自由度计算均方计算F值总变异

2

2

()

=

T

X

SS X

nk

-

∑∑

∑∑;

组间变异

22

()()

=

B

X X

SS

n nk

-

∑∑∑

组内变异

2

2

()

=

W T B

X

SS SS SS X

n

-=-

∑∑

组间自由度:

1

B

df k

=-;

组内自由度:

(1)

W

df k n

=-;

总自由度:

1

T B W

df df df nk

=+=-

组间均方:

B

B

B

SS

MS

df

=;

组内均方:

W

W

W

SS

MS

df

=

B

W

MS

F

MS

=

完全随机设计(单因素)方差分析表

变异来源平方和自由度均方 F p

组间√√√√√

组内√√√

总变异√√

PS:有以下几种应用

①各实验处理组样本容量相同

②各实验处理组样本容量不同(此时总数据个数用nk用N来表示)

③利用样本统计量进行方差分析

随 机 区

组 设

的 方 差 分 析

即组内设计的方差分析。【每个组均接受所有的实验处理】

安排被试的一般格式

处理1 处理2 …… 处理k 被试1 被试1 …… 被试1 被试1 被试2 …… 被试2 被试1 被试3 …… 被试3 …… …… …… ……

随机区组设计的方差分析表

变异来源 平方和 自由度 均方 F p 组间 √ √ √ √ √

区组 √ √ √ √ √ 误差 √ √ √ 总变异 √ √

需要计算的统计量基本公式一览表 计算平方和

计算自由度

计算均方 计算F 值

总变异

2

2

()=T X SS X nk

-

∑∑∑∑组间

变异

2

2

()()=B X X SS n

nk

-

∑∑∑∑

区组变异

2

2

n

1

()()

R R R SS k

nk

=-

∑∑∑∑

误差项平方和

E T B R SS SS SS SS =--

总自由度:1T df N =- 组间自由度:1B df k =-

区组自由度:1R df n =- 误差自由度:

(1)(1)E df k n =--

组间均方:

B B B SS MS df =

区组均方:

R

R R

SS MS df =

误差均方:

E

E E

SS MS df =

组间方差是否大于误差

项的方差:(一般)

B

B E

MS F MS =

检验区组效应:

R

R E

MS F MS =

PS :

实验原则:同一区组内的被试应该同质。

区组效应:被试之间性质不同产生的差异。区组效应显著说明分组成功。

事 后 检 验

在方差分析基础上,若结果是拒绝了虚无假设,即差异显著,但究竟是那几对平均数存在差异,则需要进行事后检验。(事后多重比较) 注意:事后多重比较并不限于方差分析,只要是对多个平均数进行两两比较,都可以采用此方法。 N-K 检验法:即q 检验法。步骤如下:

①把要比较的平均数从小到大做等级排列;可列表如下

等级 1(最小) 2 3 4 5 6 …… 平均数 X 下标 X 下标 X 下标 X 下标 X 下标 X 下标

可列出具体数值

②根据比较等级r ,自由度E df ,查附表(q 分布的临界值表)中对应的0.05q (或0.01水平)的值;

(比较等级r 是被比较的两个平均数的等级数之差再加1,即1i j r r r =-+。E df 即方差分析中的误差自由度,与完全随机设计中的组内自由度W df 相等)。 ③求样本平均数的标准误:

E

X MS SE n

=

(其中,E MS 为组内均方,n 为每组容量。完全随机设计时用W MS ), 完全随机设计,各组容量不同时使用:11

()2W X a b

MS SE n n =

+ ④0.05X SE q ?就是对应于某一个r 值得两个平均数相比较时的临界值。

若两个平均数的差异>(0.05X SE q ?),则认为这两个平均数在0.05水平差异显著;可列表如下: 表中数值表示平均数两两之间的差数,显著可加*号。比较时,注意对应的是哪个r 值。

X 下标

(数值)

X 下标

X 下标

X 下标

X 下标 (两平均数差)

X 下标 √ √ X 下标 √ √ √ X 下标

第十章 2χ检验

1、相关知识点

【2

χ检验】是对类别数据的检验,对数据总体的分布形态不做任何要求,实际上是一种非参数检验。处理的是一个因素两项或多项分类的【实际观察频数】与【理论频数】(即期望次数)是否一致。

【2

χ的假设】

①分类相互排斥,互不包容;②观测值相互独立;(要求每个被试只有一个观测值)③期望次数的大小;(每一个单元格中的期望次数至少在5个以上)

类别配合度检验

即无差假说检验。用来检验一个因素多项分类的实际观察数与某理论次数是否接近。

涉及的是某总体的分布是否与某种分布相符合。

(当对连续数据的正态性进行检验时,此法也称正态吻合性检验。)

独立性检验

用来检验两个或两个以上因素各种分类之间是否有关联或是否有独立性的问题。

(交互作用。例如:性别与对某个问题的态度是否有关联等)

同质性检验检定不同人群母总体在某一变量的反应是否具有显著差异。

基本公式

2 20

=e

e

f f

f χ∑(-)

基本步骤①提出假设;②计算2

χ值;③查表,比较并做出决断。

小期望次数的连续性校正1、单元格合并法;

2、增加样本数;

3、去除样本法;

4、使用校正公式;2×2列联表中,

①若单元格的期望次数在5到10之间,则用耶茨校正公式;

②若期望次数低于5,或样本总人数低于20,则用费舍精确概率检验法;

③若单元格内容涉及到重复测量设计(如前后测设计),则使用麦内玛检验;

2、2

χ检验一览表

度检验一般问题

1、统计假设。

H:

f-

e

f=0或

f=

e

f

1

H:

f-

e

f≠0或

f≠

e

f

2、理论次数的计算:

①无差假说。即理论次数=总数×(1/分类项数);②按照某种理论分布。

3、自由度:分类项目减去计算时用的统计量数,一般为分类项目减去1.。

应用

检验无差假说

无差假说,即各项分类的实计数之间没有差异,也就是各项分类间机会相等(概率相等),理论

次数完全按概率相等的条件算,即理论次数=总数×(1/分类项数) 检验假设分布的概率

假设某因素各项分类的次数为正态分布,检验实计数与理论上期望的结果之间是否有差异。

吻合性检验 即拟合度检验。针对连续性数据,检验其是否符合某种理论分布。 比率或百分数的….. 针对搜集到的资料是用百分数表示的情况,方法与上同。 只是将最后的2χ值乘以

100

N

后,再查2χ表。(亦可先将百分数转换为实际频数来计算) 二项分类的配合度检验

二项分类的2χ检验与比率显著性检验相同,配合度检验更为简便。

2χ的连续

性校正

当期望次数小于5时,比率的显著性检验不能用近似正态而应用二项分布概率计算。

或采用耶茨提出的校正公式为:2

02

=e e

f f f χ-∑(-1/2)

独立性检验

一般问题与步骤

1、统计假设。一般多用文字描述。

虚无假设为因素间无关联(或独立的),备择假设则为因素间有关联(或差异显著)。

2、理论次数(直接用列联表中数据推算):xi yi e f f f N

=

;(x f 为每行之和,y f 为每列之和)

3、自由度:(1)(1)df R C =--;(R 为每一行的分类项目,C 为每一列的分类项目) 类型

四格表独立性检验

1、独立样本。(相当于独立样本比率差异的显著性检验) 独立样本的四格表示意:

因 素 B

因素A

分类1 分类2 分类1 A B A+B 分类2 C D C+D

A+B

B+D

N=A+B+C+D

①当e f ≥5时,2

2

=()()()()

N A B C D A C B D χ++++(AD-BC )

(df=1)

②当某一个e f <5时,用校正公式:2

22=()()()()

N N A B C D A C B D χ-

++++(AD-BC )

2、相关样本。(相当于相关样本比率差异的显著性检验)

①当e f ≥5时,2

2

=A D

χ+(A-D )

(df=1)。其中A 、D 为两次实验或调查中分类项目不同的两个格的

实计数。(如,学生测两次成绩,第1次答对但第2次答错&第一次答错但第二次答对。)

统计学原理-计算公式

位值平均数计算公式 1、众数:是一组数据中出现次数最多的变量值 组距式分组下限公式:002 110m m d L M ??+??+= 0m L :代表众数组下限; 1100--=?m m f f :代表众数组频数—众数组前一组频数 0m d :代表组距; 1200+-=?m m f f :代表众数组频数—众数组后一组频数 2、中位数:是一组数据按顺序排序后,处于中间位置上的变量值。 中位数位置2 1+=n 分组向上累计公式:e e e e m m m m e d f S f L M ?-∑+=-12 e m L 代表中位数组下限; 1-e m S :代表中位数所在组之前各组的累计频数; e m f 代表中位数组频数; e m d 代表组距 3、四分位数:也称四分位点,它是通过三个点将全部数据等分为四部分,其中每部分包含 25%,处在25%和75%分位点上的数值就是四分位数。 其公式为:4 11+=n Q 212+=n Q (中位数) 4)1(33+=n Q 实例 数据总量: 7, 15, 36, 39, 40, 41 一共6项 Q1 的位置=(6+1)/4=1.75 Q2 的位置=(6+1)/2=3.5 Q3的位置=3(6+1)/4=5.25 Q1 = 7+(15-7)×(1.75-1)=13, Q2 = 36+(39-36)×(3.5-3)=37.5, Q3 = 40+(41-40)×(5.25-5)=40.25 数值平均数计算公式 1、简单算术平均数:是将总体单位的某一数量标志值之和除以总体单位。 其公式为:n x n x x x X n ∑=??++=21 2、加权算术平均数:受各组组中值及各组变量值出现的频数(即权数f )大小的影响,

心理统计学公式总结

心理统计学公式总结 一、集中量 1.算术平均数:X??X X??fXNNNi ?n1)2fmd? 2.中位数:Md?Lmd?( 3.众数:M??3Md?2X 4.加权算术平均数:XW? 5.几何平均数:Xg? 6.调和平均数:XH? 二、差异量 1.四分差:QD?N?WX ?W X1X2?XN N1?XQ3?Q1 2 2X?X?2.平均差:MD?N3.标准差:?X?? N24.方差:?2X? ?N5.差异系数:CV??XX100% 6.百分等级分数:PR??Fb???f(X?Lb)?100?N i?7.标准分数:Z? X?X?X 三、相关量1.积差相关系数:r??XY?nXY n?x?y6?D2n(n2?1) 2.斯皮尔曼等级相关系数:rR?1?2?23.肯德尔和谐系数:rW? 式中:SSR??R? 123nK(n?n)12SSR4.点二列相关系数:rpb?Xp?Xq?tpq 5.二列相关系数:

rb?Xp?Xqpq ?tY6.多系列相关系数:rs??[(Y?Y)X] (Y?Y)??pLH2LHt7.四分相关系数:rt?cos(180?bc1?ad) 8.Φ相关系数:r??ad?bc(a?b)(a?c)(b?d)(c?d) 9.列联相关系数:c? 四、推断统计?2 N??2XXn?X1.二项分布概率:P?Cpq n2.二项分布平均数:??np 3.二项分布标准差:??npq Ne12??(X??)22?24.正态分布曲线:Y??2? 5.标准正态分布曲线:Y?e?Z22 6.平均数抽样分布标准误:?X??n??Xn?1 五、总体平均数的显著性检验 1.?已知:Z?X??? nX??2.?未知但n>30:Z??X n?1 3.?未知但n≤30:t?X???Xn?1 六、平均数差异的显著性检验 1.相关大样本:Z?X1?X2?2X1??2X2 ?2r?X1?X2n?1 df?n?1 2.相关小样本:t?X1?X2?2X1??2X2?2r?X1?X2n?13.独立大样本:Z?X1?X2?2X1n14.独立小样本:t???2X2

心理统计学公式

若n为奇数,则Md为第「个数 2 X n X n 1 若n 为偶数,则Md 2- 2 b.有重复数据 b1.重复数没有位于数列中间 方法与无重复数一样 b2.重复数位于数列中间若重复数的个数为奇数若重复个数为偶数 先将数据从小到大(从大到小)排列 三、众数 a.皮尔逊经验公式:分布近似正态探M。:3Md -2X 算术平均数、中位数、众数三者的关系探 在正态分布中:X=Md=M O 四分位差:a未分组数据Q =Q^ Q1 2 b分组数据2 f——Xi Qi = 1* --------- j------ X i 二?平均差— 1. 原始数据计算公式:氷D _》X_X n If Xc-乂2. 次数分布表计算公式:AD = ----------------- n 三.方差和标准差的定义式:探 S2 原始数据导出公式 、算术平均数 1.原始数据计算公式探 X i n 1 X X n 2.简捷公式 1—— X = AM x' n 、中位数(中数) 1.原始数据计算法探 a.无重复数据一.全距R (又称极差):探R = Xmax — Xmin P 百分位数的计算方法:I Pp为所求的第P个百分位数 Lb为百分位数所在组的精确下限 f为百分位数所在组的次数 Fb为小于Lb的各组次数的和 N为总次数 i为组距 百分等级:P R -10°F b f(x 一Lb) R n [ b i 」 在负偏态分布中:X ::: Md ::: M O 四、其它集中量数 1. 加权平均数(Mw)探 W t X, + Xj + - + W,X n 2. 几何平均数(Mg)探 M g 7 X i X2 X n 3、调和平均数 (MH)____________ 1 丄(丄+丄』 N V X1X2X3X4 'X i S2 1X 2 次数分布表计算公式 S2 、fg-X)2 n 导出公式 、2 If X c2代f X c f > = - n i n 丿 If X f(X ci-X)2 n 2 在正偏态分布中: X Md M O

统计学原理常用公式汇总

2.加权算术平均数 X =- X h X 3调和平均数: 式中: m = Xf , f X 统计学原理常用公式汇总 第2章统计整理 a ) 组距=上限—下限 b ) 组中值=(上限+下限)—2 c ) 缺下限开口组组中值=上限-1/2邻组组距 d ) 缺上限开口组组中值=下限+1/2邻组组距 e ) 组数k=1+3.322Lg n n 为数据个数 第3章综合指标 i. 相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2?比例相对指标=总体中某一部分数值/总体中另一部分数值 3?比较相对指标=甲单位某指标值/乙单位同类指标值 4. 强度相对指标=某种现象总量指标/另一个有联系而性质不 同的现象总量指标 5. 计划完成程度相对指标=实际数/计划数 =实际完成程度(%) /计划规定的完成程度(%) ii. 平均指标 1.简单算术平均数:; 丄 iii. 标志变动度 1.全距=最大标志值-最小标志值 加权 或 ? f ? Xf ? Xf

3.标准差系数:”= iiii抽样推 断 1.抽样平均误差: 重复抽样: p(1 P) n 不重复抽样: 2 ( 1 2.抽样极限误差 3.重复抽样条件下: 平均数抽样时必要的样本数目 n 成数抽样时必要的样本数目不重复抽样条件下: t2 2 2- x t2P(1 p) 平均数抽样时必要的样本数目第4 章动态数列分析一、平均发展水平的计算方法:(1)由总量指标动态数列计算序时平均数 ①由时期数列计算 a a n Nt2 2 N 2x t2 2 ②由时点数列计算 在间断时点数列的条件下计算: 若间断的间隔相等,则米用“首末折半法”计算。公式为: 1 1 a i a2 a n a. 1 a 2—— n 1 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为:

统计学常用公式汇总 (2)

统计学常用公式汇总 项目三 统计数据的整理与显示 组距=上限-下限 a) 组中值=(上限+下限)÷2 b) 缺下限开口组组中值=上限-邻组组距/2 c) 缺上限开口组组中值=下限+1/2邻组组距 例 按完成净产值分组(万元) 10以下 缺下限: 组中值=10—10/2=5 10—20 组中值=(10+20)/2=15 20—30 组中值=(20+30)/2=25 30—40 组中值=(30+40)/2=35 40—70 组中值=(40+70)/2=55 70以上 缺上限:组中值=70+30/2=85 项目四 统计描述 i. 相对指标 1. 结构相对指标=各组(或部分)总量/总体总量 2. 比例相对指标=总体中某一部分数值/总体中另一部分数值 3、 比较相对指标=甲单位某指标值/乙单位同类指标值 4、 动态相对指标=报告期数值/基期数值 5、 强度相对指标=某种现象总量指标/另一个有联系而性质不同的现 象总量指标 6、 计划完成程度相对指标K =计划数实际数 =% %计划规定的完成程度实际完成程度 7、 计划完成程度(提高率):K=%10011?++计划提高百分数 实际提高百分数 计划完成程度(降低率):K=%10011?--计划提高百分数 实际提高百分数 ii. 平均指标 1、简单算术平均数: 2、加权算术平均数 或

iii. 变异指标 1. 全距=最大标志值-最小标志值 2、标准差: 简单σ= ; 加权 σ= 成数的标准差(1) p p p σ=- 3、标准差系数: 项目五 时间序列的构成分析 一、平均发展水平的计算方法: (1)由总量指标动态数列计算序时平均数 ①由时期数列计算 n a a ∑= ②由时点数列计算 在连续时点数列的条件下计算(判断标志按日登记):∑∑=f af a 在间断时点数列的条件下计算(判断标志按月/季度/年等登记): 若间断的间隔相等,则采用“首末折半法”计算。公式为: 1 212 1121-++++=-n a a a a a n n 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为: ∑ --++++++=f f a a f a a f a a a n n n 11232121222 (2) (选用)由相对指标或平均指标动态数列计算序时平均数 基本公式为: b a c = 式中:c 代表相对指标或平均指标动态数列的序时平均数; a 代表分子数列的序时平均数; b 代表分母数列的序时平均数;

统计学名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。 概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。

11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。 22.离散型变量:只能取可数值的变量。 23.连续型变量:可以在一个或多个区间中取任何值的变量。 四、习题答案 1.D 2.D 3.A 4.B 5.A 6.D 7.C 8.B 9.A 10.A 11.C、12.C 13.B 14.A 15.C 16.D 17.C 18.A 19.C 20.D 21.A 22.C 23.C 24.B 25.D 26.C 27.B 28.D 29.A 30.D 31.A 32.B 33.C 34.A 35.A 36.A 37.D 38.B 39.B 40.C 41.C 42.D 43.C 44.D 45.A 46.B 47.C 48.A 49.C 50.D 51.A 52.C 53.D 54.A 55.B

应用心理学专业心理统计学作业及答案

《心理统计学》作业 本课程作业由两部分组成。第一部分为“客观题部分”,由15个选择题组成,每题1分,共15分。第二部分为“主观题部分”,由绘制图表题和计算题题组成,共15分。作业总分30分,将作为平时成绩记入课程总成绩。 一、选择题(每题1分) 1 按两个以上品质分组的统计表是:D A 简单表 B 相关表 C 双向表 D 复合表 2 若描述统计事项随时间的变化其总体指标的变化趋势,应该使用:C A 次数分布多边图B依存关系曲线图 C 动态曲线图D次数分布直方图 3 按照数据的获得方式,找出下列数据中与其他不同类型的数据:D A 80斤 B 80升 C 80米D80条 4 测量数据的下实限是:D A B 10.005 C D. 5按测量数据实限的规定, 组限a~b的实际代表范围应是:D A 开区间 B 闭区间C左开右闭 D 左闭右开 6 绘制次数分布多边图时,其横轴的标数是:B A 次数B组中值 C 分数D上实限 7 编制次数分布表最关键的两个步骤是:A A 求全距与定组数 B 求组距与定组限 C 求中值与划记D记录次数与核对 8 将一组数据中的每个数据都加上10,则所得平均数比原平均数:A A 多10 B多,但具体多少无法知道 C 相等D多10 数据个数 9 已知有10个数据的平均数是12,另外20个数据的平均数是9,那么全部数据的平均数应为:B A 9 B 10 C 11 D 12 10 某校1990年在校学生为880人,1992年在校学生为1760人。那么从1990年到1992年在校人数平均增长率为:B

A % B % C 126% D 26% 11 可否用几何平均数求平均下降速度及平均下降率。A A 两者都可以 B 可以求平均下降速度但不能求平均下降率 C两者都不可以D可以求平均下降率但不能求平均下降速度 12 下面哪种情况用差异系数比较数据的离散程度比较适合D A 单位相同,标准差相差较大 B单位相同,标准差相差较小 C单位相同,平均数相差较小 D单位相同,无论平均数相差大小 13 一组数据44,45,48,52,60,64,65,89,83,65,87,66,67,81,80,68,79,72,79,73的四分差为:B A B 8.75 C D 62 14 某班语文期末考试,语文平均成绩为82分,标准差为分;数学平均成绩为75分,标准差为分;外语成绩为66分,标准差为8分,问哪一科成绩的离散程度最大C A 语文 B 数学 C 外语 D 无法比较 15某校抽取45名五年级学生参加市统一组织的数学竞赛,成绩如下表: 问用什么作为起差异量的代表值合适B A 标准差 B 四分差 C 差异量数D标准分数 二、制表绘图题(每题3分)

心理统计学公式

第三章集中量数 一、算术平均数 1.原始数据计算公式※ 121 1n n i i X X X X X n n =+++==∑ 2.简捷公式 二、中位数(中数) 1. 原始数据计算法※ a. 无重复数据 b.有重复数据 b1.重复数没有位于数列中间 方法与无重复数一样 b2.重复数位于数列中间 若重复数的个数为奇数 若重复个数为偶数 先将数据从小到大(从大到小)排列 三、众数 a. 皮尔逊经验公式:分布近似正态※ 算术平均数、中位数、众数三者的关系※ 在正态分布中: 在正偏态分布中: 在负偏态分布中: 四、其它集中量数 1. 加权平均数(Mw)※ 2. 几何平均数(Mg)※ 3、调和平均数(MH) 第四章离散量数 一.全距 R (又称极差):※ R =Xmax -Xmin 百分位数的计算方法: Pp 为所求的第P 个百分位数 Lb 为百分位数所在组的精确下限 f 为百分位数所在组的次数 Fb 为小于Lb 的各组次数的和 N 为总次数 i 为组距 百分等级: 四分位差:a 未分组数据 b 分组数据 二.平均差 1. 原始数据计算公式:※ 2. 次数分布表计算公式: 三.方差和标准差的定义式:※ 原始数据导出公式 次数分布表计算公式 导出公式 个数为第 则为奇数若2 1 ,+n Md n 2 ,1 22 ++= n n X X Md n 则为偶数若X n X ∑=1' 1x n AM X ∑+=X Md M o 23-≈O M Md X ==O M Md X >>O M Md X <

统计学原理常用公式汇总

统计学原理常用公式汇总 第2章统计整理 a)组距=上限-下限 b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距 d)缺上限开口组组中值=下限+1/2邻组组距 e)组数k=1+3.322Lg n n为数据个数 第3章综合指标 i.相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2.比例相对指标=总体中某一部分数值/总体中另一部分数值 3.比较相对指标=甲单位某指标值/乙单位同类指标值 4.强度相对指标=某种现象总量指标/另一个有联系而性质不 同的现象总量指标 5.计划完成程度相对指标=实际数/计划数 =实际完成程度(%)/计划规定的完成程度(%) ii.平均指标 1.简单算术平均数: 2.加权算术平均数或 3调和平均数: ? ? = f X f X h 1 1 式中:, h Xf Xf m X X m f Xf X X m m Xf f X ==== == ??? ??? iii.标志变动度 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ=

3.标准差系数: iiii 抽样推断 1. 抽样平均误差: 重复抽样: n x σ μ= n p p p ) 1(-= μ 不重复抽样: )1(2 N n n x - = σμ 2.抽样极限误差 x x t μ=? 3.重复抽样条件下: 平均数抽样时必要的样本数目 2 22x t n ?= σ 成数抽样时必要的样本数目2 2)1(p p p t n ?-= 不重复抽样条件下: 平均数抽样时必要的样本数目 2222 2σσt N Nt n x +?= 第4章 动态数列分析 一、平均发展水平的计算方法: (1)由总量指标动态数列计算序时平均数 ①由时期数列计算 n a a ∑= ②由时点数列计算 在间断时点数列的条件下计算: 若间断的间隔相等,则采用“首末折半法”计算。公式为: 1 212 11 21-++++=-n a a a a a n n Λ 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为:

统计学主要计算公式72485

统计学主要计算公式(第三章) 1 11 1k i i k i i k i k i i i f f f f ====?? ? ???? ? ? ?? ? ? ???? ?? ?∑ ∑ ∑ ∑ ∑ N i i=1i i 一、算术平x 简单x=N x 均数加权x=频数权数x=x 1i i H i i i i m m x m m x x = = ∑∑∑∑二、调和平均数 ? = ?? ? ? =?? G G 简单x 三、几何平均数加权x 11/2/2m e m m e m f S M L i f f S M U i f -+?-=+ ??? ? -?=-???∑∑下限公式四、中位数上限公式 1012 20 12d M L i d d d M U i d d ? =+??+?? ?=-??+? 下限公式五、众数上限公式

() ()x x x x f f AD AD ? -?? ? -??? ∑ ∑∑六、平均差简单=N 加权= σ σ σ σ ??? ???? ??? ??? ????? ??? 七、标准差简单加权 简捷公式 简单 加权 100%100% AD AD V x V x σσ ? ??? ? ???? 平均差系数=八、离散系数标准差系数= 统计学主要计算公式(第五章) ( )( ) 11n n s s t t n αα α α αα σ σ μμμμμμ--?±±?? ?? ±±?? ? ?±±??22 22 22 一、参数估计(随机抽样)1.总体均值估计-单总体 正态总体,方差已知 =x z =x z 正态总体,方差未知=x =x 非正态总体,足够大=x z =x z

心理统计公式汇总

心理统计公式汇总 心理学考研分为:心理学学硕和心理学专硕(又称“应用心理硕士”、“心理专硕”)。心理学学硕和心理学专硕考试科目不同,但是都会考察到心理学统计,(部分自主命题院校不考察心理学统计,考生需要提前了解院校信息。)无论是对本专业还是跨专业心理学考研的同学而言,心理学统计始终是比较难懂的一块。博仁教育老师为考生分章节整理出心理学统计公式,方便考生进行复习与记忆。 第三章集中量数 1、几个集中量数的公式计算一览表

【组中值的计算】 第四章差异量数

第五章相关关系

第六章概率分布 1、几个基本概念 (1)概率:表明随机事件出现的可能性大小的客观指标。 (2)后验概率(统计概率): 先验概率(古典概率): (3)概率分布:对随机变量取值的概率分布的情况用数学方法(函数)描述。 2、概率的基本性质: ※概率的公理系统: 任何一个随机事件的概率都是非负的; 在一定条件下必然发生的必然事件概率为1; 在一定条件下必然不发生的事件,即不可能事件的概率为0. ※概率的加法定理 ※概率的乘法定理 3、概率的分布类型划分

4、几个重要分布 ★正态分布 (1)特征: ①正态分布的形式是对称的,对称轴是经过平均数的垂线。 ②正态分布的中央点即平均数最高,然后逐渐向两侧下降;曲线形式先向内弯,再向外弯,拐点位于正负1个标准差处,曲线两端向基线无线靠近,但不相交。 ③正态曲线下面积为1。 ④正态分布是一族分布。平均数决定其位置,标准差决定其形态。标准差越小,曲线越狭高。 ⑤正态分布中各差异量数值间有固定比率。 ⑥正态曲线下,标准差和概率(面积)有一定的数量关系。 (2)正态分布表的利用 ①已知Z分数求概率p,即已知标准分数求面积。 ②已知概率P求Z分数。 ③已知概率或Z求概率密度y,即曲线的高。【直接查表即可。注意已知的y是位于中间部分,还是两尾。】 (3)次数分布是否为正态的检验方法 (4)正态分布理论在测验中的应用 ①化等级评定为测量数据 ②标准测验题目的难易度 ③在能力分组或等级评定时确定人数 ④测验分数的正态化 二项分布(贝努里分布) (1)几个重要概念理解

心理统计公式汇总

心理统计公式汇总 第三章集中量数1、几个集中量数的公式计算一览表 平均数(M) 算术平均数 (M) 未分组:1 = n i i X X n = ∑ 分组数据:i ci i f X M f ? = ∑ ∑ 加权平均数 (单位权重不相 等的情况) i i i W X Mw W ? = ∑ ∑ 几何平均数 (解决增长率的 问题) lg lg i X Mg N = ∑ ;1 1 N N X Mg X - =; 1 ,, N N Mg X X = 调和平均数 (解决速度的问 题) 倒数的算术平均数的倒数: 1 H i N M X = ∑ ; 中数(Md) 未分组: 无重复值 N=奇数:中数即 1 2 N+ 位置的数; N=偶数:中数即中间两个数的平均数; 有重复值 若重复值没有位于中间,则求法与无重复值时 一致; 若重复值位于中间,则(P62): 图示: 思路:①连续性数字,不是一个点,是一个区 间; ②有几个重复的,则将组距除以几; 分组d() 2 b b Md N i M L F f =+-? 众数(Mo) 1、直接观察法。 2、公式法。(皮尔逊经验法&金式插补法) ①皮尔逊经验法:o32 M Md M =-; ②金式插补法:a b a b f Mo L i f f =+? + ; 【组中值的计算】

第四章 差异量数 百分位数(点) 100b p b P N F P L i f ?-=+?; 百分等级 未分组:(10050) 100R R P N -=- 分组:()100 []b R b f X L P F N i -= ?+ 四分位差 31 = 2 Q Q Q -; (Q3与Q1即P25与P75) 平均差 未分组:..i i X A D n n X x -= = ∑∑ 分组:..f x A D n = ∑;(IxI 为各组中点值对平均数离差的绝对值) 方差与 标准差 未分组:① 2 2 2 ()s X X N N x -= = ∑∑; ②原始数据代入:2 2 2 2 2 2 () ()s N N X X X X N N -= -= ∑∑∑∑ 分组: 2 2 2 ()c f X X f N N x s -= = ∑ ∑ 2 2 s ()f i N fd d N = -?∑∑ 总方差与总标准差: 2 2 2;()i i i i T i T i i N s N d s d X X N += =-∑∑∑ 标准差 的应用 差异 系数 100%s CV X = ? 标准 分数 X X x Z s s -= = 第五章 相关关系

统计学主要计算公式

统计学主要计算公式(第三章) 统计学主要计算公式(第五章) 010220102001001111221012221 22((((1,1)(1,1)(H H Z Z H H H Z Z H H H Z Z H H H F n n F F n n H S F S ααααασσσσχσσσσσσσσσσσσσ-?≠≥??>≥??<≤??≠--≤≤--22220022222002222002222224.方差检验(正态总体) 单总体: :=:拒绝双侧)(n-1)S =:=:拒绝单侧):=:拒绝单侧) 两方差之比检验 :=:拒绝=011112001111210(1,1)((1,1)(H H F F n n H H H F F n n H αασσσσσσσσ-???>≥--??<≤--??222222222222双侧):=:拒绝单侧):=:拒绝单侧) 统计学主要计算公式(第六章) 统计学主要计算公式(第七章) 统计学主要计算公式(第八章) d L d U 2 4-d U 4-d L d

01'201201101???????(1)(1)(1)t t t t t t t t t y y b b t y y b b t b t y ab b b y y a y a a a a -???=+???=++???=?? =++++=+-=-+-t t-1t t-1t-2t-n t+1t t 六、时间序列预测 一阶差分大致相同,趋势外推法模型测定二阶差分大致相同, (同回归模型)y 环比发展速度大体相同,y 自回归预测y (同回归模型) y y y 移动平均n 指数平滑y =ay y y 201(1)(1)n a a a a ++-++-t-1t-2t-n-1 y y 统计学主要计算公式(第九章)

心理统计常用公式总结

心理统计常用公式总结 1 、组数K (总体分布为正态)(N 为数据个数,K 取近似整数) 2 、算术平均数 3 、中数 4 、众数 5 、加权平均数 ,其中W i 为权数 ,其中为各小组的平均数,n i 为各小组人数 6 、几何平均数

,其中n 为数据个数,X i 为数据的值 7 、调和平均数 8 、方差与标准差 , 其中 9 、变异系数,其中S 为标准差,M 为平均数 10 、标准分数,其中X 为原始数据,为平均数,S 为标准差 11 、全距R =最大数-最小数 12 、平均差

13 、四分差 ,其中L b 为该四分点所在组的精确下限, F b 为该四分点所在组以下的累加次数, 和为该四分点所在组的次数,i 为组距,N 为数据个数 14 、积差相关 基本公式:,其中 , ,N 为成对数据的数目,S x 、S y 分别为X 和Y 的标准差 变形: 差法公式:

用估计平均数计算: 用相关表计算: 15 、斯皮尔曼等级相关 ,其中 D 为各对偶等级之差 直接用等级序数计算:,其中R X 、R Y 分别为二变量各等级数有相同等级时:

16 、肯德尔等级相关 有相同等级: 17 、点二列相关,其中是两个二分变量对偶的连续变量的平均数,p 、q 是二分变量各自所占的比率,p+q=1 ,S t 是连续变量的标准差 18 、二列相关 ,其中S T 与是连续变量的标准差与平均数,y 为P 的正态曲线的高度 19 、多系列相关

,其中P i 为每系列的次数比率,y 1 为每一名义变量下限的正态曲线高度,y h 为每一名义变量上线的正态曲线高度, 为每一名义变量对偶的连续变量的平均数,S t 为连续变量的标准差 20 、总体为正态,σ 2 已知: 21 、总体为正态,σ 2 未知: 22 、 23 、 24 、

心理统计学重要知识点

心理统计学重要知识点 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑ = Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中 位数上下的数据出现次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。

最新《统计学原理》常用公式汇总及计算题目分析

《统计学原理》常用公式汇总及计算题目分析 第一部分常用公式 第三章统计整理 a)组距=上限-下限 b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距 d)缺上限开口组组中值=下限+1/2邻组组距 第四章综合指标 i.相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2.比例相对指标=总体中某一部分数值/总体中另一部分数值 3.比较相对指标=甲单位某指标值/乙单位同类指标值 4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现 象总量指标 5.计划完成程度相对指标=实际数/计划数 =实际完成程度(%)/计划规定的完成程度(%) ii.平均指标

1.简单算术平均数: 2.加权算术平均数或 iii.变异指标 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ= 3.标准差系数: 第五章抽样估计 1.平均误差: 重复抽样: 不重复抽样: 2.抽样极限误差 3.重复抽样条件下: 平均数抽样时必要的样本数目

成数抽样时必要的样本数目 4.不重复抽样条件下: 平均数抽样时必要的样本数目 第七章相关分析 1.相关系数 2.配合回归方程y=a+bx 3.估计标准误: 第八章指数分数 一、综合指数的计算与分析 (1)数量指标指数

此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。 ( - ) 此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。 ( - ) 此差额说明由于质量指标的变动对价值量指标影响的绝对额。 加权算术平均数指数= 加权调和平均数指数= (3)复杂现象总体总量指标变动的因素分析 相对数变动分析: = × 绝对值变动分析:

现代心理与教育统计学课后题完整版78975

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学?学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤? 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体? 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点

统计学主要计算公式

统计学主要计算公式(第三章) 1 11 1k i i k i i k i k i i i f f f f ====?? ? ???? ? ? ?? ? ? ???? ?? ?∑ ∑ ∑ ∑ ∑ N i i=1i i 一、算术平x 简单x=N x 均数加权x=频数权数x=x 1i i H i i i i m m x m m x x = = ∑∑∑∑二、调和平均数 ? = ?? ? ? =?? G G 简单x 三、几何平均数加权x 11/2/2m e m m e m f S M L i f f S M U i f -+?-=+ ??? ? -?=-???∑∑下限公式四、中位数上限公式 1012 20 12d M L i d d d M U i d d ? =+??+?? ?=-??+? 下限公式五、众数上限公式

()()x x x x f f AD AD ? -?? ? -??? ∑∑∑六、平均差简单= N 加权= σ σ σ σ ??? ???? ??? ??? ????? ??? 七、标准差简单加权 简捷公式 简单 加权 100% 100% AD AD V x V x σσ ? ??? ? ???? 平均差系数=八、离散系数标准差系数= 统计学主要计算公式(第五章) ( ) ( ) 11n n t t n αα αα αα μμμμμμ--?±±?? ?? ±±?? ? ?±±??22 22 22 一、参数估计(随机抽样)1.总体均值估计-单总体 正态总体,方差已知 =x z =x z 正态总体,方差未知=x =x 非正态总体,足够大=x z =x z

0272《心理统计学》2016年6-7月期末考试指导.

0272《心理统计学》2016年6-7月期末考试指导 一、考试说明 本课程闭卷考试,满分100分,考试时间90分钟。可能的考试题型包括: 1、单项选择题 2、判断题 3、简答题 4、计算题 5、综合应用题 二、重点复习内容 (一)绪论 1、心理学统计学的内容:描述统计、推论统计、实验设计。其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关 2、数据的种类 按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。 (1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。 (2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。例如,测量温度的℃。 (4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。 (二)统计图表 1、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。 2、编制次数分布表的步骤 (1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示(2)定组数 (3)求组距:指每一组的间距,用符号i表示。 (4)定组限:指各组数据在数值上的起点值和终点值。 (5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。(6)归类划记:将原始观测值按照一定的顺序逐一归组。 (7)记录各组次数(f)。 (8)核对,抄录新表。 3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。 4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。 5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。 (三)集中量数 集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。 1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。

统计学常用公式汇总

《统计学原理》常用公式汇总 组距=上限-下限组中值=(上限+下限)÷2 缺下限开口组组中值=上限-1/2邻组组距缺上限开口组组中值=下限+1/2邻组组距 111平均指标 1.简单算术平均数: 2.加权算术平均数 或 iii.变异指标 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ= 3.标准差系数: 第五章抽样估计 1.平均误差:重复抽样: 不重复抽样: 2.抽样极限误差 3.重复抽样条件下:平均 数抽样时必要的样本数目 成数抽样时必要的样本数目 4.不重复抽样条件下:平均数抽样时必要的样本数目 第七章相关分析 1.相关系数 2.配合回归方程y=a+bx

3.估计标准误: 第八章指数分数一、综合指数的计算与分析 (1)数量指标指数 此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。 ( - ) 此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。 ( - ) 此差额说明由于质量指标的变动对价值量指标影响的绝对额。 加权算术平均数指数= 加权调和平均数指数= (3)复杂现象总体总量指标变动的因素分析 相对数变动分析: = × 绝对值变动分析: - = ( - )×( - ) 第九章动态数列分析 一、平均发展水平的计算方法:

(1)由总量指标动态数列计算序时平均数 ①由时期数列计算 ②由时点数列计算 在间断时点数列的条件下计算: a.若间断的间隔相等,则采用“首末折半法”计算。公式为: b.若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为: (2)由相对指标或平均指标动态数列计算序时平均数 基本公式为: 式中:代表相对指标或平均指标动态数列的序时平均数; 代表分子数列的序时平均数; 代表分母数列的序时平均数; 逐期增长量之和累积增长量 二. 平均增长量=─────────=───────── 逐期增长量的个数逐期增长量的个数 (1)计算平均发展速度的公式为: (2)平均增长速度的计算 平均增长速度=平均发展速度-1(100%)

相关文档
最新文档