心理统计学复习题

心理统计学复习题
心理统计学复习题

第一章

※1.心理与教育统计的定义与性质。(名词解释)

心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据所传递的信息,进行科学推论找出心理与教育活动规律的一门学科。

2.心理与教育统计学的内容(描述统计、推论统计的界定)。(名词解释) ●

描述统计:主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。 ●

推论统计:主要研究如何通过局部数据所提供的信息,推论总体的情形。

※3.心理与教育科学研究数据的特点。(填空、选择、简答)

? 多用数字形式呈现 ?

数据具有随机性和变异性

? 随机因素,随机误差,随机现象 ? 数据具有规律性

? 研究目标是通过部分数据推论总体

※4.心理与教育统计的数据类型。(填空、选择)

※5.变量、观测值与随机变量。(名词解释)

变量:是指一个可以取不同数值的物体的属性或事件。由于其数值具有不确定性,所以被称之为变量。 变量的具体取值即观测值。

随机变量:指在取值之前不能预料取到什么值的变量,一般用X,Y 表示。

※6.总体、个体与样本。(名词解释)

◆ 总体:又称母体、全域,是指具有某种特征的一类事物的全

体。 ◆ 个体:组成总体的每个基本单元。

样本:从总体中抽取的一部分个体,构成总体的一个样本。

※7.参数与统计量。(名词解释)

参数又称为总体参数,是对总体情况进行描述的统计指标。

统计量又称特征值,是根据样本的观测值计算出来的一些量数,它是对样本的数据情况进行描述。

第二章

1.对数据资料进行初步整理的基本方式。(填空、选择) 排序和统计分组

2.统计分组应该注意的问题。(简答)

要以被研究对象的本质特性为分组基础;分类标志(被研究对象的本质特性)要明确,能包括所有的数据。“不能既是这个又是那个” 3.分组的标志形式。(填空、选择)

性质类别(称名数据与顺序数据)与数量类别。 4.组距与分组区间。(填空、选择) ●

组距:任意一组的起点与终点的距离。 i= R / K , 常取2、3、5、10、20。

分组区间(组限)即一个组的起点值和终点值。起点值为组下限,终点值为组上限。组限有表述组限和精确组限两种。

5. 不同图表形式所各自适用表示的资料类型。(选择、填空)

第三章

1.集中趋势与离中趋势。(名词解释) ● 集中趋势:数据分布中大量数据向某方向集中的程度,即在某点附近取值的频率较其它点大的趋势。 ●

离中趋势:数据分布中数据彼此分散的程度。

2.对一组数据集中趋势的进行度量的统计量有哪些?(填空、选择) 算术平均数、中数、众数、加权平均数、几何平均数和调和平均数等。

3.算数平均数的计算方法(未分组与分组数据两种情况)。(填空、选择、计算) (一)未分组数据计算平均数的方法 公式 :

表示原始分数的总和,N 表示分数的个数。 (二) 用估计平均数计算平均数

数据值过大时,利用估计平均数(an estimated mean )可以简化计算。

具体方法,先设定一个估计平均数,用符号A M 表示,从每一个数据中减去AM ,使数据值变小,最后将其加入总的计算结果之中。 公式:

X ˊ=Xi-AM

(三)分组数据计算平均数的方法 ● 组中值假设

● 散布在各区间内的数据围绕着该区间的组中值Xc 均匀分布。 ● 计算公式

Xc 为各区间的组中值,f 为各区间的次数,N 为数据的总次数, (四)分组数据平均数的估计平均数方法

AM 为估计平均数,i 为次数分布表的组距, d 可称为组差数

4.平均数的特点。(填空、选择) ●

在一组数据中,每个变量与平均数之差(称为离均差)的总和等于0 。

● 在一组数据中,每一个数据都加(减)上一个常数C ,则所得的平均数为原来的平均数加常数C 。

● 在一组数据中,每一个数据都乘(除)以一个常数C ,则所得的平均数为原来的平均数乘(除)以常数C 。

5.平均数的优缺点。(简答)

1)优点 :

反应灵敏;计算严密;计算简单;简明易解;适合于进一步用代数方法演算;较少受抽样变动的影响。 2)缺点:

易受极端数据的影响 ;若出现模糊不清的数据时,无法计算平均数。 6.计算与应用平均数的原则。(简答) ● 同质性原则

● 平均数与个体数据相结合的原则 ●

平均数与标准差、方差相结合的原则

7.中数的应用。(简答) 当一组观测结果中出现两个极端数目; 次数分布的两端数据或个别数据不清楚

需要快速估计一组数据的代表值。

8.众数的计算方法、众数的优缺点及应用。(简答、计算)

(一)计算众数的方法 1、直接观察法

i

X

X N

=

∑'X X

AM N

=+

∑N

fXc

X ∑

=

i

N

fd AM X ∑+=i

AM Xc d /)(-=

b. 在次数分布表中,次数最多的那个分组区间的组中值为众数。 2、公式法 用公式计算的众数称为数理众数。

(1) 皮尔逊经验法 (2)金氏插补法 公式:

9.平均数、中数与众数的关系。(选择、填空、简答) ● 正态分布: Mo=Md=M

● 在偏态分布中,M 永远位于尾端,Md 位于中间,两者距离较近 Mo=3Md-2M ●

在正偏态分布中,M> Md> Mo 在负偏态分布中,M< Md< Mo

第四章

1.对一组数据离中趋势进行度量的差异量数有哪些?各自的意义是怎样的?(填空、选择) 全距、四分位差、百分位差、平均差、标准差和方差等。

2. 平均差、方差及标准差的计算公式(每一个数据都参与运算)。(填空、选择、计算) 平均差计算公式:

样本方差的计算公式:

样本标准差的计算公式:

3. 方差与标准差的性质与意义。

方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。 标准差是一组数据方差的平方根,具有一些特性。 ● 标准差的性质:

每一个观测数据加上一个相同常数C 之后,计算到的标准差等于原标准差。

若Y i=Xi+C 则有 每一个观测数据乘以一个相同常数C 之后,则所得标准差等于原标准差乘以这个常数。若Y i=Xi ×C 则有

每一个观测值都乘以同一个常数C (C ≠0),再加上一个常数d ,所得的标准差等于原标准差乘以这个常数C 。若Y i=Xi ×C+d ( C ≠0 )则有 ●

方差与标准差的意义

(1)方差与标准差是表示一组数据离散程度的最好指标。

其值越大,说明次数分布的离散程度越大,该组数据较分散; 其值越小,说明次数分布的数据比较集中,离散程度越小。 (2)优点:

反应灵敏;计算公式严密;容易计算;适合代数运算;受抽样变动小;简单明了。(3)在正态分布中,可确定平均数上下几个标准差内的数据个数。(1-1/h2)

4. 标准差的应用(差异系数,标准分数与异常值的取舍)。(选择、填空、简答、计算) 一、差异系数 ●

标准差:绝对差异量数

对同一特质使用同一观测工具进行测量,所测样本水平比较接近时,可直接比较标准差大小 ● 差异系数(coeff i cient of variation ),又称变异系数、相对标准差等,它是一种相对差异量,用CV 来表示。

差异系数应用于

①同一团体不同观测值之间离散程度的比较。

②对于水平差异较大,但进行的是同一种观测的各种团体 二、标准分数

标准分数(standard score ),又称基分数或Z 分数(Z- score ),是以均值为参照点,以标准差为单位表示一个原始分数在团体中所处位置的相对位置AD =

2

2S %100?=X s

CV 1

3

d o M M M M -=

-a b a b

f Mo L i

f f +=+

?s

s X

Y

=X

Y

s

s

C ?

=s s

X

Y

C ?=

即原始数据在平均数以上或以下几个标准差的位置。公式:

三、异常值的取舍

?三个标准差法则

?当数据较多时,如果数据值落在平均数加减三个

标准差之外,则在整理数据时,可将此数据作为

异常值舍弃。

?当数据较少时,需考虑全距与标准差之比,再加

以其他处理。

5. 标准分数的意义及计算公式。(选择、填空、简答、计算)

*见第4题第二点

标准分数的优点

?可比性

?可加性

?明确性

?稳定性

6. 标准分数的性质。(选择、填空、简答)

Z分数的性质

?Z分数无实际单位,是以平均数为参照点,以标准差为单位

的一个相对量。

?一组原始分数转换得到的Z分数可以为正值,也可以是负值。

?凡小于平均数的原始分数的Z值为负数,大于平均数的原始分数的Z值为正数,等于平均数的原始分数的Z值为零。

?所有原始分数的Z分数之和为零,Z分数的平均数也为零。

即∑Z=0,=0

?一组原始数据转换后Z分数的标准差是1,即Sz=1.

?若原始分数成正态分布,则转换得到的所有Z分数的均值为

0,标准差为1的标准正态分布(standard normal distribution)

7. 标准分数的应用。(选择、填空、简答)

?用于比较几个分属性质不同的观测值在各自数据分布中相

对位置的高低。

?某学生的身高、体重哪个在班级中位置在前面

?计算不同质的观测值的总和或平均值,表示在团体中的相对

位置。

?计算各科的总成绩

?表示标准测验分数

Z’=aZ+b

IQ=15Z+100

T=500+100Z

第五章1.事物之间的关系类型。(填空、选择)

因果关系、共变关系和相关关系。

2.相关的类型。(填空、选择)

正相关、负相关和零相关。

3.散点图的不同形式与不同的相关关系的对应。(填空、选择)s x

s X

X

Z=

-

=

4.积差相关的计算的前提条件。(选择、填空、简答)

积差相关的适用条件:

●成对数据,样本容量要大(>30);

●两变量来自的总体均为正态分布;

●两个变量都是连续数据/测量数据;

●两变量之间为线性关系:可根据相关散布图判断。

5.积差相关的计算公式。(填空、选择、计算)

6. 斯皮尔曼(二列)与肯德尔(多列)等级相关的适用数据类型。(选

择、填空)

●斯皮尔曼(二列)等级相关适用于两个以等级次序表示的变量,

并不要求两个变量总体呈正态分布,也不要求样本的容量必须大

于30。

●肯德尔和谐系数常以W 表示,适用于多列等级变量相关程度的

分析。

肯德尔和谐系数可以反映多个等级变量变化的一致性。

●肯德尔U系数又称一致性系数,适用于对K个评价者的一致性

进行统计分析。

7. 质与量相关的数据类型及具体的相关类别。(选择、填空)

●一列为等比或等距的测量数据,另一列按性质划分的类别

●质量相关包括点二列相关、二列相关和多系列相关。

8. 点二列、二列与多列相关的适用数据资料。(选择、填空)

一、点二列相关

适用资料:一列变量为等距或等比数据,且其总体分布为正态,另一列

变量为二分称名变量。

二、二列相关

适用资料:一列变量为等距或等比数据,另一列变量为人为划分二分变

量,且两列变量数据的总体分布均为正态。

三、多列相关

适用资料:适合处理两列正态分布变量,一列为等比或等距的测量数据;

另一列变量被人为地划分为多种类别。

9. 相关系数值的解释。(选择、填空、简答)

●相关系数表示两个变量之间的关系程度,不是等距的测量值,只

能说绝对值大者比小的相关更密切一些。

●.相关系数的大小表示关系密切程度,正负号表示方向。

●两变量之间的关系可能受到第三方影响

●相关关系不等于因果关系

出现相关原因:X 引起Y;Y引起X;X、Y同时受另一变量影响

第六章 概率分布

1.概率、后验概率与先验概率的界定。(名词解释) ● 概率(probability )是表示随机事件出现可能性大小的客观指标。 ● 后验概率(或统计概率):通过对随机事件的观测和试验得到的概率

先验概率(古典概率):在特殊情况下直接计算的比值,是真实的概率而不是估计值。

2.概率的基本性质。(选择、填空、计算) (一)概率的公理系统 ● 任何随机事件A的概率都是在0与1之间的正数,即 0 ≤ P (A )≤1 ● 必然事件的概率等于1,即 P (A )= 1 ●

不可能事件的概率等于零,即 P (A )= 0

(二)概率的加法定理 ● 在一次实验或调查中,若事件A发生,则事件B就一定不发生,这样的两个事件为互不相容事件。 ●

两个互不相容事件之和的概率,等于这两个事件概率之和

(三)概率的乘法定理

适用于几种情况组合的概率,即几种事件同时发生的情况 ● 若事件A发生不影响事件B是否发生,这样的两个事件为互相独立事件。 ●

两个互相独立事件同时出现的概率,等于这两个事件概率的乘积,即

3.概率分布的界定及类型。(名词解释) ● 概率分布(probability distribution )是指对随机变量取不同值时的概率分布情况的描述,一般用概率分布函数进行描述。 ●

类型 依随机变量是否取连续数据分类,可将概率分布分为离散型概率分布与连续型概率分布。 依分布函数的来源,可将概率分布分为经验分布与理论分布。

依所描述的数据特征,将概率分布分为基本随机变量分布与抽样分布。

4.正态分布的特征。(简答) 正态分布的形式是对称的,对称轴是经过平均数的垂线。

正态分布中平均数所对应点最高,然后逐渐向两侧下降。拐点位于+1s 处。

正态曲线下的面积为1,过平均数的垂线左右两部分面积均为0.50。面积即概率,即值为每一横坐标值的随机变量出现的概率。

正态分布是一族分布。因平均数与标准差不同有不同的分布形态。所有正态分布都可以通过Z 分数公式非常容易地转换成标准正态分布。 正态分布中各差异系数间有固定比率

标准正态曲线下标准差与概率(面积)有一定的数量关系。

+1s 包括68.26%的个体 +1.96s 包括95% +2.58s 包括99%

+3s 包括99.73%(可疑值取舍的依据) +4s 包括99.99%

5.二项分布的应用——解决含有机遇性质的问题。(计算)

二项分布函数除了用来求成功事件恰好出现X 次的概率之外,在教育中二项分布主要用于解决含有机遇性质的问题

即主要用来判断试验结果是由猜测造成还是真实结果之间的界限。

()()

()A B A B P P P +=+()()

B A B A P P P ?=?)(

6.t 分布的情况及分布特点。(简答) t 分布是常用的一种随机变量分布,也称为学生氏分布。

t 分布受自由度(df =n-1,即一个统计量中可以自由变化的数目)影响,与总体标准差无关。

t 分布的特点

● 平均数为0,以平均数为中心左右对称分布,左侧t 值为负,右侧t 值为正。

● 形状与正态分布曲线相似,峰态比较高狭,t 分布曲线随自由度的变化而变化 ● 变量取值没有固定范围,-∞— +∞之间。

样本容量越大(n-1>30),t 分布越接近正态分布,方差大于1;当样本容量趋向于无穷大时,t 分布为正态分布,方差为1;当n-1<30,t 分布与正态分布相差较大,离散程度更大,分布图中间变低尾部变高。

第七章 参数估计

1.

总体参数估计的界定及类型。(名词解释) ● 根据样本统计量对相应总体参数所作的估计叫作总体参数估计。 ● 总体参数估计分为点估计和区间估计。

2.

点估计与区间估计的界定。(名词解释) ● 由样本的平均数和标准差估计总体的平均数和标准差即为点估计;

由样本的平均数和标准差估计总体平均数和标准差的取值范围则为区间估计。

3. 良好点估计量的标准。(简答) ●

无偏性

如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。 ●

有效性

当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。 ●

一致性

当样本容量无限增大(大样本)时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参数一致性估计量。 ●

充分性

一个容量为n 的样本统计量,应能充分地反映全部n 个数据所反映的总体的信息。

4. 置信区间、置信水平与显著性水平。(名词解释) ● 置信区间,也称置信间距(conf idence interval,CI )是指在某一置信度时,总体参数所在的区域距离或区域长度。 ● 置信度,即置信水平,是作出某种推断时正确的可能性(概率)。如.95和.99的置信区间。1-α ●

显著性水平是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。

5. 区间估计的原理。(简答)

● 根据抽样分布理论,用抽样分布的标准误(SE )计算区间长度,解释总体参数落入某置信区间可能的概率。

置信度为.95和.99,以及相对应的.05与.01的显著性水平是习惯上常用的两个数值,其依据是.05与.01的概率属于小概率事件,小概率事件在一次抽样中是不可能出现的。

● 区间估计依据的是该样本统计量的分布规律及样本分布的标准误(SE )。 6. 总体平均数估计(正态分布或t 分布)。(简答、计算) ● 平均数区间估计的基本原理

通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或非正态总体中的n >30的样本),而计算出来的实际

X X X t s s μμ

--==

根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。

因为样本平均数的平均数与母总体的平均数相同(),因此,对平均数总体的平均数进行估计就是对母总体平均数的估计。

估计总体平均数的步骤

1.根据样本的数据,计算样本的平均数和标准差; 2.计算平均数抽样分布的标准误 ;

(1)当总体方差 已知时,

(2)当总体方差 未知时,

3.确定置信水平或显著性水平;

4.根据样本平均数的抽样分布确定查何种统计表; 总体方差已知时,查正态表,总体方差未知时,查t 值表 5.计算置信区间;

6.解释总体平均数的置信区间。

总体平均数μ的估计

1.当总体 已知时,查正态分布表 ①总体正态,不管样本容量大小, ②总体非正态,大样本(n>30),

平均数的抽样分布呈正态,总体平均数的置信区间为:

例题:某小学10岁全体女童身高历年来标准差为6.25厘米,现从该校随机抽27名10岁女童,测得平均身高为134.2厘米,试估计该校10岁全体女童平均身高的95%和99%置信区间。

解:10岁女童的身高假定是从正态总体中抽出的随机样本,并已知总体标准差为σ=6.25。无论样本容量大小,一切样本平均数的抽样分布呈正态分布。于是可用正态分布来估计该校10岁女童身高总体平均数95%和99%的置信区间。

2

σ

2

σn σ

σ=

1

1

-=

-n s n

s n x σx

σn

x σ

=

σn

Z X n

Z X σ

μσ

αα?+<

-2/2/2σ

2. 总体方差 未知,查t 分布表

①总体正态,不管样本容量大小, ②总体非正态,大样本(n>30),

平均数的抽样分布为t 分布,平均数的置信区间为:

例题:从某小学三年级随机抽取12

名学生,其阅读能力得分为28,32,36,22,34,30,33,25,31,33,29,26。试估计该校三年级学生阅读能力总体平均数95%和99%的置信区间。

解:12名学生阅读能力的得分假定是从正态总体中抽出的随机样本,而总体标准差σ未知,样本的容量较小(n=12<30),在此条件下,样本平均数与总体平均数离差统计量服从呈t 分布。于是需用t 分布来估计该校三年级学生阅读能力总体平均数95%和99%的置信区间。

3.总体非正态,大样本

平均数的抽样分布接近于正态分布,用正态分布代替t 分布近似处理:

1

1

-=

-n s n s n x σ()()n

S t X n S t X n df n df 12/12/--?

+<

S Z X n S Z X n n 1

2/12/--?+<

-ααμ

解:学生高考分数假定是从正态总体中抽出的随机样本,而总体的标准差σ未知,样本平均数与总体平均数离差统计量呈t 分布。但是由于样本容量较大(n=120>30),t 分布接近于正态分布,因此可用正态分布近似处理。

第八章 假设检验

1.假设检验的概念与原理(小概率事件)。(名词解释、简答) ● 利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。 ●

设立标准的依据:小概率事件

样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,这时就认为小概率事件发生了。把出现概率很小的随机事件称为小概率事件。

当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是罕见的,几乎是不可能的。

2.假设检验中的两类错误及其之间的关系。(名词解释、简答) ●

对于总体参数的假设检验,有可能犯两种类型的错误,即α错误

和β错误。

Ⅰ型错误(α错误)意味着当实验处理效应不存在时,研究者却得出结论,处理效应存在。

Ⅱ型错误( β错误)意味着当实验处理效应确实存在时,但是假设检验却没有识别出来。 ●

两类错误之间的关系 α与β是两个前提下的概率;α+β不等于1 对于固定的n , α与β一般情况下不能同时减小。 要想减少α与β,一个方法就是要增大样本容量n 。

统计检验力:1- β

3.虚无假设与备择假设。(名词解释)

H0:零假设,或称原假设、虚无假设(null hypothesis )、解消假设;是要检验的对象之间没有差异的假设。

H1:备择假设(alternative hypothesis ),或称研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设。 4.单侧与双侧检验的确定。(简答) 略

5.假设检验的步骤。(简答)

⑴ 提出假设(虚无假设和备择假设) ⑵ 确定做出结论的标准(确定显著性水平) ⑶ 选择检验统计量并计算统计量的值 ⑷.做出统计结论

6.平均数的显著性检验(单总体检验)的几种不同情况。(简答、计算) ⑴.总体为正态,总体标准差σ已知

平均数的抽样分布服从正态分布,以Z为检验统计量,其计算公式为:

⑵.总体为正态,总体标准差σ未知,样本容量小于30

平均数的抽样分布服从t 分布,以t 为检验统计量,计算公式为:

⑶.总体标准差σ未知,样本容量大于30

平均数的抽样分布服从t 分布,但由于样本容量较大,平均数的抽样分布接近于正态分布,因此可以用Z 代替t 近似处理,计算公式为:

n

X X Z X

σ

μσμ0

-=

-=

1

00

--=-=n S X X t μσμ1

-=n df X X Z 00

μμ-=

-=

'

⑷.总体非正态,小样本

不能对总体平均数进行显著性检验。

7.平均数差异的显著性检验(双总体检验)的几种不同情况。(简答、计算)

平均数差异的显著性检验时,统计量的基本计算公式为:

1.两总体正态,总体标准差已知

总体标准差已知条件下,平均数之差的抽样分布服从正态分布,以Z作为检验统计量,计算公式为:

2.两总体正态,标准差未知,方差齐性,n1或n2小于30

总体标准差未知条件下,平均数之差的抽样分布服从t 分布,以t 作为检验统计量,计算公式为:

3.两总体非正态,n1和n2大于30(或50)

总体标准差未知条件下,平均数之差的抽样分布服从t 分布,但样本容量较大,t 分布接近于正态分布,可以以Z近似处理,因此以Z ′作为检验统计量,计算公式为:

4.总体非正态,小样本

不能对平均数差异进行显著性检验。

第九章 方差分析

1.方差分析的主要功能。(填空、选择、简答)

方差分析又称为变异分析(analysis of vari ance ,ANOV A ),是由斯内德克提出的一种变量关系的检验方法。

其主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。 2.方差分析的基本原理(综合的F 检验与方差的可加性)。(简答) 一、方差分析的基本原理:综合的F 检验 (一)综合虚无假设与部分虚无假设

方差分析通过对多组平均数的差异进行显著性检验,分析实验数据中不同来源的变异对总变异影响的大小。 (二)方差的可分解性

方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性。

3.方差分析将总平方和分解为几个不同来源的平方和:组内平方和(实验误差,包括个体差异)与组间平方和(实验处理效应)。(简答)

方差分析是将总平方和分解为几个不同来源的平方和(实验数据与平均数离差的平方和)。然后分别计算不同来源的方差,并计算方差的比值即F值。根据F值是否显著,对几组数据的差异是否显著作出判断。 4.方差分析的基本假定。(选择、简答) ⑴ 总体正态分布

⑵ 变异的相互独立性,即各实验处理是随机且相互独立的(一般情况下都能满足)

⑶ 各实验处理内的方差一致(需要进行检验)

5.完全随机设计的方差分析与随机区组设计的方差分析的不同。(简答)

为了检验某一个因素多种不同水平间差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同的实验处理之后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。

在对各区组施以多种实验处理之后,用方差分析法对这多个相关样本平均数差异所进行的显著性检验,称为随机区组设计的方差分析。

与完全随机设计的方差分析相比,其最大优点是考虑到个别差异的影响(即区组效应),可以将这种影响从组内变异中分离出来,从而提高效率。但是这种设计也有不足,主要表现在划分区组的困难上。如果不能保证同一区组内尽量同质,则有出现更大误差的可能。

第十章 χ2检验

1. χ2

检验的假设。(简答) ⑴ 分类相互排斥,互不相容;

⑵ 观测值相互独立;(每个被试只有一个观测值) ⑶ 期望次数的大小

2. χ2

检验的类别。(填空、选择、简答)

配合度检验

用来检验一个因素多项分类的实际观察数与某理论次数是否接近,有时也称为无差假说检验。正态吻合性检验 ()

()X

D S

E X X

2121μμ---=

统计量X

D S

E X X Z 2

1-=

X

D

SE X X

t 2

1

-=

X

D

SE X X

Z 2

1

-=

'

用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。

同质性检验

检定不同人群母总体在某个变量的反应是否具有显著差异

3.χ2检验的原理。(简答)

χ2检验(chi-square test)是专门用于计数数据的统计方法。 由于这类数据在整理时,常常以列联表(contingency table)或交叉表(cross tabulation)呈现,因此这种分析方法又被称为列联表分析或交叉表分析。

又因列联表的单元格里是次数或百分比,因此又称为百分比检验。

非参数检验方法

第十一章非参数检验

1.非参数检验的特点。(简答)

◆一般不需要严格的前提假设。

◆非参数检验特别适用于顺序资料或等级变量。

◆非参数检验适用于小样本,且方法简单。

◆非参数检验最大的不足是未能充分利用资料的全部信息。

◆非参数方法目前还不能处理“交互作用”。

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

(完整版)统计学期末考试试卷

2009---2010学年第2学期统计学原理课程考核试卷(B)考核方式: (闭卷)考试时量:120 分钟 一、填空题(每空1分,共15分) 1、按照统计数据的收集方法,可以将其分为和。 2、收集数据的基本方法是、和。 3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是,中位数是。 4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率密 度函数为 0 ()1 f x b a ? ? =? ?- ? 则X的期望值为,方差为。 5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)= 。 6、概率是___ 到_____ 之间的一个数,用来描述一个事件发生的经常性。 7、对回归方程线性关系的检验,通常采用的是检验。 8、在参数估计时,评价估计量的主要有三个指标是无偏性、和 。 二、判断题,正确打“√”;错误打“×”。(每题1分,共10 分) 1、理论统计学与应用统计学是两类性质不同的统计学() 2、箱线图主要展示分组的数值型数据的分布。() 3、抽样极限误差可以大于、小于或等于抽样平均误差。() 4、在全国人口普查中,全国人口数是总体,每个人是总体单位。() 5、直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知, 仅需对分布的未知参数进行估计的问题称为参数估计。() 6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少() 7、在单因素方差分析中,SST =SSE+SSA() 8、右侧检验中,如果P值<α,则拒绝H 。() 9、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量 与边际误差成正比。() 10、当原假设为假时接受原假设,称为假设检验的第一类错误。() 三、单项选择题(每小题1分,共 15分) 1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职 工家庭的年人均收入。这项研究的样本()。 A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200个万个家庭的总收入 2、当变量数列中各变量值的频数相等时()。 A、该数列众数等于中位数 B、该数列众数等于均值 C、该数列无众数 D、该众数等于最大的数值 其他 (a

中科院心理所心理统计学考试试题

心理统计 中国科学院心理研究所班级____________________ 姓名__________________ 一、单项选择题(在每小题的四个备选答案中选出一个正确答案,并将其号码填在题后的括号 内。每小题2分,共20分) 1.下列数据中,哪个数据是顺序数据?( ) A.月工资1300元 B.语文成绩为80分 C.百米赛跑得第2名 D.某项技能测试得5分 2.下列描述数据集中情况的统计量是( ) A.M M dμ B.M o M d S C.S μσ D.M M d Mg 3.一组数据中有少数数据偏大或偏小,数据的分布呈偏态时,其集中趋势代表值应是( ) A.几何平均数 B.调和平均数 C.算术平均数 D.众数 4.测得某班学生的身高平均170厘米,体重平均65公斤,欲比较两者的离散程度,应选( ) A.方差 B.标准差 C.四分差 D.差异系数 5.假设两变量为线性关系,这两变量为等距或等比的数据且均为正态分布,计算它们的相关 系数时应选用( ) A.积差相关 B.斯皮尔曼等级相关 C.二列相关 D.点二列相关 6.以下各分布中,不因样本容量的变化而变化的分布是( ) A.t分布 B.F分布 C.χ2分布 D.正态分布 7.以下有关α错误和β错误的说法正确的是( ) A. 可能同时会犯α错误和β错误 B. α+β=1 C.当样本容量n不变时,有可能同时减小α和β D. 实际上不可能同时犯α错误和β错误 8. 同一组学生的数学成绩与物理成绩的关系为( ) A. 因果关系 B. 共变关系 C. 函数关系 D. 相关关系 9. 一个好的估计量应具备的特点是( ) A. 充分性、必要性、无偏性、一致性 B. 充分性、无偏性、一致性、有效性 C. 必要性、无偏性、一致性、有效性 D. 必要性、充分性、无偏性、有效性 10. 某项调查选取三个独立样本,其容量分别为n1=10,n2=12,n3=15,用方差分析法检验平 均数之间的差异显著性时,其组内自由度为( ) A. 2 B. 5 C. 36 D. 34 二、填空题(每空1分,共10分) 1. 实验数据按其是否具有连续性可划分为________和离散变量。 2. 一组数据35、40、50、60、56、30的中数为________,样本方差为______。 3. 从某正态总体中随机抽取一个样本,n=9,S=6,则样本平均数分布的标准误为________。 4. 总体分布正态,总体方差未知,已知样本容量为n,样本标准差为S,当显著性水平为α 时,用样本平均数X估计总体平均数μ的置信区间为________。 5. 当_________________________时F(n1, n2)为正态分布。

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

教育与心理统计学的习题及解答

1、全国大学英语四级考试结束后,随机抽取广州市考生21名,长沙市考生16 名,得到数据如下表所示,试确定两市考生该次考试成绩就是否有显著差异?(α=0、05) 47275639622943837 74.86 21X ?+?++?+?+?= =解: 38392265680568 16Y ?+?+?+?== 21 2 211 11()236.61i i X X S n ==-=-∑ 162 2 2 1 21()308.41i i Y Y S n ==-=-∑ (1)由于总体方差未知,所以先做方差的齐性检验 H 0: σ1= σ2 H 1: σ1≠ σ2 22308.4 = 1.3236.6 F S S = =大小 0.05(15,20)0.05 2.57 1.3 F F α==>=当时,查表 所以接受零假设H 0,即方差齐性,即认为两个总体方差相等 (2)对两个样本进行显著性检验 H 0: μ1 = μ2 H 1: μ1 ≠μ2 1.3 t = = = 0.05(15,20)2 0.052116235, 1.3 df t t α==+-=>=对于给定的,且查表知 所以接受零假设H 0 答: 两市考生该次考试成绩没有显著差异。 2、《教育统计学》考试成绩的σ=5,某班49名学生,该班这门课程考试成绩平均分为85分,试推论这门课程学习的真实成绩。(α=

0、05) 解:已知=85,σ2 =25,查表得 Z 2 05.0=1、96,设实际成绩为x, {} 0.0520.05X Z Z >=则由(0,1)与P 得 X -1、96· n σ≤x ≤96.1+X ·n σ 代入数据计算得83.686.4X ≤≤ 故该班这门课程学习的真实成绩在83、6与86、4之间。 3、已知某能力测验由三个分测验组成,各分测验在标准化样组上的平均数与标准差如下表所示: 分测验一二三平均数6558111标准差 7 5 15 ①、 甲生在分测验一、二、三上的成绩依次为82,70,110, 比较她在各分测验上成绩的高低。 ②、 第一个分测验用公式计算:T=10Z+50,求甲生在第一个分 测验上的T 分数。 ③、 乙生在第一个分测验上的T 分数为75分,求她在该测验 上的原始分数。 1 12382-65 =2.43 77058 2.4 5110111 0.067 15X S Z Z Z μ--==-==-解:(1)由公式Z= 得 = 123 Z Z Z >>显然有 所以甲在第一个测验上的分数最高,其次就是第二个测验,最后就是第三个测验。 (2)由(1)知Z 1=2、43,再由T=10Z+50得 T=10×2、43+50=74、3

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

统计学期末考试试题库和答案解析

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。()

三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备 4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。

高校教育与心理统计学试卷附答案

某高校成教学院 教育与心理统计学结业试卷 20XX、X、X 姓名▁▁▁▁▁▁班级▁▁▁▁▁▁学号▁▁▁▁任职单位▁▁▁▁▁▁(说明:以下题目的答案数据一律保留2位小数) 一、4个数据分别为70、60、70、90。填出下表中所缺的统计指标名称、统计学符号、EXCEL函数及计算值。(28分) 注:差异系数以总体标准差为基准。 二、36个学生在一次测验中的得分如下: 606265687071717374757576 767777777879808080808182 828283858586868888888995 请以5分为一组制作简单次数分布表及次数分布多边图。(12分) 三、某年级甲、乙、丙三个班级学生人数分别为50人、55人、55人。期末数学考试各班的平均成绩分别为90分、90分、85分,使用加权平均数求全年级学生的平均成绩,并指出丙班的权数和权重。(10分) 四、在一次测验中,全班学生的成绩平均分为90分,标准差为4分。得94分的学生,他的标准分数为多少?另一个标准分数为-2 的学生,他的原始分数为多少?(6分) 六、分)

1、标准分数的平均数与标准差之和为▁▁▁▁: A、0 B、1 C、2 D、不是一个确定值 2、教育统计学与教育学科其它分支学科相比,其特点之一是通过对教育领域中大量数据进行分析以▁▁▁▁: A、发现其变化规律 B、预测其结局 C、描述相关 D、揭示其原因 3、在统计学书籍中,小写希腊字母一般用来表示▁▁▁▁。 A、集中量数 B、总体参数 C、 差异量数 D、样本统计量 4、下面哪一句话是错误的? A、称名数据即类别数据 B、计数数据是根据称名数据统计出来的 C、比率数据必然是等距数据 D、称名数据是测量水平最高的数据 5、在▁▁▁▁时,中数肯定与某一个原始数据的值相等。 A、原始数据按升序排列 B、原始数据为连续数据 C、原始数据个数为奇数 D、原始数据为顺序数据 6、相关系数的量纲单位▁▁▁▁。 A、与原始数据单位一致 B、无测度单位 C、是原始数据单位的平方 D、以占原始数据总和的百分比来表示 7、在统计分析中应用最为广泛的统计指标是▁▁▁▁。 A、平均数 B、标准分数 C、Z检验 D、相关系数 8、方差属于▁▁▁▁。 A、集中量数 B、差异量数 C、相关系数 D、总体参数 9、使用加权方法计算出来的平均数总是▁▁▁▁不使用加权方法计算出来的平均数。 A、等于 B、大于 C、大于或等于 D、上述答案都不对 10、两极差▁▁▁▁。 A、总是正数 B、总是负数 C、总是非负数 D、总是非零数 11、对几个样本平均数的差异进行统计检验通常使用▁▁▁▁。 A、Z检验B、F检验C、t检验D、Χ2 检验 12、全距为零,意味着全体数据▁▁▁▁。 A、全部相等B全部为零、C、的中数为零D、的平均数为零 13、扇形图又称为▁▁▁▁。 A、象形图 B、圆形图 C、曲线图 D、统计地图 14、几何平均数为零时,▁▁▁▁。 A、变化率为0 B、增长率为0 C、原始数据均为0 D、缺乏实际意义 15、教育统计学包括▁▁▁▁等分支。 A、描述统计B、推断统计C、教育评价D、教育测量

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

心理统计学练习题库

心理统计学练习题库 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

《心理统计学》复习题 一、填空题 1、次数分布的两个基本特征是趋势与趋势。 2、数据(14,15,18,10,22,13,23,11)的中位数为,数据(26,11,9,18,22,7,17,22,10)的中位数为。 3、数据(14,15,18,10,22,13,23,11)的中位数为。 4、当样本分布满足分布时,样本的算数平均数、中位数、众数相等。 5、当样本容量足够大时,任何样本的分布都将趋于分布。 6、根据样本统计量对相应总体参数所做的估计叫总体参数估计,总体参数估计分为点估计和。 7、某班平均成绩为90分,标准差为3分,甲生得分,则甲生的标准分为。 8、统计推断中,经常犯的两类错误是,。 9、当两个变量都是变量,而且两者之间的关系呈线性关系时,才能采用积差相关。 10、随机变量可以分为_______变量和离散变量。 11、假设检验一般有两个相互对立的假设,即原假设和__________。 12、两个独立的正态总体,已知总体方差相等但未知其具体数值,从中分别抽取容量为10和13的两个样本进行平均数差异的显着性检验,其自由度应为__________。 13、标准分数是以__________为单位,表示一个原始分数在团体中所处的位置。 14、当样本分布是偏态时,描述数据集中趋势的有效量是________。 15、描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组。 16、从数据的观测方法和来源划分,研究数据可分为和。 17、统计图一般由下面几个部分组成、、、、、。

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

统计学原理期末复习题及答案

期末复习题(答案仅供参考) 一、判断题(把正确的符号“V”或错误的符号“X”填写在题后的括号中。) 1. 社会经济统计的研究对象是社会经济现象总体的各个方面。(X) 2. 在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(X) 3. 总体单位是标志的承担者,标志是依附于单位的。(V ) 4. 在全国工业普查中,全国工业企业数是统计总体,每个工业企业是总体单位。(X) 5. 全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的(X)。 6. 调查单位和填报单位在任何情况下都不可能一致。(X) 7. 对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。(V) 8. 统计分组的关键问题是确定组距和组数(V) 9. 总体单位总量和总体标志总量是固定不变的,不能互相变换。(X) 10. 相对指标都是用无名数形式表现出来的。() 11. 国民收入中积累额与消费额之比为1: 3,这是一个比较相对指标。(X) 12. 抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的 会产生误差,这种误差的大小是不能进行控制的。(X) 13. 从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(X) 14. 在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。(X) 15. 抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(V) 16. 在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(X) 17. 施肥量与收获率是正相关关系。(X ) 18. 计算相关系数的两个变量都是随机变量(V) 19. 利用一个回归方程,两个变量可以互相推算(X) 20. 数量指标作为同度量因素,时期一般固定在基期(X)。 Z q1 p1 21. 在单位成本指数——中,'p1p1 —'弋1卩0表示单位成本增减的绝对额(V)。 瓦q1 P o

教育与心理统计学试题A答案

试题A答案 一、单项选择 1 A 2 A 3 A 4 B 5 A 6 B 7 A 8 D 9 A 10 C 11 C 12B 13A 14D 15C 二、填空 1、73 2、变异性 3、局部控制 4、正态 5、点估计 6、双侧检验 7、样本 8、集中量数 9、误差10、P(A)+P(B) 三、名词解释 1、标准分数又叫基分数或Z 分数,是以标准数为单位,反应一个原始数在团体中所处的位置的量数。 2、随机现象是指事先不能断言出现那种结果的现象。 3、差异量数是描述数据离散趋势的统计量。 4、相关关系是事物间存在联系但又不能直接做出因果关系解释时的事物间的关系。 四、简答 1、1)、求全距:2)、定组数;3)、定组距4)、写组限5)求组 中值6)归类划记7)登记次数。 2、1)建立原假设和备择假设。 2)在原假设成立的前提下,选择合适统计量的抽样分布,计算统计量的值,常用的有Z分布、T分布、F分布。 3)选定显著性水平,查相应分布表确定临界值,从而确定原 假设的拒绝区间和接受区间。

4)对原假设做出判断和解释,如果统计量值大于临界值,拒绝原假设。反之,则接受原假设。 3、1)总体正态分布2)变异可加性3)各处理的方差一致 五、简单计算 1、ⅹ=26毫秒AD=3.71毫秒 2、ZⅠ=0.67 ZⅡ=1.25 ZⅢ=0.83 ZⅡ>ZⅢ>ZⅠ 3、SE X=2U=65±1.96×2U∈(61.08-----68.92) 4、CV身高=0.12 CV体重=0.15 CV体重>CV身高 六、综合计算 双侧t检验 SEx=1.36 t=1.62 df=61 t<t0.05/2(60)=2.00 拒绝H0

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

教育与心理统计学的习题与解答

1、全国大学英语四级考试结束后,随机抽取广州市考生21 名,长沙市考生 16名,得到数据如下表所示,试确定两市考生该次考试成绩是否有显著差异?(α=0.05) x477539629483 频数261237 y38926580 频数3265 解:X 4 727 56 3 9 6 229 438 37 21 74.86 Y 3 839 22 6 568 05 16 68 2 121 ( X i X ) 2236.6 S 1 n 11i1 2 116 (Y i Y ) 2308.4 S 2n 2 1i1 ( 1)由于总体方差未知,所以先做方差的齐性检验 H0: 1=σ2H1: σ1≠2σσ2 F S 大308.4 2 = 1 . 3 S 小236.6 当0.0时5,查表F 2.57F 1 . 3 0.05(15,20) 所以接受零假设H0,即方差齐性 ,即认为两个总体方差相等 ( 2)对两个样本进行显著性检验 H0:μ 1=μ 2H1: μ1≠μ2 t X Y74.8668 1.3 2220236.615308.411 (n 1 1)S 1 (n 2 2)S 2 11 )() ( 21162 n n2n n2116 1212 对于给定的0 . 0 ,5 且 d f21 16 2 查3表5知,t0 .0 5t 1 . 3 2( 1 5,20) 所以接受零假设H0 答:两市考生该次考试成绩没有显著差异。 2、《教育统计学》考试成绩的σ=5,某班49名学生,该班这门课程考试成绩平均分为85分,试推论这门课程学习的真实成绩。(α

=0 .05 ) 解:已知 X 85, 2 2 =1.96,设实际成绩为 x , =25,查表得 Z 0 .05 X X ~N (0,1 )与P Z Z 0.得05 则由Z= n 0.05 2 X -1.96· ≤ x ≤ X 1 .96 · n n 代入数据计算得 83.6 X 86.4 故该班这门课程学习的真实成绩在 83.6 和 86.4 之间。 3、已知某能力测验由三个分测验组成,各分测验在标准化样组上的 平均数和标准差如下表所示: 分 测 验 一 二 三 平 均 数 65 58 111 标 准 差 7 5 15 ①、 甲生在分测验一、二、三上的成绩依次为 82,70,110, 比较他在各分测验上成绩的高低。 ②、 第一个分测验用公式计算: T=10Z+50,求甲生在第一个分 测验上的 T 分数。 ③、 乙生在第一个分测验上的 T 分数为 75 分,求他在该测验 上的原始分数。 解:(1)由公式Z= X 1 得 S Z 82-65 = = 2.43 1 7 70 58 Z 2 2.4 5 110 111 Z 3 0.067 15 显 然 有 Z Z Z 1 2 3 所以甲在第一个测验上的分数最高, 其次是第二个测验, 最后是第三个测验 。 (2)由( 1)知 Z 1 =2.43,再由 T=10Z+50得 T=10 ×2.43+50=74.3

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

相关文档
最新文档