心理统计学考研历年真题及答案
考研真题和强化习题详解
第一章绪论
一、单选题
1 .三位研究者评价人们对四种速食面品牌的喜好程度。研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。研究者乙让评定者将四种品牌分别给予l~5 的等级评定,( l 表示非常不喜欢,5 表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。研究者甲、乙、丙所使用的数据类型分别是:( )
A .类目型―顺序型―计数型
B .顺序型―等距型―类目型
C .顺序型―等距型―顺序型
D .顺序型―等比型―计数型
2 .调查了n =200 个不同年龄组的被试对手表显示的偏好程度,如下:
该题自变量与因变量的数据类型分别是:( )
A .类目型―顺序型
B .计数型―等比型
C .顺序型―等距型
D .顺序型―命名型
3 .157.5 这个数的上限是()。
A . 157 . 75
B . 157 . 65
C . 157 . 55
D . 158 . 5
4 .随机现象的数量化表示称为()。
A .自变量
B .随机变量
C .因变量
D .相关变量
5 .实验或研究对象的全体被称之为()。
A .总体
B .样本点
C .个体
D .元素
6 .下列数据中,哪个数据是顺序变量?( )
A .父亲的月工资为1300 元
B .小明的语文成绩为80 分
C .小强100 米跑得第2 名
D .小红某项技能测试得5 分
7、比较时只能进行加减运算而不能使用乘除运算的数据是【】。
A .称名数据
B .顺序数据
C .等距数据
D .比率数据
参考答案:1 . B 2 . D 3 . C 4 . B 5 . A 6 . C 7.C
二、概念题
1.描述统计(吉林大学2002 研)
答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。
2.推论统计(中国政法大学2005 研,浙大2000研)
答:推论统计又称推断统计,指研究如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等的统计方法。常用的统计方法有:假设检验的各种方法、总体参数特征值的估计方法(又称总体参数的估计)和各种非参数的统计方法等等。
3 .假设检验(浙大2002 研)
答:假设检验指在统计学中,通过样本统计量得出的差异作出一般性结论,判
断总体参数之间是否存在差异的推论过程。假设检验是推论统计中最重要的内容,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。检验的推理逻辑是一定概率保证下的反证法。一般包括四个步骤:( l )根据问题要求提出原假设H0 ; ( 2 )寻找检验统计量,用于提取样本中的用于推断的信息,要求在H0成立的条件下,统计量的分布已知且不包含任何未知参数;( 3 )由统计量的分布,计算“概率值”或确定拒绝域与接受域;( 4 )由具体样本值计算统计量的观测值,对统计假设作出判断。若H0的内容涉及到总体参数,称为参数假设检验,否则为非参数检验。
第二章统计图表
一、单选题
1 .一批数据中各个不同数值出现的次数情况是()
A.次数分布B.概率密度函数C.累积概率密度函数D.概率
2 .以下各种图形中,表示连续性资料频数分布的是()。
A .条形图
B .圆形图
C .直方图
D .散点图
3 .特别适用于描述具有百分比结构的分类数据的统计分析图是()。
A .散点图
B .圆形图
C .条形图
D .线形图
4 .对有联系的两列变量可以用()表示。
A.简单次数分布表B.相对次数分布表
C.累加次数分布表D.双列次数分布表
5.以下各种图形中,表示间断性资料频数分布的是()。
A .圆形图
B .直方图
C .散点图
D .线形图
6.特别适用于描述具有相关结构的分类数据的统计分析图是()。
A .散点图
B .圆形图
C .条形图
D .线形图
7 .适用于描述某种事物在时间上的变化趋势,及一种事物随另一种事物发展变化的趋势模式,还适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系的统计分析图是()。
A .散点图
B .圆形图
C .条形图
D .线形图
8.以下各种图形中,以图形的面积表示连续性随机变量次数分布的是【】。
A .圆形图
B .条形图
C .散点图
D .直方图
参考答案:1 . A 2 . C 3 . B 4 . D 5 . A 6 . A 7 . D 8.D
二、多选题:
1 .次数分布可分为()。
A .简单次数分布
B .分组次数分布
C .相对次数分布
D .累积次数分布
2 .以下各种图形中,表示连续性资料频数分布的是()。
A .圆形图
B .直方图
C .直条图
D .线形图
3 .累加曲线的形状大约有以下几种()。
A.正偏态分布B.负偏态分布 C. F 分布D.正态分布
4 .统计图按形状划分为()。
A .直方图
B .曲线图
C .圆形图
D .散点图
参考答案:1 . ABCD 2 . BD 3 . ABD 4 . ABCD
三、简答题
1 .简述条图、直方图、圆形图(饼图)、线图以及散点图的用途。
答:这几种图是统计学中最常用的图形,条图和直方图都用于表示变量各取值结果的次数或相对次数,即次数分布图。不同的是前者用于离散或分类变量,后者用于连续变量(分组后)。圆形图用于表示离散变量的相对次数,即频率,整个圆面积为 1 ,各扇形块表示各类别的频率。线图用于表示连续变量在某个分类变量各水平上的均值,如各年级的考试成绩均分,常用于组间比较中。散点图用于两连续变量的相关分析,可将两变量成对数据的值作为横、纵坐标标于图上,根据散点的形状可以大致判断两变量是否存在相关以及相关的程度。
2 .简述条形图与直方图的区别。
答:参见本章复习笔记。
第三章集中量数
一、单选题
1 .一位教授计算了全班20 个同学考试成绩的均值、中数和众数,发现大部分同学的考试成绩集中于高分段。下面哪句话不可能是正确的?( ) (北大2001年研)
A .全班65 %的同学的考试成绩高于均值。
B .全班65 %的同学的考试成绩高于中数。
C .全班65 %的同学的考试成绩高于众数。
D .全班同学的考试成绩是负偏态分布。
2 .一个N = 10 的总体,ss= 200 。其离差的和∑(x-μ)是:
A. 14 . 14
B. 200 C.数据不足,无法计算D.以上都不对。
3 .中数在一个分布中的百分等级是()。
A . 50
B . 75
C . 25
D . 50~51
4 .平均数是一组数据的()。
A .平均差
B .平均误
C .平均次数
D .平均值
5 .六名考生在作文题上的得分为12,8,9,10,13,15,其中数为()。
A . 12
B . 11
C . 10
D . 9
6 .下列描述数据集中情况的统计量是()。
A . M M d B. M o M d S C. s ωσ D. M M d M g
7 .对于下列实验数据:1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11 ,描述其集中趋势用( )最为适宜,其值是()。
A.平均数,14 . 4 B.中数,8 . 5 C.众数,8 D.众数,11
8 .一个n = 10 的样本其均值是21 。在这个样本中增添了一个分数.得到的新样本均值是25 ,这个增添的分数值为()。
A . 40
B . 65
C . 25
D . 21
9 .有一组数据其均值是20 ,对其中的每一个数据都加上10 ,那么得到的这组新数据的均值是()。
A . 20
B . 10
C . 15
D . 30
10 .有一组数据其均值是25 ,对其中的每一个数据都乘以2 ,那么得到的这组新数据的均值是()。
A . 25
B . 50
C . 27
D . 2
11 .一个有10 个数据的样本,它们中的每一个分别与20 相减后所得的差相加是100 , 那么这组数据的均值是()。
A . 20
B . 10
C . 30
D . 50
12 .下列数列4 , 6 , 7 , 8 , 11 , 12 的中数为()。
A . 7 . 5
B . 15
C . 7
D . 8
13 .在偏态分布中,平均数、中数、众数三者之间的关系()。
A . M=M d=M o
B . M o=3M d-2M
C . M > M d > M
D . M < M d < M o
14 .下列易受极端数据影响的统计量是()。
A .算术平均数
B .中数
C .众数
D .四分差
15. “75~”表示某次数分布表中某一分组区间,其组距为5 ,则该组的组中值是()。
A . 77
B . 76 . 5
C . 77 . 5
D . 76
参考答案:1 . B 2 . D 3 . A 4 . D 5 . B 6 . D 7 . C 8 . B
9 . D 10 . B 11 . C 12 . A 13. B 14 . A 15.A
二、多选题
1 .下面属于集中量数的有()。
A .算术平均数
B .中数
C .众数
D .几何平均数
2 .平均数的优点:( )。
A .反应灵敏
B .不受极端数据的影响
C .较少受抽样变动的影响
D .计算严密
3 .中数的优点:( )。
A.简明易懂B.计算简单C.反应灵敏D.适合进一步作代数运算
4 .众数的缺点()。
A .概念简单,容易理解B.易爱分组影响,易爱样本变动影响C.不能进一步作代数运算D.反应不够灵敏
参考答案:1 . ABCD 2 . ACD 3.AB 4. BCD
三、简答题
1 .简述算术平均数的使用特点(浙大2003研,苏州大学200
2 研)
答:算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。 计算公式: N X X i
∑=
式中, N 为数据个数;X i 为每一个数据;∑为相加求和。
( l )算术平均数的优点是: ① 反应灵敏; ② 严密确定,简明易懂,计算方便; ③ 适合代数运算; ④ 受抽样变动的影响较小。
( 2 )除此之外,算术平均数还有几个特殊的优点: ① 只知一组观察值的总和及总频数就可以求出算术平均数。 ② 用加权法可以求出几个平均数的总平均数。 ③ 用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。 ④ 在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
( 3 )算术平均数的缺点: ① 易受两极端数值(极大或极小)的影响。 ② 一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
2 .算术平均数和几何平均数分别适用于什么情形?(南开大学 2004 研) 答: ( l )算术平均数
① 算术平均数的概念
算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。 ② 算术平均数的优点
a .一般优点
第一,反应灵敏;第二,严密确定,简明易懂,计算方便;第三,适合代数运算;第四,受抽样变动的影响较小。
b .特殊优点第一,只知一组观察值的总和及总频数就可以求出算术平均数;第二,用加权法可以求出几个平均数的总平均数;第三,用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值;第四,在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
③缺点 a .易受两极端数值(极大或极小)的影响;b .一组数据中某个数值的大小不够确切时就无法计算其算术平均数;
④适用情况
第一,数据必须是同质的,即同一种测量工具所测量的某一特质;
第二,数据取值必须明确;
第三,数据离散不能太大。
( 2 )几何平均数
①几何平均数的概念
几何平均数是指一种由n 个正数之乘积的n 次根表示的平均数。在计算学校经费的增加率、平均率,学生人学率,毕业生的增加率时常用。
②应用
第一,求学习、记忆的平均进步率;
第二,求学校经费平均增加率,学生平均人学率、平均增加率,平均人口出生率。
第四章差异量数
一、单选题
1 .欲比较同一团体不同观测值的离散程度,最合适的指标是()。
A .全距
B .方差
C .四分位距
D .变异系数
2 .在比较两组平均数相差较大的数据的分散程度时,宜用()。
A .全距
B .四分差
C .离中系数
D .标准差
3 .已知平均数μ=4.0,s=1.2,当X= 6.
4 时,其相应的标准分数为()。
A . 2.4 B. 2.0 C . 5.2 D . 1.3
4 .求数据16 , 18 , 20 , 22 , 17 的平均差()。
A . 18.6
B . 1.92
C . 2.41
D . 5
5 .测得某班学生的物理成绩(平均78 分)和英语成绩(平均70 分),若要比较两者的离中趋势,应计算()。
A .方差
B .标准差
C .四分差
D .差异系数
6.某学生某次数学测验的标准分为 2.58 ,这说明全班同学中成绩在他以下的人数百分比是() ,如果是-2.58 ,则全班同学中成绩在他以上的人数百分比是()。
A . 99 % , 99 %
B . 99 % , l %
C . 95 % , 99 %
D . 95 % , 95 %
7.已知一组数据6 , 5 , 7 , 4 , 6 , 8 的标准差是1.29 ,把这组中的每一个数据都加上5 ,然后再乘以2 ,那么得到的新数据组的标准差是()。
A . 1 . 29
B . 6 . 29
C . 2 . 58
D . 12 . 58
8 .标准分数是以()为单位表示一个分数在团体中所处位置的相对位置量数。
A .方差
B .标准差
C .百分位差
D .平均差
9 .在一组原始数据中,各个Z 分数的标准差为()。
A . 1
B . 0
C .根据具体数据而定
D .无法确定
10 .已知某小学一年级学生的平均体重为26kg ,体重的标准差是3.2kg ,平
均身高110cm ,标准差为6.0cm ,问体重与身高的离散程度哪个大() ? A.体重离散程度大B.身高离散程度大C.离散程度一样D.无法比较1 1.已知一组数据服从正态分布,平均数为80 ,标准差为10 。Z 值为-1.96的原始数据是()。
A . 99 . 6
B . 81 . 96
C . 60 . 4
D . 78 . 04
12 .某次英语考试的标准差为5.1 分,考虑到这次考试的题目太难,评分时给每位应试者都加了10 分,加分后成绩的标准差是()。
A . 10
B . 15.1
C . 4.9
D . 5.1
13 .某城市调查8 岁儿童的身高情况,所用单位为厘米,根据这批数据计算得出的差异系数()。
A .单位是厘米
B .单位是米
C .单位是平方厘米
D .无单位
参考答案:1 . D 2 . D 3 . B 4 . B 5 . D 6 . A 7 . C 8 . B 9. A
10 . A 11 . C 12 . D 13 . D
二、多选题
1 .平均差的优点()。
A .平均差意义明确,计算容易
B .较好的代表了数据分布的离散程度
C .反应灵敏
D .有利于进一步做统计分析
2 .常见的差异量数有()。
A .平均差
B .方差
C .百分位数
D .几何平均数
3 .标准分数的优点()。
A .可比性
B .可加性
C .明确性
D .稳定性
参考答案:1 . ABC 2 . ABC 3 . ABCD
三、概念题
1 .差异系数(浙大 2003 研)
答:差异系数( coefficient of variation ) ,又称变异系数、相对标准差等,它是一种相对差异量,用 CV 来表示,为标准差与平均数的百分比。在对不同样本的观测结果的离散程度进行比较时,常常遇到下述情况:两个或多个样本所测的特质不同。如何比较其离散程度?即使使用的是同一种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?这时需要运用相对差异量进行比较。差异系数的计算公式是:%100?=V
S CV (S 为某样本的标准差, M 为该样本的平均数)。差异系数在心理与教育研究中常常应用于同一对象的不同领域或同一领域的不同对象。
2 .四分差(中科院 2004 研)
答:四分差又称四分位差,是差异量数的一种。计算公式: 213Q Q QD -=。Q3:第三个四分位数,Q1:第一个四分位数。在次数分配上第一个四分位数与第三个四分位数之间包含着全体项数的一半。次数分配越集中,离中趋势越小,则这二者的距离也越小。根据这两个四分位数的关系,观测次数分配的离散程度也可以得到相当高的准确性。因此,四分差可以说明某系列数据中间部分的离散程度,并可避免两极端值的影响。四分差通常与中数联系起来共同应用,不适合进一步代数运算,反应不够灵敏。
3 .集中量数与差异量数(浙大2000研,苏州大学 2002 研)
答:集中量数与差异量数都是描述一组数据特征的统计量。集中量数是表现数据集中性质或集中程度的统计量,数据的集中情况指一组数据的中心位置;集中趋势的度量即确定一组数据的代表值,描述集中情况的度量包括:算术平均数、
中位数、众数、几何平均数、调和平均数和加权平均数等。差异量数是表现数据分散性质或分散程度的统计量,数据的差异性即为离中趋势;常见的差异量数有标准差或方差、全距、平均差、四分差和各种百分差等。
4 . T 分数(华中师大 2004 研)
答: T 分数指由正态分布上的标准分数转换而来的等距量表分数。 T 分数以 50 为平均数,以 10 为标准差。 T=50+10z 。 T 分数是z 分数的变形,因为z 分数有负值和小数,人们不习惯,所以采用这个公式处理。经过变换,所得的分数全是整数, 50分为普通, 50分以上越高越好, 50分以下越低越差。 T 分数的意义及其优点和标准分数相同,不同之处是消除了小数和分数。 5 .标准分数(华中师大 2006 研)
答:标准分数指以标准差为单位的一种差异量数,又称Z 分数或基分数。它等于一数列中各原始分数与其平均数的差,再除以标准差所得的商,公式为:()s x x Z i /-=,式中,Z 为某原始数据的标准分数,X i 为原始数据的值,x 为该组数据的平均数, S 为该组数据的标准差。标准分数的平均数为 0 ,标准差为 1 。标准分数是一种不受原始测量单位影响的数值,用来表示一个原始分数在团体中所处位置的相对位置量数。其作用除了能够表明原数据在其分布中的位置外,还能对未来不能直接比较的各种不同单位的数据进行比较。如比较各个学生的成绩在班级成绩中的位置或比较某个学生在两种或多种测验中所得分数的优劣。
四、计算题
1 .计算未分组数据: 18 , 18 , 20 , 21 , 19 , 25 , 24 , 27 , 2
2 , 25 , 26 的平均数、中位数和标准差。(首师大 200
3 研)
2 .把下列分数转换成标准分数。 11 . 0 , 11 .
3 , 10 . 0 , 9 . 0 , 11 . 5 , 12 . 2 , 13 . 1 ,
9 . 7 , 10 . 5 (华南师大2003 研)
第五章相关系数
一、单选题
1 .现有8 名面试官对25 名求职者的面试过程做等级评定,为了解这8 位面试官的评价一致性程度,最适宜的统计方法是求()。
A . spearman相关系数B.积差相关系数
C.肯德尔和谐系数D.点二列相关系数
2 .下列哪个相关系数所反映的相关程度最大()。
A . r =+ 0.53
B . r=-0. 69
C . r=+0.37
D . r=+0.72
3 . AB 两变量线性相关,变量A为符合正态分布的等距变量,变量B也符合正态分布且被人为划分为两个类别,计算它们的相关系数应采用()。
A .积差相关系数
B .点双列相关
C .二列相关
D .肯德尔和谐系数
4 .假设两变量线性相关,两变量是等距或等比的数据,但不呈正态分布,计算它们的相关系数时应选用()。
A. 积差相关B.斯皮尔曼等级相关
C.二列相关 D .点二列相关
5 .假设两变量为线性关系,这两变量为等距或等比的数据且均为正态分布,计算它们的相关系数时应选用()。
A.积差相关B.斯皮尔曼等级相关C.二列相关D.点二列相关
6 .r=-0.50的两变量与r=+ 0 . 50 的两变量之间的关系程度()。
A.前者比后者更密切B.后者比前者更密切C.相同D.不确定
7 .相关系数的取值范围是()。 A . r < 1 B . r ≥0 C .r ≤1 D . 0 8.确定变量之间是否存在相关关系及关系紧密程度的简单而又直观的方法是( )。 A .直方图 B .圆形图 C .线性图 D .散点图 9 .积差相关是英国统计学家( )于 20 世纪初提出的一种计算相关的方法。 A .斯皮尔曼 B .皮尔逊 C .高斯 D .高尔顿 10 .同一组学生的数学成绩与语文成绩的关系为()。 A .因果关系 B .共变关系 C .函数关系 D .相关关系 11 .假设两变量线性相关,一变量为正态、等距变量,另一变量为二分名义变 量,计算它们的相关系数时应选用()。 A .积差相关 B .二列相关 C .斯皮尔曼等级相关 D .点二列相关 12 .斯皮尔曼等级相关适用于两列具有( )的测量数据,或总体为非正态的等距、等比数据。 A .类别 B .等级顺序 C .属性 D .等距 13 .在统计学上,相关系数 r=0 ,表示两个变量之间( )。 A .零相关 B .正相关 C .负相关 D .无相关 14 .如果相互关联的两变量,一个增大另一个也增大,一个减小另一个也减小,变化方向一致,这叫做两变量之间有()。 A .负相关 B .正相关 C .完全相关 D .零相关 15 .有10名学生参加视反应时和听反应时的两项测试,经过数据的整理得到 452=∑D ,这两项能力之间的等级相关系数是() 。 A . 0 . 73 B . 0 . 54 C . 0 . 65 D . 0 . 27 16 .两列正态变量,其中一列是等距或等比数据,另一列被人为地划分为多类,计算它们的相关系数应采用()。 A.积差相关B.多列相关C.斯皮尔曼等级相关D.点二列相关 17 .下列相关系数中表示两列变量间的相关强度最小的是()。 A . 0.90 B . 0.10 C .-0.40 D.-0.70 18 .一对n = 6的变量X , Y 的方差分别为8 和18 ,离均差的乘积和是sp= 40,变量X , Y 积差相关系数是()。 A . 0 . 05 B . 0 . 28 C . 0 . 56 D . 3 . 33 19 .有四个评委对八位歌手进行等级评价,要表示这些评价的相关程度,应选用()。 A .肯德尔W系数 B .肯德尔U系数 C .斯皮尔曼等级相关 D .点二列相关 20 .有四个评委对八位歌手两两配对进行等级比较,要表示这些评价的一致程度,应选用()。 A .肯德尔W系数 B .肯德尔U系数 C .斯皮尔曼等级相关 D .点二列相关 21 .两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型,这样的变量求相关应选用()。 A .肯德尔W 系数 B .肯德尔U 系数 C .斯皮尔曼等级相关 D .四分相关 22 .初学电脑打字时,随着练习次数增多,错误就越少,这属于()。 A .负相关 B.正相关 C .完全相关 D .零相关 23 .10名学生身高与体重的标准分数的乘积之和为8.2 ,那么身高与体重的相关系数为( )。 A . 0 . 82 B . 8 . 2 C . 0 . 41 D . 4 . 1 24 .有两列正态变量X , Y ,其中s x=4,s y=2 , s x-y=3,求此两列变量的积差相关系数()。 A . 1 . 38 B . 0 . 69 C . 0 . 38 D . 0 . 75 25 .以下几个点二列相关系数的值,相关程度最高的是()。 A . 0.8 B . 0.1 C .-0.9 D.-0.5 参考答案:1 . C 2 . D 3 . C 4 . B 5 . A 6 . C 7 . C 8 . D 9 . B 10 . D 11 . D 12.B 13 . A 14 . B 15 . A 16 . B 17 . B 18 . C 19 . A 20 . B 21 . D 22 . A 23 . A 24.B 25 . C 二、多选题 1 .相关有以下几种()。 A .正相关 B .负相关 C .零相关 D .常相关 2 .利用离均差求积差相关系数的方法有()。 A .减差法 B .加差法 C .乘差法 D .除差法 3 .相关系数的取值可以是()。 A . 0 B .-1 C . 1 D . 2 4 .计算积差相关需满足()。 A .要求成对的数据 B .两列变量各自总体的分布都是正态 C .两相关变量都是连续变量 D .两变量之间的关系应是直线型的 5 .计算斯皮尔曼等级相关可用()。 A .皮尔逊相关 B .等级差数法 C .等级序数法 D .等级评定法 6 .肯德尔W 系数取值可以是()。 A .-1 B . 0 C . l D . 0 . 5 7 .质量相关包括()。 A .点二列相关 B .二列相关 C .多列相关 D .积差相关 8 .品质相关主要有()。 A .质量相关 B .四分相关 C .φ相关 D .列联相关 参考答案:1 . ABC 2 . AB 3 . ABC 4 . ABCD 5 . BC 6 . BCD 7 . ABC 8 . BCD 三、概念题 1 .相关系数(吉林大学200 2 研) 答:相关系数是两列变量间相关程度的指标。相关系数的取值在-1到+1 之间,常用小数表示,其正负号表示方向。如果相关系数为正,则表示正相关,两列变量的变化方向相同。如果相关系数为负值,则表示负相关,两列变量的变化方向相反。相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在1. 00 与0 之间,则表示不同程度的相关。绝对值接近 1.00 端,一般为相关程度密切,接近0值端一般为关系不够密切。0相关表示两列变量无任何相关性。 2 .二列相关(中科院2004研) 答:二列相关是两列变量质量相关的一种。适用的资料是两列变量均属于正态分布,但其中一列变量是等距或等比的测量数据,另一列变量虽然也呈正态 分布,但它被人为地划分为两类,例如:健康与不健康的划分。这种相关适用于对项目区分度指标的确定。 四、简答题 1 .简述使用积差相关系数的条件。(首师大2004 研) 答:积差相关又较积矩相关,是求直线相关的基本方法。积差相关系数适合的情况如下:(l)两列数据都是测量数据,而且两列变量各自总体的分布是正态的,即正态双变量。为了判断计算相关的两列变量其总体是否为正态分布,一般要根据已有的研究资料进行查询。如果没有资料查询,研究者应取较大样本分别对两变量作正态性检验。这里只要求保证双变量总体为正态分布,而对要计算相关系数的两样本的观测数据并不一定要求正态分布。(2)两列变量之间的关系应是直线性的。如果是非直线性的双列变量,不能计算线性相关。判断两列变量之间的相关是否直线式,可以作相关散布图进行线性分析。相关散布图是以两列变量中的一列变量为横坐标,以另一变量为纵坐标,画散点图。如果呈椭圆形则说明两列变量是线性相关的,如果散点是弯月状(无论弯曲度大小或方向),说明两变量之间呈非线性关系。(3)实际测验中,计算信度涉及的积差相关时,分半的两部分测验须满足在平均数、标准差、分布形态、测题间相关、内容、形式和题数都相似的假设条件。另外,积差相关要求成对的数据,即若干个体中每个个体都有两种不同的观测值。任意两个个体之间的观测值不能求相关。每对数据与其他对数据相互独立。计算相关的成对数据的数目不少于30 对,否则数据太少而缺乏代表性。 2 .哪些测量和统计的原因会导致两个变量之间的相关程度被低估。(北师大2004 研) 答:影响两个变量之间的相关程度被低估的原因有:(1)测量原因:测量方法的选择、两个变量测验材料的选择和收集、测量工具的精确性、测量中出现的误差、测验中主试和被试效应、测量的信度和效度、测验分数的解释等。(2)统计原因:全距限制,指相关系数的计算要求每个变量内各个分数之间必须有足够大的差异,数值之间必须有显著的分布跨度或变异性,所以全距限制问题会导致低相关现象;没有满足计算相关系数的前提假设也会低估相关系数,比如用皮尔逊相关计算非线性关系的两个变量间的相关系数。 3 .如果你不知道两个变量概念之间的关系,只知道这两个变量的相关系数很高,请问你可能做出什么样的解释?(武汉大学200 4 研) 答:( l )两个变量之间的相关系数很高说明两变量存在共变关系,还不能判断两个变量之间的具体关系。(2)根据相关系数的性质,系数值的大小只是表示变量变化趋势(0≦r≦1)。如果相关系数为0 ,则两个变量变化的方向没有关系;如果相关系数为正,则说明两个变量是同一个变化方向,比如:人的身高和体重就常常是一个变化方向,即身高增加,体重也增加;如果相关系数为负值,则说明两个变量变化方向相反,值的大小说明程度。比如:某研究中胆固醇水平与青少年青春期身高增长负相关,即胆固醇水平高的同时,青少年青春期身高增长反而在减慢。(3)两个变量之间的相关性只是显示出变量的变化趋势,并不能显示出两个变量的因果关系。如果相关系数很高,还需要考察是正相关还是负相关,这样来说明两个变量究竟是向同一个方向还是相反方向变化。 4 .一个变量的两个水平间的相关很高,是否说明两水平的均数间没有差异呢?为什么?举例说明。(中山大学2004 研)