测量工具的信度和效度分析.

测量工具的信度和效度分析.
测量工具的信度和效度分析.

测量工具的信度和效度分析

常用的测量工具主要有调查问卷和量表,它们都是对个人行为和态度的一种测量技术,是测量答卷者对问卷题目主观认识的个体差异的工具,也是研究者用来搜集资料的一种技术。一般情况下,编制一份量表必须做效度和信度评价,而调查问卷则不是必须的。对于有些调查问卷,其包含了类似量表性质对答卷者客观指标测量的题目,对这部分题目需要进行效度和信度的评价。

第一节信度分析概述

一、信度的概念

信度是指测量工具的可靠性和稳定性的程度,或是指使用某测量工具所获得结果的一致程度或准确程度。

测量工具的信度包含2层含义:一是相同的个体在不同时间,以相同的测量工具测验或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即测量工具的测验结果是否随时间和地点等因素而变化;二是能否减少随机误差对测量工具测验结果的影响,从而反映测量工具所要测量的真实情况,即测量工具是否具有稳定性、可靠性和可预测性。

信度的三个特征是:稳定性、内部一致性和等同性。一个好的测量工具必须是稳定可靠,且多次测验结果应前后一致。

信度本质上是一个统计学概念,是用于估计测量误差大小的尺度,主要说明测量工具测验结果中测量误差所占的比例。实际应用中主要通过构建平行测验来计算测量工具的信度。

二、信度的评价方法

信度研究的是测量工具测验结果的可靠性与稳定性,这种可靠性与稳定性可以从4个不同的角度来评价:①在相同条件下所得测量工具测验结果一致程度;

②不同研究者用同一种测量工具同时测验所得结果的一致程度;③同一研究者用同一种测量工具在不同时间内测验所得结果的一致程度;④同一答卷者在不同时间内对同一种测量工具测验的稳定程度。

根据研究角度不同,信度分为外在信度(external reliability)与内在信度(internal reliability)两大类。外在信度是指不同时间测量时测量工具测量的一致性程度。内在信度是指测量工具是否测量的是单一概念,同时也表明测

量工具各项目之间的内在一致性程度。

衡量信度高低的统计指标是信度系数(r)来表示,r 〉0.75表明信度水平较高;r= 0.5-0.75表示信度处于中等水平低水平;r〈 0.5表示信度处于较低水平。常见的信度系数有重测信度、复本信度、分半信度和Cronbach's系数等。重测信度是最常用的外在信度,Cronbach's系数是最常用的内在信度。

三、信度的分析方法

1重测信度(test-retest reliability)

1.1定义:用同一工具两次或多次测定同一研究对象,所得结果的一致程度。

1.2指标:重测相关系数(r) r=0-1 ;r 越接近1,重测信度越高

计算公式:r==

∑X:第一次测试研究对象各得分之和

∑Y:第二次测试研究对象各得分之和

∑X2:第一次测试研究对象各得分平方之和

∑Y2:第二次测试研究对象各得分平方之和

1.3在SPSS中计算重测信度的步骤:

在任务栏中选Analyze→correlate bivaviate→ varables→ pearson

1.4使用重测信度需考虑的问题

①两次测量间隔时间

②研究工具所测量的变量性质:适用较稳定的变量:人格特征、能力、生活质量、某些生理指标。

③测量环境的一致,包括:物理环境、时间、测量程序与测试者等

④样本量:预计样本的10%(10-20例

1.5重测信度结果的影响原因:变量随时间推移而发生改变;第一次测量结果的记忆效应;被调查者对第二次测评的不认真;条目设置问题;答案的评分等级问题

研究表明:采用同一份由204个问题组成的自填式医学问卷,对2352名病人进行两次调查,间隔30分钟,发现仅20%的人对所有问题两次回答一致,有5%的人对13个及以上的问题两次回答不一致。

2 复本信度(alternative form reliability):也叫等值性系数(coefficient

Of equivalence)。指两个大致相似的研究工具同时被用于研究对象,即题目不同但内容相似的两份测量工具。复本信度越高,测量工具越可靠,越能代表所欲测量的内容。计算方法是用两个复本间隔一定时间或同时施于同一答卷者所得分数的相关系数。

3分析测量工具内部一致性(internal consistency)的信度系数:适用于由多个条目组成的问卷或量表,是护理研究中最常用的信度测量方法。种类包括:折半信度(split-half reliability)、Cronbach's a系数以及适用于计算二分类是非题同质性信度的库德-理查森20号公式(KR20)。

3.1折半系数:将测量工具(量表)的各项目分成两部分,分别加以计分,对这两个部分的数值进行相关分析,然后采用Spearman-Brown公式计算信度。

折半方法:奇偶折半法、前后折半法

计算方法:先根据重测信度公式计算出相关系数r,再使用Spearman-Brown公式计算折半信度。

折半系数测定的缺点是:不同的折半方法会导致不同的结果,而Cronbach’a 系数与KR-20值所计算的是工具中所有项目的平均相关程度。

3.2 Cronbach’a系数:该系数是Cronbach于1951年创立的,取值范围在0-1之间,a系数越高,信度越高,测量工具内部一致性越好。

计算公式:α=N p/[1+p(N-1)

在SPSS中计算重测信度的步骤:

在任务栏中选Analyze→scale→ reliability→item→alpha

3.3 KR-20:是Cronbach’a的一种特殊形式,适用于二分制的测量工具,例如

回答“是”或“否”、“正确”或“错误”的测量工具。

计算公式:α= [k/(k - 1) ]. (δ2 -Σpiqi)/δ2

4 评分者信度:不同评定者使用相同的工具,同时测量相同的对象时,需计算评定者间一致程度。检验方法:相关系数。

信度系数的计算有多种方法,各种方法所适用的信度类型也不同,因此在计算信度系数时必须认真考虑实际所求信度的类型,然后选择恰当的信度系数公式。由于误差来源不同,即使同一个测量工具用不同方法所计算的信度系数也会不同,所以各信度系数间也不具有可比性。一般在信度分析中,要分别报告不同方法计

算出的信度值。各种信度及其误差来源:

重测信度:检验量表的稳定性,考虑的误差来源是时间取样。

分半信度:检验量表的一致性,它考虑的误差来源是内容取样。

内部一致性系数:检验量表的一致性,考虑的是测验内容是否异质。

评分者信度:检验量表的等同性,考虑的误差来源是评分者间的差别。

复本信度:检验量表的等同性,考虑的误差来源是内容取样。

四提高测量工具信度的方法

1 适当延长测量工具的长度。测量工具的题目越少,得分越容易受偶然因素的影响,测量工具的信度就越低;反之,测量工具题目越多,扩大了被测量者得分范围,在一定程度上排除了偶然因素的影响,提高了测量工具的信度。但是测量工具长度的增加与测量工具信度的提高并不总成正比,当信度系数较小时,延长测量工具的题目,信度系数增加较大;而当信度系数较大时,延长测量工具的长度对信度系数的影响就较小。

2测量工具难度适中。测量工具题目太难或太易都会使测量工具得分差异减小,从而降低了测量工具的信度。

3测量工具的内容尽可能同质。

4测验时间要充分,测验程序要统一,测量工具的评分要客观。

第二节效度分析概述

一、效度的概念

1 效度的定义:效度通常是指测量工具的有效性和正确性,即所用的测量工具能够测量出研究者所欲测量特性的程度。效度是测量工具最重要的特征,效度越高表示该测量工具测验的结果所能代表要测验行为的真实度越高,越能够达到测验目的,该测量工具才越正确越有效。对于一个标准测验来说,效度比信度更为重要,效度的大小由效度系数来表示。

效度包括了两方面的含义:其一是测量工具的测验目的;其二是测量工具对测量目标测量的精确度和真实性。

2 效度的性质效度是指测验结果的正确性或可靠性,而不是指测验工具本身;效度并非全有或全无,只是在程度上有高低不同的差别;效度是针对某一特殊功能或者某种特殊用途而言,不具有普遍性;效度无法实际测量,只能从现有信息

作逻辑推断或对实证资料作统计检验分析。

3效度的分类

①内在效度(internal validity)是指某特定测量工具中自变量与因变量之间存在因果关系的程度,反应测量工具的内容的正确性与真实性。内在效度是测量研究工具中应具备的最基本的效度,测量工具的内在效度越高,其价值也越高。

②外在效度(external validity)是指研究结果的概括性和代表性,即研究结果可否推论到研究对象以外的其它受试者,或研究情景以外的其它情境。一项研究越能实现以上目标,就表示该研究的外部效度越好。

二、效度的评价方法

评价效度的指标有:表面效度(face validity)、内容效度(content validity)、效标关联效度(criterion-related validity)、结构效度(construct validity)、判别效度(discriminant validity)、聚合效度(covergent validity)、因子效度(factorial validity)等。

1表面效度( Face validity):

定义:指通过粗略观察判断研究工具是否能测出所期望的概念。表面效度属于一种直觉判断用“有”或“无”来评价,在阐述表面效度时,应详细报告评价者的特点及其评价的可信度。

缺点:缺乏科学性,不能体现效度在程度上差异

2内容效度(content validity):

2.1定义:指量表中条目反映所测量内容的程度。即每个条目与所测内容的相关性,以及量表中条目是否充分地反映了测量工具所测的领域。适用范围:问卷或量表形式的研究工具。建立在大量查阅文献、工作经验、综合分析、判断的基础上。

2.2评价方法:专家组(expert panel)以文字形式评价评定,由专家对工具内容的合适性进行判断,一般需3个以上专家。应包括社会心理学领域、相关领域的临床护理专家、护理教育专家。专家资质要求:在本领域具有较高的学术水平;具有较高的教育背景;具有丰富的社会心理学知识;熟悉测量工具的发展与心理学特征测定的方法;严谨求实的科学态度。

2.3实施步骤:内容效度指数CVI公式( content validity index)

专家两两配对成组,分别计算各组中两个专家都认为相关的条目数占总条目数的百分比。如:AB-0.8 AC-0.9 AD-0.85、AE-0.9、BC-0.7、BD-0.8、BE-0.85、CD-0.7、CE-0.75、DE-0.75。计算所有组的平均值,得到CVI为0.8

3、效标效度(criterion-related validity)

定义:以一个公认有效的研究工具作为标准,检验新工具与标准工具测定结果的相关性。可分为同时效度(concurrent validity) 研究工具与现有标准之间的相关性和预测效度(predictive validity)测量工具作为未来情况预测指标的有效程度。

估计方法:①相关法,即计算某测量工具得分与效标间的相关性性,其结果即为效标效度。当测验分数与效标测量分数都是连续变量时,用积差相关公式求相关系数;当测量工具分数是连续变量而效标分数是二分变量时,可用二列相关公式计算效标效度。②区分法:即看测量工具测量分数是否可以区分由效标所划分的团体,可以用t检验进行差异性检验。

4、结构效度(constructive validity)

定义:反映研究工具所依据理论的程度,与理论框架相符合与否。用已知的具体的概念反映抽象的概念。

检验方法:因子分析,其主要功能是从量表全部变量(题项)中提取一些公因子,各公因子分别与某一群特定变量高度关联,这些公因子即代表了量表的基本结构。通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种结构。在因子分析的结果中,用于评价结构效度的主要指标有累积贡献率、共同度和因子负荷。累积贡献率反映公因子对量表或问卷的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷反映原变量与某个公因子的相关程度。

评价测量工具的效度较为复杂,实际应用时可以结合各种情况进行评价。

三、提高效度的方法

1 提高内在效度的方法:理论正确,解释清楚,概念要明确,解释要信而可证;操作规范以减少误差;控制系统误差;样本适宜且要预防流失,测试的样本容量一般不应低于30例;适当增加测量工具的长度,增加测量工具的长度既可以提高测量工具的信度又可以增加测量工具的效度,但增加测量工具长度对信度的影

响大于效度;排除无关因素干扰。

2 提高外在效度的方法:测量工具测量结果的解释分析应具有普遍性、客观性、合理性与真实性;以可操作性定义代表抽象性定义,取样应有足够的代表性,研究的情景要适宜,最好能与未来情景类似;观察具有普遍性,资料搜集要注意多元性,且要客观;尽可能排除无关的干扰变量,并慎防实验者效应发生。

四效度和信度的关系

信度与效度,二者既有联系又有区别,信度是对调查对象而言,效度是对调查所要说明的问题而言信度高效度不一定高,效度高则信度必定高,换句话说,可信的不一定有效的,有效的则必是可信的。以打靶为例,信度检验资料的可靠性、稳定性、一致性,效度(validity)检验结果的准确性。

信度和效度的关系概括如下:信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象:信度高,效度未必高。例如,尺子量布;效度低,信度很可能高;效度高,信度也必然高。即1可信:可能有效,也可能无效; 2.不可信:无效3. 有效:必须可信4. 无效:可能不可信,也可能可信。

问卷的信度与效度

调查问卷的信度效度分析方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法 复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的

信度与效度的关系

研究信度与效度的关系 一、信度与效度的定义 信度即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度,或者说,信度是指测量结果的一致性或稳定性。 效度即准确度,它是指测量工具或测量手段能够准确测出所要测量的变量的程度,或者说能够准确、真实地度量事物属性的程度.二、信度与效度的关系 (一)教育科学研究中信度与效度的关系 信度是研究结果所显示的一致性、稳定性程度,也是对研究结果一致性和稳定性的评价标准。一个具有信度的研究程序,不论其过程是由谁操作,或进行多少次同样的操作,其结果总是非常一致的.效度是一个研究程序的性质和功能,也是对研究结果正确性的评价标准,一个有效度的研究程序,不仅能够明确地回答研究的问题和解释研究结果,而且能够保证研究结果在一定规模的领域中推广。把两者的作用结合起来看,信度和效度是一项教育科学研究活动和结果具有科学价值和意义的保证。研究的信度是研究的效度的一个必要的前提,没有信度,效度不可能单独存在,也就是说,一项研究不可能没有信度却具有效度。 (二)人力资源招聘信度与效度的关系 影响测评信度的因素有很多,主要是系统误差和随机误差.包括测评者的专业性和素质、被测评者本人的心理、侧评工具的稳定性、

环境的稳定性等都会影响测评的可信度。影响测评的效度因素也有很多,如测评工具、测评过程及测评者因素、被测评者状态、效标因素和信度因素等。在实际招聘与录用评估过程中要把握各相关方面,不仅要有专业的测评人员,同时也要在稳定的环境中为被测评者提供一个放松真实的氛围。信度和效度是人才侧评与选拔质量的重要指标.图形形式表现分析得出的信度和效度的三种关系,则会是以下这些样式,如图8—l .图8-2和图8—3所示。所以,:高信度是高效度的必要条件,但非充分条件.即信度高不一定其效度就高,但要想获得较高的测评效度,其信度必定要高, (三)用结构式问卷来测量家长“溺爱孩子”的行为中信度与效

测量工具的信度和效度分析

测量工具的信度和效度分析 常用的测量工具主要有调查问卷和量表,它们都是对个人行为和态度的一种测量技术,是测量答卷者对问卷题目主观认识的个体差异的工具,也是研究者用来搜集资料的一种技术。一般情况下,编制一份量表必须做效度和信度评价,而调查问卷则不是必须的。对于有些调查问卷,其包含了类似量表性质对答卷者客观指标测量的题目,对这部分题目需要进行效度和信度的评价。 第一节信度分析概述 一、信度的概念 信度是指测量工具的可靠性和稳定性的程度,或是指使用某测量工具所获得结果的一致程度或准确程度。 测量工具的信度包含2层含义:一是相同的个体在不同时间,以相同的测量工具测验或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即测量工具的测验结果是否随时间和地点等因素而变化;二是能否减少随机误差对测量工具测验结果的影响,从而反映测量工具所要测量的真实情况,即测量工具是否具有稳定性、可靠性和可预测性。 信度的三个特征是:稳定性、内部一致性和等同性。一个好的测量工具必须是稳定可靠,且多次测验结果应前后一致。 信度本质上是一个统计学概念,是用于估计测量误差大小的尺度,主要说明测量工具测验结果中测量误差所占的比例。实际应用中主要通过构建平行测验来计算测量工具的信度。 二、信度的评价方法 信度研究的是测量工具测验结果的可靠性与稳定性,这种可靠性与稳定性可以从4个不同的角度来评价:①在相同条件下所得测量工具测验结果一致程度; ②不同研究者用同一种测量工具同时测验所得结果的一致程度;③同一研究者用同一种测量工具在不同时间内测验所得结果的一致程度;④同一答卷者在不同时间内对同一种测量工具测验的稳定程度。 根据研究角度不同,信度分为外在信度(external reliability)与内在信度(internal reliability)两大类。外在信度是指不同时间测量时测量工具测量的一致性程度。内在信度是指测量工具是否测量的是单一概念,同时也表明测

测量工具地信度和效度分析报告报告材料

测量工具的信度和效度分析

测量工具的信度和效度分析 常用的测量工具主要有调查问卷和量表,它们都是对个人行为和态度的一种测量技术,是测量答卷者对问卷题目主观认识的个体差异的工具,也是研究者用来搜集资料的一种技术。一般情况下,编制一份量表必须做效度和信度评价,而调查问卷则不是必须的。对于有些调查问卷,其包含了类似量表性质对答卷者客观指标测量的题目,对这部分题目需要进行效度和信度的评价。

第一节信度分析概述 一、信度的概念 信度是指测量工具的可靠性和稳定性的程度,或是指使用某测量工具所获得结果的一致程度或准确程度。 测量工具的信度包含2层含义:一是相同的个体在不同时间,以相同的测量工具测验或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即测量工具的测验结果是否随时间和地点等因素而变化;二是能否减少随机误差对测量工具测验结果的影响,从而反映测量工具所要测量的真实情况,即测量工具是否具有稳定性、可靠性和可预测性。 信度的三个特征是:稳定性、内部一致性和等同性。一个好的测量工具必须是稳定可靠,且多次测验结果应前后一致。 信度本质上是一个统计学概念,是用于估计测量误差大小的尺度,主要说明测量工具测验结果中测量误差所占的比例。实际应用中主要通过构建平行测验来计算测量工具的信度。 二、信度的评价方法 信度研究的是测量工具测验结果的可靠性与稳定性,这种可靠性与稳定性可以从4个不同的角度来评价:①在相同条件下所得测量工具测验结果一致程度;②不同研究者用同一种测量工具同时测验所得结果的一致程度;③同一研究者用同一种测量工具在不同时间内测验所得结果的一致程度;④同一答卷者在不同时间内对同一种测量工具测验的稳定程度。 根据研究角度不同,信度分为外在信度(external reliability )与内在信度(internal reliability )两大类。外在信度是指不同时间测量时测量工具测量的

问卷的信度与效度

?调查问卷的信度效度分析方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法

复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(r hh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式: 求出整个量表的信度系数(r )。 u 4、α信度系数法 Cronbach α信度系数是目前最常用的信度系数,其公式为: 其中,K为量表中题项的总数,为第i题得分的题方差,为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。 二、效度分析

如何进行信度检验、效度检验:概念介绍 & 软件操作

如何进行信度检验、效度检验:概念介绍&软件操作一、构念的维度: 可以用验证性因子分析(CFA)检验因子(维度)与测项之间的从属关系是否正确。检验指标是各个拟合优度指数和路径系数。 二、量表的信度: 信度包括重测信度、复本信度和内部一致性信度。在一次测量中,只能检验内部一致性信度,通常是用α系数。SPSS可以进行信度检验,一般要求α>0.7。每个测项的item-total correlation(项对总项相关系数)>0.4。同时还要看每个测项“α if item deleted”的值,它表示的是当删除该测项时,量表的α系数的值。如果α if item deleted>原来的α,则应该删除该测项。 三、构念的效度 1. 构念的收敛效度(convergent validity) 收敛效度指的是量表与同一构念的其他指标确实相互关联的程度。收敛效度可通过CFA检验,观察测量项目在构念上的负载(loading),如果标准化估计值(standardizes estimate)大于0.5,且t值大于1.96,平均提取方差(Average variance extracted,AVE)大于0.6,组合信度(construct reliability,CR)大于0.7,通常认为收敛效度较高。 ●平均提取方差(AVE):表示的是潜变量的变异量中有多大比例能用指 标变异量来解释(即指标解释潜变量的程度); ●组合信度(CR):模型内在质量的判别准则之一,反映了每个潜变量中 所有测项是否一致性地解释该潜变量。 2. 构念的判别效度(discriminant validity) 判别效度指的是一个测量值与其他应该有所不同的构念之间不相互关联的程度。判别效度可通过CFA检验,如果各个因子的AVE的平方根比该因子与其他因子之间的相关系数都大,则判别效度较高(或者说AVE的平方根大于该构念与任何其他构念的相关系数,则判别效度较高)。 另外一种检验判别效度的方法是卡方检验。在一个限制模型中(相关系数限制为1),配对构念之间的相关系数如果允许自由估计,卡方值显著地减少了,则说明两个构念之间的判别效度较高。卡方分布临界点为 3.84(P<0.05)或6.63(P<0.01)。 3. 构念的法则效度(nomological validity) 法则效度指的是量表以在理论上可以预测的方式,与不同但相关的构念的测量值之间相互关联的程度。 ◆收敛效度、判别效度、法则效度并称为建构效度(construct validity);另外 两种效度是内容效度(content validity)和标准效度(criterion validity)。内容效度是对量表的内容表现特定测量项目任务的优劣程度的一个主观而系统的评价。标准效度指一个量表是否像预期的那样反映与选作标准的其他变

测量问卷信效度分析

测量问卷信效度分析 信度和效度分析是问卷分析的第一步,也是检验该问卷是否合格的标准之一,所以,我们在做问卷调查的时候第一步就要进行信度和效度的分析,才能确保我们的问卷有意义。 信度(Reliability)即可靠性,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的一致性程度。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才可信。例如,我们用一把尺子测量一张桌子的高度,今天测量得高度与明天测量的高度不同,那么我们就会对这把尺子产生怀疑。因此,一张设计合理的调查问卷应该具有它的可靠性和稳定性。 目前最常用的是Alpha信度系数,一般情况下我们主要考虑量表的内在信度——项目之间是否具有较高的内在一致性。通常认为,信度系数应该在0~1之间,如果量表的信度系数在0.9以上,表示量表的信度很好;如果量表的信度系数在0.8~0.9之间,表示量表的信度可以接受;如果量表的信度系数在0.7~0.8之间,表示量表有些项目需要修订;如果量表的信度系数在0.7以下,表示量表有些项目需要抛弃。 信度分析是:“分析”——“度量”——“可靠性分析”,把所有主观题选到:“项目”中,确定即可,得出总的信度。把统一维度的题目选中,得出先关维度的信度。 具体步骤:分析——度量——可靠性分析 模型选择a,点击确定即可。 结果分析: 分析各个维度和总量的信度后,将它们列出一个表格,其中每个维度的a信度系数都大于0.7,说明该量表信度较好,符合问卷调查。 效度(Validity)即有效性,是衡量综合评价体系是否能够准确反映评价目的和要求。是指测量工具能够测出其所要测量的特征的正确性程度。效度越高,即表示测量结果越能显示其所 要测量的特征,反之,则效度越低。常用于调查问卷效度分析的方法主要有以下几种。 1、单项与总和相关效度分析 这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项

什么是测试的信度和效度,如何保证测试的信度和效度

什么是测试的信度和效度,如何保证测试的信度和效度 棋盘中小张倩倩 在教育研究中,信度与效度是很常见的两个概念。但每次看到或听到这两个名词,我的脑袋老反应不过来,看来基础就是不扎实。我在这里就谈谈我浅显的认识。 一、信度 所谓的信度,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的可能性。如果说某个指标或测量工具的信度高,那它提供的测量结果就不会因为指标、测量工具或测量设计本身的特性而发生变化;反之亦然。根据测量过程中不同的误差来源,可分为再测信度、复本信度和折半信度。 再测信度,是用同一测量工具在不同的时间对同一群受试者前后测量两次,然后计算两次测量分数的相关系数,相关系数越大说明两次测量的一致性越高。相隔的时间不应该太长。 复本信度,是用两个完全等值的(平行的)复本对同一群受试者进行测试,计算两种复本测量分数的相关系数,相关系数越大说明两个复本构成带来的变异越小。如考试中使用的A、B卷 折半信度,只用一个测量工具对同一群受试者实施一次测量,但将奇数题和偶数题分开计分,再计算奇数试题和偶数试题分数之间的相关系数。 二、效度 所谓的效度,是指测量工具能够测出其所要测量的特征的正确性程

度。效度越高,即表示测量结果越能显示其所要测量的特征。如果说根据某项特征能够区分人、物或事件,那么说某个测量该特征的测量工具是有效的,就是指它的测量结果能把具有不同特征的人、物或事件进行有效的区分。常用的有变面效度、内容效度和效标效度。 表面效度是指测量效果和人们头脑中的印象或学术界形成的共识之间的吻和程度,吻合程度高,表面效度就高。 内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵,测量工具代表概念定义的内容越多,内容效度就越高。 效标效度是指测量结果与一些标准之间的一致性程度,这些标准能够精确表示被测概念。 三、信度与效度的关系 信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。 信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。 信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。 效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。 效度高,信度也必然高。

调查表的的信度与效度评价方法

调查表的的信度与效度评价方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。 一、信度分析 信度(Reliability)即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。信度指标多以相关系数表示,具体评价方法大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间进行两次测量。两次测量相距一般在两到四周之内。用两次测量结果间的相关分析或差异的显著性检验方法,评价量表信度的高低。 2、折半法。折半法是将上述两份问卷合成一份问卷(通常要求

这两份问卷的问题数目相等),每一份作为一部分,然后考察这两个部分的测量结果之间的相关性。 3、折半信度法折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式: 求出整个量表的信度系数(ru)。 4、α信度系数法 Cronbach α信度系数是目前最常用的信度系数,其公式为: 其中,K为量表中题项的总数,为第i题得分的题内方差,为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。 二、效度分析 效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型:内容效度、准则效度

信度和效度

信度和效度分析 一、概念 信度是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。 效度是指测量工具或手段能够准确测出所需测量的事物的程度。 二、一句话解释 信度分析用于测量样本回答结果是否可靠,通俗来讲,即样本有没有真实回答了问题。通常情况下,信度分析仅仅只能分析量表题项。信度分析仅针对定量数据。 效度分析用于研究题项是否有效地表达研究变量或者维度的概念信息,通俗来讲,即研究测量题项设计是否合理。正常情况下,效度分析仅仅针对量表数据,非量表题目比如多选,单选性别之类的题目不能进行效度分析。如果一定想分析效度,建议可使用‘内容效度’,即用文字详细描述问卷设计的过程,用文字的形式描述清楚问卷是做什么,有什么用处,为什么合理,而且有专家认证,这样就说明问卷设计合理有效。 三、涉及术语 编号方法名词术语 1信度分析克隆巴赫系数,信度系数,α系数,项删除后的克隆 巴赫系数,校正的项总计相关性(CITC),预测试 2效度分析内容效度,结构效度,探索性因子分析,验证性因 子分析 克隆巴赫系数,也称信度系数,内部致性系数,或者Cronbach's Alpha,或者α系数,此值一般大于0.7即可。项删除后的克隆巴赫系数,如果某个维度或变量对应着5个题项,那删除掉某题项后余下4个题项的信度系数值即称作“项删除后的克隆巴赫系数”,通常此指标在预测试分析中使用。预测试指在问卷初步设计之后,收集小量样本(通常100内)进行信度或者效度分析,以发现题项可能存在的问题,并且对问卷进行修正处理,得到正式问卷。校正的项总计相关性,也称CITC值,比如某维度对应5个题项,那么此5个题项之间的相关关系情况则使用此指标进行表示,通常此值大于0.4即说明某题项与另外的题项间有着较高的相关性,预测试时通常会使用“校正的项总计相关性”这一指标。

SPSS与测验信度、效度、及项目分析

SPSS与测验信度、效度、及项目分析 在SPSS中,专门用来进行测验信度分析的模块为Scale下的Reliability Analysis;使用Data Reduction之下的Factor模块,可以利用因素分析的方法来进行测验的建构效度检验; 至于项目分析则没有专门的模块可以之间进行计算分析,但是却可以利用Summarize下的Frequencies、Correlate下的Bivariate和Compare Mean下的Independent-Samples T Test来计算几个常用的项目分析指标。 一、信度分析 Reliability Analysis模块主要功能是检验测验的信度,主要用来检验折半信度、库李及a系数以及Hoyt信度系数值。至于重测信度和复本信度,只需将样本在二次(份)测验的分数的数据合并到同一数据文件之后,利用Correlate之下的Bivariate求其相关系数,即为重测或复本信度;而评分者信度则就就是使用的Spearman等级相关及Kendall和谐系数。 表1 Reliability Analysis模块的Model选项的参数及对应中文术语关键字功能 Alpha Cronbach a系数 Split-half折半信度,n是第二分量表的题数 Guttman Guttman最低下限真实信度法 Parallel各题目变异数同质时的最大概率(maximum-likelihood)信度Strict parallel各题目平均数与变异数均同质时的最大概率信度 表2 Reliability Analysis模块的Statistics部分选项的参数及对应中文术语 关键字功能 F test Hoyt信度系数 Friedman Chi Friedman等级变异数分析及Kendall和谐系数 Cochran Chi Cochran’s Q检验,适用于答案为二分(如是非题)的量表Hotelling’s T Hotelling’s T2检验 Tukey’s Tukey的可加性检验 Intraclass量表内各题目平均数相关系数 二、效度分析 即因素分析的方法。 三、项目分析 (一)难度 1、是非题和选择题 对于是非题、选择题等采用二分法记分的项目,难度通常用通过率来表示,即用答对或通过该题人数的百分比作为指标: P-项目的通过率,R答对或通过该项目的人数,N为全体被试人数。 所涉及SPSS模块:Frequencies。

第四节个案研究的效度与信度

第四节个案研究的效度与信度 信度与效度是个案研究受人争议之所在,也是评价个案研究品质之所在。如何保证和提高个案研究的信度与效度,不能用传统的量化处理的手段来分析和判断个案研究的确信程度,而应采取新的标准与新的方法。 一、内在效度 内在效度处理的问题是研究者的发现与事实相符合的程度,即研究结果是不是真的捕捉到事实的真相和本事,真的观察到他们想要的东西。要提高个案研究的效度,一般采取以下五种措施:1.三角检定法 运用多元的搜集资料方式,包括不同的资料来源(报章、官方文件、会议记录),访谈不同的人员(如教师、行政人员、学者专家),及采用不同资料的搜集方法(如访谈、观察、非正式讨论),来相互验证资料与实施的相符程度。 2.研究对象的检核 在访谈和观察之后,研究者与被研究者讨论文稿及札记,最后的研究报告也请他们提供返馈建议,以确认能掌握被研究者所提供的经验和想法。 3.持续的观察 与被研究者建立信任、学习与合作的文化,在交往与研究中不断检视可能由研究者或研究对象所造成的误报或失真的介绍。 4.外在的审查 聘请具有个案研究知识与经验的专家进行审查,审查者应与这个研究无关,要审查研究的过程、诠释与结论,评断他们的正确性。 5.澄清研究者的偏见 在研究一开始的时候先澄清研究者自己的假设、世界观和理论导向,这是非常重要的,藉此读者了解研究者的观点、任何偏见或可能影响研究的假定。 二、外在效度 外在效度关心的是研究结果可应用到其它情境中的程度。个案研究的目的在深入了解一个特殊的例子而不是了解一般人共有的状况,因此,我们不能从单一的个案中作一般性的推论,这是个案研究的局限性之所在。但是,个案研究不仅能够为我们解决个别问题提供理论的视角与方法,而且也可为其它事件的发展和问题的解决提供借鉴和启发,因此,有学者提出个案研究的外在效度不能用量化的可推广性来评价,而应用可转换性(transferability)来代替,并透过提供丰

前测数据分析--信度和效度分析

第二节信度和效度分析 一、信度分析 与预测试数据分析方法一样,为了确保问卷的可靠性,先进行信度分析,信度检验指标在前面已详细述,在此不再述。问卷信度分析如表4-2所示: 表4-2:量表信度检验结果 - . -优质文档

经过SPSS24.0数据统计软件分析得知个变量Cronbach's α均大于0.6,且 组合信度在0.792以上,说明所有问卷都具备可靠性,能够较好的反应变量的真实情况。 二、效度检验 (一)容效度 为了确保调研问卷容的有效性,问卷量表通过文献研究先初步圈定问卷容,所用量表大多采用国外已经开发出的成熟量表,对于这部分量表,本文给予直接采用的方式,其余量表则是在前人研究的基础上,根据本文的研究目的和方向进行谨慎的拟定。因此,本问卷具有容效度。 (二)结构效度 在测量结构效度时,通常采用探索性因子分析。在进行因子分析时,通常采用主成分分析法,主成分分析的目的在于利用变量间的线性组合来解释每个层面的方差,变量的第一个线性组合可以解释最大的变异量,以此类推,所以主成分分析法的步骤是,选取特征值大于1的因子,然后利用方差最大旋转法进行旋转,使得旋转后题目在各个因子的负荷量大小出现明显差异,大部分题目在每个公共 因子中有一个差异较大的因子负荷量出现。但在因子分析之前需要进行KMO值- . -优质文档

和Bartlett球形检验,只有当KMO>0.5且Bartlett球形检验的Sig.值小于0.05时,问卷才具有结构效度,才能够进行因子分析。本研究中对三个量表进行的结构效度分析具体情况如下。 (1)虚拟品牌社群价值的效度检测 1.1虚拟品牌社群价值的KMO值和Bartlett球形检验 在对虚拟品牌社群价值做因子分析之前,先做KMO值和Bartlett球形检验,检测结果如表4-3所示: 表4-3:虚拟品牌社群价值的KMO值和Bartlett检验 取样足够度的Kaiser-Meyer-Olkin度量.901 Bartlett的球形度检验近似卡方4892.820 df 186 Sig. .000 通过对虚拟品牌社群价值量表的14个题项进行KMO检验和Bartlett球形检验,发现虚拟品牌社群价值量表的KMO值为0.901,表明各个变量之间的相关系数非常高,适合做因子分析,同时Sig.值为0.000<0.05,达到显著性水平,综上可以得出虚拟品牌社群价值量表适合做因子分析。 1.2虚拟品牌社群价值因子分析 通过KMO值和Bartlett球形检验可知,虚拟品牌社群价值适合做因子分析,运用主成分提取法进行因子旋转后得到以下数据,如:表4-4所示: 表4-4:虚拟品牌社群价值旋转因子负荷值 - . -优质文档

信度和效度评价

调查问卷信度和效度评价 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数来表示:大致可分为三类:稳定系数(跨时间的一致性)、等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。 若以信度系数来表示信度的大小。信度系数越大,表示测量的可信程度越大。究竟信度系数要多少才算有高的信度。学者DeVellis(1991)认为,0.60~0.65(最好不要);0.65~0.70(最小可接受值);0.70~0.80(相当好);0.80~0.90(非常好)。由此,一份信度系数好的量表或问卷,最好在0.80以上,0.70至0.80之间还算是可以接受的范围;分量表最好在0.70以上,0.60至0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在 0.80以下,应考虑重新修订量表或增删题项。 二、信度分析的方法主要有以下四种 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法 复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述模式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法

SPSS信度和效度

关于调查问卷的信度和效度检验 (一)信度 1 、信度的含义 测验的信度又称测验的可靠性 , 是指同一个测验对同一组被试施测两次或多次 , 所得结果一致形程度。一个好的测验必须是稳定可靠的 , 多次使用所获得的结果是前后一致的。例如 , 用直尺测量长度 , 其结果是稳定可靠的 ; 用橡皮筋测长度则是不可靠的 , 前后测量结果缺乏一致性。在测量理论中 , 信度被定义为 : 某次测验分数的真变异数与总变异数 ( 即实测分数 ) 之比 : 2 2 S R x xx ST = 式中 Rxx 表示测量的信度 ,ST 2 代表真分数的变异数 ( 方差 ),Sx 2 表示实得分数的变异数 ( 方差 ) 。 从上式可看出 , ( 1 )信度是指实测值和真值相差的程度 , 实测值是指对某物实际进行测量时所获得值 , 也称实测分数 (X); 真值是指被测事物的真实规模取值 , 也称真分数 (T) 。由于各种原因 , 实得分数常不等于真分数 , 两者之差称为测量误差或误差分数 (E) 。从理论上看 , 实得分数由真分数和误差分数两部分组成即 :X=T+E Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。 ( 2 )信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次测验中 , 受测者所得分数或所处等级前后一致 , 则说明测验结果的信度较高 ; 反之 , 两次测验结果一致性低 , 说明测验结果的信度低。 信度是任何一种测量的必要条件 ( 但不是唯一条件 ), 只有测量值接近或等于真值 , 用同一工具多次测量同一特性获得相同或相近的结果 , 才能认为这个测量结果是可靠的。信度对于教育测量尤其重要 , 只有信度高的教育测验才能成为教育工作者有用的工具 , 才能为教育工作者提供可靠的信息 , 为教育预测和决策提供客观依据。 2 、信度的估计方法 测验的信度是用信度系数的大小来表示的 , 根据测量理论 , 信度系数 2 2 S R x xx ST = 但是在实际测量中 , 一般只能获得实得分数 (X) 及实得变异数 (Sx 2 ), 而真分数 (T) 及真变异数 (ST 2 ) 是不知道的 , 因此 , 依据上述公式还无法机算信度系数。在统计上 , 主要采用相关分析的方法即机算两列变量的相关系数 , 用相关系数的大小来表示信度的高低。主要用以下方法来求得信度 : ( 1 )再测法 : 用同一测验对同一被试 , 前后施测两次 , 根据两次测验分数计算相关系数 , 即是再测信度。该信度反映了测验的稳定性程度 , 故又称稳定性系数 , 是用皮尔逊积差相关公式计算的 : 2 12 1/21S S M M N X X R xx ?-= ∑ 式中 X 1 .X 2 为同一被试的两次测验得分 ,M1.M2 为两次测验的平均分数 ,S 1 .S 2 是两次测验的标准 差 ,N 是被试人数。 用再测法估计信度 , 可以得到有关测验结果是否随时间而变化及变化程度的资料 , 可以作为预测被测者将来行为表现的依据。但也存在明显的局限性 : 前后两次测验结果易受到练习和记忆的影响 , 前后两次施测的时间间隔影响稳定性系数 , 特别是对学绩测验的影响较大。如果时间间隔太长 , 被测者的身心因受环境影响将发生大的变化 , 从而对第二次施测结果产生较大影响 , 使稳定性系数降低 ; 如果间隔太短 , 则被试第一次完成测验时练习和记忆会对第二次测验产生较大影响 , 使第二次测验性质发生变化。另外 , 有些测验不宜用再测法估计信度 , 如测量创造力测验 , 被试一旦掌握了解决问题的办法、原则 , 重测时 , 他将很容易作出反应 , 这样测验的性质就发生了改变。因此 , 只有在没有复本可用 , 测验不易受重复使用影响 , 现实条件又允许重复施测的情况下才使用重测法估计信度。 用重测法估计信度 , 间隔时间长短没有严格的规定 , 一般说 , 间隔时间越长 , 稳定性系数越低 , 最适

信度与效度分析步骤

如何用spss做问卷的结构效度分析? 问:因子分析里面Descriotives里面KMO和巴特利检验就可以了吗?除此之外,还要做什么啊?请高手赐教点简单易懂又能说明效度问题的,谢谢啦! 问题补充: 提取因子的个数怎么确定?是选特征值大于1的吗?还有,因子载荷怎么算?是在输出结果中直接可以看到吗?本人刚接触spss,请多多指教! 答: 首先必须要做KMO和Bartlett球形检验,这个你应该会了吧,如果这两个检验合格的话说明数据是适合做因子分析的。 然后提取因子后,看主因子解释总变异的百分比和个因子的因子载荷,主因子解释总变异一般若大于60%的和因子载荷大于0.6的话说明结构效度很好。 pS: ,如果题目没有规定就是选特征值大于1的,如果题目事先要提取几个因子,那么在操作的时候,用SPSS那个因子分析的选项里面有一个地方可以著名,因子载荷在输出的结果直接可以看到(rotated compoment matrpx),一定要是旋转后的因子载荷 用spss进行效度分析? 我要对我的问卷调查数据做一个信度和效度分析。信度分析我会了,就是看Cronbach’s Alpha 系数。效度分表面效度、准则效度和构建效度,前面两项只要说明一下,但是构建效度要用SPSS分析,我想是在因子分析里面吧?就是不知道哪个值代表效度。 答: 因子分析的效度分析主要的指标可以看,因子提取的方差累积贡献率,如果因子提取的越少且方差累积率又不低的话(一般如果2个因子达到40%以上的贡献率就算可以的了),就可以认为因子分析的效度还可以。 除此之外,你可以用因子分析里面Descriotives里面KMO和巴特利检验(battele,不知道是不是这样写的),KMO的值如果> 0.5,则说明因子分析的效度还行,可以进行因子分析;另外,如果巴特利检验的P<0.001,说明因子的相关系数矩阵非单位矩阵,能够提取最少的因子同时又能解释大部分的方差,即效度可以。 问:问卷效度测验如何应用于SPSS 问卷效度测验如何应用于SPSS,然后因为做效度检验貌似要用皮尔逊相关还是因子分析,所以不懂如何把这些应用于SPSS,不想要变量,想要整体,一个整体。 用因子分析,就已经是在检验变量的整体了 因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计方法。 三、因子分析的SPSS过程 第一步:准备数据文件,打开对话框,加载观测变量。数据文件主要是由较多的(一般在10个以上)可观测变量组成,个案数应比较大。然后点击“Analyze” ,选择 “Data Reduction” 中的“Factor”打开因子分析对话框,将参与分析的所有观测变量加载到“Variables”下边的方框中。 第二步:点击“Descriptives…”设置描述性统计要求。这里关键的是要求输出因子分析适合度的检验,一般要求输出:计算相关系数矩阵(选中Coefficients)、相关系数显著性水平矩阵(选中Significance levels)、反像相关矩阵检验 ( 选中Anti-image ) 、KMO 和巴特利特球形检验(选中 KMO and Bartlett’s test of sphericity)。 第三步: 点击“Extraction”打开对话框设置因子提取方式。在界定因子提取方法中需要设置以下几个方面的参数: (1) 因子构造方法:大多数情况下认为因子是变量的线性组合,所以使用最多的是主成分分析法(Principal components);

10效度与信度

效度(validity) 又称准确度,用以反映测量指标或观测结果与“真值”的差异大小(接近程度),即多大程度上反映了事物的客观真实性。其主要受系统误差的影响,偏倚具有方向性。 例如评价某人的健康状况有三种方法:可以根据本人的主诉、也可以统计他近三个月到医疗机构就诊的次数、还可以对他进行临床检查。效度情况:主诉最差,就诊次数尚可,临床检查结果最好。但从获取资料的成本(复杂性、费用、时间等)来看,则临床检查最高,主诉最低。选择观察指标应兼顾效度和成本,即选择效度较高而成本较低的测量方法。 常用的效度评价方法 (1)表面效度(face validity)指测量方法或观测结果所要说明的问题符合专家和公众的共识。如用专业技术职称说明医生的学术水平,用抢救次数反映患者的病情危重程度。 (2)内容效度(content validity)或称一致性效度(agreement validity),指测量方法或测量指标得到多少专家的认同。请一批有代表性的专家独立对各预选指标的效度进行评判,计算一致率(百分比)。 如测量睡眠情况,一批专家各自给出的测量指标和一致率分别为:仪器监控的睡眠时间(100%),受试者主诉的睡眠时间(92%),受试者对睡眠好坏的自我评价(80%),受试者亲属报告的睡眠时间(60%)。虽然仪器监控的睡眠时间用于测量睡眠情况的效度最好,但测量成本也高。 (3)平行效度(convergent validity)又称同期效度(concurrent validity)或标准关联效度(criterion-related validity),指用一个预选测量指标X和一个公认效度高的指标Y同时测量同一对象,计算X和Y的相关系数r。如果r较大(>0.75)且P<0.05,则认为预选测量指标X具有与Y相似的平行效度。如受试者主诉的睡眠时间(X)与仪器监控的睡眠时间(金标准,Y)的相关系数约为0.80~0.95,因此,用主诉的睡眠时间测量睡眠状况有与“金标准”相似的平行效度。 (4)预测效度(predictive validity)指测量结果是否与后来发生的事件相吻合。如采用问卷评分测量口腔保健知识的了解程度,如果评分结果与后来临床检查发现的口腔疾病严重程度呈现负相关(如r<-0.75),则说明问卷调查结果确能反映出口腔保健知识的水平。 注意:预测效度与平行效度的区别,前者是两种测量方法前后相关,后者是两种测量方法的同期相关。 (5) 结构效度(construct validity)指对客观事物的多指标测量是否具有专业上的理想结构。结构效度的评价通常没有“金标准”或专家意见可以参照,需要先收集一定数量的实际调查数据,采用统计分析的方法进行分析评价,如因子分析。例如,关于健康测量的效度评价,无论有多少调查项目,至少要具有“体格健康”和“心理健康”两个稳定的结构。5种效度指标的使用 在大多数情况下采用表面效度和内容效度,主要计算一致率; 在有“金标准”作为参照的情况下,采用平行效度或预测效度,主要进行相关分析; 结构效度的评价涉及到比较复杂的统计方法。 2. 信度(reliability) 又称可靠性或精确度,用以反映相同条件下对同一客观事物重复测量结果的相互符合程度,其主要受随机因素的影响,误差不具有方向性。信度评价主要是评价不同的测量者、不同的测量时间、不同的测量工具对数据可靠性的影响。 常用的信度评价方法 (1)客观信度(objectivity reliability) 也称测量者间信度(inter-rater reliability),指m(>=2)个的测量者(raters)同一时间段对同一对象进行重复测量。如两名护士先后测量同一患者的血压。如果测量了n个患者,两名护士的客观信度用简单相关系数r表示。当

相关文档
最新文档