spss协方差分析的基本原理-最棒的

spss协方差分析的基本原理-最棒的
spss协方差分析的基本原理-最棒的

协方差分析的基本原理

1.协方差分析的提出

无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量。在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。

例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。又比如,考查受教育程度对个人工资是否有显著影响,这时必须考虑工作年限因素。一般情况下,工作年限越长,工资就越高。在研究此问题时必须排除工作年限因素的影响,才能得出正确的结论。再如,如果要了解接受不同处理的小白鼠经过一段时间饲养后体重增加量有无差别,已知体重的增加和小白鼠的进食量有关,接受不同处理的小白鼠其进食量可能不同,这时为了控制进食量对体重增加的影响,可在统计阶段利用协方差分析(Analysis of Covariance),通过统计模型的校正使得各组在“进食量”这个变量的影响上相等,即将进食量作为协变量,然后分析不同处理对小白鼠体重增加量的影响。

为了更加准确地控制变量不同水平对结果的影响,应该尽量排除其它在实验设计阶段难以控制或者是无法严格控制的因素对分析结果的影响。利用协方差分析就可以完成这样的功能。协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。

协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变量时,称为多元协方差分析。以下将以一元协方差分析为例,讲述协方差分析的基本思想和步骤。

2.协方差分析的计算公式

以单因素协方差分析为例,总的变异平方和表示为:

Q Q Q Q

++

总控制变量协变量随机变量

协方差分析仍然采用F检验,其零假设

H为多个控制变量的不同水平下,各总体平均值没有显著差异。

F统计量计算公式为:

2

2

S

F

S

控制变量

控制变量

随机变量

=,

2

2

S

F

S

协变量

协变量

随机变量

以上F统计量服从F分布。SPSS将自动计算F值,并根据F分布表给出相应的相伴概率值。

如果F

控制变量

的相伴概率小于或等于显著性水平,则控制变量的不同水平对观察变量产生了显著的影响;如

果F

协变量

的相伴概率小于或等于显著性水平,则协变量的不同水平对观察变量产生了显著的影响。

3.协方差分析需要满足的假设条件

(1)自变量是分类变量,协变量是定距变量,因变量是连续变量;

(2)对连续变量或定居变量的协变量的测量不能有误差;

(3)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;(4)协变量的回归系数是相同的。在分类变量形成的各组中,协变量的回归系数(即各回归线的斜率)必须是相等的,即各组的回归线是平行线。如果违背了这一假设,就有可能犯第一类错误,即错误地接受虚无假设。

(5)自变量与协变量是直角关系,即互不相关,它们之间没有交互作用。如果协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除。

4.协方差分析SPSS的示例

在进行新的外语教学方法实验时,往往需要在实验前和实验后对实验组和控制组的学生都进行成绩测试,以便确定新的教学方法对实验后成绩的影响。显然,实验前成绩与实验后成绩之间会有内在联系,如果要更准确地确定新的教学方法的效果,有必要考虑实验前成绩对实验后成绩的影响,也就是说可以把前测成绩作为协变量进行协方差分析。

本例子中的实验研究共有15名受试者,将这些受试者随机分为3组,各组有5人,然后对这三组进行不同的教学方法实验。其中一组为控制组,实验时不对教学方法进行改变,仍然采用以前的传统教学方法。另两组为实验组,分别用交际法和沉浸法两种教学方法进行教学方法实验。实验开始前对这三组学生用相同的试卷进行了英语测试,得出了前测成绩。实验结束后,用新的试卷同时对这三组学生进行了测试,得出了后测成绩。然后将要分析的数据输入到SPSS中去。见数据录入表格所示。我们用1表示传统教学方法,2表示交际法,3表示沉浸法。

我们先不考虑前测成绩,以“教学方法”为因素变量,“后测成绩”为因变量进行单因素方差分析。从方差分析结果来看,概率值为0.463(远远大于0.05的显著性水平),说明三种教学方法在后测成绩上似乎没有显著差异,但如果以前测成绩作为协变量进行方差分析时,分析结果可能就会有差异。以下将以前测成绩作为协变量进行方差分析,检验三种不同教学方法是否真的没有显著差异。

未作协方差分析之前的单因素方差分析表

ANOVA

后测成绩

用SPSS进行协方差分析,可以分两大步骤进行,首先检验回归斜率相等的假设,然后进行协方差分析。

一、回归斜率相等的假设

1、分组散点图

对于本例,首先应了解三种教学方法的前测成绩与后测成绩的回归线是否平行,即前测考试成绩的影响在分别采用三种教学法的三个班级中是否相同,这可以用前测成绩与教学法是否存在交互作用来表示。对于该问题,首先可以作分组散点图,观察三组直线趋势是否近似,然后看交互作用有无统计学意义,当交互作用无统计学意义时,则进行协方差分析,得出统计结论。

在菜单中选择Graphs→Scatter/Dot,打开atter/Dot对话框,选择Simple Scatter选项,按右上角Define 按钮,以前测成绩为X轴,后测成绩为Y轴,教学方法作为(Panel by →Rows),作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor对话框,按照菜单Element→Fit Line at Total,可以得到如下图所示的散点图,从图中可知三组中前测成绩和后测成绩有明显的直线趋势,且三组中直线趋势的斜率接近,因此从图形上未发现违反前提条件的迹象,可以进一步作假设检验,检验各组总体斜率是否相等。

如果按照菜单Graphs→Scatter/Dot,打开atter/Dot对话框,选择Simple Scatter选项,按右上角Define 按钮,以前测成绩为X轴,后测成绩为Y轴,教学方法作为标记变量(Set markers by),作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor对话框,按照菜单Element→Fit Line at Total,可以得到如下图所示的散点图,作出散点图,注意在作出散点图之后,左键双击输出的图形,调出Chart Editor 对话框,按照菜单Element→Fit Line at subgroups,可以得到如下图所示的散点图,从图中可知三组中前测成绩和后测成绩有明显的直线趋势,且三组中直线趋势的斜率接近,因此从图形上未发现违反前提条件的迹象,可以进一步作假设检验,检验各组总体斜率是否相等。

2、组内回归斜率相同检验

步骤1:选择协方差分析菜单(与GLM单因素方差分析菜单相同)。点击数据编辑界面的Analyze命令,选择General Linear Model,并打开Univariate对话框。

步骤2:选定因变量、因素变量和协变量。在对话框中左边变量列表中选择“后测成绩”作为因变量,并将其移入Dependent Variable 方框中。然后选择“教学方法”作为因素变量,将其移入到Fixed Factor(s)方框中。再选择“前测成绩”作为协变量,将其移入Ccvariate(s)方框中。

步骤3:确定分析模型。在对话框中单击Model命令按钮,进入Univariate Model对话框中。该对话框提供了两种不同形式的模型,完全因素(full factorial)和自定义因素(custom)模型。由于要进行回归斜率相同的检验,所以本例使用自定义因素模型。点击Custom选择按钮后,从左边的变量列表中选择“教学方法”,点击右向箭头将其移入Model方框中。用同样的方法将变量列表中的“前测成绩”移入Model方框中。最后在变量列表中连续点击“教学方法”和“前测成绩”,同时选中它们,再点击右向箭头,Model方框中会出现“教学方法*前测成绩”字样,意为进行交互效应分析,即检验回归线斜率相等的假设。点击Continue

命令按钮回到主对话框中,并点击OK按钮提交程序运行。

组内回归斜率相同检验结果

Tests of Between-Subjects Effects

Dependent Variable:后测成绩

a R Squared = .845 (Adjusted R Squared = .759)

上表是组内回归斜率相同检验结果,教学方法与前测成绩的交互效应检验的F值为2.726,概率值为0.119(大于0.05),没有达到显著性水平,表明三组的回归斜率相同,即各组的回归线为平行线,符合了协方差分析的回归斜率相同的条件。这一结果表明,下面所进行的协方差分析的结果是有效的。

二、协方差分析步骤

步骤1:选择协方差分析菜单(与GLM单因素方差分析菜单相同)。点击数据编辑界面的Analyze命令,选择General Linear Model,并打开Univariate对话框。

步骤2:选定因变量、因素变量和协变量。在对话框中左边变量列表中选择“后测成绩”作为因变量,并将其移入Dependent Variable 方框中。然后选择“教学方法”作为因素变量,将其移入到Fixed Factor(s)方框中。再选择“前测成绩”作为协变量,将其移入Ccvariate(s)方框中。

步骤3:选择组建对比方式和输出结果。由于有了协方差,无法使用主对话框中Post Hoc命令按钮进行组间多重比较。但是可以按照下面的方法进行。在主对话框中点击Option按钮,进入结果输出选择对话框中,从左边的因素变量列表中选择“教学方法”将其移入Display Means for方框中,意为输出不同教学方法后测成绩调整后(考虑了协变量效应之后)的边缘平均值。选择Compare main effects,意为对“教学方法”各组的后测成绩平均值进行组间比较。在Confidence interval adjustment 下拉菜单中选择LSD,意为进行Tukey

LSD事后检验。

选择输出结果时,在Display部分选择Descriptive statistics、Homogeneity tests,分别意味着输出每一组的描述统计量和方差齐性检验(见下图)

步骤4:指定模型形式。在主对话框中点击Model按钮进入Univariate:Model对话框。本例采用完全因素模型,即点击Full factorial按钮(见下图)。完全因素模型包括全部因素变量和协变量的主效应、因素变量间的交互效应,但不包括与协变量的交互效应。由于本例中只有一个因素变量和一个协变量,没有交互效应,计算结果只会有主效应。至此为止,所有对话框指定完毕,点击Continue按钮回到主对话框,再点击OK按钮提交程序运行即可。

三、协方差分析输出结果及说明

因素变量表

描述统计表

方差齐性检验表

下表汇报了方差齐性检验结果,由表可知,F

值为0.220,概率值为0.806(大于0.05),说明各组之间的方差基本相同。这一结果满足了参数检验的另一个条件,因此下面些方差分析结果是有效的。

协方差分析表

上表包括了协变量“前测成绩”之后的方差分析结果,由表可知,协变量“前测成绩”的概率值为0.000,

说明“前测成绩”能显著地预示“后测成绩”,也就是说,它对后测成绩产生了显著的影响。因素变量“教学法”也达到了显著水平(0.041),说明“教学方法”对后测成绩也产生了显著的影响,该结果告诉我们至少有一个教学组与另一个教学组之间有显著差异,但哪些组之间有差异,必须查看后面的组间多重比较结果。

这里我们不妨把协方差分析结果与没有包括协方差分析结果做一比较,看看它们之间是否有差异。

未作协方差分析之前的单因素方差分析表(表1)

ANOVA

协方差分析表(表2)

(1)表1中,“教学方法”的概率值为0.463,大于0.05的显著性水平,方差分析结果表明,“教学方法”对“后测成绩”不产生显著影响;而表2中的协方差分析结果表明,“教学方法”达到了显著性水平(0.041),即对“后测成绩”产生了显著影响。

(2)表1中由组间差异(Between Groups)解释的方差是213.333;表2中而考虑了协方变量之后,模型解释的方差(Corrected Model)却增加到了1332.043。

(3)表1表明,需要解释的总方差为1773.333,而“教学方法”只解释了213.333个单位,还有1560个单位的方差未得到解释;表2表明,需要解释的总方差仍然是1773.333,但“教学方法”解释的方差却增加到了346.429,除掉协变量解释的方差(1118.71),未解释的方差只有441.29。

由上述3个方面可以看出,进行协方差分析能更准确地检验因素变量对因变量的作用。

调整后的后测成绩平均值(Estimates)

上表给出的不是三个不同教学组的原始后测成绩平均值,而是调整后的各组平均值,即模型的预示平均值,本利中模型预示的三种教学法的平均成绩分别为51.097、63.387和52.516。从这一结果也可以看出,第一

种与第二种的差异较大,而与第三种教学法的平均值比较接近。

多重组间比较结果

该结果对三个教学组分别进行了比较,由该表可知,传统教学法与交际教学法有显著差异,交际法与沉浸法之间也有显著差异。从平均值一栏中,还可以看出,交际法的教学效果优于其他两种方法。

多重组间比较方差分析结果

上表给出了方差来源、对比(教学方法)和误差的平方和、自由度、均方、F值和概率值。多重组间比较方差分析同样表明,不同的教学方法之间的后测成绩有显著差异。

结果汇报

协方差分析产生了大量表格,再研究汇报时不宜一一汇报,可主要汇报描述统计表、些方差分析表以及多重组间比较结果表。

练习1:

现在想研究3组同学(分别接受了3种不同的教学方法)在数学成绩上是否有显著差异。已知这些同学的数学入学成绩,数据如下表所示。表中共有四列数据,其中学生的数学成绩也会受到入学成绩的影响,而入学成绩是连续数值型,我们一般假定入学成绩与教学法(这里体现为组别,是控制变量)不存在交互影响,则我们认为在这个问题中,应该数学成绩作为观察变量;组别作为控制变量;将入学成绩作为协变量进行处理较为合适。

练习2:

某学校在教学改革中为了考核某种课程新教学方法的效果,特选择两个班级进行试验,一个班级用标准教学法,另一个班级采用新教学法,一学期后采用相同的试卷进行测试,记录期末考试成绩,见(两种教学法成绩情况数据)请通过该数据对新教学法和标准教学法的效果进行比较。

练习3:

为了研究三种不同饲料对生猪体重增加(wyh)的影响,将生猪随机分成三组各喂养不同的饲料(sl),得到体重增加的数据。由于生猪体重的增加理论上会受到猪自身身体条件的影响,于是收集生猪喂养前体重(wyq)的数据,作为自身身体条件的测量指标。为准确评价饲料的优劣,采用单因素协方差分析的方法进行分析。这里,猪体重的增加量为观测变量,饲料为控制变量,猪喂养前的体重为协变量。

练习4:

比较三种饲料F1、F2、F3对猪催肥的效果,测得每头猪的增加重量(WI)和出生重量(WB)的数据

练习5:

将体重相近,出生3周的36只大白鼠,按照窝别、性别等条件分成12窝,没窝3只,随机分到核黄素缺乏组、限食量组与不限食量组进行喂养,测得大白鼠的体重与事物消耗量如下表所示。检验三种喂养方式是否有显著差异?

练习6:

某研究者想研究不同的图式对阅读效果的影响,研究者设计了四种不同的图式,分配给四个实验小组,经过图式学习、运用图式阅读等实验环节,最后测查被试的阅读效果。在这个研究中,研究者意识到学生的智商是一个重要的干扰因素,因此,在前测中对每个被试进行了智商测验,得到下表的数据,试分析不同图式对阅读效果的影响。

练习7:

某研究者要研究演讲法、自学法和启发法三种教学方法对小学生数学学习成绩的影响。研究者从学校中抽取三个班级作为实验班,再以班级为单位随机分派,接受一种教学方法进行实验。由于学习能力足以影响实验的结果,故实验前对每位学生进行了学习能力测验。下表是每位学生的学习能力测验分数(X)和实验一年后的数学测验成绩(Y)。问三种教学方法之间有无差异?

方差分析和协方差分析,协变量和控制变量

方差分析和协方差分析,协变量和控制变量 方差分析 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。 假定条件和假设检验? 1. 方差分析的假定条件为:(1)各处理条件下的样本是随机的。(2)各处理条件下的样本是相互独立的,否则可能出现无法解析的输出结果。(3)各处理条件下的样本分别来自正态分布总体,否则使用非参数分析。(4)各处理条件下的样本方差相同,即具有齐效性。 2. 方差分析的假设检验假设有K个样本,如果原假设H0样本均数都相同,K个样本有共同的方差σ,则K个样本来自具有共同方差σ和相同均值的总体。如果经过计算,组间均方远远大于组内均方,则推翻原假设,说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义。否则承认原假设,样本来自相同总体,处理间无差异。 作用 一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。经过方差分析若拒绝了检验假设,只能说

spss学习系列23.协方差分析

(一)原理 一、基本思想 在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。 协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。 当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变量时,称为多元协方差分析。

二、协方差分析需要满足的条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差; (2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设; (3) 自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除; (4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 三、基本理论 1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即 ()ij i ij ij y u t x x βε=++-+ (1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。 用协变量进行修正,得到修正后的y ij (adj)为 (adj)()ij ij ij i ij y y x x u t βε=--=++ 就可以对y ij (adj)做方差分析了。关键问题是求出回归系数β. 2. 总离差=分组变量离差+协变量离差+随机误差,

熟练使用SPSS进行双因素方差分析

2. 统计分析。 依次选取“Analyze”、“General Linear Model”、“Univariate” 。 图2 选择分析工具 展开对话框如下图,将x选入Dependent V ariable(因变量框),g、id 选入Fixed Factors(固定因素框)。 图3 选择变量进入右侧的分析列表

对话框右边有一排按钮Mode、Contrasts 、Plots、Post Hoc、Save 和Options,下面分别对其子对话框选项作一简单介绍: Model:指定不同的模型,除方差分析外General Linear Model可作其他统计分析; Contrasts:指定一种要用t 检验来检验的priori 对比; Plots:指定作某种图; Post Hoc:指定两两比较的方法; Save:指定将产生的一些指标保存为新的变量; Options:指定要输出的一些选项,如数据的描述方差齐性检等 单击Model 展开其子对话框如下图,最上方Specify Model 定义模型,有两个选项:Full factorial(全因子)和Custom,选取Custom(自定义),Build Terms (选取模型中各项)下方有一选项,单击下拉箭头将其展开,选择Main Effects(主效应因)(本例不考虑交互作用),再将Factors 框中的g、id 选入Model:框,按Continue返回主对话框,单击Post Hoc 按钮展开其子对话框,将g 选入Post Hoc Test for,即要做两两比较的因素框,选取SNK 即q检验,返回主对话框,单击OK 键提交执行。 图4 Model对话框设置

spss协方差分析的基本原理-最棒的

协方差分析的基本原理 1.协方差分析的提出 无论是单因素方差分析还是多因素方差分析,它们都有一些人为可以控制的控制变量。在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。又比如,考查受教育程度对个人工资是否有显著影响,这时必须考虑工作年限因素。一般情况下,工作年限越长,工资就越高。在研究此问题时必须排除工作年限因素的影响,才能得出正确的结论。再如,如果要了解接受不同处理的小白鼠经过一段时间饲养后体重增加量有无差别,已知体重的增加和小白鼠的进食量有关,接受不同处理的小白鼠其进食量可能不同,这时为了控制进食量对体重增加的影响,可在统计阶段利用协方差分析(Analysis of Covariance),通过统计模型的校正使得各组在“进食量”这个变量的影响上相等,即将进食量作为协变量,然后分析不同处理对小白鼠体重增加量的影响。 为了更加准确地控制变量不同水平对结果的影响,应该尽量排除其它在实验设计阶段难以控制或者是无法严格控制的因素对分析结果的影响。利用协方差分析就可以完成这样的功能。协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协变量时,称为多元协方差分析。以下将以一元协方差分析为例,讲述协方差分析的基本思想和步骤。 2.协方差分析的计算公式 以单因素协方差分析为例,总的变异平方和表示为: Q Q Q Q ++ 总控制变量协变量随机变量 = 协方差分析仍然采用F检验,其零假设 H为多个控制变量的不同水平下,各总体平均值没有显著差异。 F统计量计算公式为: 2 2 S F S 控制变量 控制变量 随机变量 =, 2 2 S F S 协变量 协变量 随机变量 = 以上F统计量服从F分布。SPSS将自动计算F值,并根据F分布表给出相应的相伴概率值。 如果F 控制变量 的相伴概率小于或等于显著性水平,则控制变量的不同水平对观察变量产生了显著的影响;如 果F 协变量 的相伴概率小于或等于显著性水平,则协变量的不同水平对观察变量产生了显著的影响。 3.协方差分析需要满足的假设条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量; (2)对连续变量或定居变量的协变量的测量不能有误差; (3)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;(4)协变量的回归系数是相同的。在分类变量形成的各组中,协变量的回归系数(即各回归线的斜率)必须是相等的,即各组的回归线是平行线。如果违背了这一假设,就有可能犯第一类错误,即错误地接受虚无假设。

方差分析(ANOVA)与协方差分析(ANCOVA)

方差分析(ANOVA)与协方差分析(ANCOVA) 第5章方差分析(ANOVA)与协方差分析(ANCOVA) ——野外竞争试验 Deborah E.Goldberg Samuel M.Scheiner 5.1 引言 自从达尔文时期,竞争就占据了生态理论的中心,关于竞争的实验在许多来自许多不同环境的多生物种之间开展过(Jackson,1981综述; Connell,1984; Schoener,1984; Hairston,1989; Gurevitch,1992)。有各种各样的竞争实验,而本章的重点则放在怎样为具体的竞争问题选择适当的实验设计和统计分析。这类选择取决于所研究问题及系统的许多方面。对于大多数我们所给出的设计、基本的统计方法、方差分析(ANOVA)和协方差分析(ANCOVA)在实验设计与分析的教科书中也有详尽描述,我们在这里就不像本书其他章节那样提供详细的统计细节。对于ANOVA的基本介绍见第四章。虽然我们着重于竞争,但许多观点对其他类型的种间关系实验同样有效,如捕食者—猎物关系或者互惠共生关系。 5.2 关于竞争的生态问题 我们可以提出关于竞争的最简单问题莫过于竞争是否在野外存在,要回答这个问题,就必须利用实验处理,使潜在竞争者们的绝对多度可被控制,同时检验处理中存在低多度潜在竞争者时物种是否可能生长的更好。这类多度处理之间生长的差异即是竞争的量纲(或促进facilitation的量纲如果在较高多度下生长较佳)。在任何野外竞争调查中,发现是否存在竞争是重要的第一步,但是,就其本身而言,并没有什么意义。多数关于竞争的重要问题包括竞争强度的比较以及随之而来的实

SPSS 重复测量的多因素方差分析

1、概述 重复测量数据的方差分析是对同一因变量进行重复测量的一种试验设计技术。在给予一种或多种处理后,分别在不同的时间点上通过重复测量同一个受试对象获得的指标的观察值,或者是通过重复测量同一个个体的不同部位(或组织)获得的指标的观察值。重复测量数据在科学研究中十分常见。 分析前要对重复测量数据之间是否存在相关性进行球形检验。如果该检验结果为P﹥0.05,则说明重复测量数据之间不存在相关性,测量数据符合Huynh-Feldt条件,可以用单因素方差分析的方法来处理;如果检验结果P﹤0.05,则说明重复测量数据之间是存在相关性的,所以不能用单因素方差分析的方法处理数据。在科研实际中的重复测量设计资料后者较多,应该使用重复测量设计的方差分析模型。 球形条件不满足时常有两种方法可供选择:(1)采用MANOVA(多变量方差分析方法);(2)对重复测量ANOVA检验结果中与时间有关的F值的自由度进行调整。 2、问题 新生儿胎粪吸入综合征(MAS)是由于胎儿在子宫内或着生产时吸入了混有胎粪的羊水,从而导致呼吸道和肺泡发生机械性阻塞,并伴有肺泡表面活性物质失活,而且肺组织也会发生化学性炎症,胎儿出生后出现的以呼吸窘迫为主,同时伴有其他脏器受损现象的一组综合征。血管内皮生长因子(vascular endothelial growth factor,VEGF)是一种有丝分裂原,它特异作用于血管内皮细胞时,能够调节血管内皮细胞的增殖和迁移,从而使血管通透性增加。而本实验旨在通过观察分析给予外源性肺表面活性物质治疗前后胎粪吸入综合征患儿血清中VEGF的含量变化,评价药物治疗的效果。 将收治的诊断胎粪吸入综合症的新生儿共42名。将患儿随机分为肺表面活性物质治疗组(PS组)和常规治疗组(对照组),每组各21例。PS组和对照组两组所有患儿均给予除用药外的其他相应的对症治疗。PS组患儿给予牛肺表面活性剂PS 70mg/kg治疗。采集PS 组及对照组患儿0小时,治疗后24小时和72小时静脉血2ml,离心并提取上清液后保存备用并记录血清中VEGF的含量变化情况。 结果如下: 3、统计分析

协方差分析

第十一节协方差分析 (analysis of covariance) 在各种试验设计中,对应变量(dependent variable)Y 研究时,常希望其他可能影响Y的变量在各组间保持基本一致,以达到均衡可比。例如:比较几种药物的降压作用,各试验组在原始血压、性别、年龄等指标应无差异。

第十一节协方差分析 有时这些变量不能控制,须在统计分析时,通过一定方法来消除这些变量的影响后,再对应变量y作出统计推断。称这些影响变量为协变量(Covariate)。 如果所控制的变量是分类变量时,可用多因素的方差分析; 当要控制的变量是连续型变量时,可用协方差分析,以消除协变量的影响,或将协变量化成相等后,对y的修正均数进行方差分析。

第十一节协方差分析 例如:比较几种不同饲料对动物体重增加的作用,可把动物的进食量作为协变量。 比较大学生和运动员的肺活量时,可把身高作为协变量。 比较治疗后二组舒张压的大小,可把治疗前的舒张压作为协变量。

第十一节协方差分析 协方差分析的基本原理: 协方差分析是把直线回归和方差分析结合起来的一种统计分析方法。当不同处理结果的y值受协变量x的影响时,先找出y与x的直线关系,求出把x值化为相等后y的修正均数,然后进行比较,这样就能消除x对y的影响,更恰当地评价各种处理的作用。

协方差分析的步骤 ±观察指标服从正态分布、方差齐性、各观察相互独立H检验分组因素与协变量x是否有交互作用。对上例,即是否雌雄羔羊进食量相同,它们的体重增加量却不相同。如检验结果分组因素与协变量x间没有交互作用,即说明雌雄羔羊进食量相同的情况下,它们的体重增加量是相同的。进行第二项检验: H检验协变量与应变量之间是否存在线性关系。如果不存在线性关系,则不能简单地运用协方差分析,因为协方差分析是利用协变量x与应变量y之间的线性回归关系扣除协变量x对y的影响。必要时可考虑进行变量转换。如果检验结果协变量与应变量之间存在线性关系,则进行第三项检验: H进一步扣除x对y影响的前提下,检验各组的修正均数差别是否有统计学意义。

用SPSS进行单因素方差分析和多重比较

方差分析 方差分析可以用来检验来多个均值之间差异的显著性,可以看成是两样本t检验的扩展。统计学原理中涉及的方差分析主要包括单因素方差分析、两因素无交互作用的方差分析和两因素有交互作用的方差分析三种情况。虽然Excel可以进行这三种类型的方差分析,但对数据有一些限制条件,例如不能有缺失值,在两因素方差分析中各个处理要有相等的重复次数等;功能上也有一些不足,例如不能进行多重比较。而在方差分析方面SPSS的功能特别强大,很多输出结果已经超出了统计学原理的范围。 用SPSS检验数据分布的正态性 方差分析需要以下三个假设条件:(1)、在各个总体中因变量都服从正态分布;(2)、在各个总体中因变量的方差都相等;(3)、各个观测值之间是相互独立的。 在SPSS中我们很方便地对前两个条件进行假设检验。同方差性检验一般与方差分析一起进行,这一小节我们只讨论正态性的检验问题。 [例7.4] 检验生兴趣对考试成绩的影响的例子中各组数据的正态性。 在SPSS中输入数据(或打开数据文件),选择Analyze→Descriptive Statistics→Explore,在Explore对话框中将统计成绩作为因变量,兴趣作为分类变量(Fator),单击Plots按钮,选中“Histogram”复选框和“Normality plots with Test”,单击“Continue”按钮,在单击主对话框中的“OK”,可以得到分类别的描述统计信息。从数据的茎叶图、直方图和箱线图都可以对数据分布的正态性做出判断,由于这些内容前面已经做过讲解,这里就不再进一步说明了。 图7-2 用Expore过程进行正态性检验 top↑

SPSS教程-多因素方差分析

多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。 表5-7 不同温度与不同湿度粘虫发育历期表 数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。 1)准备分析数据 在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。

图5-6 数据输入格式 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。 图5-7 多因素方差分析窗口 3)设置分析变量 设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。 设置因素变量:在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量。由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。

23. 协方差分析

23. 协方差分析 一、基本原理 1. 基本思想 在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。 协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。 当有一个协变量时,称为一元协方差分析,当有两个或两个以上

的协变量时,称为多元协方差分析。 2. 协方差分析需要满足的条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差; (2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设; (3) 自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除; (4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 二、协方差理论 1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即 ()ij i ij ij y u t x x βε=++-+ (1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。 用协变量进行修正,得到修正后的y ij (adj)为 (adj)()ij ij ij i ij y y x x u t βε=--=++

spss 多因素方差分析例子

作业8:多因素方差分析 1,data0806-height是从三个样方中测量的八种草的高度,问高度在三个取样地点,以及八种草之间有无差异?具体怎么差异的? 打开spss软件,打开data0806-height数据,点击Analyze->General Linear Model->Univariate 打开: 把plot和species送入Fixed Factor(s),把height送入Dependent Variable,点击Model 打开:

选择Full factorial,Type III Sum of squares,Include intercept in model(即全部默认选项),点击Continue回到Univariate主对话框,对其他选项卡不做任何选择, 结果输出:

因无法计算MM e rror,即无法分开MM intercept和MM error,无法检测interaction的影响,无法进行方差分析, 重新Analyze->General Linear Model->Univariate打开: 选择好Dependent Variable和Fixed Factor(s),点击Model打开: 点击Custom,把主效应变量species和plot送入Model框,点击Continue回到Univariate主对话框,点击Plots:

Univariate对话框,点击Options:

把OVERALL,species, plot送入Display Means for框,选择Compare main effects,Bonferroni,点击Continue回到Univariate对话框, 输出结果: 可以看到:SS species=33.165,df species=7,MS species=4.738;SS plot=33.165,df plot=7,MS plot=4.738;SS error=21.472,df error=14,MS error=1.534; Fspecies=3.089,p=0.034<0.05;Fplot=12.130,p=0.005<0.01; 所以故认为在5%的置信水平上,不同样地,不同物种之间的草高度是存在差异的。

协方差分析理论与案例

协方差分析理论与案例 假设我们有N 个个体的K 个属性在T 个不同时期的样本观测值,用it y ,it x ,…,N,t=1,…,T,k=1,…,K 表示。一般假定y 的观测值是某随机实验的结果,该实验结果在属性向量x 和参数向量θ下的条件概率分布为(,)f y x θ。使用面板数据的最终目标之一就是利用获取的信息对参数θ进行统计推断,譬如常假设假定的y 是关于x 的线性函数的简单模型。协方差分析检验是识别样本波动源时广泛采用的方法。 方差分析:常指一类特殊的线性假设,这类假设假定随机变量y 的期望值仅与所考察个体所属的类(该类由一个或多个因素决定)有关,但不包括与回归有关的检验。而协方差分析模型具有混合特征,既像回归模型一样包含真正的外生变量,同时又像通常的方差一样允许每个个体的真实关系依赖个体所属的类。 常用来分析定量因素和定性因素影响的线性模型为: *,1,,,1,,it it it it it y x u i N t T αβ'=++=???=??? 从两个方面对回归系数估计量进行检验:首先,回归斜率系数的同质性;其 次,回归截距系数的同质性。检验过程主要有三步: (1) 检验各个个体在不同时期的斜率和截距是否都相等; (2) 检验(各个体或各时期的)回归斜率(向量)是否都相等; (3) 检验各回归截距是否都相等。 显然,如果接受完全同同质性假设(1),则检验步骤中止。但如果拒绝了完全同质性性假设,则(2)将确定回归斜率是否相同。如果没有拒绝斜率系数的同质性假设,则(3)确定回归截距是否相等。(1)是从(2)、(3)分离出来的。 基本思想:在作两组或多组均数1y ,2y ,…,k y 的假设检验前,用线性回归分析方法找出协变量X 与各组Y 之间的数量关系,求得在假定X 相等时修定均数1y ',2y ',…,k y '然后用方差分析比较修正均数间的差别,这就是协方差分析的基本思想。 协方差分析的应用条件:⑴要求各组资料都来自正态总体,且各组的方差相等;(t 检验或方差分析的条件)⑵各组的总体回归系数i β相等,且都不等于0(回归方程检验)。因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用。 ⑴各比较组协变量X 与分析指标Y 存在线性关系(按直线回归分析方法进行判断)。 ⑵各比较组的总体回归系数i β相等,即各直线平行(绘出回归直线,看是否

SPSS学习系列23. 协方差分析

23. 协方差分析 (一)原理 一、基本思想 在实际问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确的结论。这种影响的变量称为协变量(一般是连续变量)。 例如,研究3种不同的教学方法的教学效果的好坏。检查教学效果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们自身知识基础的影响,在考察的时候必须排除这种影响。 协方差分析将那些难以控制的随机变量作为协变量,在分析中将其排除,然后再分析控制变量对于观察变量的影响,从而实现对控制变量效果的准确评价。 协方差分析要求协变量应是连续数值型,多个协变量间互相独立,且与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变量(控制变量),又包含了定量变量(协变量)。 协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分析,是一种把直线回归或多元线性回归与方差分析结合起来的方法,其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的回归直线基本平行。 当有一个协变量时,称为一元协方差分析,当有两个或两个以上

的协变量时,称为多元协方差分析。 二、协方差分析需要满足的条件 (1)自变量是分类变量,协变量是定距变量,因变量是连续变量;对连续变量或定距变量的协变量的测量不能有误差; (2)协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违背这一假设;协变量的回归系数(即各回归线的斜率)是相同的,且不等于0,即各组的回归线是非水平的平行线。否则,就有可能犯第一类错误,即错误地接受虚无假设; (3)自变量与协变量相互独立,若协方差受自变量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除; (4)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 三、基本理论 1. 观测值=均值+分组变量影响+协变量影响+随机误差. 即 ()ij i ij ij y u t x x βε=++-+(1) 其中,X 为所有协变量的平均值。 注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分析中需要分离出来。 用协变量进行修正,得到修正后的y ij (adj)为 (adj)()ij ij ij i ij y y x x u t βε=--=++ 就可以对y ij (adj)做方差分析了。关键问题是求出回归系数β.

协方差分析

协方差分析 某城市教育局在一次对全市初中一年级至高中三年级学生的调查研究中想要考察身心发展对学习成绩的影响,研究者手机了各学校初一年级至高三年级学生的学业成绩以及相关身心发展量表得分,在分析时以学生所在年级来代表年龄差异,但是由于男同学与女同学的身心发展存在差异,因此需要在结果中排除性别因素,然而无法在收集数据时只收集男同学的数据或收集女同学的数据,那么该如何排除性别因素对结果的影响呢? 在实验设计中,考虑到实际的实验情形,无法一一排除某些会影响实验结果的无关变量(干扰变量),为了排除这些不能在实验处理中所操作的变量,而其结果又会影响因变量,可以通过“统计控制”的方法来弥补实验控制的不足,为了提高实验研究的内在效率,必须将可能干扰实验结果的无关变量加以控制,不致产生严重的系统性误差。控制系统误差的方法有很多,例如以随机的方式将被试分配至不同群体;将系统误差加入实验设计,使其变成一个自变量;尽可能控制可控制的系统误差如光纤亮度、噪音等。 实验研究的优点众所周知,即其严密的逻辑性以及可以良好的控制误差,但是让一个标准的实验设计走出实验室,在社会科学领域实施通常比较困难。因此在社会科学领域中经常实施的是准实验设计,在准实验设计中无法使用实验控制法来完全控制无关的干扰变量,故经常增加实验内在效度的方法——统计控制法,最常用的便是协方差分析(analysis of covariance,ANCOV A)。 顾名思义,协方差分析是方差分析的一种,它也包括自变量与因变量,同方差分析,因变量为连续变量且需要满足方差分析关于因变量的假设条件,自变量为分类变量。不同的是,并不是实验所关注的自变量却为研究者进行控制的一类变量被加入分析,它们被称为“协变量”(covariate),要注意,协变量是连续变量。 1.协方差分析的假设 协方差分析的基本假设与方差分析相同,包括变量的正态性、观测值独立、方差齐性等,此外还有三个重要的假设: 1)因变量与协方差之间直线关系; 2)所测量的协变量不应有误差,如果选用的是多项的量表,应有高的内部一致性信度或重 测信度,α系数最好大于0.80。这一假设若被违反会造成犯一类错误的概率上升,降低统计检验力。 3)“组内回归系数同质性”(homogeneity of with in rgression),各实验处理组中一举 协变量(X)预测因变量(Y)的回归线的回归系数要相等,即斜率相等,各条回归线平行。如果斜率不等则不宜直接进行协方差分析。 2.协方差分析的方差分解 方差分析的原理是将因变量的总方差分解成自变量效果(组间)与误差效果(组内)两个部分,再进行F检验。协方差使用的也是这样的方差分析思路,将因变量的总方差先行分割为协变量可解释部分与不可解释部分,不可解释的部分再由方差分析原理进行拆解。协方差分析的方差拆解如下: 3.协方差分析的步骤 协方差分析结合了回归分析与方差分析的方法,计算方法比较复杂,由于涉及回归分析的基本思路,因此一下内容也许需要在阅读了本章第六部分“一元线性回归分析”后理解得更加透彻。 以单因素协方差分析为例说明协方差分析的步骤: 1)协方差分析的准备 (B:组间;W:组内;T:总和;n:组内样本容量;k:组间容量;x:协变量;y:因变量)

第一节方差分析原理.doc

第一节方差分析原理 一、方差分析基本思想 方差分析( analysis of variance ,或缩写 ANOVA )又称变异数分析,是一种应用非常广 泛的统计方法。其主要功能是检验两个或多个样本平均数的差异是否有统计学意义,用以推断它们的总体均值是否相同。它是真正用来进行上述“多组比较”问题的正确方法,从这个意 义上说,它可看成是t 检验等“两组比较法”的推广。理解方差分析的原理,主要在于其基本思想,而不在于数学推导。 以单因素完全随机化实验设计为例(这是最简单的多组实验设计)介绍方差分析的原理。注意下面列出的该种设计的数学模式,假设有 k 个处理,每个处理下有n 个被试,一共有nk 个被试。 K 个处理下的数据构成比较中的k 个组或 k 个样本。 理T 1 T 2 ?T j ?T k X 11 X 12 ?X 1j ?X 1k X 21 X 22 ?X 2j ?X 2k 各?????? 数据X i1 X i2 ?X ij ?X ik ?????? X n1 X n2 ?X nj ?X nk 不失一般地,其对应的图示如下:

根据测量学中的真分数理论,观测值等于真值和误差之和;据此,对照上面的数据可得到下面的数学模型: 其中: X ij 指第 j 个处理下的第 i 个被试的实验数据; μ 指总体均值;在图中样本数据中,即红色线表示的总平均; μ 指第 j 个处理的均值; j τ 称为第 j 个处理的效应;通常,τj=μj–μ,也即各组均值偏离总平均的离差; j ε ij 为随机误差( idd 表示误差独立同分布);在该模型中,误差就是各组中数据偏离 其组均值的离差。因为根据单因素完全随机化设计的特点,同组中的被试,其各方面条件都相同,接受的处理也相同,其观测值间的差异只能归结为随机误差。 首先对检验的零假设进行变换: 下面我们就需要构造一个统计量使得它在Ho"下无未知量且有精确的分布,以进行假设2 检验。由于τj是每个处理的平均数与总平均之差,所以我们考虑从数据的离均差的平方 入手来构造统计量: 对每个观测数据: 即:任意一个数据与总平均数的离差= 该数与所在组平均数的离差+ 所在组的平均数与总平均数的离差。 我们针对第j 组中每个数据的上述分解式的平方求和得:

spss相关分析案例多因素方差分析

本次实验采用2005年东部、中部和西部各地区省份城镇居民月平均消费类型划分的数据(课本139页),将东部、中部和西部看作三个不同总体,31个数据分别来自于这三个总体。本人对这三个不同地区的城镇居民月平均消费水平进行比较,并选取人均粮食支出、副食支出、烟酒及饮料支出、其他副食支出、衣着支出、日用杂品支出、水电燃料支出和其他非商品支出八个指标来衡量城镇居民月平均消费情况。 在进行比较分析之前,首先对个数据是否服从多元正态分布进行检验,输出结果为: 表一 如表一,因为该例中样本数n=31<2000,所以此处选用Shapiro-Wilk统计量。由正态性检验结果的sig.值可以看到,人均粮食支出、烟酒及饮料支出、其他副食支出、水电燃料支出和其他非商品支出均明显不遵从正态分布(Sig.值小于,拒绝服从正态分布的原假设),因此,在下面分析中,只对人均副食支出、衣着支出和日用杂品支出三项指标进行比较,并认为这三个变量组成的向量都遵从正态

分布,并对城镇居民月平均消费状况做出近似的度量。另外,正态性的检验还可以通过Q-Q图来实现,此时应判别数据点是否与已知直线拟合得好。如果数据点均落在直线附近,说明拟合得好,服从正态分布,反之,不服从。具体情况这里不再赘述。 下面进行多因素方差分析: 一、多变量检验 表二 由地区一栏的(即第二栏)所列几个统计量的Sig.值可以看到,无论从那个统计量来看,三个地区的城镇居民月平均消费水平都是有显著差别的(Sig.值小于,拒绝地区取值不同,对Y,即城镇居民月平均消费水平的取值没有显著影响的原假设)。 二、主体间效应检验 表三

如表三,可以看到三个指标地区一栏的(即第三栏)Sig.值分别为、、,说明三个地区在人均衣着支出指标上没有明显的差别(Sig.值大于,不拒绝地区取值不同,对指标的取值没有显著影响的原假设),反之,而在人均副食支出和日用杂品支出指标上有显著差别。 三、多重比较 表四 Contrast Results (K Matrix) 地区 Simple Contrast a Dependent Variable 人均副食支出(元/人) 人均日用杂品支出(元 /人) 人均衣着支出(元/人) Level 1 vs. Level 3 Contrast Estimate Hypothesized Value 0 0 0 Difference (Estimate - Hypothesized) Std. Error Sig. .001 .036 .517 95% Confidence Interval for Difference Lower Bound .173 Upper Bound Level 2 vs. Level 3 Contrast Estimate Hypothesized Value 0 0 0 Difference (Estimate - Hypothesized) Std. Error Sig. .668 .343 .638 95% Confidence Interval for Difference Lower Bound Upper Bound

SPSS教程02(带图)-协方差分析-chenxy

简单教程0 2 1.相关配套数据已经上传百度文库: 2.配套软件SPSS 17.0 已经上传百度文库; 百度文库搜索“SPSS简单教程配套数据及软件_chenxy” 百度云盘链接; 3 协方差分析 (2) 3.1 单因素协方差分析 (2) 3.2 双因素协方差分析 (4) 3.2.1 无交互作用的协方差分析 (4) 3.2.2 有交互作用的协方差分析................................................... 错误!未定义书签。

3 协方差分析 课程内容: 协方差分析 这种不是在试验中控制某个因素,而是在试验后对该因素的影响进行估计,并对试验指标的值作出调整的方法称为统计控制 以统计控制为目的,利用线性回归消除混杂因素的影响后再进行的方差分析,称为协方差分析; 所需要统计控制的一个或多个因素,称为协变量; 1.自变量是分类变量,协变量是定距变量,因变量是连续变量; 2.对连续变量或定距变量的协变量的测量不能有误差; 3.协变量与因变量之间的关系是线性关系,可以用协变量和因变量的散点图来检验是否违 背这一假设; 4.协变量的回归系数是相同的。在分类变量形成的各组中,协变量的回归系数(即各回归 线的斜率)必须是相等的,即各组的回归线是平行线。如果违背了这一假设,就有可能犯第一类错误,即错误地接受虚无假设。 5.自变量与协变量是直角关系,即互不相关,它们之间没有交互作用。如果协方差受自变 量的影响,那么协方差分析在检验自变量的效应之前对因变量所作的控制调整将是偏倚的,自变量对因变量的间接效应就会被排除。 分类变量:以班级将学生分类班级即为分类变量 定距变量:刻度级变量定距定比 连续变量:可以用小数表示的变量 协方差分析:将回归分析与方差分析相结合的一种分析方法 3.1 单因素协方差分析 判断是否需要做协方差分析 1)对自变量做单因素方差分析 2)对自变量和因变量做相关分析 方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述条件后才能应用,否则不宜适用 操作步骤1 (数据见文件20151022_单因素协方差分析) 1.在Variable View 窗口定义变量 肥料(nominal 并设定标签值1~3 肥料A~C ) 第一年产量(Scale) 第二年产量(Scale) (判断需不需要做协方差分析) 操作步骤1 : 先对第一年产量为协变量进行单因素协方差分析: Analyze -> Compare Means -> one-way ANOVA Continue -> OK 结果如下: 由表可知:F=6.340 sig.(P值)=0.007 < 0.05 表明拒绝原假设H0,有95%的把握认为第一年的产量是有显著性差异的 操作步骤2 : Analyze ->Correlate -> Bivariate 进入Bivariate Correlations 窗口勾选Pearson

方差分析与协方差分析

方差分析 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。 方差分析的作用 一个复杂的事物,其中往往有许多因素互相制约又互相依存。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等。方差分析是在可比较的数组中,把数据间的总的“变差”按各指定的变差来源进行分解的一种技术。对变差的度量,采用离差平方和。方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和,这是一个很重要的思想。 经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。 方差分析的分类及举例

一、单因素方差分析 (一)单因素方差分析概念理解步骤 是用来研究一个控制变量的不同水平是否对观测变量产生 了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。 例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。 单因素方差分析的第一步是明确观测变量和控制变量。例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。 单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=S SA+SSE。 单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。 (二)单因素方差分析原理总结 容易理解:在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起

相关文档
最新文档