课设方差分析的MATLAB实现

课设方差分析的MATLAB实现
课设方差分析的MATLAB实现

东北大学秦皇岛分校

数学软件认识实习报告

方差分析的MATLAB实现

学院数学与统计学院

专业数学与应用数学

学号0

姓名XXX

指导教师林秋张子选

成绩

教师评语:

指导教师签字:

2013年01月07日

1 绪论

方差分析是工农业生产和科学研究中对实验数据或其他观察数据进行统计分析和检验的一种实用、有效的数理统计方法。

方差分析(Analysis of variance,简称ANOV A):根据不同需要把某变量方差分解为不同的部分,比较它们之间的大小并用F检验进行显著性检验的方法。又称“变异数分析”或“F检验”,是用于两个及两个以上样本均数差别的显著性检验。F值是两个均方的比值(效应项/误差项),不可能出现负值。F值越大(与给定显著水平的标准F值相比较)说明处理之间效果(差异)越明显,误差项越小说明试验精度越高。

一个复杂的事物往往受到多种因素的影响。例如,一件产品的质量就受到机器、原料、温度等因素的影响;同样,一种农作物的产量也会受到种子、肥料、土质、水分等因素的影响。如何通过实验数据,分析出各个因素的影响,从而抓住事物的主要矛盾,这就是方差分析所要解决的主要问题。本文主要就单因素方差分析和双因素方差分析进行讨论,对于两个以上的因素的方差分析,其解决问题的基本思想与此类似。

方差分析为资料分析中常见的统计模型,主要为探讨连续型(Continuous)资料型态之因变量(Dependent variable)与类别型资料型态之自变量(Independent variable)的关系,当自变量的因子中包含等于或超过三个类别情况下,检定其各类别间平均数是否相等的统计模式,广义上可将T检定中变异数相等(Equality of variance)的合并T检定(Pooled T-test)视为是方差分析的一种,基于T检定为分析两组平均数是否相等,并且采用相同的计算概念,而实际上当方差分析套用在合并T检定的分析上时,产生的F值则会等于T 检定的平方项。

方差分析依靠F-分布为机率分布的依据,利用平方和(Sum of square)与自由度(Degree of freedom)所计算的组间与组内均方(Mean of square)估计出F值,若有显著差异则考量进行事后比较或称多重比较(Multiple comparison),较常见的为Scheffé's method、Tukey-Kramer method与Bonferroni correction,用于探讨其各组之间的差异为何。

在方差分析的基本运算概念下,依照所感兴趣的因子数量而可分为单因子方差分析、双因子方差分析、多因子方差分析三大类,依照因子的特性不同而有三种型态,固定效应方差分析(fix-effect analysis of variance)、随机效应方差分析(random-effect analysis of variance)与混合效应方差分析(Mixed-effect analysis of variance),然而第三种型态在后期发展上被认为是Mixed model的分支,关于更进一步的探讨可参考Mixed model的部份。

方差分析优于两组比较的T检定之处,在于后者会导致多重比较(multiple comparisons)

的问题而致使第一型错误(Type one error)的机会增高。因此比较多组平均数是否有差异则是方差分析的主要命题。

在统计学中,方差分析(ANOV A)是一系列统计模型及其相关的过程总称,其中某一变量的方差可以分解为归属于不同变量来源的部分。其中最简单的方式中,方差分析的统计测试能够说明几组数据的平均值是否相等,因此得到两组的t测试。在做多组双变量t测试的时候,错误的几率会越来越大,特别是I型错误。因此,方差分析只在二到四组平均值的时候比较有效。

2 ANOV A的模式型态

方差分析分为三种型态:

固定效应模式(Fixed-effects models)

用于方差分析模型中所考虑的因子为固定的情况,换言之,其所感兴趣的因子是来自于特定的范围,例如要比较五种不同的汽车销售量的差异,感兴趣的因子为五种不同的汽车,反应变量为销售量,该命题即限定了特定范围,因此模型的推论结果也将全部着眼在五种汽车的销售差异上,故此种状况下的因子便称为固定效应。

随机效应模式(Random-effects models)

不同于固定效应模式中的因子特定性,在随机效应中所考量的因子是来自于所有可能得母群体中的一组样本,因子方差分析所推论的并非着眼在所选定的因子上,而是推论到因子背后的母群体,例如,借由一间拥有全部车厂种类的二手车公司,从所有车厂中随机挑选5种车厂品牌,用于比较其销售量的差异,最后推论到这间二手公司的销售状况。因此在随机效应模型下,研究者所关心的并非局限在所选定的因子上,而是希望借由这些因子推论背后的母群体特征。

混合效应模式(Mixed-effects models)

此种混合效应绝对不会出现在单因子方差分析中,当双因子或多因子方差分析同时存在固定效应与随机效应时,此种模型便是典型的混合型模式。

3 ANOV A的模式假设

方差分析之统计分析假设通常会依照各种模式型态不同而有差异,但广义而言,方差分析一共有三大前提假设[1]:

1.各组样本背后所隐含的族群分布必须为常态分布或者是逼近常态分布。

方差分析是用于科学研究的一种重要的统计方法,在实验研究中,我们往往会涉及不同的实验因素,为了判断不同的因素是否对实验结果有差异,我们需要做方差分析。因为实验结果的差异可能是不同的实验因素造成的,或者是外部的环境,随机误差造成的因而方差分析是检验试验处理间是否存在真实差异的有效手段。本节主要介绍利用MATLAB统计工具箱如实现方差分析的操作,包括单因素,双因素和多因素的方差分析。下面具体介绍这些内容。

4.1 单因素方差分析

当实验仅有一个因素,即单因素试验,我们仅需要研究单因素的不同水平是否对实验结果的差异有显著的影响,此时我们需要做单因素方差分析。

4.1.1单因素方差分析概念理解步骤

单因素方差分析是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。单因素方差分析的第一步是明确观测变量和控制变量。例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。

单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值得变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=SSA+SSE。单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。

4.1.2单因素方差分析原理及基本步骤

容易理解:在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平方和所占比例小,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。

1.提出原假设:H0——无差异;H1——有显著差异。

2.选择检验统计量:方差分析采用的检验统计量是F统计量,即F值检验。

3.计算检验统计量的观测值和概率P值:该步骤的目的就是计算检验统计量的观测值和相应的概率P值。

4.给定显著性水平,并做出决策。

4.1.3 用MATLAB做单因素方差分析例子

MATLB程序:

Score=[75 62 71 58 73;81 85 68 92 90;73 79 60 75 81];

P=anova1(Score)

图 4.1 正确运行

图 4.2 正确输出结果

4.2 双因素方差分析

上面讲解了单因素试验的方差分析问题,但在科研和实际生产中,常常需要同时研究两个以上因素对实验结果的影响情况。若同时研究两个因素对实验结果的影响,就要对两个实验因素进行方差分析。对于双因素方差分析,其基本思想和方法与单因素方差分析相似,前提条件仍然是要满足独立,方差具有齐性、正态。不同的是,在双因素试验中,有可能出现交互作用。按照是否进行重复试验,双因素方差分析又分为两种,即有重复和无重复,下面主要来介绍双因素重复试验的方差分析。

4.2.1 求解双因素方差分析的MATLAB工具

在试验设计中如果涉及两个实验因素,需要进行双因素的方差分析。MATLAB统计工具箱中还提供了函数anova2()用于双因素的方差分析。

图 4.3 方差分析表

其调用格式如下;

P=anova2(X,reps)

p=anova2(X,reps,’displayopt’)

[p,table]=anova2(...)

[p,table,stats]=anova2(...)

其中,双因素方差分析是一种两因素,多水平析因试验数据的统计分析方法。其目的在于确认来自不同组的数据是否具有相同的均值。

4.2.2 双因素方差分析例子[2]

双因素方差分析:

>>load popcorn

p=anova2(popcorn,3)

运行程序,输出如下(效果见图 4.5)popcorn =

5.5000 4.5000 3.5000

5.5000 4.5000 4.0000

6.0000 4.0000 3.0000

6.5000 5.0000 4.0000

7.0000 5.5000 5.0000

7.0000 5.0000 4.5000

p =

0.0000 0.0001 0.7462,

图 4.4 运行程序

图4.5双因素方差分析、

4.3 多因素方差分析

多因素方差分析可以用于确定根据多个因素划分的不同组数据的均值是否不同。如果它们不同,还可以进一步确定这种差异是由哪一个或几个因素引起的。

对涉及两个以上因素的试验需要进行多因素方差分析,在MATLAB中进行多因素方差分析的函数为anovan(),其调用格式为:

定各因素的分组情况,返回值p用于检验各因素的水平是否具有显著差异,向量p的大小为试验的因素数。

P=anaovan(x,group,’Param1’,val1,’Pram2’,val2,...):设置参数param1的值为val1,参数param2的值为val2,可以设置的多重比较的参数具体参考MATLA B的帮助文档。

[p,table]=anovan(...):参数table返回方差分析表。

[p,table,stats]=anovan(...):返回的结构体stats用于多重比较。

结论

假设检验和方差分析是数理统计计算中重要的内容,但由于他们在实际计算与应用中,经常会遇到一些复杂繁琐的计算,这往往是我们力所不能及的。面对这些难题,我们可以借助于MATLAB进行实现。

通过对假设检验以及方差分析问题的MATLAB求解,我们可以清晰的看到,对于假设检验和方差分析中一些复杂繁琐的数据计算问题,可以通过MATLAB简便直观的处理,给予我们学习和工作带来极大的方便。

参考文献

[1]薛定宇,陈阳泉.高等应用数学问题的MATLAB求解(第二版).清华大学出版社.

[2]张德丰等编著. MATLAB概率与数理统计分析. 机械工业出版社.

利用Matlab作方差分析

利用Matlab作方差分析 例1(单因素方差分析)一位教师想要检查3种不同的教学方法的效果,为此随机地选取水平相当的15位学生。把他们分为3组,每组5人,每一组用一种方法教学,一段时间以后,这位教师给15位学生进行统考,成绩见下表1。问这3种教学方法的效果有没有显著差异。表1 学生统考成绩表 Matlab中可用函数anova1(…)函数进行单因子方差分析。 调用格式:p=anova1(X) 含义:比较样本m×n的矩阵X中两列或多列数据的均值。其中,每一列表示一个具有m个相互独立测量的独立样本。 返回:它返回X中所有样本取自同一总体(或者取自均值相等的不同总体)的零假设成立的概率p。 解释:若p值接近0(接近程度有解释这自己设定),则认为零假设可疑并认为至少有一个样本均值与其它样本均值存在显著差异。 Matlab程序: Score=[75 62 71 58 73;81 85 68 92 90;73 79 60 75 81]’; P=anova1(Score) 输出结果:方差分析表和箱形图 ANOVA Table Source SS df MS F Prob>F Columns 2 Error 12 Total 14 由于p值小于,拒绝零假设,认为3种教学方法存在显著差异。

例2(双因素方差分析)为了考察4种不同燃料与3种不同型号的推进器对火箭射程(单位:海里)的影响,做了12次试验,得数据如表2所示。表2 燃料-推进器-射程数据表 在Matlab中利用函数 anova2函数进行双因素方差分析。 调用格式:p=anova2(X,reps) 含义:比较样本X中两列或两列以上和两行或两行以上数据的均值。不同列的数据代表因素A的变化,不同行的数据代表因素B的变化。若在每个行-列匹配点上有一个以上的观测量,则参数reps指示每个单元中观测量的个数。 返回:当 reps=1(默认值)时,anova2将两个p值返回到向量p中。 H0A:因素A的所有样本(X中的所有列样本)取自相同的总体; H0B:因素B的所有样本(X中的所有行样本)取自相同的总体。当reps>1时,anova2还返回第三个p值: H0AB:因素A与因素B没有交互效应。 解释:如果任意一个p值接近于0,则认为相关的零假设不成立。 Matlab程序:disp1=[ ; ; ; ]’; p=anova2(disp1,1) 输出结果:方差分析表ANOVA Table Source SS df MS F Prob>F Columns 3 Rows 2 Error 6 12 Total 11

方差分析matlab实现

方差分析matlab实现 一、单因素分析 单因素方差分析的命令为:p=anoval(x,group)) 数据x是一个向量,从第1个总体的样本到第r个总体的样本一次排序,group 是一个与x有相同长度的向量,表示x中的元素是如何分组的,可以用同一个整数代表同一个组也可以用相同的字符代表相同的一个组。 Anoval还给出了两幅图表:一个是标准的方差分析表;一个是x中各组的盒子图,如果盒子图的中心线差别很大,则对应的F值很大,相应的概率值(p值)也小。 零假设为各样本具有相同的均值,如果p值接近于零,则拒绝零假设。 例 1 设有三台机器, 用来生产规格相同的铝合金薄板,取样测量薄板的厚度精确至千分之一厘米. 得结果如下表所示. 表8-1A 铝合金板的厚度 这里, 试验的指标是薄板的厚度,机器为因素, 不同的三台机器就是这个因素的三个不同的水平. 如果假定除机器这一因素外, 材料的规格、操作人员的水平等其它条件都相同,这就是单因素试验. 试验的目的是为了考察各台机器所生产的薄板的厚度有无显著的差异, 即考察机器这一因素对厚度有无显著的影响. 如果厚度有显著差异, 就表明机器这一因素对厚度的影响是显著的。 该问题单因素方差分析调用程序如下: 解:chengxu6 x=[0.236 0.238 0.248 0.245 0.243 0.257 0.253 0.255 …

0.254 0.261 0.258 0.264 0.259 0.267 0.262]; group=[1 1 1 1 1 2 2 2 2 2 3 3 3 3 3]; p=anova1(x,group); x1=x(1:5);x2=x(6:10);x3=x(11:15); 判断效应值,得如下结果 ? Source SS df MS F Prob>F ? ------------------------------------------------------ ? Groups 0.00105 2 0.00053 32.92 1.34305e-005 ? Error 0.00019 12 0.00002 ? Total 0.00125 14 a =0.0113 0.0027 0.0087 a 为效应向量,显然对于此问题效应越小越好,所以第二台机器比较好。 例 某食品公司对一种食品设计了四种新包装. 为了考察哪种包装最受欢迎, 选了十个有近似相同销售量的商店作试验, 其中两种包装各指定两个商店销售, 另两种包装各指定三个商店销售. 在试验期中各商店的货架排放位置、空间都尽量一致, 营业员的促销方法也基本相同. 观察在一定时期的销售量, 数据如表7.1.1所示: 表7.1.1 销售量 在本例中, 我们要比较的是四种包装的销售量是否一致, 为此把包装类型看成是一个因子, 记为因子A , 它有四种不同的包装, 就看成是因子A 的四个水平, 记为4321,,,A A A A .一般将第i 种包装在第j 个商店的销售量记为 i ij m j i x ,,2,1;4,3,2,1,Λ== (在本例中,2,3,3,24321====m m m m ). 由于商店间的差异已被控制在最小的范围内, 因此一种包装在不同商店里

多元方差分析matlab程序

x=[1.7541 13.95 -0.4048 1.4666 0.013394 2.0081 24.02 0.2926 1.1369 0.006832 0.1431 13.29 -1.1024 0.0833 0.098995 0.7571 21.54 0.4785 0.7129 0.0183 0.0001 12.19 -0.1576 0.1084 0.076041 1.5481 16.86 0.0295 -0.2196 0.002411 0.1601 17.17 0.2114 -0.1427 0.126538 1.5111 16.34 0.1295 -0.3673 0.06839 1.1721 16.93 0.5895 -0.1423 0.081091 0.3351 14.31 1.5193 0.4275 0.040945 0.1051 13.18 -0.0401 -0.7828 0.000214 1.5481 15.1 0.181 -0.2239 0.028667 0.0001 11.58 -0.4348 0.0059 0.053359 0.3251 12.95 -1.1025 0.4149 0.134351 0.4581 32.38 -0.3326 -3.4022 0.002839 2.0681 1 3.96 -2.0022 2.0934 0.090616 1.7841 14.75 -1.7051 -1.4627 0.06561 1.0541 17.14 -0.3084 - 2.6986 0.002113 1.5511 1 2.82 -0.6163 3.8799 0.012266 1.2361 16.22 - 2.1802 1.3637 0.086214 2.2401 15.97 -1.4668 8.3393 0.005284 ] x =1.7541 13.9500 -0.4048 1.4666 0.0134 2.0081 24.0200 0.2926 1.1369 0.0068 0.1431 13.2900 -1.1024 0.0833 0.0990 0.7571 21.5400 0.4785 0.7129 0.0183 0.0001 12.1900 -0.1576 0.1084 0.0760 1.5481 16.8600 0.0295 -0.2196 0.0024 0.1601 17.1700 0.2114 -0.1427 0.1265 1.5111 16.3400 0.1295 -0.3673 0.0684 1.1721 16.9300 0.5895 -0.1423 0.0811 0.3351 14.3100 1.5193 0.4275 0.0409 0.1051 13.1800 -0.0401 -0.7828 0.0002 1.5481 15.1000 0.1810 -0.2239 0.0287 0.0001 11.5800 -0.4348 0.0059 0.0534 0.3251 12.9500 -1.1025 0.4149 0.1344 0.4581 32.3800 -0.3326 -3.4022 0.0028 2.0681 1 3.9600 -2.0022 2.0934 0.0906 1.7841 14.7500 -1.7051 -1.4627 0.0656 1.0541 17.1400 -0.3084 - 2.6986 0.0021 1.5511 1 2.8200 -0.6163 3.8799 0.0123 1.2361 16.2200 - 2.1802 1.3637 0.0862 2.2401 15.9700 -1.4668 8.3393 0.0053 >> x'

origin方差分析

实验六 《实验数据的方差分析》 一、实验目的 1. 了解方差分析原理。 2. 掌握实验数据方差分析的计算机操作方法。 3. 分析运算结果,对实验结果做出正确解释,以掌握方差分析的运用。 二、方差分析简介 设A 因素有n 个水平,分别记为A 1、A 2、…、A n ,每个水平重复进行m 次试验,总共进行了n ×m 次试验,结果记为x ij (i=1,2,…,n; j= 1,2,…,m)。 则总均值: 11 1n m ij i j x x n m ===×∑∑ 某水平实验结果的平均值: 1 1m i i j j x x m ==∑ 总偏差平方和Q T : 2 2 11112 2 11 1 ()[()() ()() n m n m T ij ij i i i j i j n m n ij i i i j i E A Q x x x x x x x m x x Q Q ========?=?+?=?+?=+∑∑∑∑∑∑∑]x 上式中Q E 为组内偏差平方和,即每个水平下各实验结果与该水平平均值之差的平方和。 Q E 反映误差的大小,故又称为误差平方和。Q A 为组间偏差平方和,它反映水平的改变对试验结果的影响。 Q A 事实上反映了因素对试验结果的影响,故又称为因素偏差平方和。 各偏差平方和的自由度(变量的总个数):

组内偏差平方和的自由度: (1E f n m n n m )=×?=? 组间偏差平方和的自由度: 1A f n =? 总偏差平方和的自由度: 1T f n m =×? 方差与偏差平方和的关系为: 2 Q S f = 组内方差: 2E E E E Q Q S f n m n ==×? 组间方差: 21 A A A A Q Q S f n = =? 总方差: 21 T T T T Q Q S f n m = =×? 方差分析指导思想就是根据偏差平方和的加和性,总偏差平方和可以分解成为组间偏差平方和与组内偏差平方和,前者反映了因素对试验结果的影响,后者反映了误差对试验结果的影响。根据数学原理对组间偏差平方和与组内偏差平方和进行合理的比较,就能分析出因素对试验结果的影响程度、性质。 令: 221(1) A A E E Q S n F Q S n m ?==? 1. F 值应接近于1。如果F 比1大得多,表明组间方差比组内方差大得多。 2. 如果F 0.01(f A ,f E )>F ≥ F 0.05(f A ,f E ) ,由于F ≥ F 0.05(f A ,f E ) 出现的概率只有5

利用Matlab作方差分析

利用Matlab作方差分析 例1 (单因素方差分析)一位教师想要检查3种不同的教学方法的效果,为此随机地选取水平相当的15位学生。把他们分为3组,每组5人,每一组用一种方法教学,一段时间以后,这位教师给15位学生进行统考,成绩见下表1。问这3种教学方法的效果有没有 显著差异。表1学生统考成绩表 Matlab中可用函数anova1(??函数进行单因子方差分析。 调用格式:p=anova1(X)含义:比较样本m X n的矩阵X中两列或多列数据的均值。 其中,每一列表示一个具有m个相互独立测量的独立样本。 返回:它返回X中所有样本取自同一总体(或者取自均值相等的不同总体)的零假设成立的概率p。 解释:若p值接近0 (接近程度有解释这自己设定),则认为零假设可疑并认为至少 有一个样本均值与其它样本均值存在显著差异。Matlab程序:Score=[75 62 71 58 73;81 85 68 92 90;73 79 60 75 81] ' ; P=a no va输出结果:方差分析表和箱形图ANOVA Table Source SS df MS F Prob>F Columns 604.9333 2 302.4667 4.2561 0.040088 Error 852.8 12 71.0667 Total 1457.7333 14 由于p值小于0.05,拒绝零假设,认为3种教学方法存在显著差异。

例2 (双因素方差分析) 为了考察4种不同燃料与3种不同型号的推进器对火箭射程 (单位:海里)的影响,做了 12次试验,得数据如表 2所示。表2燃料-推进器-射程数据 表 在Matlab 中利用函数anova2函数进行双因素方差分析。 调用格式:p=anova2(X,reps ) 含义:比较样本X 中两列或两列以上和两行或两行以上 数据的均值。不同列的数据代表因素 A 的变化,不同行的数据代表因素 B 的变化。若在每 个行-列匹配点上有一个以上的观测量,则参数 reps 指示每个单元中观测量的个数。 返回:当reps=1 (默认值)时,anova2将两个p 值返回到向量p 中。 HOA : 因素A 的所有样本(X 中的所有列样本)取自相同的总体; H0B :因素B 的所有样本 (X 中的所有行样本)取自相同的总体。 当reps>1时,anova2还返回第三个p 值: H0AB :因素A 与因素B 没有交互效应。 解释:如果任意一个p 值接近于0,则认为相关的零假设不成立。 Matlab 程序: disp 仁[58.2 56.2 65.3;49.1 54.1 51.6;60.1 70.9 39.2;75.8 58.2 48.7] ;p=a no va2(disp‘ 输出结果:方差分析表 ANOVA Table Source SS df MS F Prob>F Colu mns 157.59 3 52.53 0.43059 0.73875 Rows 223.8467 2 111.9233 0.91743 0.44912 Error 731.98 6 12 1.9967 Total 1113.4167 1 1 由于燃料和推

基于MATLAB的方差分析

基于MATLAB 的方差分析 (重庆科技学院 数理学院) 摘要:方差分析是重要的,应用广泛的实验数据统计分析方法,其实质是检验多个变量均 值的一致性。运用MATLAB 软件进行单因子及双因子方差分析。 关键字:方差分析,MATLAB,单因子,双因子。 1 引言 方差分析是分析试验(或观测)数据的一种统计方法。在工农业生产和科学研究中, 经常要分析各种因素及因素之间的交互作用对研究对象某些指标值的影响。在方差分析中,把试验数据的总波动(总变差或总方差)分解为由所考虑因素引起的波动(各因素的变差)和随机因素引起的波动(误差的变差),然后通过分析比较这些变差来推断哪些因素对所考察指标的影响是显著的,哪些是不显著的。 2 单因子方差分析 某个可控制因素A 对结果的影响大小可通过如下实验来间接地反映,在其它所有可控制因素都保持不变的情况下,只让因素A 变化,并观测其结果的变化,这种试验称为“单因素试验”。因素A 的变化严格控制在几个不同的状态或等级上进行变化,因素A 的每个状态或等级成为因素A 的一个水平。若因素A 设定了s 个水平,则分别记为 A 1,A 2,…,A s 。 数学模型: 2(,),1,2,...,.i i X N i s μσ= (1) 显著性影响问题转化为因素A 不同水平下各随机变量总体的均值是否相等问题,即检验假设 012:s H μμμ== =是否成立 (2) 记号 ij x : 不同水平下的试验结果,i=1,2,…,s ;j=1,2,…,n i ; n=n 1+n 2+…+n s :试验总数; 总平均:11 1i n s ij i j x x n ===∑∑;

matlab与统计回归分析 (1)

一Matlab作方差分析 方差分析是分析试验(或观测)数据的一种统计方法。在工农业生产和科学研究中,经常要分析各种因素及因素之间的交互作用对研究对象某些指标值的影响。在方差分析中,把试验数据的总波动(总变差或总方差)分解为由所考虑因素引起的波动(各因素的变差)和随机因素引起的波动(误差的变差),然后通过分析比较这些变差来推断哪些因素对所考察指标的影响是显著的,哪些是不显著的。 【例1】(单因素方差分析)一位教师想要检查3种不同的教学方法的效果,为此随机地选取水平相当的15位学生。把他们分为3组,每组5人,每一组用一种方法教学,一段时间以后,这位教师给15位学生进行统考,成绩见下表1。问这3种教学方法的效果有没有显著差异。 表1 学生统考成绩表 方法成绩 甲75 62 71 58 73 乙71 85 68 92 90 丙73 79 60 75 81 Matlab中可用函数anova1(…)函数进行单因子方差分析。 调用格式:p=anova1(X) 含义:比较样本m×n的矩阵X中两列或多列数据的均值。其中,每一列表示一个具有m 个相互独立测量的独立样本。 返回:它返回X中所有样本取自同一总体(或者取自均值相等的不同总体)的零假设成立的概率p。

解释:若p值接近0(接近程度有解释这自己设定),则认为零假设可疑并认为至少有一个样本均值与其它样本均值存在显著差异。 Matlab程序: Score=[75 62 71 58 73;81 85 68 92 90;73 79 60 75 81]’; P=anova1(Score) 输出结果:方差分析表和箱形图 ANOVA Table Source SS df MS F Prob>F Columns 604.9333 2 302.4667 4.2561 0.040088 Error 852.8 12 71.0667 Total 1457.7333 14 由于p值小于0.05,拒绝零假设,认为3种教学方法存在显著差异。 例2(双因素方差分析)为了考察4种不同燃料与3种不同型号的推进器对火箭射程(单位:海里)的影响,做了12次试验,得数据如表2所示。 表2 燃料-推进器-射程数据表 推进器1 推进器2 推进器3 燃料1 58.2 56.2 65.3 燃料2 49.1 54.1 51.6 燃料3 60.1 70.9 39.2 燃料4 75.8 58.2 48.7 在Matlab中利用函数anova2函数进行双因素方差分析。 调用格式:p=anova2(X,reps)

方差分析习题及matlab程序

习题四作业 1、一个年级有3个小班,他们进行了一次数学考试,现从3个小班中分别随机抽取12,15,13个学生记录其成绩如下: I:73,66,89,60,82,45,43,93,83,36,73,77; II:88,77,78,31,48,78,91,62,51,76,85,96,74,80,56; III:68,41,79,59,56,68,91,53,71,79,71,15,87. α下,检验各班的平均分数设各班成绩服从正态分布且方差相等,试在显著性水平05 .0 = 有无显著性差异. x=[73,66,89,60,82,45,43,93,83,36,73,77,88,77,78,31,48,78,91,62,51,76,85,96,74,80,56,6 8,41,79,59,56,68,91,53,71,79,71,15,87]; group=[ones(1,12),2*ones(1,15),3*ones(1,13)]; [p,table,stat]=anova1(x,group) p = 0.63 table = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Groups' [ 335.48] [ 2.00] [167.74] [0.46] [ 0.63] 'Error' [13429.50] [37.00] [362.96] [] [] 'Total' [13764.98] [39.00] [] [] [] stat = gnames: {3x1 cell} n: [12.00 15.00 13.00] source: 'anova1' means: [68.33 71.40 64.46] df: 37.00 s: 19.05 ?Source SS df MS F Prob>F ?----------------------------------------------- ?Groups 335.5 2 167.739 0.46 0.6335 ?Error 13429.5 37 362.959 ?Total 13765 39

数学建模算法方差分析

-134- 第十一章 方差分析 我们已经作过两个总体均值的假设检验,如两台机床生产的零件尺寸是否相等,病人和正常人的某个生理指标是否一样。如果把这类问题推广一下,要检验两个以上总体的均值彼此是否相等,仍然用以前介绍的方法是很难做到的。而你在实际生产和生活中可以举出许多这样的问题:从用几种不同工艺制成的灯泡中,各抽取了若干个测量其寿命,要推断这几种工艺制成的灯泡寿命是否有显著差异;用几种化肥和几个小麦品种在若干块试验田里种植小麦,要推断不同的化肥和品种对产量有无显著影响。 可以看到,为了使生产过程稳定,达到优质、高产,需要对影响产品质量的因素进行分析,找出有显著影响的那些因素,除了从机理方面进行研究外,常常要作许多试验,对结果作分析、比较,寻求规律。用数理统计分析试验结果、鉴别各因素对结果影响程度的方法称为方差分析(Analysis Of Variance ),记作ANOV A 。 人们关心的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子,因素所处的状态称为水平。上面提到的灯泡寿命问题是单因素试验,小麦产量问题是双因素试验。处理这些试验结果的统计方法就称为单因素方差分析和双因素方差分析。 §1 单因素方差分析 只考虑一个因素A 对所关心的指标的影响,A 取几个水平,在每个水平上作若干个试验,试验过程中除A 外其它影响指标的因素都保持不变(只有随机因素存在),我们的任务是从试验结果推断,因素A 对指标有无显著影响,即当A 取不同水平时指标有无显著差别。 A 取某个水平下的指标视为随机变量,判断A 取不同水平时指标有无显著差别,相当于检验若干总体的均值是否相等。 1.1 数学模型 设A 取r 个水平r A A A ,,,21 ,在水平i A 下总体i x 服从正态分布),(2σμi N , r i ,,1 =,这里2,σμi 未知,i μ可以互不相同,但假定i x 有相同的方差。又设在每 个水平i A 下都作了n 次独立试验,即从中抽取容量为n 的样本,记作n j x ji ,,1, =, ji x 服从),(2σμi N ,n j r i ,,1,,,1 ==且相互独立。将这些数据列成下表(单因 素试验数据表)的形式: 1A 2A … r A 1 11x 12x … r x 1 2 21x 22x … r x 2 n 1n x 2n x … nr x 将第i 列称为第i 组数据。判断A 的r 个水平对指标有无显著影响,相当于要作以 下的假设检验 r H μμμ=== 210:;r H μμμ,,,:211 不全相等 由于ji x 的取值既受不同水平i A 的影响,又受i A 固定下随机因素的影响,所以将它 分解为 ji i ji x εμ+=, r i ,,1 =,n j ,,1 = (1)

MATLAB单因素方差分析

MATLAB :单因素方差分析 重复数相同的方差分析 当在因素A 的每一水平下重复试验次数相同,即当12r m m m == =时,上 述一些表达式可以简化。若记每一水平下重复次数为m ,则效应约束条件可简化为 1 0r i i a ==∑ SSA 的计算公式可简化为 2211r i i y SSA y m n =?? =?- ∑ i μ的置信水平为1α-的置信区间可改为 ( ( 1122i E i E y t f y t f αα--???-?+ ? 其他一切都不变。对于重复数相同的单因素方差分析,Matlab 提供了anova1函数来处理单因素方差分析的问题。anova1函数主要是比较多组数据的均值,然后返回这些均值相等的概率,从而判断这一因素是否对试验指标有显著影响。 其调用格式如下: p=anova1(X) p=anova1(X,group) p=anova1(X,group,’displaypot ’) [p,table]=anoval(…) [p,table,stats]=anova1(…) 其中,()1p anova X =对样本X 中的两列或多列数据进行均衡的单因素方差分析,以比较各列的均值。函数返回“零假设”(即X 中各列的均值相同)成立的概率值。如果概率值接近于零,则零假设值得怀疑,表明各列的均值事实上是不同的。()1,p anova X group =对样本X 中由矢量group 索引的两组或多组数据进行单因素方差分析以比较各列的均值。输入参数group 标明矢量X 中相应元素

的组别。group中的值为整数,最大值为需要比较的不同组的数量,最小值为1.每组至少应有一个元素,但并不要求每组的元素个数相同,因此适合于数据不均衡的情况,用于决定结果是否具有统计上的显著性的概率值大小限制的选择留给用户。[p,table,stats]=anova1(…)同时还显示一张表table和一幅图stats。表为标准的ANOV A表,表中将X中数据的变化分别分成两部分: ①各列均值的差异而产生的变化。 ②由各列的数据及其均值间的差异而导致的变化。 ANOV A表至少具有5列数据。 ①第一列标明数据源。 ②第二列给出数据源的均方和(SS)。 ③第三列给出相应数据源的自由度df。 ④第四列给出均方值p,即比率SS df。 ⑤第五列给出F统计量。 p值是F的函数(fcdf)。随着F的增加,p值减小。在box图中,各列数据的图的中心线若表现出较大差异,则相应于F值较大以及p值较小。 【例】某钢厂检查一月上旬的5天中生产的钢锭质量,结果如表1。 表 1 α=)。 试检验不同日期生产的钢锭有无显著差异(0.05 分析:把不同日期生产的钢锭质量分别看做一个变量。检验它们的平均质量是否有明显差异,相当于比较5个变量的均值是否一致。①5个变量均服从正态分布。②每一变量的方差相同。③从5个变量抽取的样本相互独立。采用方差分析法来检验不同日期生产的钢锭质量是否有明显差异。

MATLAB进行单因素方差分析-ANOVA

MATLAB进行单因素方差分析—ANOVA 方差分析的目的是确定因素的不同处理(方法、变量)下,响应变量(类别、结果)的均值是否有显著性差异。 方差分析用于两个或者两个以上因素样本均值的检验问题,如果直接使用假设检验的方法进行检验,那么需要对两两变量进行假设检验,如果有r个变量,需要进行的检验数量为r*(r-1)个,计算量相当庞大。对此,R.A. Fisher提出一种基于总误差分解分析的方法对所有样本的误差量分解为随机误差(组内的波动误差)和条件误差(组间的、由不同因素或者不同处理造成的误差),分别表示为SSE和SSA,总误差为SST,那么,SST=SSE+SSA。 由随机误差和波动误差构造F统计量对样本均值进行检验的过程,称之为方差分析(Analysis of Variance, ANOVA)。使用常用的统计工具可以方便的进行方差分析,并给出方差分析表。 方差分析表如有如下格式,可以一目了然的获得关于样本总误差分配情况以及所构造的统计量大小、检验显著性等。 方差分析的前提是以下两个假设: (1)正态性假设; (2)方差齐性假设; 第一个假设即各变量服从正态分布,可以通过一般的正态性检验方法进行检验,这里不再赘述;主要关注一下方差齐性检验,所谓方差齐性,也即方差分析是针对方差一致的情况下,检验样本均值是否一致。因此,所使用样本首先要通过方差齐性检验,其H0假设即为所有样本的样本方差相等。 为检验该假设,Bartlett提出了一种卡方检验方法,所构造统计量服从自由度为r-1的卡方分布,r为变量个数。 其检验的思想是,首先求出各个样本的样本方差,然后得到样本方差的算术平均值和几何平均值,那么,几何平均值<=算术平均值(GMSSE& lt;=MSSE),当所有样本方差相等时,取等号。因此,MSSE/GMSSE比较大时,说明H0假设不

matlab建模常用函数

附录Ⅰ工具箱函数汇总 Ⅰ.1 统计工具箱函数 表Ⅰ-1 概率密度函数 函数名对应分布的概率密度函数betapdf 贝塔分布的概率密度函数 binopdf 二项分布的概率密度函数 chi2pdf 卡方分布的概率密度函数 exppdf 指数分布的概率密度函数 fpdf f分布的概率密度函数 gampdf 伽玛分布的概率密度函数 geopdf 几何分布的概率密度函数hygepdf 超几何分布的概率密度函数normpdf 正态(高斯)分布的概率密度函数lognpdf 对数正态分布的概率密度函数nbinpdf 负二项分布的概率密度函数ncfpdf 非中心f分布的概率密度函数nctpdf 非中心t分布的概率密度函数 ncx2pdf 非中心卡方分布的概率密度函数poisspdf 泊松分布的概率密度函数 raylpdf 雷利分布的概率密度函数 tpdf 学生氏t分布的概率密度函数unidpdf 离散均匀分布的概率密度函数unifpdf 连续均匀分布的概率密度函数weibpdf 威布尔分布的概率密度函数 表Ⅰ-2 累加分布函数 函数名对应分布的累加函数 betacdf 贝塔分布的累加函数 binocdf 二项分布的累加函数 chi2cdf 卡方分布的累加函数 expcdf 指数分布的累加函数 fcdf f分布的累加函数 gamcdf 伽玛分布的累加函数 geocdf 几何分布的累加函数 hygecdf 超几何分布的累加函数 logncdf 对数正态分布的累加函数 nbincdf 负二项分布的累加函数 ncfcdf 非中心f分布的累加函数 nctcdf 非中心t分布的累加函数 ncx2cdf 非中心卡方分布的累加函数normcdf 正态(高斯)分布的累加函数poisscdf 泊松分布的累加函数 raylcdf 雷利分布的累加函数 tcdf 学生氏t分布的累加函数

用MATLAB解方差分析问题

实验报告12 实验名称:用MATLAB解方差分析问题 实验目的:学会如何运用MATLAB解方差分析问题; 实验内容: 书P348 18、抽查地区3所小学五年级男生的身高由下表给出,问该地区这3所小学五年级男生的平均身高是否有显著差别( =0.05)? 学校实测身高 数据 1 28.1 134.1 133.1 138.9 140.8 127.4 2 150. 3 147.9 136.8 126 150.7 155.8 3 40.6 143.1 144.5 143.7 148.5 146.4 程序: a=[128.1 134.1 133.1 138.9 140.8 127.4; 28.1 134.1 133.1 138.9 140.8 127.4;140.6 143.1 144.5 143.7 148.5 146.4]; m=mean(a),[p,tbl,stats]=anova1(a) 结果: m = 139.6667 141.7000 138.1333 136.2000 146.6667 143.2000 p = 0.7838 tbl = 'Source' 'SS' 'df' 'MS' 'F' 'Prob>F' 'Columns' [ 211.3361] [ 5] [42.2672] [0.4813] [0.7838] 'Error' [1.0538e+003] [12] [87.8167] [] [] 'Total' [1.2651e+003] [17] [] [] [] stats = gnames: [6x1 char]

n: [3 3 3 3 3 3] source: 'anova1' means: [139.6667 141.7000 138.1333 136.2000 146.6667 143.2000] df: 12 s: 9.3711 单因子方差表

matlab函数库大全

matlab中统计工具箱函数大全 MATLAB统计工具箱包括概率分布、方差分析、假设检验、分布检验、非参数检验、回归分析、判别分析、主成分分析、因子分析、系统聚类分析、K均值聚类分析、试验设计、决策树、多元方差分析、统计过程控制和统计图形绘制等。优化工具箱包括无约束最优化、有约束最优化、二次规划、多目标规划、最大最小化、半元限问题、方程求解以及大型优化问题的求解等。 表Ⅰ-1 概率密度函数 betapdf贝塔分布的概率密度函数 binopdf二项分布的概率密度函数 chi2pdf卡方分布的概率密度函数 exppdf指数分布的概率密度函数 fpdf f分布的概率密度函数 gampdf伽玛分布的概率密度函数 geopdf几何分布的概率密度函数 hygepdf超几何分布的概率密度函数 normpdf正态(高斯)分布的概率密度函数 lognpdf对数正态分布的概率密度函数 nbinpdf负二项分布的概率密度函数 ncfpdf非中心f分布的概率密度函数 nctpdf非中心t分布的概率密度函数 ncx2pdf非中心卡方分布的概率密度函数 poisspdf泊松分布的概率密度函数 raylpdf雷利分布的概率密度函数 tpdf学生氏t分布的概率密度函数 unidpdf离散均匀分布的概率密度函数 unifpdf连续均匀分布的概率密度函数 weibpdf威布尔分布的概率密度函数 表Ⅰ-2 累加分布函数 函数名 对应分布的累加函数 betacdf贝塔分布的累加函数 binocdf二项分布的累加函数 chi2cdf卡方分布的累加函数 expcdf指数分布的累加函数 fcdf f分布的累加函数

matlab 方差分析教案

方差分析 方差分析是分析试验(或观测)数据的一种统计方法。在工农业生产和科学研究中,经常要分析各种因素及因素之间的交互作用对研究对象某些指标值的影响。在方差分析中,把试验数据的总波动(总变差或总方差)分解为由所考虑因素引起的波动(各因素的变差)和随机因素引起的波动(误差的变差),然后通过分析比较这些变差来推断哪些因素对所考察指标的影响是显著的,哪些是不显著的。 一、单因子方差分析 某个可控制因素A 对结果的影响大小可通过如下实验来间接地反映,在其它所有可控制因素都保持不变的情况下,只让因素A 变化,并观测其结果的变化,这种试验称为“单因素试验”。因素A 的变化严格控制在几个不同的状态或等级上进行变化,因素A 的每个状态或等级成为因素A 的一个水平。若因素A 设定了s 个水平,则分别记为 A 1,A 2,…,A s 。 数学模型: 2 (,),1,2,...,.i i X N i s μσ= (1) 显著性影响问题转化为因素A 不同水平下各随机变量总体的均值是否相等问题,即检验假设 012:s H μμμ=== 是否成立 (2) 记号 ij x : 不同水平下的试验结果,i=1,2,…,s ;j=1,2,…,n i ; n=n 1+n 2+…+n s :试验总数; 总平均:11 1 i n s ij i j x x n === ∑∑;

总离差平方和:22 11 () i n s T ij i j S x x === -∑∑; 组内平方和(误差平方和):2 2 11() i n s E ij i i j S x x === -∑∑,随机因素的影响; 组间平方和(因素平方和):22 11 () i n s A i i j S x x === -∑∑,水平差异的影响; H 0的拒绝域为: 2 2 ()(1,)(1)A E n s S W F s n s s S α??-=>--??-?? 检验结果: 高度显著: 2 0.012 ()(1,)(1)A E n s S F s n s s S ->---; 显著:2 0.010.052 ()(1,)(1,) (1)A E n s S F s n s F s n s s S ---≥ >---; 有一定影响:2 0.050.12()(1,)(1,)(1)A E n s S F s n s F s n s s S ---≥>---; 无显著影响: 2 0.12()(1,)(1)A E n s S F s n s s S -≤---。 可构造方差表来完成计算: 二、双因素有交互效应的方差分析 在两个因素的试验中,不但每一个因素单独对试验结果起作用,往往两个因素的不同水平组合还会产生一定的合作效应,在方差分析中称为交

方差分析在MATLAB中的应用

方差分析在MATLAB中的应用 摘要:如今,计算机仿真在许多领域得到了越来越广泛的应用。方差分析(Analysis of Variance缩写为ANOV A)是数理统计中的常用的数据处理方法之一,是工农业生产和科学研究中分析试验数据的一种有效工具,也是开展实验设计,参数设计和容差设计的数学基础。本文就就单因素试验的方差分析在MATLAB中进行建模,并通过数据分析找出对事物有显著影响的因素,以及显著影响因素的最佳水平等。 关键词:均值,自由度,方差分析,MATLAB建模,单因素试验 一、方差分析的基本思想 一个复杂的事物,其中往往有许多因素相互制约又相互依存。方差分析方法为一种重要的对定量变量进行假设检验的统计分析方法。当研究两个或多个样本均数代表的总体均数是否相同时, 可采用方差分析方法。方差分析是检验多组样本均值间的差异是否具有同居意义的一种方法。例如,医学届研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同饲料对牲畜体重增长的效果等,这些都可以使用方差分析方法去解决。方差分析的目的是通过数据分析找出对该事物有显著影响的因素,各个因素之间的交互作用,以及显著影响因素的最佳水平。 应用方差分析对资料进行统计推断之前应注意其使用条件,包括: (1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。 (2)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。 (3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。

数学建模算法方差分析

第十一章 方差分析 我们已经作过两个总体均值的假设检验,如两台机床生产的零件尺寸是否相等,病人和正常人的某个生理指标是否一样。如果把这类问题推广一下,要检验两个以上总体的均值彼此是否相等,仍然用以前介绍的方法是很难做到的。而你在实际生产和生活中可以举出许多这样的问题:从用几种不同工艺制成的灯泡中,各抽取了若干个测量其寿命,要推断这几种工艺制成的灯泡寿命是否有显著差异;用几种化肥和几个小麦品种在若干块试验田里种植小麦,要推断不同的化肥和品种对产量有无显著影响。 可以看到,为了使生产过程稳定,达到优质、高产,需要对影响产品质量的因素进行分析,找出有显著影响的那些因素,除了从机理方面进行研究外,常常要作许多试验,对结果作分析、比较,寻求规律。用数理统计分析试验结果、鉴别各因素对结果影响程度的方法称为方差分析(Analysis Of Variance ),记作ANOV A 。 人们关心的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子,因素所处的状态称为水平。上面提到的灯泡寿命问题是单因素试验,小麦产量问题是双因素试验。处理这些试验结果的统计方法就称为单因素方差分析和双因素方差分析。 §1 单因素方差分析 只考虑一个因素A 对所关心的指标的影响,A 取几个水平,在每个水平上作若干个试验,试验过程中除A 外其它影响指标的因素都保持不变(只有随机因素存在),我们的任务是从试验结果推断,因素A 对指标有无显著影响,即当A 取不同水平时指标有无显著差别。 A 取某个水平下的指标视为随机变量,判断A 取不同水平时指标有无显著差别,相当于检验若干总体的均值是否相等。 1.1 数学模型 设A 取r 个水平r A A A ,,,21 ,在水平i A 下总体i x 服从正态分布),(2 i N , r i ,,1 ,这里2, i 未知,i 可以互不相同,但假定i x 有相同的方差。又设在每个水平i A 下都作了n 次独立试验,即从中抽取容量为n 的样本,记作n j x ji ,,1, , ji x 服从),(2 i N ,n j r i ,,1,,,1 且相互独立。将这些数据列成下表(单因 素试验数据表)的形式: 1A 2A …r A 111x 12x …r x 1 221x 22x …r x 2 n 1n x 2n x …nr x 将第i 列称为第i 组数据。判断A 的r 个水平对指标有无显著影响,相当于要作以下的假设检验 r H 210:;r H ,,,:211 不全相等 由于ji x 的取值既受不同水平i A 的影响,又受i A 固定下随机因素的影响,所以将它分解为 ji i ji x ,r i ,,1 ,n j ,,1 (1) 其中),0(~2 N ji ,且相互独立。记

课设方差分析的MATLAB实现

东北大学秦皇岛分校 数学软件认识实习报告 方差分析的MATLAB实现 学院数学与统计学院 专业数学与应用数学 学号0 姓名XXX 指导教师林秋张子选 成绩 教师评语: 指导教师签字: 2013年01月07日

1 绪论 方差分析是工农业生产和科学研究中对实验数据或其他观察数据进行统计分析和检验的一种实用、有效的数理统计方法。 方差分析(Analysis of variance,简称ANOV A):根据不同需要把某变量方差分解为不同的部分,比较它们之间的大小并用F检验进行显著性检验的方法。又称“变异数分析”或“F检验”,是用于两个及两个以上样本均数差别的显著性检验。F值是两个均方的比值(效应项/误差项),不可能出现负值。F值越大(与给定显著水平的标准F值相比较)说明处理之间效果(差异)越明显,误差项越小说明试验精度越高。 一个复杂的事物往往受到多种因素的影响。例如,一件产品的质量就受到机器、原料、温度等因素的影响;同样,一种农作物的产量也会受到种子、肥料、土质、水分等因素的影响。如何通过实验数据,分析出各个因素的影响,从而抓住事物的主要矛盾,这就是方差分析所要解决的主要问题。本文主要就单因素方差分析和双因素方差分析进行讨论,对于两个以上的因素的方差分析,其解决问题的基本思想与此类似。 方差分析为资料分析中常见的统计模型,主要为探讨连续型(Continuous)资料型态之因变量(Dependent variable)与类别型资料型态之自变量(Independent variable)的关系,当自变量的因子中包含等于或超过三个类别情况下,检定其各类别间平均数是否相等的统计模式,广义上可将T检定中变异数相等(Equality of variance)的合并T检定(Pooled T-test)视为是方差分析的一种,基于T检定为分析两组平均数是否相等,并且采用相同的计算概念,而实际上当方差分析套用在合并T检定的分析上时,产生的F值则会等于T 检定的平方项。 方差分析依靠F-分布为机率分布的依据,利用平方和(Sum of square)与自由度(Degree of freedom)所计算的组间与组内均方(Mean of square)估计出F值,若有显著差异则考量进行事后比较或称多重比较(Multiple comparison),较常见的为Scheffé's method、Tukey-Kramer method与Bonferroni correction,用于探讨其各组之间的差异为何。 在方差分析的基本运算概念下,依照所感兴趣的因子数量而可分为单因子方差分析、双因子方差分析、多因子方差分析三大类,依照因子的特性不同而有三种型态,固定效应方差分析(fix-effect analysis of variance)、随机效应方差分析(random-effect analysis of variance)与混合效应方差分析(Mixed-effect analysis of variance),然而第三种型态在后期发展上被认为是Mixed model的分支,关于更进一步的探讨可参考Mixed model的部份。 方差分析优于两组比较的T检定之处,在于后者会导致多重比较(multiple comparisons)

相关文档
最新文档