描述性分析参数估计与假设检验方差分析非参数检验

节能调研数据的探索和描述

实验要求

1．以年份为指标对原数据拆列。以便对不同年份的数据分别研究。

法一、选中年份列，Data-split file-compare groups ，可将数据分为83和84年两组，从这以后所做的描述分析结果output将按两年分别列示。

法二、Data-select cases-if-年份=83，选出83年数据，暂时忽略84年数据。

2．就1983年的数据，通过实验回答下列问题：（1）认为能源短缺对人们生活影响“很严重”、“有些严重”、“不很严重”、“根本不严重”

的人各占多大比例？

法一Analyze-tables-tables of frequencies-statistics-选中count 和percent （有时题目问到“相对频数”，实际就是问所占百分比percent ）

如果问题1按照法一操作，则结果为

如果问题1按法二操作，则结果为

法二Analyze-Descriptive Statistics-Frequencies

如果问题1用法一做的，则结果为

如果问题1用法二做的，则结果为

的人各占多大比例？

（3）用pie chart表示认为能源价格对人们生活影响“很严重”、“有些严重”、“不很严

重”、“根本不严重”的人各占多大比例。（讲解三个按钮的不同类型的数据）

Graphs-pie-Summaries for groups of cases-双击图－双冰箱

重”、“根本不严重”的人数。（讲解三个按钮的不同类型的数据）

方法同第（1）（2）问，注意“相对频数”=percent

（6）被调查家庭降低采暖温度的比例占多少？注意随手关灯的比例占多少？少驾车出行的比例占多少？尽量乘坐公车的比例占多少？

Tables-tables of frequencies-拖入4项statistics-percent

（7）绘制对比采取各项节能措施的人数的条形图。

注意四项全选中，打开statistic对话框，点击number below，value输入2，选出值小于2的样本。

（8）采取的某项节能措施在所采取的所有节能措施中所占百分比。

只能在此进行分析

异方差性的white检验及处理方法

实验二异方差模型的white检验与处理【实验目的】掌握异方差性的white检验及处理方法【实验原理】 1. 定性分析异方差 (1) 经济变量规模差别很大时容易出现异方差。如个人收入与支出关系，投入与产出关系。 (2) 利用散点图做初步判断。 (3) 利用残差图做初步判断。 2、异方差表现与来源异方差通常有三种表现形式（1）递增型（2）递减型（3）条件自回归型。 3、White检验（1）不需要对观测值排序，也不依赖于随机误差项服从正态分布，它是通过一个辅助回归式构造 2 统计量进行异方差检验。White检验的零假设和备择假设是 H0: (4－1)式中的ut不存在异方差， H1: (4－2)式中的ut存在异方差。 (2)在不存在异方差假设条件下，统计量 T R 2 2(5) 其中T表示样本容量，R2是辅助回归式(4－3)的OLS估计式的可决系数。自由度5表示辅助回归式(4－3)中解释变量项数（注意，不计算常数项）。T R 2属于LM统计量。（3）判别规则是若T R 2 2 (5), 接受H0（ut 具有同方差）若T R 2 > 2 (5), 拒绝H0（ut 具有异方差）【实验软件】 Eview6 【实验要求】熟练掌握异方差white检验方法【实验内容】建立并检验我国部分城市国民收入y和对外直接投资FDI异方差模型【实验方案设计】下表列出了我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据，并利用统计软件Eviews建立异方差模型

表1 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据（单位：元）【实验过程】 1、启动Eviews6软件，建立新的workfile. 在主菜单中选择【File 】--【New 】--【Workfile 】,弹出 Workfile Create 对话框,在Workfile structure typ 中选择unstructured/undted.然后在observations 中输入31.在WF 中输入Work1，点击OK 按钮。如图： 2、数据导入且将要分析的数据复制黏贴. 在主菜单的空白处输入data x y 按下enter 。将家庭人均纯收入X 和家庭生活消地区家庭人均纯收入家庭生活消费支出地区家庭人均纯收入家庭生活消费支出北京湖北 3090 天津湖南河北广东山西广西内蒙古海南辽宁重庆吉林四川黑龙江贵州上海云南江苏西藏浙江陕西安徽甘肃福建青海江西宁夏山东新疆河南

异方差性检验

金融122班 23号钟萌异方差性检验引入滞后变量X-1、X-2、Y-1 。可建立如下中国居民消费函数： Y=β0+β1X+β2X(-1)+β3X(-2)+β4Y(-1) 用OLS法进行估计，结果如下：对应的表达式为 Y=429.3512+0.143X-0.104X(-1)+0.063X(-2)+0.838Y(-1) 2.18 2.09 -0.73 0.63 7.66 R2=0.9988 F=4503.94 估计结果显示，在5%的显著性水平下，自由度为25的临界值为2.060，若存在异方差性，则可能是由X、Y（-1）引起的。

做OLS回归得到的残差平方项分别与X、Y(-1)的散点图

从散点图可以看出，两者存在异方差性。下面进行统计检验。采用White异方差检验：所以辅助回归结果为： e2=-194156.4-249.491X+0.003X2+265.306X(-1)-0.004X(-1)2+4.187X(-2)- 0.001X(-2)2 +51.377Y(-1)+0.001Y(-1)2 -1.566 -4.604 2.863 2.648 -1.604 0.055 -0.301 0.579 0.410 X与X的平方项的参数的t检验是显著的，且White统计量为

16.999>5%显著性水平下，自由度为8的卡方分布值15.51，(从nR2 统计量的对应值的伴随概率值容易看出）所以在5%的显著性水平下，拒绝同方差性这一原假设，方程确实存在异方差性。用加权最小二乘法对异方差性进行修正，重新进行回归估计，得到加权后消除异方差性的估计结果：回归表达式为： Y=275.0278-0.0192X+0.1617X(-1)-0.0732X(-2)+0.9165Y(-1) 3.5753 -0.3139 1.3190 -1.0469 16.5504

t检验、u检验、卡方检验、F检验、方差分析

统计中经常会用到各种检验，如何知道何时用什么检验呢，根据结合自己的工作来说一说： t检验有单样本t检验，配对t检验和两样本t检验。单样本t检验：是用样本均数代表的未知总体均数和已知总体均数进行比较，来观察此组样本与总体的差异性。配对t检验：是采用配对设计方法观察以下几种情形，1，两个同质受试对象分别接受两种不同的处理；2,同一受试对象接受两种不同的处理；3，同一受试对象处理前后。 u检验：t检验和就是统计量为t,u的假设检验，两者均是常见的假设检验方法。当样本含量n较大时，样本均数符合正态分布，故可用u检验进行分析。当样本含量n小时，若观察值x符合正态分布，则用t检验（因此时样本均数符合t 分布），当x为未知分布时应采用秩和检验。 F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本，要对这两个样本进行比较的时候，首先要判断两总体方差是否相同，即方差齐性。若两总体方差相等，则直接用t检验，若不等，可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等，就可以用F检验。简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验（等方差双样本检验，异方差双样本检验）的前提条件。在t检验中，如果是比较大于小于之类的就用单侧检验，等于之类的问题就用双侧检验。卡方检验是对两个或两个以上率（构成比）进行比较的统计方法，在临床和医学实验中应用十分广泛，特别是临床科研中许多资料是记数资料，就需要用到卡方检验。方差分析用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家R.A.Fisher首先提出，以F命名其统计量，故方差分析又称F检验。其目的是推断两组或多组资料的总体均数是否相同，检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析（one-way ANOVA）：用途：用于完全随机设计的多个样本均数间的比较，其统计推断是推断各样本所代表的各总体均数是否相等。完全随机设计（completely random design）不考虑个体差异的影响，仅涉及一个处理因素，但可以有两个或多个水平，所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因

描述性统计分析报告--Descriptive Statistics菜单详解

第六章：描述性统计分析－－ Descriptive Statistics菜单详解描述性统计分析是统计分析的第一步，做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析，但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中，最常用的是列在最前面的四个过程：Frequencies过程的特色是产生频数表；Descriptives过程则进行一般性的统计描述；Explore过程用于对数据概况不清时的探索性分析；Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验，我们常用的X2检验也在其中完成。本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。 §6.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一，Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表，还可以按要求给出某百分位点的数值，以及常用的条图，圆图等统计图。和国内常用的频数表不同，几乎所有统计软件给出的均是详细频数表，即并不按某种要求确定组段数和组距，而是按照数值精确列表。如果想用Frequencies过程得到我们所熟悉的频数表，请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。 6.1.1 界面说明 Frequencies对话框的界面如下所示：

该界面在SPSS中实在太普通了，无须多言，重点介绍一下各部分的功能如下：【Display frequency tables复选框】确定是否在结果中输出频数表。【Statistics钮】单击后弹出Statistics对话框如下，用于定义需要计算的其他描述统计量。现将各部分解释如下：

统计学例题-方差分析、相关分析、卡方检验和交互分析

第一章方差分析例1、1977年，美国的某项调查从三种受过不同教育类型的妇女中各分别抽取了50位全日制工作的妇女样本，她们的年收入（单位：千美元）数据整理后归纳如下：完成的学历年数收入平均值X () 2 )(∑-X X 初中（8年）X1 高中（12年）X2 大学（16年）X3 7.8 9.7 14.0 1835 2442 4707 解：： = ：三组收入均值有显著差异 F = ，即组间均方/组内均方其中，组间自由度 =3-1=2，组内自由度 =(50-1)╳3=147 由于样本均值=(7.8+9.7+14.0)/3=10.5 所以组间偏差平方和=50=50*( + + )=1009 组内偏差平方和= =1835+2442+4707=8984 所以，F = ≈ 8.2548419 > (2,147)=3.07 拒绝原假设；认为不同学历的妇女收入存在差异。例2、月收入数据：男：2500，2550，2050，2300，1900 女：2200，2300，1900，2000，1800 如果用Y 表示收入，哑变量X 表示性别（X =1为女性），计算Y 对X 的回归方程，并在5％的水平下检验收入是否与性别无关（先求回归系数的置信区间）。解：令Y=+X+ 根据最小二乘法，可知= (1) VAR()= (2) = (3) 计算如下：：收入与性别无关收入与性别不完全无关

Y 2500255020502300190022002300190020001800 X 0 0 0 0 0 1 1 1 1 1 240 290 -210 40 -360 160 260 -140 -40 -240 =2150=0.5 根据公式1，得=-220；，即Y=-220X+ 根据公式2、3，得VAR()=≈156.3549577 n=10.，n-2=8；当df=8时，=2.306 的0.05置信区间求解方法如下： -2.036<=<=2.306,得140.57769. 由于原假设=0落入了这个置信区间，所以接受原假设，认为系数不显著，收入与性别无关。第二章相关分析例1、10对夫妇的一个随机样本给出了如下的结婚年龄数据结婚时丈夫的年龄y 24 22 26 20 23 21 24 25 22 23 结婚时妻子的年龄x 24 18 25 22 20 23 19 24 23 22 2) 求总体相关系数的95％置信区间； 3) 以5％的水平，检验“夫妻的结婚年龄之间没有什么线性联系”这一原假设。解：(1) = 由于=22，=23；=≈0.3426 (2)由于se()=,n=10，df=8=2.306，所以： se()=0.332 -2.036<=<=2.306 得 1.062072

异方差性的检验及处理方法

实验四异方差性【实验目的】掌握异方差性的检验及处理方法【实验内容】建立并检验我国制造业利润函数模型【实验步骤】【例1】表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料，请利用统计软件Eviews建立我国制造业利润函数模型。一、检验异方差性 ⒈图形分析检验 ⑴观察销售利润（Y）与销售收入（X）的相关图(图1)：SCAT X Y 图1 我国制造工业销售利润与销售收入相关图从图中可以看出，随着销售收入的增加，销售利润的平均水平不断提高，但离散程度也逐步扩大。这说明变量之间可能存在递增的异方差性。

⑵残差分析首先将数据排序（命令格式为：SORT 解释变量），然后建立回归方程。在方程窗口中点击Resids按钮就可以得到模型的残差分布图（或建立方程后在Eviews工作文件窗口中点击resid对象来观察）。图2 我国制造业销售利润回归模型残差分布图2显示回归方程的残差分布有明显的扩大趋势，即表明存在异方差性。 ⒉Goldfeld-Quant检验 ⑴将样本按解释变量排序（SORT X）并分成两部分（分别有1到10共11个样本合19到28共10个样本） ⑵利用样本1建立回归模型1（回归结果如图3），其残差平方和为2579.587。 SMPL 1 10 LS Y C X 图3 样本1回归结果 ⑶利用样本2建立回归模型2（回归结果如图4），其残差平方和为63769.67。 SMPL 19 28 LS Y C X

图4 样本2回归结果 ⑷计算F 统计量：12/RSS RSS F =＝63769.67/2579.59=24.72，21RSS RSS 和分别是模型1和模型2的残差平方和。取 05 .0=α时，查F 分布表得 44.3)1110,1110(05.0=----F ，而 44.372.2405.0=>=F F ，所以存在异方差性 ⒊White 检验 ⑴建立回归模型：LS Y C X ，回归结果如图5。图5 我国制造业销售利润回归模型 ⑵在方程窗口上点击View\Residual\Test\White Heteroskedastcity,检验结果如图6。图6 White 检验结果

在EXCEL中实现多总体方差的Bartlett齐性检验

在EXCEL中实现多总体方差的Bartlet t齐性检验在体育教学和运动训练等的科学实验中，对影响体育教学成绩及运动竞赛的成绩的原因的探究，一直是当代体育科研中研究的主线。例如，在运动训练中，为更加有效地提高运动成绩，通常需要考察不同的运动强度、不同的运动量和不同的运动持续时间等因素对不同的专项运动成绩的影响，目的是为了找出适合不同专项的运动强度、运动量、运动持续时间的较佳组合。又如，我们从运动系体操专业的学生中随机抽取条件相似的20 名学生随机分成4组，每组5人，由 4 位教师施以不同的教学方法，教20 个具有相当难度的体操动作，并规定每个动作的计分标准，试教一学期后举行测试，测得各组得分，见下表。现假定每组的得分服从正态分布，则这 4 种教学方法的效果间是否有显著性差异的问题就是我们迫切需要了解的。如果仅仅从上例每组的总分上看，显然四种不同的教法带来了四种不同的学生得分，分值上肯定有差异，但这种差异主要是由随机误差引起的，还是主要是由于教学方法的不同而引起的，即是否有显著性差异的统计结论，还须经统计检验后才能得出。若用两个样本间均数差异的显著性检验方法来处理本类问题的话，需要做6次检验。若这样的试验安排共有N组，则需要做N （N-1）/2 次两两比较，这一方面，显然太麻烦了，另一方面，

当设定两两比较时，犯第一类错误的概率 a =0.05，则N个独立样本两两比较时，每次比较不犯第一类错误的概率为0.95N(N-1) ／2，相应犯第一类错误的概率为1-0.95N(N-1) ／2，远远大于事先设定的0.05。因此，多个均数比较时不宜采用我们熟知的t 检验作两两比较，应采用一种新的统计处理方法来实现。解决这一类问题的方法是方差分析。它最早由英国统计学家费舍( R.A.Fisher )在1923 年提出，最初用于生物学和农业试验方面，后于1946年由斯内德克(G.W.Snedecor)进一步加以完善。为纪念费舍的杰出贡献，又把它称为 F 检验。现在它在体育领域中也得到了广泛的应用。方差分析是在总体服从正态分布且方差齐性的假设下展开的，在满足总体正态性但方差不齐时，此法不可用，而只能改用方差不齐时两均数差异的显著性检验的方法来进行两两均数间的比较。因此，这里很有必要来考虑方差的齐性检验的问题。本文主要介绍在EXCEL中如何来实现多总体方差的Bartlett 齐性检验的自动计算。 1 Bartlett 方差齐性检验的方法 Bartlett 法是一种可在各水平重复测定次数不等时用来检验方差齐性的方法，虽然，当各水平重复测定次数相等时，可用Cochran 提供的检验方法，但Bartlett 法同样适用。 2在EXCEL中进行Bartlett 方差齐性检验的方法 2.1工作表的安排在用Bartlett 法进行方差齐性检验时，为使计算相对自动化，

异方差检验

七、异方差与自相关一、背景我们讨论如果古典假定中的同方差和无自相关假定不能得到满足，会引起什么样的估计问题呢？另一方面，如何发现问题，也就是发现和检验异方差以及自相关的存在性也是一个重要的方面，这个部分就是就这个问题进行讨论。二、知识要点 1、引起异方差的原因及其对参数估计的影响 2、异方差的检验（发现异方差） 3、异方差问题的解决办法 4、引起自相关的原因及其对参数估计的影响 5、自相关的检验（发现自相关） 6、自相关问题的解决办法（时间序列部分讲解）三、要点细纲 1、引起异方差的原因及其对参数估计的影响原因：引起异方差的众多原因中，我们讨论两个主要的原因，一是模型的设定偏误，主要指的是遗漏变量的影响。这样，遗漏的变量就进入了模型的残差项中。当省略的变量与回归方程中的变量有相关关系的时候，不仅会引起内生性问题，还会引起异方差。二是截面数据中总体各单位的差异。后果：异方差对参数估计的影响主要是对参数估计有效性的影响。在存在异方差的情况下，OLS 方法得到的参数估计仍然是无偏的，但是已经不具备最小方差性质。一般而言，异方差会引起真实方差的低估，从而夸大参数估计的显著性，即是参数估计的t 统计量偏大，使得本应该被接受的原假设被错误的拒绝。 2、异方差的检验（1）图示检验法由于异方差通常被认为是由于残差的大小随自变量的大小而变化，因此，可以通过散点图的方式来简单的判断是否存在异方差。具体的做法是，以回归的残差的平方2i e 为纵坐标，回归式中的某个解释变量i x 为横坐标，画散点图。如果散点图表现出一定的趋势，则可以判断存在异方差。（2）Goldfeld-Quandt 检验

方差齐性检验的原理

统计学搜索整理汇总——方差齐性检验的原理 LXK的结论：齐性检验时F越小（p越大），就证明没有差异，就说明齐，比如F=1.27，p>0.05则齐，这与方差分析均数时F越大约好相反。 LXK注：方差(MS或s2)=离均差平方和/自由度（即离均差平方和的均数）标准差=方差的平方根（s) F=MS组间/MS误差=（处理因素的影响+个体差异带来的误差）/个体差异带来的误差 ================= F检验为什么要求各比较组的方差齐性？ ——之所以需要这些前提条件，是因为必须在这样的前提下所计算出的t统计量才服从t分布，而t检验正是以t分布作为其理论依据的检验方法。在方差分析的F检验中，是以各个实验组内总体方差齐性为前提的，因此，按理应该在方差分析之前，要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性，而且经过F检验所得多个样本所属总体平均数差异显著，这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致；如果各个总体方差不齐，那么经过F 检验所得多个样本所属总体平均数差异显著的结果，可能有一部分归因于各个实验组内总体方差不同所致。简单地说就是在进行两组或多组数据进行比较时，先要使各组数据符合正态分布，另外就是要使各组数据的方差相等（齐性）。 ----------------- 在SPSS中，如果进行方差齐性检验呢？命令是什么？方差分析(Anaylsis of Variance, ANOVA)要求各组方差整齐，不过一般认为，如果各组人数相若，就算未能通过方差整齐检验，问题也不大。 One-Way ANOVA对话方块中，点击Options…(选项…)按扭，勾Homogeneity-of-variance即可。它会产生Levene、Cochran C、Bartlett-Box F等检验值及其显著性水平P值，若P值<于0.05，便拒绝方差整齐的假设。顺带一提，Cochran和Bartlett检定对非正态性相当敏感，若出现「拒绝方差整齐」的检测结果，或因这原因而做成。 --------------- 用spss处理完数据的显示结果中，F值，t值及其显著性（sig）都分别是解释什么的？答案一般而言，为了确定从样本(sample)统计结果推论至总体时所犯错的概率，我们会利用统计学家所开发的一些统计方法，进行统计检定。通过把所得到的统计检定值，与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较，我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现，出现这结果的机率很少，亦即是说，是在机会很少、很罕有的情况下才出现；那我们便可以有信心的说，这不是巧合，是具有统计学上的意义的(用统计学的话讲，就是能够拒绝

Eviews 进行异方差性检验及估计模型

异方差性检验及存在异方差模型估计检验使用方法：（1）G-Q检验（2）White 检验模型估计方法：加权最小二乘法（WLS）下表为2000年中国部分省市城镇居民每个家庭平均年可支配收入(X)与消费性支出（Y）的统计数据： 1

一、利用Eviews求出线性模型可得模型: ?272.2250.755 i i Y X =+ 2

(1.705) (32.394) R2=0.9832 二、异方差检验（1）G-Q检验：首先将可支配收入X升序进行排列，然后去掉中间4个样本，将余下的样本分为容量各为8的两个子样本，并分别进行回归。大样本小样本 3

样本取值较小的Eviews输出结果如下残差平方和：RSS1=126528.3 4

样本取值较大的Eviews输出结果如下：残差平方和：RSS2=615073.7 因此统计量为：2 14.8611 RSS F RSS == 在5%的显著性水平下，0.05(6,6) 4.28 F=,4.86>4.28,因此拒绝原假设，存在异方差性。 5

（2）White检验:在原模型的最小二乘估计窗口上选择“View\Residual Tests\Heteroskedasticity Tests\White”得到如下结果： x ，因此12.6478>5.99，因而拒绝原假设，检验统计量值为12.64768，查询20.05(2) 5.99 模型存在异方差。三、估计存在异方差的经济模型利用加权最小二乘法（WLS）进行估计：首先在对原模型进行估计后，保存残差，步骤如下：①Quick\Generate Series 再输入“e1=resid”，得到e1 ②Quick\Estimte Equation 再输入“Y C X” ③选择Options,在“Weighted LS/TLS”输入“1/abs(e1)”(备注：abs表示绝对值) 得到如下结果; 6

方差齐性检验

一、方差齐性检验 1、 data abc; do a=1 to 4; do i=1 to 4; Input x @@; Output; end; end; t=_n_; /*自动生成序号变量t*/ cards; 19 23 21 13 21 24 27 20 20 18 19 15 22 25 27 22 ; Proc gplot data=a; /*绘图—按文件a作散点图*/ Plot x*t; /*纵坐标为x，横坐标为t*/ proc print a; proc anova; class a; model x=a; means a/hovtest; run; 2、 data d0; Input x @@; t=_n_; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc print; var t x; proc gplot data=d0; plot x*t; symbol c=red i=join v=star; run; data d1; do a=1 to 4; do i=1 to 6; Input y @@; output; end; end; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc anova; class a; model y=a; means a/hovtest; proc print; var a y; run; data d0; Input y @@; t=_n_; do a=1 to 4; do i=1 to 6; Input x @@; output; end; end; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc print; var t x; proc gplot data=d0; plot x*t; symbol c=red i=join v=star; run; proc anova; class a; model x=a; means a/hovtest; run;

案例库项目八假设检验回归分析与方差分析

项目八假设检验、回归分析与方差分析实验3 方差分析实验目的学习利用Mathematica求单因素方差分析的方法. 基本命令 1.调用线性回归软件包的命令<

中,向量Y是因变量,也称作响应变量.矩阵X称作设计矩阵, ?是参数向量??是误差向量? ????????DesignedRegress也是作一元和多元线性回归的命令, 它的应用范围更广些. 其格式与命令Regress的格式略有不同: DesignedRegress[设计矩阵X,因变量Y的值集合, RegressionReport ->{选项1, 选项2, 选项3,…}] RegressionReport(回归报告)可以包含:ParameterCITable(参数?的置信区间表???? ?PredictedResponse (因变量的预测值), MeanPredictionCITable(均值的预测区间), FitResiduals(拟合的残差), SummaryReport(总结性报告)等, 但不含BestFit. 实验准备—将方差分析问题纳入线性回归问题在线性回归中, 把总的平方和分解为回归平方和与误差平方和之和, 并在输出中给出了方差分析表. 而在方差分析问题

中, 也把总的平方和分解为模型平方和与误差平方和之和, 其方法与线性回归中的方法相同. 因此只要把方差分析问题转化为线性模型的问题, 就可以利用线性回归中的设计回归命令DesignedRegress 做方差分析. 单因素试验方差分析的模型是 ?? ? ??==+=. ,,2,1;,,2,1,),,0(~,2s j n i N Y j ij ij ij j ij ΛΛ独立各εσεεμ (3.1) 上式也可改写成 ?? ? ??===+-+==+=.,,2,1;,,2,1,),,0(~; ,,3,2,)(, ,,2,1,2111111s j n i N s j Y n i Y j ij ij ij j ij i i ΛΛΛΛ独立各εσεεμμμεμ (3.2) 给定具体数据后, 还可(2.2)式写成线性模型的形式:

异方差性及其检验

异方差性及其检验 I 概念对于多元线性回归模型同方差性假设为如果出现即对于不同的样本点，随机干扰项的方差不再是常数，而是互不相同，不具有等同的分散程度，则认为出现了异方差（Heteroskedasticity ） II 类型同方差性假定是指，回归模型中不可观察的随机误差项i u 以解释变量X 为条件的方差是一个常数，因此每个i u 的条件方差不随X 的变化而变化，即有 2()i i f X σ=≠常数在异方差的情况下，总体中的随机误差项i u 的方差 2 i σ不再是常数，通常它随解释变量值的变化而变化，即异方差一般可归结为三种类型： 01122 1,2, ,i i i k ki i Y X X X i n ββββμ=+++ ++=2(), 1,2,...,i Var i n μσ==2(), 1,2,...,i i Var i n μσ==2() i i f X σ=

异方差类型图： III来源（1）截面数据（不同样本点除解释变量外其他影响差异大）（2）时间序列（规模差异）（3）分组数据、异常值等（4）模型函数形式设置不正确和数据变形不正确（5）边错边改学习模型 IV影响计量经济学模型一旦出现异方差，如果仍然用普通最小二乘法估计模型参数，会产生一系列不良后果。（1）参数估计量非有效（2）OLS估计的随机干扰项的方差不再是无偏的

（3）基于OLS估计的各种统计检验非有效（4）模型的预测失效 V检验异方差性，即相对于不同的样本点，也就是相对于不同的解释变量观测值，随机干扰项具有不同的方差，那么检验异方差性，也就是检验随机干扰项的方差与解释变量观测值之间的相关性。一般检验方法如下：（1）图示检验法（2）帕克(Park)检验与戈里瑟(Gleiser)检验（3）G-Q（Goldfeld-Quandt）检验（4）F检验（5）拉格朗日乘子检验（6）怀特检验（具体步骤随后介绍） VI修正方法加权最小二乘法定义：加权最小二乘法是对原模型加权，使之变成一个新的不存在异方差性的模型，然后采用OLS法估计其参数。基本思想：在采用OLS方法时，对较小的残差平方2? e赋予较大的权 i 重，对较大的2? e赋予较小的权重，以对残差提供的信息的重要程度 i 作一番修正，提高参数估计的精确程度。不同形式的异方差要求用不同的加权方法来处理：

假设检验与方差分析

实验四假设检验实验目的：通过此实验熟练掌握如何利用假设检验工具根据不同条件选择相应检验工具进行检验，有助于学习者理解假设检验的过程及结果实验要求：能够运用Excel 对总体均值进行假设检验，学会针对实际背景提出原假设和备择假设来检验实际问题，并根据检验结果作出符合统计学原理和实际情况的判断和结论，加深对统计学方法的广泛应用背景的理解假设检验与区间估计两者之间存在密切的关系，二者用的是同一个样本、同一个统计量、同一种分布，所以也可以用区间估计进行假设检验，两者结论是一致的。在Excel 中进行假设检验，除可按区间估计过程用公式和逆函数计算外，还备有专用的假设检验工具，包括Z —检验工具、T —检验工具和F —检验工具。使用这些工具，可以直接根据样本数据进行计算，一次给出检验统计量、单尾和双尾临界值以及小于或等于临界值的概率等所需要的数值。实验四主要介绍假设检验工具的使用。一、假设检验的一般过程假设检验主要是根据计算出的检验统计量与相应临界值比较，作出拒绝或接受原假设的决定。根据全国汽车经销商协会报道，旧车的平均销售价格是10192美元。堪萨斯城某旧车经销处的一名经理检查了近期在该经销处销售的100辆旧车。结果样本平均价格是9300美元，样本标准差是4500美元。在0.05的显著性水平下，检验H 0：10192≥μ H 1：10192<μ。问：假设检验的结论是什么？这名经理接下来可能会采取什么行动？本例由于样本容量比较大，其均值近似服从正态分布，总体方差未知，需要用样本标准差来代替，选择T 统计量进行检验。T 统计量的计算公式如下：

)1(~1 0--= -n t n s x t n μ 单击任一空单元格，输入“=(9300-10192)/(4500/SQRT(100))”，回车确认，得出t 统计量为-1.982。单击另一空单元格，输入“=TINV(0.025,99)”，回车确认，得出t 分布的右临界值为2.276。因为276.2982.1<-，所以不拒绝原假设，认为此旧车经销处旧汽车平均销售价格不小于10192美元。那么接下来这名经理会采取什么相应行动？（请读者思考）。本例主要介绍了假设检验的一般过程，利用Excel 的公式和函数求出相应的统计量值和临界值，最后作出结论。二、假设检验工具的使用接下来介绍如何使用Excel 的假设检验工具。使用这一工具应该注意二点：第一，由于现实世界和生活中大量的数据服从正态分布，Excel 的假设检验工具是按正态总体设计的（以下各例未特殊说明，认为其服从或近似服从正态分布）；第二，Excel 的假设检验工具主要用于检验两总体之间有无显著差异。具体来讲，Z —检验工具是对方差或标准差已知的两总体均值进行差异性检验；T —检验工具是对方差和标准差未知的两总体均值进行差异性检验，其中包括等方差假设检验、异方差假设检验和成对双样本检验；F —检验工具是对总体的标准差进行检验。（一）Z —检验工具的使用国际航空运输协会对商务旅行者进行调查以确定大西洋两岸过关机场的等级分数。假定：要求50名商务旅行者组成的随机样本给迈阿密机场打分，另50名商务旅行者组成的随机样本给洛杉机机场打分，最高等级为10分。两个样本数据如下：迈阿密机场得分数据： 6 4 6 8 7 7 6 3 3 8 10 4 8 7 8 7 5 9 5 8 4 3 8 5 5 4 4 4 8 4 5 6 2 5 9 9 8 4 8 9 9 5 9 7 8 3 10 8 9 6 洛杉机机场得分数据： 10 9 6 7 8 7 9 8 10 7 6 5 7 3 5 6 8 7 10 8 4 7 8 6 9 9 5 3 1 8 9 6 8 5 4 6 10 9 8 3 2 7 9 5 3 10 3 5 10 8 假定两总体的等级标准差已知（这里用样本标准差代替总体标准差），

异方差的检验及修正

异方差问题的检验与修正【实验目的】 1、深刻理解异方差性的实质、异方差出现的原因、异方差的出现对模型的不良影响（即异方差的后果），掌握估计和检验异方差性的基本思想和修正异方差的若干方法。 2、能够运用所学的知识处理模型中的出现的异方差问题，并要求初步掌握用Eviews处理异方差的基本操作方法。【实验原理】 1、最小二乘估计。 2、异方差。 3、最小二乘残差图解释异方差。 4、Breusch-Pagan检验（B-P检验）和White检验（怀特检验）检验特定方差函数的异方差性。 5、稳健标准差和加权最小二乘法对特定方差函数的异方差性的修正。【实验软件】 Eviews6.0 【实验步骤】一、设定模型首先将实验数据导入软件之中。（注：本实验报告正文部分只显示软件统计结果，导入数据这一步骤参见附A）本次实验的数据主要是Big Andy店的食品销售收入数据与食品价格数据，共采用了75组。实验数据来源于课本中的例题，由老师提供。如下表：表Big Andy店月销售收入和价格的观测值

sales price sales price sales price sales price 73.2 5.6975.7 5.5978.1 5.773.7671.8 6.4974.4 6.2288 5.2271.2 6.3762.4 5.6368.7 6.4180.4 5.0584.7 5.3367.4 6.2283.9 4.9679.7 5.7673.6 5.2389.3 5.0286.1 4.8373.2 6.2573.7 5.8870.3 6.4173.7 6.3585.9 5.3478.1 6.2473.2 5.8575.7 6.4783.3 4.9869.7 6.4786.1 5.4178.8 5.6973.6 6.3967.6 5.4681 6.2473.7 5.5679.2 6.2286.5 5.1176.4 6.280.2 6.4188.1 5.187.6 5.0476.6 5.4869.9 5.5464.5 6.4984.2 5.0882.2 6.1469.1 6.4784.1 4.8675.2 5.8682.1 5.3783.8 4.9491.2 5.184.7 4.8968.6 6.4584.3 6.1671.8 5.9873.7 5.6876.5 5.3566 5.9380.6 5.0282.2 5.7380.3 5.2284.3 5.273.1 5.0874.2 5.1170.7 5.8979.5 5.6281 5.2375.4 5.7175 5.2180.2 5.2873.7 6.0281.3 5.45 75 6.05 81.2 5.83 69 6.33 其中，sales 表示在某城市的月销售收入，以千美元为单位；price 表示在该城市的价格，以美元为单位。假设表1中的月销售收入数据满足假设SR1—SR5。即，假设Big Andy 店的月销售收入的期望值是产品价格水平的线性函数，误差项额的均值为零，销售收入的方差和误差项e 的方差相同，随机误差项e 在统计上不相关，且选取的价格的值是非随机的。这样，在上面的基础之上，建立Big Andy 的食品销售收入（sales ）与食品价格（price ）之间的线性模型方程： e price sales ++=10ββ根据最小二乘估计的思想估计模型参数，（此过程参见附B ）结果如下图： Coefficient Std.Error t-Statistic Prob.C 121.9002 6.52629118.678320.0000PRICE -7.829074 1.142865 -6.850394 0.0000R-squared 0.391301Mean dependent var 77.37467Adjusted R-squared 0.382963 S.D.dependent var 6.488537

实验四-异方差性的检验与处理

实验四异方差性的检验及处理（2学时）一、实验目的（1）、掌握异方差检验的基本方法；（2）、掌握异方差的处理方法。二、实验学时：2学时三、实验要求（1）掌握用MATLAB 软件实现异方差的检验和处理；（2）掌握异方差的检验和处理的基本步骤。四、实验原理 1、异方差检验的常用方法 (1) 用X-Y 的散点图进行判断 (2). 22 ?(,)(,)e x e y %%或的图形 ,),x )i i y %%i i （(e 或(e 的图形）

(3) 等级相关系数法（又称Spearman 检验）是一种应用较广的方法，既可以用于大样本，也可与小样本。 :i u 0原假设H 是等方差的；:i u 0备择假设H 是异方差；检验的三个步骤 ① ?t t y y =-%i e ② |i x %%i i 将e 取绝对值，并把|e 和按递增或递减次序排序，计算Spearman 系数rs ,其中：2 1n i i d =∑s 2 6r =1-n(n -1) |i x %i i 其中， n 为样本容量d 为|e 和的等级的差数。 ③ 做等级相关系数的显著性检验。n>8时， 22(2) 1s s n t t n r -= --0当H 成立时， /2(2),t t n α≤-若认为异方差性问题不存在； /2(2),t t n α>-反之，若||i i e x %说明与之间存在系统关系，异方差问题存在。

(4) 帕克(Park)检验帕克检验常用的函数形式：若α在统计上是显著的，表明存在异方差性。 2、异方差性的处理方法: 加权最小二乘法如果在检验过程中已经知道：222 ()()()i i i ji u Var u E u f x σσ=== 则将原模型变形为： 121()()()() () i i p pi i ji ji ji ji ji y x x u f x f x f x f x f x βββ=+?++?+L 在该模型中： 22 11 ( )()()()()() i i ji u u ji ji ji Var u Var u f x f x f x f x σσ=== 即满足同方差性。于是可以用OLS 估计其参数，得到关于参数12,,,p βββL 的无偏、有效估计量。五、实验举例例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下： No x y no x y 1 10 8 16 25 19.1 2 10 8.2 17 25 23.5 3 10 8.3 18 25 22. 4 4 10 8.1 19 2 5 23.1 5 10 8.7 20 25 15.1 6 15 12.3 21 30 24.2 7 15 9.4 22 30 16.7 8 15 11.6 23 30 27 9 15 12 24 30 26 10 15 8.9 25 30 22.1 11 20 15 26 35 30.5 12 20 16 27 35 28.7 13 20 12 28 35 31.1 14 20 13 29 35 20 15 20 19.1 30 35 29.9

描述性分析 参数估计与假设检验 方差分析 非参数检验