关于多重共线性模型的检验和克服

关于多重共线性模型的检验和克服
关于多重共线性模型的检验和克服

关于多重共线性模型的检验和克服

一、实验目的:掌握多重共线性模型的检验和处理方法

二、实验原理:判定系数检验法、逐步回归法、解释变量相关系数的检验

三、实验步骤:

1、创建一个new workfile

打开Eviews软件,点击File下New中的Workfile,创建一个新的工作文件,打开中国粮食生产函数模型的数据,观察数据,发现数据是一组以年为单位的时间数据,所以选择Annual,在Start Date 中输入1983,在End Date中输入2000,点击OK,生成后点击Save 进行保存。

2、输入数据

点击Quick下Empty Group,输入Y、X1、X2、X3、X4、X5六个变量,其中Y表示粮食产量,X1表示农业化肥施用量,X2表示粮食播种面积,X3表示成灾面积,X4表示农业机械总动力,X5表示农业劳动力。从Excel中找到数据,复制粘贴到Workfile中的对应位置,点击Name进行保存。

3、利用OLS估计模型参数

令Y为被解释变量,X1、X2、X3、X4、X5均为解释变量,对被解释变量和所有解释变量用普通最小二乘法进行估计,点击name进行保存。

点击quick下的estimate equation,输入Y C X1 X2 X3 X4 X5,对被解释变量和所有解释变量用普通最小二乘法进行估计,得结果如下:

Variable Coefficient Std. Error t-Statistic Prob.

C -12815.75 14078.90 -0.910280 0.3806

X1 6.212562 0.740881 8.385373 0.0000

X2 0.421380 0.126925 3.319919 0.0061

X3 -0.166260 0.059229 -2.807065 0.0158

X4 -0.097770 0.067647 -1.445299 0.1740

R-squared 0.982798 Mean dependent var 44127.11

Adjusted R-squared 0.975630 S.D. dependent var 4409.100

S.E. of regression 688.2984 Akaike info criterion 16.16752

Sum squared resid 5685056. Schwarz criterion 16.46431

Log likelihood -139.5077 F-statistic 137.1164

4、多重共线性的检验:解释变量之间的相关系数矩阵

Y表示粮食产量,X1表示农业化肥施用量,X2表示粮食播种面积,X3表示成灾面积,X4表示农业机械总动力,X5表示农业劳动力,R-squared为0.983,调整后的R-squared 为0.976,说明拟合优度较高,F-statistic为137.1164较大,说明变量间存在多重共线性,

X4农业机械总动力,X5农业劳动力,与Y粮食产量的关系为正相关,而他们的系数却为负,所以并不合理,推测变量之间存在相关性。

检验解释变量间的相关性,采用解释变量相关系数法进行检验,点击quick下的group statistics中的correlations,输入X1 X2 X3 X4 X5 ,得出解释变量的相关系数,发现x1,x4的相关系数为0.96,平方后大于0.8,说明x1与x4存在高度相关性。

5、多重共线性的处理:逐步回归法

首先运用OLS方法逐一求Y对各个解释变量的回归。点击quick下的estimate equation,输入Y C X1 ,得到:

a、关于Y=f(x1)

Y= 30867.31062 + 4.576114592*x1

R=0.8919412R=0.885187F=132.0666

t=11.492 2

b、关于Y=f(x2)

Y = -33822.41419 + 0.6988798505*X2

R=0.0750732R=0.017265F=1.0298665

t=1.139590 2

c、关于Y=f(x3)

Y = 35712.86142 + 0.3499782775*X3

R=0.1595632R=0.107036F=3.037721

t=1.742906 2

d、关于Y=f(x4)

Y = 31918.71828 + 0.3799666823*X4

R=0.7527072R=0.737252F=48.7..67

t=6.978587 2

e、关于Y=f(x5)

Y = -28260.02281 + 2.239614307*X5

R=0.3064292R=0.263081F=7.06018

t=2.658762 2

发现Y与解释变量X1的判定系数最大,线性关系也最为显著,即把第一个模型作为基础方程。

把X2引入基础方程,点击quick下的estimate equation,输入Y C X1 X2,得到:

Y = -43872.27229 + 4.561055211*X1 + 0.6704913829*X2

R=0.9610292R=0.955833 F=184.9504

t = 5.1567602

R-squared为0.961,拟合优度较高,t-Statistic为5.157,影响显著,X2作为一个独立解释变量保留在模型中。

再引入X3,用相同的方法进行检验,得到:

Y=-11978.18057+5.255935121*X1+ 0.408432175*X2 - 0.1946087795*X3

R=0.9795932R=0.975220 F=224.0086

t = -3.5686372

R-squared为0.979593,拟合优度较高,t-Statistic为-3.568637,影响显著,X3作为一个独立解释变量保留在模型中。

再引入X4,用相同的方法进行检验,得到:

Y = -13055.99863 + 6.167476407*X1 + 0.4160261327*X2 - 0.1686028853*X3 - 0.09448145178*X4

R=0.9827692R=0.977468 F=185.3683

t = -1.5481722

R-squared为0.983,拟合优度较高,t-Statistic为-1.548172,小于2,不显著,把X4从模型中去掉。

再把X5引入基础方程,用相同的方法进行检验,得到:

Y = -12815.75054 + 6.21256194*X1 + 0.4213801204*X2 - 0.1662595096*X3 - 0.0977********X4 - 0.028*********X5

R=0.9827982R=0.97563 F=0.97563

t = -0.1404712

R-squared为0.979803,拟合优度较高,t-Statistic为0.368223,小于2,不显著,把X5从模型中去掉。

所以模型中只包含X1、X2、X3,选择只有Y、X1、X2、X3的模型,点击view下的representation,得到Y = -11978.18057 + 5.255935121*X1 + 0.408432175*X2 -

0.1946087795*X3。

四、实验结论:

通过使用eviews软件进行多重共线性分析,最后的结果说明粮食产量与农业化肥施用量、粮食播种面积、成灾面积之间有着明显的联系,与农业机械总动力和农业劳动力之间则关系不大,这就给我们在提高粮食产量方面提供了指导性意义:

1、适量增加农业化肥的使用量,以求达到增加产量的最大值。

2、在可能的条件下扩大播种面积,以求形成规模效应。

3、尽力减少受灾面积;但是当灾害已然造成的情况下,应当极力补救,减少损失。

简单线性回归模型

第二章 简单线性回归模型 一、单项选择题 1.影响预测误差的因素有( ) A .置信度 B .样本容量 C .新解释变量X 0偏离解释变量均值的程度 D .如果给定值X 0等于X 的均值时,置信区间越长越好。 2.OLS E 的统计性质( ) A .线性无偏性 B .独具最小方差性 C .线性有偏 D .β∧ 是β的一致估计 3.OLSE 的基本假定( ) A .解释变量非随机 B .零均值 C .同方差 D .不自相关 4.F 检验与拟合优度指标之间的关系( ) A . 21111n p p R --?? ?- ?-?? B . 21111n p p R --?? ?- ?-?? C . 2111n p p R -???- ?-?? D . 2111n p p R -???- ?-?? 5.相关分析和回归分析的共同点( ) A .都可表示程度和方向 B .必须确定解释(自)变量和被解释(因)变量 C .不用确定解释(自)变量和被解释(因)变量 D .都研究变量间的统计关系 6.OLS E 的基本假设有( ) A .解释变量是随机的 B .随机误差项的零均值假设

C .随机误差项同方差假设 D .随机误差项线性相关假设 7.与 2 ()() 1 ()1i i i n x x y y i n x x i - --==∑∑ 等价的式子是( ) A .2 2 1()1i i i n x y nx y i n x n x i -=-=∑∑ B .2()1()1i i i n x x y i n x x i --==∑∑ C .2()1()1i i i n x x x i n x x i -=-=∑∑ D .xy xx L L 8.下列等式正确的是( ) A .SSR=SST+SSE B .SST=SSR+SSE C .SSE=SSR+SST D .SST=SST ×SSE 9.无偏估计量i β的方差是( ) A . 2 1 () n j j X X σ=-∑ B . 2 2 1 ()n j j X X σ=-∑ C . 2 () n j j X X σ=-∑

(完整版)多重共线性检验与修正.doc

问题: 选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y 的因素有:农业化肥施 用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程: y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下: 解: 1、检验多重共线性 (1)在命令栏中输入: ls y c x1 x2 x3 x4 x5,则有; 可以看到,可决系数R2 和 F 值都 很高,二自变量x1 到 x5 的 t 值 均较小,并且x4 和 x5 的 t 检验 不显著,说明方程很可能存在多 重共线性。 (2)对自变量做相关性分析: 将x1—— x5 作为组打开, view —— covariance analysis—— correlation ,结果如下: 可以看到x1 和 x4 的相关系数 为 0.96,非常高,说明原模型 存在多重共线性

2、多重共线性的修正 (1)逐步回归法 第一步:首先确定一个基准的解释变量,即从 x1, x2, x3, x4, x5 中选择解释 y 的最好的一个建 立基准模型。分别用 x1, x2, x3, x4, x5 对 y 求回归,结果如下: 从上面 5 个输出结果可以知道,y 对 x1 的可决系数R2=0.89(最高),因此选择 第一个方程作为基准回归模型。即: Y = 30867.31062 + 4.576114592* x1 在基准模型的基础上,逐步将x2, x3 等加入到模型中, 加入 x2,结果:

拟合优度R2=0.961395 ,显著提高; 并且参数符号符合经济常识,且均显著。 所以将模型修改为: Y= -44174.52+ 4.576460*x1+ 0.672680*x2 再加入 x3,结果: 拟合优度R2=0.984174 ,显著提高; 并且参数符号符合经济常识(成灾面积越大,粮食产 量越低),且均显著。 所以将模型修改为: Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4,结果: 拟合优度R2=0.987158 ,虽然比上一次拟 合提高了; 但是变量x4 的系数为 -0.091271 ,符号不 符合经济常识(农业机械总动力越高, 粮食产量越高),并且 x4 的 t 检验不显著。 因此应该从模型中剔除x4。

经典线性回归模型

2 经典线性回归模型 §2.1 概念与记号 1.线性回归模型是用来描述一个特定变量y 与其它一些变量x 1,…,x p 之间的关系。 2. 称特定变量y 为因变量 (dependent variable )、 被解释变量 (explained variable )、 响应变量(response variable )、被预测变量(predicted variable )、回归子 (regressand )。 3.称与特定变量相关的其它一些变量x 1,…,x p 为自变量(independent variable )、 解释变量(explanatory variable )、控制变量(control variable )、预测变量 (predictor variable )、回归量(regressor )、协变量(covariate )。 4.假定我们观测到上述这些变量的n 组值:( ) ip i i x x y , , , 1 L (i=1,…,n)。称 这n 组值为样本(sample )或数据(data )。 §2.2 经典线性回归模型的假定 假定 2.1(线性性(linearity)) i ip p i i x x y e b b b + + + + = L 1 1 0 (i=1,…,n)。 (2.1) 称方程(2.1)为因变量y 对自变量x 1,…,x p 的线性回归方程(linear regression equation ),其中 ( ) p , k k , , 1 0 L = b 是待估的未知参数(unknown parameters ), ( ) n i i , , 1 L = e 是满足一定限制条件的无法观测的误差项(unobserved error term ) 。称自 变量的函数 ip p i x x b b b + + + L 1 1 0 为回归函数(regression function )或简称为回归 (regression )。称 0 b 为回归的截距(ntercept),称 ( ) p k k , , 1 L = b 为自变量的回归系数 (regression coefficients ) 。某个自变量的回归系数表示在其它条件保持不变的情况下,

多重共线性的检验与修正

计量经济学实验报告成绩 课程名称计量经济学指导教师苏卫东实验日期 2014-6-24 院(系)财政与金融学院专业班级金融二专实验地点实验楼八机房 学生姓名单一芳学号 201212041018 同组人无 实验项目名称多重共线性的检验与修正 一、实验目的和要求 1、理解多重共线性的含义与后果 2、掌握Eviews软件的操作和多重共线性的检验与修正 二、实验原理 Eviews软件的操作和多重共线性的检验修正方法 三、主要仪器设备、试剂或材料 Eviews软件,计算机 四、实验方法与步骤 1、准备工作:建立工作文件,并输入数据 CREATE A 1974 1981; DATA Y X1 X2 X3 X4 X5 2、OLS估计: LS Y C X1 X2 X3 X4 X5; 3、计算简单相关系数 COR X1 X2 X3 X4 X5 4、多重共线性的解决 LS Y C X1; LS Y C X2; LS Y C X3; LS Y C X4; LS Y C X5;

LS Y C X1 X3; LS Y C X1 X3 X2; LS Y C X1 X3 X4; LS Y C X1 X3 X5 五、实验数据记录、处理及结果分析 1、建立工作组,输入以下数据: obs Y X1 X2 X3 X4 X5 1974 98.45 560.2 153.2 6.53 1.23 1.89 1975 100.7 603.11 190 9.12 1.3 2.03 1976 102.8 668.05 240.3 8.1 1.8 2.71 1977 133.95 715.47 301.12 10.1 2.09 3 1978 140.13 724.27 361 10.93 2.39 3.29 1979 143.11 736.13 420 11.85 3.9 5.24 1980 146.15 748.91 497.16 12.28 5.13 6.83 1981 144.6 760.32 501 13.5 5.47 8.36 1982 148.94 774.92 529.2 15.29 6.09 10.07 1983 158.55 785.3 552.72 18.1 7.97 12.57 1984 169.68 795.5 771.16 19.61 10.18 15.12 1985 162.14 804.8 811.8 17.22 11.79 18.25 1986 170.09 814.94 988.43 18.6 11.54 20.59 1987 178.69 828.73 1094.65 23.53 11.68 23.37 2、OLS估计 LS Y C X1 X2 X3 X4 X5 Dependent Variable: Y Method: Least Squares Date: 06/24/14 Time: 18:45 Sample: 1974 1987 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -3.650950 30.00144 -0.121692 0.9061 X1 0.125752 0.059087 2.128275 0.0660 X2 0.072656 0.037445 1.940317 0.0883 X3 2.681426 1.258639 2.130418 0.0658 X4 3.405866 2.444896 1.393052 0.2011 X5 -4.430561 2.194164 -2.019248 0.0781 R-squared 0.970397 Mean dependent var 142.7129

简单线性回归分析思考与练习参考答案

第10章 简单线性回归分析 思考与练习参考答案 一、最佳选择题 1.如果两样本的相关系数21r r =,样本量21n n =,那么( D )。 A. 回归系数21b b = B .回归系数12b b < C. 回归系数21b b > D .t 统计量11r b t t = E. 以上均错 2.如果相关系数r =1,则一定有( C )。 A .总SS =残差SS B .残差SS =回归 SS C .总SS =回归SS D .总SS >回归SS E. 回归MS =残差MS 3.记ρ为总体相关系数,r 为样本相关系数,b 为样本回归系数,下列( D )正确。 A .ρ=0时,r =0 B .|r |>0时,b >0 C .r >0时,b <0 D .r <0时,b <0 E. |r |=1时,b =1 4.如果相关系数r =0,则一定有( D )。 A .简单线性回归的截距等于0 B .简单线性回归的截距等于Y 或X C .简单线性回归的残差SS 等于0 D .简单线性回归的残差SS 等于SS 总 E .简单线性回归的总SS 等于0 5.用最小二乘法确定直线回归方程的含义是( B )。 A .各观测点距直线的纵向距离相等 B .各观测点距直线的纵向距离平方和最小 C .各观测点距直线的垂直距离相等 D .各观测点距直线的垂直距离平方和最小 E .各观测点距直线的纵向距离等于零 二、思考题 1.简述简单线性回归分析的基本步骤。 答:① 绘制散点图,考察是否有线性趋势及可疑的异常点;② 估计回归系数;③ 对总体回归系数或回归方程进行假设检验;④ 列出回归方程,绘制回归直线;⑤ 统计应用。 2.简述线性回归分析与线性相关的区别与联系。

经典线性回归模型的诊断与修正

经典线性回归模型的诊断与修正下表为最近20年我国全社会固定资产投资与GDP的统计数据:1 年份国内生产总值(亿元)GDP 全社会固定资产投资(亿元)PI 1996 71813.6 22913.5 1997 79715 24941.1 1998 85195.5 28406.2 1999 90564.4 29854.7 2000 100280.1 32917.7 2001 110863.1 37213.49 2002 121717.4 43499.91 2003 137422 55566.61 2004 161840.2 70477.43 2005 187318.9 88773.61 2006 219438.5 109998.16 2007 270232.3 137323.94 2008 319515.5 172828.4 2009 349081.4 224598.77 2010 413030.3 251683.77 2011 489300.6 311485.13 2012 540367.4 374694.74 2013 595244.4 446294.09 1数据来源于国家统计局网站年度数据

1、普通最小二乘法回归结果如下: 方程初步估计为: GDP=75906.54+1.1754PI (32.351) R2=0.9822F=1046.599 DW=0.3653 2、异方差的检验与修正 首先,用图示检验法,生成残差平方和与解释变量PI的散点图如下:

从上图可以看出,残差平方和与解释变量的散点图主要分布在图形的下半部分,有随PI的变动增大的趋势,因此,模型可能存在异方差。但是否确定存在异方差,还需作进一步的验证。 G-Q检验如下: 去除序列中间约1/4的部分后,1996-2003年的OLS估计结果如下所示:

多重共线性检验与修正

多重共线性检验与修正 数据来源:《中国统计年鉴2014》12-10、4-3、12-4、12-5、12-8、 Eviews操作: 1、基本操作: (1)录入数据:命令:data y l m f a ir (y代表粮食产量,l代表第一产业劳动力数量,m代表农业机械总动力,f代表化肥施用量,a代表农作物总播种面积,ir为有效灌溉面积/农作总播种面积得出的灌溉率) (2)做线性回归:命令:LS y c l m f a ir 2、检验多重共线性 (1)方差膨胀因子判断法 在生成的线性回归eq01中,view—coefficient diagnostics—variance inflation factors 看生成表格中的Centered VIF,发现L、M、F、A、IR的方差膨胀因子都很大,说明存在严重多重共线性。(eg:L的Centered VIF指以L为因变量,M、A、F、IR为自变量所做出的辅助回归的判定系数R2,然后1/1-R2得出的值。) (由课本内容可知,当完全不共线性时,VIF=1;完全共线性时,VIF=正无穷)(2)相关系数矩阵判断法 命令:cor l m f a ir 这个是通过看各个解释变量之间的相关系数来判断是否存在多重共线性的。可以看到大多数解释变量之间两两相关系数都大于0.9。相关系数极大说明解释变量之间存在很高的相关性,因而也就很可能存在共线性。 3、修正多重共线性 (1)逐步回归排除引起共线性的变量 ①菜单栏操作 在生成的线性回归eq01中,Estimate—Method—STEPLS 接下来会出现两个框框,上面的框框是固定住不做逐步回归的变量,一般设定为y和c

(整理)多重共线性的检验与修正

附件二:实验报告格式(首页) 山东轻工业学院实验报告成绩 课程名称计量经济学指导教师实验日期 2013-5-25 院(系)商学院专业班级实验地点二机房 学生姓名学号同组人无 实验项目名称多重共线性的检验与修正 一、实验目的和要求 掌握Eviews软件的操作和多重共线性的检验与修正 二、实验原理 Eviews软件的操作和多重共线性的检验修正方法 三、主要仪器设备、试剂或材料 Eviews软件,计算机 四、实验方法与步骤 (1)准备工作:建立工作文件,并输入数据: CREATE EX-7-1 A 1974 1981; TATA Y X1 X2 X3 X4 X5 ; (2)OLS估计: LS Y C X1 X2 X3 X4 X5; (3)计算简单相关系数 COR X1 X2 X3 X4 X5 ; (4)多重共线性的解决 LS Y C X1; LS Y C X2; LS Y C X3; LS Y C X4; LS Y C X5; LS Y C X1 X3; LS Y C X1 X3 X2; LS Y C X1 X3 X4; LS Y C X1 X3 X5; 五、实验数据记录、处理及结果分析 (1)建立工作组,输入以下数据: 98.45 560.20 153.20 6.53 1.23 1.89 100.70 603.11 190.00 9.12 1.30 2.03 102.80 668.05 240.30 8.10 1.80 2.71 133.95 715.47 301.12 10.10 2.09 3.00 140.13 724.27 361.00 10.93 2.39 3.29

简单线性回归模型练习题

第二章 简单线性回归模型练习题 一、术语解释 1 解释变量 2 被解释变量 3 线性回归模型 4 最小二乘法 5 方差分析 6 参数估计 7 控制 8 预测 二、填空 1 在经济计量模型中引入反映( )因素影响的随机扰动项t ξ,目的在于使模型更符合( )活动。 2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的( )、社会环境与自然环境的( )决定了经济变量本身的( );(2)建立模型时其他被省略的经济因素的影响都归入了( )中;(3)在模型估计时,( )与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了( )与( )之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。 3 ( )是因变量离差平方和,它度量因变量的总变动。就因变量总变动的变异来源看,它由两部分因素所组成。一个是自变量,另一个是除自变量以外的其他因素。( )是拟合值的离散程度的度量。它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。( )是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。 4 回归方程中的回归系数是自变量对因变量的( )。某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。 5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。 6 样本观察值与回归方程理论值之间的偏差,称为( ),我们用残差估计线性模型中的( )。 三、简答题 1 在线性回归方程中,“线性”二字如何理解 2 用最小二乘法求线性回归方程系数的意义是什么 3 一元线性回归方程的基本假设条件是什么 4 方差分析方法把数据总的平方和分解成为两部分的意义是什么 5 试叙述t 检验法与相关系数检验法之间的联系。 6 应用线性回归方程控制和预测的思想。 7 线性回归方程无效的原因是什么 8 回归分析中的随机误差项i ε有什么作用它与残差项t e 有何区别

计量经济学多重共线性

2014-8-8 商学院 王中昭 教学内容 一、多重共线性 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的办法和实例 §4.3 多重共线性

2014-8-8商学院 王中昭 对于模型Y i =β0+ β1x 1i + β2x 2i +…… βk x ki +μi 如果某两个或多个解释变量之间出现相关性,即:C 1x 1i +C 2X 2i +……C k X ki =0 其中C i 不全为0,即某一个解释变量是其他解释变量的线性组合,则称为完全多重共线性。 完全多重共线性的情况并不多见,一般是出现不同程度的多重共线性。 注意多重共线性不 是指因变量与解释 一、多重共线性概念

2014-8-8商学院 王中昭 Y=Xβ+μ完全共线性:∣X′X ∣=0,(X′X)-1不存在, 使B ^=(X′X)-1X′Y 无法求解。 例如:, 0)(0020 1631084104213211 x x x 3213322113 21≠'=+-=++??????? ??=X X x x x X i i i i i i x c x c x c 这里,完全多重共线性

2014-8-8商学院 王中昭完全多重共线性的情况不多,一般出现不同程度的多重共线性。 多重共线性:∣X′X∣≈0,(X′X)-1存在,但 (X′X)-1主对角线上的元素很大。 ????? ?='≈'?≈+??????? ??=400300000300000100040030000030000010002100010004X)X ( ,0)( 0,0x x - x 199 .2993001001.4004001099.1992001101.1001001 x x x 1 -3i 2i 1i 3 21||这里,X X X 近似多重共线性

所有计量经济学检验方法(全)

计量经济学所有检验方法 一、拟合优度检验 可决系数 TSS RSS TSS ESS R - ==12 TSS 为总离差平方和,ESS 为回归平方和,RSS 为残差平方和 该统计量用来测量样本回归线对样本观测值的拟合优度。 该统计量越接近于1,模型的拟合优度越高。 调整的可决系数)1/() 1/(12---- =n TSS k n RSS R 其中:n-k-1为残差平方和的自由度,n-1为总体平方和的 自由度。将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。 二、方程的显著性检验(F 检验) 方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。 原假设与备择假设:H 0:β1=β2=β3=…βk =0 H 1: βj 不全为0 统计量 )1/(/--= k n RSS k ESS F 服从自由度为(k , n-k-1)的F 分布,给定显著性水平α,可得到临界值 F α(k,n-k-1),由样本求出统计量F 的数值,通过F>F α(k,n-k-1)或F ≤F α(k,n-k-1)来拒绝或接受原假设H 0,以判定原方程总体上的线性关系是否显著成立。 三、变量的显著性检验(t 检验) 对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。 原假设与备择假设:H0:βi =0 (i=1,2…k );H1:βi ≠0 给定显著性水平α,可得到临界值t α/2(n-k-1),由样本求出统计量t 的数值,通过 |t|> t α/2(n-k-1) 或 |t|≤t α/2(n-k-1) 来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。 四、参数的置信区间 参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。 统计量 )1(~1??? ----'--= k n t k n c S t ii i i i i i e e βββββ 在(1-α)的置信水平下βi 的置信区间是 ( , ) ββααββ i i t s t s i i -?+?2 2 ,其中,t α/2为显著性水平 为α、自由度为n-k-1的临界值。 五、异方差检验 1. 帕克(Park)检验与戈里瑟(Gleiser)检验 试建立方程:i ji i X f e ε+=)(~2 或 i ji i X f e ε+=)(|~| 选择关于变量X 的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。

多重共线性问题的检验和处理

山西大学 实验报告 实验报告题目:多重共线性问题的检验和处理 学院: 专业: 课程名称:计量经济学 学号: 学生姓名: 教师名称:崔海燕 上课时间:

一、实验目的: 熟悉和掌握Eviews在多重共线性模型中的应用,掌握多重共线性问题的检 验和处理。 二、实验原理:1、综合统计检验法; 2、相关系数矩阵判断; 3、逐步回归法; 三、实验步骤: (一)新建工作文件并保存 打开Eviews软件,在主菜单栏点击File\new\workfile,输入start date 1978和end date 2006并点击确认,点击save键,输入文件名进行保存。 (二)输入并编辑数据 在主菜单栏点击Quick键,选择empty\group新建空数据栏,根据理论和经 验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、 成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为 负,其余均应为正。下表给出了1983——2000中国粮食生产的相关数据。点击name 键进行命名,选择默认名称Group01,保存文件。 Y X1 X2 X3 X4 X5 1983 38728 1660 114047 16209 18022 31151 1984 40731 1740 112884 15264 19497 30868 1985 37911 1776 108845 22705 20913 31130 1986 39151 1931 110933 23656 22950 31254 1987 40208 1999 111268 20393 24836 31663 1988 39408 2142 110123 23945 26575 32249 1989 40755 2357 112205 24449 28067 33225 1990 44624 2590 113466 17819 28708 38914 1991 43529 2806 112314 27814 29389 39098 1992 44264 2930 110560 25895 30308 38669 1993 45649 3152 110509 23133 31817 37680 1994 44510 3318 109544 31383 33802 36628 1995 46662 3594 110060 22267 36118 35530 1996 50454 3828 112548 21233 38547 34820 1997 49417 3981 112912 30309 42016 34840 1998 51230 4084 113787 25181 45208 35177 1999 50839 4124 113161 26731 48996 35768 2000 46218 4146 108463 34374 52574 36043 2001 45264 4254 106080 31793 55172 36513 2002 45706 4339 103891 27319 57930 36870 2003 43070 4412 99410 32516 60387 36546

检验多重共线性

实验目的:在回归模型牵涉到多个自变量的时候,自变量之间可能会相互关联,即他们之间存在有多重共线性,本节实验的实验目的是如何用Eviews检测各个自变量之间是否存在的多重共线问题以及如何对多重共线性进行修正。 我们实验的原始数据如图所示,判断钢产量y与生铁产量X1,发电量X2,固定资产投资X3,国内生产总值X4,铁路运输量X5之间的关系。 实验步骤: 1:打开Eviews7.0. →File→Workfile,选择年度数据,在初始日期和结束日期分别输入“1978”和结束年份“1997”。点击“OK”确定。 2:在新建工作表中,点击Proc→Import→Read,选定需要导入的Excel工作表,在“Upper-left data cell”中输入数据在Excel中的初始位置“B2”,在“Excel 5+….”中输入“sheet1”,在“Name for serises、”中输入“y x1 x2 x3 x4 x5”点击“OK”即可。 3:在Eviews空白处输入:“ls y c x1 x2 x3 x4 x5”,回车即可,结果如下。

Dependent Variable: Y Method: Least Squares Date: 04/19/13 Time: 11:24 Sample: 1978 1997 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C 354.5884 435.6968 0.813842 0.4294 X1 0.026041 0.120064 0.216892 0.8314 X2 0.994536 0.136474 7.287380 0.0000 X3 0.392676 0.086468 4.541271 0.0005 X4 -0.085436 0.016472 -5.186649 0.0001 X5 -0.005998 0.006034 -0.994019 0.3371 R-squared 0.999098 Mean dependent var 5153.450 Adjusted R-squared 0.998776 S.D. dependent var 2512.131 S.E. of regression 87.87969 Akaike info criterion 12.03314 Sum squared resid 108119.8 Schwarz criterion 12.33186 Log likelihood -114.3314 Hannan-Quinn criter. 12.09145 F-statistic 3102.411 Durbin-Watson stat 1.919746 Prob(F-statistic) 0.000000 经查表可知,t(17)=1.345,结合上表可知,x1和x5没有通过t检验,而且F\检验较大,估计解释变量之间可能存在着多重共线性。相关性如下图所示: 可知X1 X2 X3 X4 X5,之间存在着较强的多重共线

EViews计量经济学实验报告-多重共线性的诊断与修正

时间 地点 实验题目 多重共线性的诊断与修正 一、实验目的与要求: 要求目的:1、对多元线性回归模型的多重共线性的诊断; 2、对多元线性回归模型的多重共线性的修正。 二、实验内容 根据书上第四章引子“农业的发展反而会减少财政收入”,1978-2007年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV 软件,做回归分析,判断是否存在多重共线性,以及修正。 三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等) (一)模型设定及其估计 经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。研究“农业的发展反而会减少财政收入”这个问题。 设定如下形式的计量经济模型:i Y =1β+2β2X +3β3X +4β4X +5β5X +6β6X +7β7X +i μ 其中,i Y 为财政收入CS/亿元;2X 为农业增加值NZ/亿元;3X 为工业增加值GZ/亿元;4X 为建筑业增加值JZZ/亿元;5X 为总人口TPOP/万人;6X 为最终消费CUM/亿元;7X 为受灾面积SZM/千公顷。 图1: 1978~2007年财政收入及其影响因素数据 年份 财政收入CS/亿元 农业增加值NZ/亿元 工业增加值GZ/亿元 建筑业 增加值 JZZ/亿 元 总人口 TPOP/万 人 最终消费 CUM/亿元 受灾面 积SZM/ 千公顷 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 3714.8 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 21899.9 48829 1994 5218.1 9572.7 19480.7 2964.7 119850 29242.2 55043

多重共线性题目的检验和处理

山西大学 实 验 报 告 实验报告题目:多重共线性问题的检验和处理 学 院: 专 业: 课程名称: 计量经济学 学 号: 学生姓名: 教师名称: 崔海燕 上课时间: 题电源备,检查料试卷资料试

一、实验目的: 熟悉和掌握Eviews在多重共线性模型中的应用,掌握多重共线性问题的检 验和处理。 二、实验原理:1、综合统计检验法; 2、相关系数矩阵判断; 3、逐步回归法; 三、实验步骤: (一)新建工作文件并保存 打开Eviews软件,在主菜单栏点击File\new\workfile,输入start date 1978和end date 2006并点击确认,点击save键,输入文件名进行保存。 (二)输入并编辑数据 在主菜单栏点击Quick键,选择empty\group新建空数据栏,根据理论和 经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面 积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾 面积的符号为负,其余均应为正。下表给出了1983——2000中国粮食生产的相关 数据。点击name键进行命名,选择默认名称Group01,保存文件。 Y X1X2X3X4X5 1983387281660114047162091802231151 1984407311740112884152641949730868 1985379111776108845227052091331130 1986391511931110933236562295031254 1987402081999111268203932483631663 1988394082142110123239452657532249 1989407552357112205244492806733225 1990446242590113466178192870838914 1991435292806112314278142938939098 1992442642930110560258953030838669 1993456493152110509231333181737680 1994445103318109544313833380236628 1995466623594110060222673611835530 1996504543828112548212333854734820 1997494173981112912303094201634840 1998512304084113787251814520835177 1999508394124113161267314899635768 2000462184146108463343745257436043 2001452644254106080317935517236513 2002457064339103891273195793036870 200343070441299410325166038736546

多重共线性的判断与修正

多重共线性的判断与修正 一、多重共线性的判断 1. 综合统计检验法 LS Y C X1 X2 对模型进行OLS, 得到参数估计表 (1) 当2,R F 很大,而回归系数的t 检验值小于临界值时,可判定该模型存在多重共线性。 (2) 当完全共线性存在时,模型的OLS 无法进行,Eviews 会提示:矩阵的逆(1()T X X -)不 存在。 2. 简单相关系数检验法 LS Y C X1 X2 对模型进行OLS, 得到参数估计表中的2 R . 点击:Quick/Group Statistics/Correlation 在对话框中输入:X1 X2 , 点击OK, 即可得到简单相关系数矩阵 检验:若存在 i j x x r 接近于1, 或 22,i j x x r R >,则说明,i j x x 之间存在着严重的相关性。 3. 辅助回归法(方差扩大因子法) 设 121112...(1)(1)...j j k Xj X X X j X j Xk V ααααα-+=+++-+++++ (j ) LS Xj X1 X2…Xk 对(j) 进行OLS, 得到参数估计表 检验:若表中 (2,1)F F k n k α>--+, 则可确定存在多重共线性。 或者(方差扩大因子法):计算211j j VIF R =-, (2j R 为以上方程的可决系数), 若10j VIF ≥, 则可确定存在多重共线性。 4. 逐步回归法 1) 首先计算被解释变量对每个解释变量的回归方程,得到基本回归方程: LS Y C Xi OLS ,得到基本回归方程(i), i = 1,2,…,k 2) 从这些基本回归方程中选出最合理的方程, 即,2 R 取值最大,且t 检验显著。比方说,0j Y Xj ββ=+ 3) 在这个选出的方程中增加新的解释变量, 再进行OLS 分析: LS Y C Xj Xi ( i= 1,2,…,j-1, j+1,…k) 判断: 如果新加入的解释变量对2 R 改进最大, 且每个系数又是t 统计显著,则保留这个新的解释变量。转4) 如果新加入的解释变量不仅使2R 变小, 且t 统计不显著,以至于使某些系数达到不能

实验六多元线性回归和多重共线性

实验六多元线性回归和多重共线性 姓名:何健华 学号:201330110203 班级:13金融数学2班 一 实验目的: 掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二 实验要求: 应用教材P140例子4.3.1案例做多元线性回归模型,并识别和修正多重共线性。 三 实验原理: 普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 四 预备知识: 最小二乘法估计的原理、t 检验、F 检验、R 2值。 五 实验步骤: 有关的研究分析表明,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出外,还可能与基础设施有关。因此考虑影响国内旅游收入Y (单位为亿元)的以下几个因素:国内旅游人数X1、城镇居民人均旅游支出X2(单位为元)、农村居民人均旅游支出X3(单位为元)、并以公路里程X4(单位为万公里)和铁路里程X5(单位为万公里)作为相关设施的代表,根据这些变量建立如下的计量经济模型: 01122334455y x x x x x ββββββμ=++++++ 为了估计上述模型,从《中国统计年鉴》收集到1994年到2003年的有关统计数据。 Year Y X1 X2 X3 X4 X5 1994 1023.5 52400 414.7 54.9 111.78 5.9 1995 1375.7 62900 464 61.5 115.7 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.6 1998 2391.2 69450 607 197 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.8 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200 180.98 7.3 1、 请用普通最小二乘方法估计模型参数; 2、 检验模型是否存在多重共线性,如果存在共线性,试采用适当的方法消除共线性。

计量经济学实验四 序列相关的检验与修正

实验四 序列相关的检验与修正 实验目的 1、理解序列相关的含义后果、 2、学会序列相关的检验与消除方法 实验内容 利用下表资料,试建立我国城乡居民储蓄存款模型,并检验模型的自相关性。 表3 我国城乡居民储蓄存款与GDP 统计资料(1978年=100) 一、模型的估计 0、准备工作。建立工作文件,并输入数据。 1、相关图分析 SCAT X Y 相关图表明,GDP 指数与居民储蓄存款二者的曲线相关关系较为明显。现将函数初步设定为线性、双对数等不同形式,进而加以比较分析。 2、估计模型,利用LS 命令分别建立以下模型 ⑴线性模型: LS Y C X x y 5075.9284.14984?+-=

=t (-6.706) (13.862) 2R =0.9100 F =192.145 S.E =5030.809 ⑵双对数模型:GENR LNY=LOG(Y) GENR LNX=LOG(X) LS LNY C LNX x y ln 9588.20753.8?ln +-= =t (-31.604) (64.189) 2R =0.9954 F =4120.223 S.E =0.1221 3、选择模型 比较以上模型,可见各模型回归系数的符号及数值较为合理。各解释变量及常数项都通过了t 检验,模型都较为显著。比较各模型的残差分布表。线性模型的残差在较长时期内呈连续递减趋势而后又转为连续递增趋势,残差先呈连续递增趋势而后又转为连续递减趋势,因此,可以初步判断这种函数形式设置是不当的。而且,这个模型的拟合优度也较双对数模型低,所以又可舍弃线性模型。双对数模型具有很高的拟合优度,因而初步选定回归模型为双对数回归模型。 二、模型自相关的检验 1.图示法 其一,残差序列e t 的变动趋势图。菜单:Quick→Graph→line ,在对话框中输入resid ;或者用命令操作,直接在命令行输入:line X 。 其二,作e t-1和e t 之间的散点图。菜单:Quick→Graph→Scatter ,在对话框中输入resid(-1) resid ;或者用命令操作,直接在命令行输入:scat resid(-1) resid 。 2.DW 检验 因为n =21,k =1,取显著性水平α=0.05时,查表得L d =1.22,U d =1.42,而0<0.7062=DW

相关文档
最新文档