第7章分布滞后模型与自回归模型多重共线性.doc

第7章分布滞后模型与自回归模型多重共线性.doc
第7章分布滞后模型与自回归模型多重共线性.doc

计量经济学课程教案

第7章 分布滞后模型与自回归模型

7.1 滞后效应与滞后变量模型

在经济运行过程中,广泛存在时间滞后效应。某些经济变量不仅受到同期各种因素的影响,而且也受到过去某些时期的各种因素甚至自身的过去值的影响。

通常把这种过去时期的,具有滞后作用的变量叫做滞后变量(Lagged Variable ),含有滞后变量的模型称为滞后变量模型。

滞后变量模型考虑了时间因素的作用,使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型,又称动态模型(Dynamical Model )。

一、滞后效应与与产生滞后效应的原因

因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。 表示前几期值的变量称为滞后变量。 如:消费函数

通常认为,本期的消费除了受本期的收入影响之外,还受前1期,或前2期收入的影响: C t =β0+β1Y t +β2Y t-1+β3Y t-2+μt Y t-1,Y t-2为滞后变量。 产生滞后效应的原因

1、心理因素:人们的心理定势,行为方式滞后于经济形势的变化,如中彩票的人不可能很快改变其生活方式。

2、技术原因:如当年的产出在某种程度上依赖于过去若干期内投资形成的固定资产。

3、制度原因:如定期存款到期才能提取,造成了它对社会购买力的影响具有滞后性。 二、滞后变量模型

以滞后变量作为解释变量,就得到滞后变量模型。它的一般形式为:

q ,s :滞后时间间隔

自回归分布滞后模型(autoregressive distributed lag model, ADL ):既含有Y 对自身滞后变量的回归,还包括着X 分布在不同时期的滞后变量

有限自回归分布滞后模型:滞后期长度有限 无限自回归分布滞后模型:滞后期无限,

(1)分布滞后模型(distributed-lag model )

分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X 的当期值及其若干期的滞后值:

β0:短期(short-run)或即期乘数(impact multiplier),表示本期X 变化一单位对Y 平均值的影响程度。

βi (i=1,2…,s):动态乘数或延迟系数,表示各滞后期X 的变动对Y 平均值影响的大小。

称为长期(long-run )或均衡乘数(total distributed-lag multiplier ),表示X 变动一

个单位,由于滞后效应而形成的对Y 平均值总影响的大小。

如果各期的X 值保持不变,则X 与Y 间的长期或均衡关系即为:

X

Y E s

i i )()(0

∑=+=βα∑=s

i i

t

i t i s

i t X Y μβα++=-=∑0

t

s t s t t q t q t t t X X X Y Y Y Y μαααββββ+++++++++=-----ΛΛ11022110

2、自回归模型(autoregressive model )

自回归模型:模型中的解释变量仅包含X 的当期值与被解释变量Y 的一个或多个滞后值

称为一阶自回归模型(first-order autoregressive model )。

§7.2 分布滞后模型的参数估计 一、分布滞后模型估计的困难

无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计。 有限期的分布滞后模型,OLS 会遇到如下问题: 1、没有先验准则确定滞后期长度;

2、如果滞后期较长,将缺乏足够的自由度进行估计和检验;

3、同名变量滞后值之间可能存在高度线性相关,即模型存在高度的多重共线性。 二、分布滞后模型的修正估计方法

人们提出了一系列的修正估计方法,但并不很完善。

各种方法的基本思想大致相同:都是通过对各滞后变量加权,组成线性合成变量而有目的地减少滞后变量的数目,以缓解多重共线性,保证自由度。

(1)经验加权法

根据实际问题的特点、实际经验给各滞后变量指定权数,滞后变量按权数线性组合,构成新的变量。权数据的类型有:

递减型

即认为权数是递减的,X 的近期值对Y 的影响较远期值大。

如消费函数中,收入的近期值对消费的影响作用显然大于远期值的影响。 例如:滞后期为 3的一组权数可取值如下:1/2, 1/4, 1/6, 1/8

则新的线性组合变量为:

矩型:

即认为权数是相等的,X 的逐期滞后值对值Y 的影响相同。 如滞后期为3,指定相等权数为1/4,则新的线性组合变量为:

倒V 型

权数先递增后递减呈倒“V”型。

例如:在一个较长建设周期的投资中,历年投资X 为产出Y 的影响,往往在周期期中投资对本期产出贡献最大。如滞后期为4,权数可取为1/6, 1/4, 1/2, 1/3, 1/5

则新变量为

321181614121---+++=

t t t t t X X X X W 432135*********----++++=

t t t t t t X X X X X W 321241414141---+++=

t t t t t X X X X W t t t t Y X Y μααα+++=-1210t

q

i i t i t t Y X Y μβαα+++=∑=-1

10

经验权数法的优点是:简单易行 缺点是:设置权数的随意性较大

通常的做法是:多选几组权数,分别估计出几个模型,然后根据常用的统计检验(R方检验,F检验,t 检验,D-W检验),从中选择最佳估计式。

(2)阿尔蒙(Almon )多项式法

主要思想:针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少解释变量个数,然后用OLS 法估计参数。

主要步骤为:

第一步,阿尔蒙变换

对于分布滞后模型

假定其回归系数βi 可用一个关于滞后期i 的适当阶数的多项式来表示,即:

其中,m

(3)科伊克(Koyck )方法

科伊克方法是将无限分布滞后模型转换为自回归模型,然后进行估计。

对于无限分布滞后模型:

科伊克变换假设βi 随滞后期i 按几何级数衰减:

其中,0<λ<1,称为分布滞后衰减率,1-λ称为调整速率(Speed of adjustment )。

科伊克模型的特点:

(1)以一个滞后因变量Yt-1代替了大量的滞后解释变量Xt-i ,最大限度地节省了自由度,解决了滞后期长度s 难以确定的问题;

(2)由于滞后一期的因变量Yt-1与Xt 的线性相关程度可以肯定小于X 的各期滞后值之间的相关程度,从而缓解了多重共线性。

但科伊克变换也同时产生了两个新问题: (1)模型存在随机项和vt 的一阶自相关性; (2)滞后被解释变量Yt-1与随机项vt 不独立。 这些新问题需要进一步解决。

§7.3 自回归模型的构造

一个无限期分布滞后模型可以通过科伊克变换转化为自回归模型。

事实上,许多滞后变量模型都可以转化为自回归模型,自回归模型是经济生活中更常见的模型。 以适应预期模型以及局部调整模型为例进行说明。 一、自适应预期(Adaptive expectation )模型 在某些实际问题中,因变量Yt 并不取决于解释变量的当前实际值Xt ,而取决于Xt 的“预期水平”或“长期均衡水平”Xte。

t

i t k k k s i t X i Y μαα+++=-==∑∑2

1

))1((∑=+=m

k k

k i i 1

)1(αβt

i t i s

i t X Y μβα++=-=∑0

t

i i t i t X Y μβα++=∑∞

=-0

i

i λββ0=t

s

i t s i i t X i X i μααα+++++=∑∑=-=-0

2220

1)1()1(2

212

1)1()1()1(+++=+=∑=i i i k k k i αααβ

例如,家庭本期消费水平,取决于本期收入的预期值; 市场上某种商品供求量,决定于本期该商品价格的均衡值。 因此,自适应预期模型最初表现形式是

由于预期变量是不可实际观测的,往往作如下自适应预期假定:

其中:r 为预期系数(coefficient of expectation ), 0≤r ≤1。

该式的经济含义为:“经济行为者将根据过去的经验修改他们的预期”,即本期预期值的形成是一个逐步调整过程,本期预期值的增量是本期实际值与前一期预期值之差的一部分,其比例为r 。

这个假定还可写成:

可将自适应预期模型转化为自回归模型。

二、局部调整(Partial Adjustment)模型

局部调整模型主要是用来研究物资储备问题的。

例如,企业为了保证生产和销售,必须保持一定的原材料储备。对应于一定的产量或销售量Xt ,存在着预期的最佳库存Yte 。

局部调整模型的最初形式为

Yte 不可观测。由于生产条件的波动,生产管理方面的原因,库存储备Yt 的实际变化量只是预期变化的一部分。可见,局部调整模型转化为自回归模型

§7.4 自回归模型的参数估计

对于自回归模型

估计时的主要问题:滞后被解释变量的存在可能导致它与随机扰动项相关,以及随机扰动项出现序列相关性。

因此,对自回归模型的估计主要需视滞后被解释变量与随机扰动项的不同关系进行估计。 以一阶自回归模型为例说明: 一、 工具变量法

对于一阶自回归模型

若Yt-1与μt 同期相关,则OLS 估计是有偏的,并且不是一致估计。

因此,对上述模型,通常采用工具变量法,即寻找一个新的经济变量Zt ,用来代替Yt-1。 参数估计量具有一致性。

在实际估计中,一般用X 的若干滞后的线性组合作为Yt-1的工具变量:

由于原模型已假设随机扰动项μt 与解释变量X 及其滞后项不存在相关性,因此上述工具变量与μt 不再线性相关。

一个更简单的情形是直接用Xt-1作为Yt-1的工具变量。 二、普通最小二乘法

t

e t t X Y μββ++=10)

(11e t t e t e t X X r X X ---=-e t t e t X r rX X 1

)1(--+=t

t e t X Y μββ++=10t

q

i i t i t t Y X Y μβαα+++=∑=-1

10t

t t t Y X Y μααα+++=-1210s t s t t t X X X Y ----++++=ααααΛ221101?

若滞后被解释变量Yt-1与随机扰动项μt 同期无关(如局部调整模型),可直接使用OLS 法进行估计,得到一致估计量。注意:上述工具变量法只解决了解释变量与μt 相关对参数估计所造成的影响,但没有解决μt 的自相关问题。

事实上,对于自回归模型, μt 项的自相关问题始终存在,对于此问题,至今没有完全有效的解决方法。唯一可做的,就是尽可能地建立“正确”的模型,以使序列相关性的程度减轻。

例7.4.1 建立中国长期货币流通量需求模型

经验表明:中国改革开放以来,对货币需求量(Y)的影响因素,主要有资金运用中的贷款额(X)以及反映价格变化的居民消费者价格指数(P)。

注意:

尽管D.W.=1.733,但不能据此判断自回归模型不存在自相关(Why?)。 但 LM=0.7855,

α=5%下,临界值χ2(1)=3.84, 判断:模型已不存在一阶自相关。

§7.5 格兰杰因果关系检验

自回归分布滞后模型旨在揭示:某变量的变化受其自身及其他变量过去行为的影响。 然而,许多经济变量有着相互的影响关系

问题:当两个变量在时间上有先导——滞后关系时,能否从统计上考察这种关系是单向的还是双向的?即:主要是一个变量过去的行为在影响另一个变量的当前行为呢?还是双方的过去行为在相互影响着对方的当前行为?

格兰杰因果关系检验(Granger test of causality ) 对两变量Y 与X ,格兰杰因果关系检验要求估计:

分别做包含与不包含X 滞后项的回归,记前者与后者的残差平方和分别为RSSU 、RSSR ;再计算F

统计量:

如果: F>F α(m,n-k) ,则拒绝原假设,认为X 是Y 的格兰杰原因。

注意:格兰杰因果关系检验对于滞后期长度的选择有时很敏感。不同的滞后期可能会得到完全不同的检验结果。因此,一般而言,常进行不同滞后期长度的检验,以检验模型中随机误差项不存在序列相关的滞后期长度来选取滞后期。

思考题

1、什么是滞后现象?产生滞后现象的原因是什么?

2、对分布滞后模型进行估计存在哪些困难?实际应用中如何处理这些困难?

3、检验一阶自回归模型随机扰动项是否存在自相关,为什么用德宾h 检验而不用DW 检验?

t

i t m

i i m i i t i t X Y X 21

1

μδλ++=-==-∑∑)/(/)(k n RSS m RSS RSS F U U R --=

t

i t m

i i m i i t i t Y X Y 11

1

μβα++=-==-∑∑

简单线性回归模型

第二章 简单线性回归模型 一、单项选择题 1.影响预测误差的因素有( ) A .置信度 B .样本容量 C .新解释变量X 0偏离解释变量均值的程度 D .如果给定值X 0等于X 的均值时,置信区间越长越好。 2.OLS E 的统计性质( ) A .线性无偏性 B .独具最小方差性 C .线性有偏 D .β∧ 是β的一致估计 3.OLSE 的基本假定( ) A .解释变量非随机 B .零均值 C .同方差 D .不自相关 4.F 检验与拟合优度指标之间的关系( ) A . 21111n p p R --?? ?- ?-?? B . 21111n p p R --?? ?- ?-?? C . 2111n p p R -???- ?-?? D . 2111n p p R -???- ?-?? 5.相关分析和回归分析的共同点( ) A .都可表示程度和方向 B .必须确定解释(自)变量和被解释(因)变量 C .不用确定解释(自)变量和被解释(因)变量 D .都研究变量间的统计关系 6.OLS E 的基本假设有( ) A .解释变量是随机的 B .随机误差项的零均值假设

C .随机误差项同方差假设 D .随机误差项线性相关假设 7.与 2 ()() 1 ()1i i i n x x y y i n x x i - --==∑∑ 等价的式子是( ) A .2 2 1()1i i i n x y nx y i n x n x i -=-=∑∑ B .2()1()1i i i n x x y i n x x i --==∑∑ C .2()1()1i i i n x x x i n x x i -=-=∑∑ D .xy xx L L 8.下列等式正确的是( ) A .SSR=SST+SSE B .SST=SSR+SSE C .SSE=SSR+SST D .SST=SST ×SSE 9.无偏估计量i β的方差是( ) A . 2 1 () n j j X X σ=-∑ B . 2 2 1 ()n j j X X σ=-∑ C . 2 () n j j X X σ=-∑

自回归分布滞后模型ADL的运用试验指导-时间序列分析

案例六 自回归分布滞后模型(ADL )的运用实验指导 一、实验目的 理解ADL 模型的原理与应用条件,学会运用ADL 模型来估计变量之间长期稳定关系。理解从经济理论上来说,两个经济变量之间的确有长期关系采用使用该模型进行估计。理解ADL 模型的优点:不管回归项是不是1阶单整或平稳都可以进行检验和估计。而进行标准的协整分析前,必须把变量分类成(0)I 和(1)I 。 二、基本概念 Jorgenson(1966)提出的(,p q )阶自回归分布滞后模型ADL(autoregressive distributed lag):011111 i t t p t p t t q t q i t i i y y y ταφφεθεθεβ-----='=++++--+∑x ,其中t i -x 是滞后i 期 的外生变量向量(维数与变量个数相同),且每个外生变量的最大滞后阶数为i τ,i β是参数向量。当不存在外生变量时,模型就退化为一般ARMA (,p q )模型。 如果模型中不含有移动平均项,可以采用OLS 方法估计参数,若模型中含有移动平均项,线性OLS 估计将是非一致性估计,应采用非线性最小二乘估计。 三、实验内容及要求 (1)实验内容 运用ADL 模型研究1992年1月到1998年12月我国城镇居民月对数人均生活费支出yt 和对数可支配收入xt 之间的长期稳定关系。 (2)实验要求 在认真理解模型应用条件的基础上,通过实验掌握ADL 模型的实际应用方法,并熟悉Eniews 的具体操作过程。 四、实验指导 (1)数据录入 打开Eviews 软件,选择“File”菜单中的“New --Workfile”选项,在“Workfile structure type ”栏选择“Dated-regular frequency ”,在“Data specification ”栏中“Frequency ”中选择“Monthly ”即月份数据,起始时间输入1992m1即1992年1月份,止于1998m12,点击ok ,见图6-1,这样就建立了一个工作文件。 图6-1 建立工作文件窗口

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/千 克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

自回归分布滞后模型

案例六自回归分布滞后模型(ADL)的运用实验指 导 一、实验目的 理解ADL模型的原理与应用条件,学会运用ADL模型来估计变量之间长期稳定关系。理解从经济理论上来说,两个经济变量之间的确有长期关系采用使用该模型进行估计。理解ADL模型的优点:不管回归项是不是1阶单整或平稳都可以进行检验和估计。而进行标准的协整分析前,必须把变量分类成 和 。 二、基本概念 Jorgenson(1966)提出的( )阶自回归分布滞后模型ADL(autoregressive distributed lag): ,其中 是滞后 期的外生变量向量(维数与变量个数相同),且每个外生变量的最大滞后阶数为 , 是参数向量。当不存在外生变量时,模型就退化为一般ARMA( )模型。 如果模型中不含有移动平均项,可以采用OLS方法估计参数,若模型中含有移动平均项,线性OLS估计将是非一致性估计,应采用非线性最小二乘估计。

三、实验内容及要求 (1)实验内容 运用ADL模型研究1992年1月到1998年12月我国城镇居民月对数人均生活费支出yt和对数可支配收入xt之间的长期稳定关系。 (2)实验要求 在认真理解模型应用条件的基础上,通过实验掌握ADL模型的实际应用方法,并熟悉Eniews的具体操作过程。 四、实验指导 (1)数据录入 打开Eviews软件,选择“File”菜单中的“New--Workfile”选项,在“Workfile structure type”栏选择“Dated-regular frequency”,在“Data specification”栏中“Frequency”中选择“Monthly”即月份数据,起始时间输入1992m1即1992年1月份,止于1998m12,点击ok,见图6-1,这样就建立了一个工作文件。 图6-1 建立工作文件窗口

一元线性回归模型案例分析

一元线性回归模型案例分析 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表2.5的数据: 表2.52002年中国各地区城市居民人均年消费支出和可支配收入

第十三章 时间序列回归

第十三章 时间序列回归 本章讨论含有ARMA 项的单方程回归方法,这种方法对于分析时间序列数据(检验序列相关性,估计ARMA 模型,使用分布多重滞后,非平稳时间序列的单位根检验)是很重要的。 §13.1序列相关理论 时间序列回归中的一个普遍现象是:残差和它自己的滞后值有关。这种相关性违背了回归理论的标准假设:干扰项互不相关。与序列相关相联系的主要问题有: 一、一阶自回归模型 最简单且最常用的序列相关模型是一阶自回归AR(1)模型 定义如下:t t t u x y +'=β t t t u u ερ+=-1 参数ρ是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。 二、高阶自回归模型: 更为一般,带有p 阶自回归的回归,AR(p)误差由下式给出: t t t u x y +'=β t p t p t t t u u u u ερρρ++++=--- 2211 AR(p)的自回归将渐渐衰减至零,同时高于p 阶的偏自相关也是零。 §13.2 检验序列相关 在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验残差(序列相关的证据),Eviews 提供了几种方法来检验当前序列相关。 1.Dubin-Waston 统计量 D-W 统计量用于检验一阶序列相关。 2.相关图和Q-统计量 计算相关图和Q-统计量的细节见第七章 3.序列相关LM 检验 检验的原假设是:至给定阶数,残差不具有序列相关。 §13.3 估计含AR 项的模型 随机误差项存在序列相关说明模型定义存在严重问题。特别的,应注意使用OLS 得出的过分限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关。 1.一阶序列相关 在EViews 中估计一AR(1)模型,选择Quick/Estimate Equation 打开一个方程,用列表法输入方程后,最后将AR(1)项加到列表中。例如:估计一个带有AR(1)误差的简单消费函数 t t t u GDP c c CS ++=21 t t t u u ερ+=-1 应定义方程为: cs c gdp ar(1) 2.高阶序列相关 估计高阶AR 模型稍稍复杂些,为估计AR(k ),应输入模型的定义和所包括的各阶AR 值。如果想估计一个有1-5阶自回归的模型 t t t u GDP c c CS ++=21 t t t t u u u ερρ+++=--5511 应输入: cs c gdp ar(1) ar(2) ar(3) ar(4) ar(5) 3.存在序列相关的非线性模型 EViews 可以估计带有AR 误差项的非线性回归模型。例如: 估计如下的带有附加AR(2)误差的非线性方程 t c t t u GDP c CS ++=21

简单线性回归分析思考与练习参考答案

第10章 简单线性回归分析 思考与练习参考答案 一、最佳选择题 1.如果两样本的相关系数21r r =,样本量21n n =,那么( D )。 A. 回归系数21b b = B .回归系数12b b < C. 回归系数21b b > D .t 统计量11r b t t = E. 以上均错 2.如果相关系数r =1,则一定有( C )。 A .总SS =残差SS B .残差SS =回归 SS C .总SS =回归SS D .总SS >回归SS E. 回归MS =残差MS 3.记ρ为总体相关系数,r 为样本相关系数,b 为样本回归系数,下列( D )正确。 A .ρ=0时,r =0 B .|r |>0时,b >0 C .r >0时,b <0 D .r <0时,b <0 E. |r |=1时,b =1 4.如果相关系数r =0,则一定有( D )。 A .简单线性回归的截距等于0 B .简单线性回归的截距等于Y 或X C .简单线性回归的残差SS 等于0 D .简单线性回归的残差SS 等于SS 总 E .简单线性回归的总SS 等于0 5.用最小二乘法确定直线回归方程的含义是( B )。 A .各观测点距直线的纵向距离相等 B .各观测点距直线的纵向距离平方和最小 C .各观测点距直线的垂直距离相等 D .各观测点距直线的垂直距离平方和最小 E .各观测点距直线的纵向距离等于零 二、思考题 1.简述简单线性回归分析的基本步骤。 答:① 绘制散点图,考察是否有线性趋势及可疑的异常点;② 估计回归系数;③ 对总体回归系数或回归方程进行假设检验;④ 列出回归方程,绘制回归直线;⑤ 统计应用。 2.简述线性回归分析与线性相关的区别与联系。

多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求 中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的降到1980年,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定 为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1): 表1 中国人口增长率及相关数据

, 设定的线性回归模型为: 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数 利用EViews 估计模型的参数,方法是: 1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年 年份 @ 人口自然增长率 (%。) 国民总收入 (亿元) 居民消费价格指数增长 率(CPI )% 人均GDP (元) 1988 15037 1366 1989 … 17001 18 1519 1990 18718 1644 1991 【 21826 1893 1992 26937 2311 1993 . 35260 2998 1994 48108 4044 1995 — 59811 5046 1996 70142 5846 1997 ~ 78061 6420 1998 83024 6796 1999 【 88479 7159 2000 98000 7858 2001 [ 108068 8622 2002 119096 9398 2003 : 135174 10542 2004 159587 12336 2005 、 184089 14040 2006 213132 16024

案例分析 一元线性回归模型

案例分析报告 (2014——2015学年第一学期) 课程名称:预测与决策 专业班级:电子商务1202 学号: 2204120202 学生姓名:陈维维 2014 年 11月 案例分析(一元线性回归模型) 我国城镇居民家庭人均消费支出预测 一、研究目的与要求 居民消费在社会经济的持续发展中有着重要的作用,居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。从理论角度讲,消费需求的具体内容主要体现在消费结构上,要增加居民消费,就要从研究居民消费结构入手,只有了解居民消费结构变化的趋势和规律,掌握消费需求的热点和发展方向,才能为消费者提供良好的政策环境,引导消费者合理扩大消费,才能促进产业结构调整与消费结构优化升级相协调,才能推动国民经济平稳、健康发展。例如,2008年全国城镇居民家庭平均每人每年消费支出为11242.85元,?最低的青海省仅为人均8192.56元,最高的上海市达人均19397.89元,上海是黑龙江的2.37倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定?

我研究的对象是各地区居民消费的差异。居民消费可分为城镇居民消费和农村居民消费,由于各地区的城镇与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城镇居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。 所以模型的被解释变量Y选定为“城镇居民每人每年的平均消费支出”。 因为研究的目的是各地区城镇居民消费的差异,并不是城镇居民消费在不同时间的变动,所以应选择同一时期各地区城镇居民的消费支出来建立模型。因此建立的是2008年截面数据模型。影响各地区城镇居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。 为了与“城镇居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 以下是2008年各地区城镇居民人均年消费支出和可支配收入表

简单线性回归模型练习题

第二章 简单线性回归模型练习题 一、术语解释 1 解释变量 2 被解释变量 3 线性回归模型 4 最小二乘法 5 方差分析 6 参数估计 7 控制 8 预测 二、填空 1 在经济计量模型中引入反映( )因素影响的随机扰动项t ξ,目的在于使模型更符合( )活动。 2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的( )、社会环境与自然环境的( )决定了经济变量本身的( );(2)建立模型时其他被省略的经济因素的影响都归入了( )中;(3)在模型估计时,( )与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了( )与( )之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。 3 ( )是因变量离差平方和,它度量因变量的总变动。就因变量总变动的变异来源看,它由两部分因素所组成。一个是自变量,另一个是除自变量以外的其他因素。( )是拟合值的离散程度的度量。它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。( )是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。 4 回归方程中的回归系数是自变量对因变量的( )。某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。 5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。 6 样本观察值与回归方程理论值之间的偏差,称为( ),我们用残差估计线性模型中的( )。 三、简答题 1 在线性回归方程中,“线性”二字如何理解 2 用最小二乘法求线性回归方程系数的意义是什么 3 一元线性回归方程的基本假设条件是什么 4 方差分析方法把数据总的平方和分解成为两部分的意义是什么 5 试叙述t 检验法与相关系数检验法之间的联系。 6 应用线性回归方程控制和预测的思想。 7 线性回归方程无效的原因是什么 8 回归分析中的随机误差项i ε有什么作用它与残差项t e 有何区别

五多重共线性分布滞后模型或机动

实验五多重共线性、分布滞后模型(或机动) [实验目的]让学生掌握如何辨别模型中是否存在多重共线性现象,并能够对多重共线性加以处理。[实验内容]①相关系数矩阵计算;②方差膨胀因子计算;③多重共线性处理。 [实验步骤]数据导入—查看t 统计量值和F 统计量值以及R 平方的值--计算相关系数矩阵和方差 膨胀因子—对多重共线问题加以处理(改变模型、去除不重要的变量、岭回归主成分分析等) 问题:对于1960年至1982年期间美国人均鸡肉消费量(Y),人均实际可支配收入(X1),鸡肉的实际零售价格(X2),猪肉的实际零售价格(X3),牛肉的实际零售价格(X4)等数据,见表4-1,利用它们的对数估计如下模型: 表4-1 1960年至1982年期间美国人均鸡肉消费量等数据y x1x2x3x427.8397.542.250.778.329.9413.338.15279.229.8439.240.35479.230.8459.739.555.379.231.2492.937.354.777.433.3528.638.163.780.235.6560.339.369.880.436.4624.637.865.983.936.7666.438.464.585.538.4717.840.17093.740.4768.238.673.2106.140.3843.339.867.8104.841.8911.639.779.111440.4931.152.195.4124.140.71021.548.994.2127.640.11165.958.3123.5142.942.71349.657.9129.9143.644.11449.456.5117.6139.246.71575.563.7130.9165.550.61759.161.6129.8203.350.11994.258.9128219.651.72258.166.4141221.652.9 2478.7 70.4 168.2 232.6 把数据导入GRETL 软件,产生各变量的对数变量,分别为ly、lx1、lx2、lx3、lx4,估计要求的模型,参数估计的结果为: ε βββββ+++++=443322110ln ln ln ln ln X X X X Y

多元线性回归模型案例

我国农民收入影响因素的回归分析 本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。?农民收入水平的度量常采用人均纯收入指标。影响农民收入增长的因素是多方面的,既有结构性矛盾因素,又有体制性障碍因素。但可以归纳为以下几个方面:一是农产品收购价格水平。二是农业剩余劳动力转移水平。三是城市化、工业化水平。四是农业产业结构状况。五是农业投入水平。考虑到复杂性和可行性,所以对农业投入与农民收入,本文暂不作讨论。因此,以全国为例,把农民收入与各影响因素关系进行线性回归分析,并建立数学模型。 一、计量经济模型分析 (一)、数据搜集 根据以上分析,我们在影响农民收入因素中引入7个解释变量。即:2x -财政用于农业的支出的比重,3x -第二、三产业从业人数占全社会从业人数的比重,4x -非农村人口比重,5x -乡村从业人员占农村人口的比重,6x -农业总产值占农林牧总产值的比重,7x -农作物播种面积,8x —农村用电量。

资料来源《中国统计年鉴2006》。 (二)、计量经济学模型建立 我们设定模型为下面所示的形式: 利用Eviews 软件进行最小二乘估计,估计结果如下表所示: DependentVariable:Y Method:LeastSquares Sample: Includedobservations:19 Variable Coefficient t-Statistic Prob. C X1 X3 X4 X5 X6 X7 X8 R-squared Meandependentvar AdjustedR-squared 表1最小二乘估计结果 回归分析报告为: () ()()()()()()()()()()()()()()() 2345678 2? -1102.373-6.6354X +18.2294X +2.4300X -16.2374X -2.1552X +0.0100X +0.0634X 375.83 3.7813 2.066618.37034 5.8941 2.77080.002330.02128 -2.933 1.7558.820900.20316 2.7550.778 4.27881 2.97930.99582i Y SE t R ===---=230.99316519 1.99327374.66 R Df DW F ====二、计量经济学检验 (一)、多重共线性的检验及修正 ①、检验多重共线性 (a)、直观法 从“表1最小二乘估计结果”中可以看出,虽然模型的整体拟合的很好,但是x4x6

第七章分布滞后模型与自回归模型答案(最新整理)

第七章 分布滞后模型与自回归模型 一、判断题 1. 无限分布滞后模型不可以转换为一阶自回归模型。( F ) 2. 局部调整模型变换后得到的一阶自回归模型可以应用 OLS 法估计。( T ) 3. 估计自回归模型的问题仅在于滞后被解释变量的存在可能导致它与随机扰动项相关。(F ) 4. 自回归模型的产生背景都是相同的。( F ) 5. 库伊克模型和自适应预期模型都存在解释变量与随机扰动项相关问题。( T ) 二、单项选择题 1. 设无限分布滞后模型为Y t = + 0 X t + 1 X t-1 +2X t-2 + + U t ,且该模型满足 Koyck 变换的假定,则长期影响系数为( C )。 A. B. 1+ C. 1- D. 不确定 2. 对于分布滞后模型,时间序列的序列相关问题,就转化为( B )。 A .异方差问题 B .多重共线性问题 C .多余解释变量 D .随机解释变量 3.在分布滞后模型Y t =+ 0 X t + 1 X t -1 + 2 X t -2 + + u t 中,短期影响乘数为( D )。 A. 1 1- B. 1 C. 1- D. 4. 对于自适应预期模型变换后的自回归模型,估计模型参数应采用( D ) 。 A. 普通最小二乘法 B .间接最小二乘法 C .二阶段最小二乘法 D .工具变量法 5. 经过库伊克变换后得到自回归模型,该模型参数的普通最小二乘估计量是 ( D ) 。 A. 无偏且一致 B .有偏但一致 C .无偏但不一致 D .有偏且不一致 6.下列属于有限分布滞后模型的是( D )。 A . Y t =+ 0 X t + 1Y t -1 + 2Y t -2 + + u t B . Y t =+ 0 X t + 1Y t -1 + 2Y t -2 + + k Y t -k + u t C . Y t =+ 0 X t + 1 X t -1 + 2 X t -2 + + u t D . Y t =+ 0 X t + 1 X t -1 + 2 X t -2 + + k X t -k + u t 7. 消费函数模型C ?t = 400 + 0.5I t + 0.3I t -1 + 0.1I t -2 ,其中 I 为收入,则当期收入 I t 对未来 消费C t +2 的影响是: I t 增加一单位, C t +2 增加( C )。 A .0.5 个单位 B .0.3 个单位 C .0.1 个单位 D .0.9 个单位

第7章 分布滞后模型与自回归模型多重共线性

计量经济学课程教案

第7章 分布滞后模型与自回归模型 7.1 滞后效应与滞后变量模型 在经济运行过程中,广泛存在时间滞后效应。某些经济变量不仅受到同期各种因素的影响,而且也受到过去某些时期的各种因素甚至自身的过去值的影响。 通常把这种过去时期的,具有滞后作用的变量叫做滞后变量(Lagged Variable ),含有滞后变量的模型称为滞后变量模型。 滞后变量模型考虑了时间因素的作用,使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型,又称动态模型(Dynamical Model )。 一、滞后效应与与产生滞后效应的原因 因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。 表示前几期值的变量称为滞后变量。 如:消费函数 通常认为,本期的消费除了受本期的收入影响之外,还受前1期,或前2期收入的影响: C t =β0+β1Y t +β2Y t-1+β3Y t-2+μt Y t-1,Y t-2为滞后变量。 产生滞后效应的原因 1、心理因素:人们的心理定势,行为方式滞后于经济形势的变化,如中彩票的人不可能很快改变其生活方式。 2、技术原因:如当年的产出在某种程度上依赖于过去若干期内投资形成的固定资产。 3、制度原因:如定期存款到期才能提取,造成了它对社会购买力的影响具有滞后性。 二、滞后变量模型 以滞后变量作为解释变量,就得到滞后变量模型。它的一般形式为: q ,s :滞后时间间隔 自回归分布滞后模型(autoregressive distributed lag model, ADL ):既含有Y 对自身滞后变量的回归,还包括着X 分布在不同时期的滞后变量 有限自回归分布滞后模型:滞后期长度有限 无限自回归分布滞后模型:滞后期无限, (1)分布滞后模型(distributed-lag model ) 分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X 的当期值及其若干期的滞后值: β0:短期(short-run)或即期乘数(impact multiplier),表示本期X 变化一单位对Y 平均值的影响程度。 βi (i=1,2…,s):动态乘数或延迟系数,表示各滞后期X 的变动对Y 平均值影响的大小。 称为长期(long-run )或均衡乘数(total distributed-lag multiplier ),表示X 变动一 个单位,由于滞后效应而形成的对Y 平均值总影响的大小。 如果各期的X 值保持不变,则X 与Y 间的长期或均衡关系即为: X Y E s i i )()(0 ∑=+=βα∑=s i i 0β t i t i s i t X Y μβα++=-=∑0 t s t s t t q t q t t t X X X Y Y Y Y μαααββββ+++++++++=----- 11022110

SPSS线性回归分析案例

回归分析 实验内容:基于居民消费性支出与居民可支配收入的简单线性回归分析 【研究目的】 居民消费在社会经济的持续发展中有着重要的作用。影响各地区居民消费支出的因素很多,例如居民的收入水平、商品价格水平、收入分配状况、消费者偏好、家庭财产状况、消费信贷状况、消费者年龄构成、社会保障制度、风俗习惯等等。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的经济模型去研究。 【模型设定】 : 我们研究的对象是各地区居民消费的差异。由于各地区的城市与农村人口比例及经济结构有较大差异,现选用城镇居民消费进行比较。模型中被解释变量Y选定为“城市居民每人每年的平均消费支出”。从理论和经验分析,影响居民消费水平的最主要因素是居民的可支配收入,故可以选用“城市居民每人每年可支配收入”作为解释变量X,选取2010年截面数据。 1、实验数据 表1: —

2010年中国各地区城市居民人均年消费支出和可支配收入

| 数据来源:《中国统计年鉴》2010年 2、实验过程 作城市居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)的散点图,如图1:

表2 模型汇总b — 模型 R R方调整R方标准估计的误差 - 1 .965a.932.930 ~ a.预测变量:(常量),可支配收入X(元)。 b.因变量:消费性支出Y(元) 表3 相关性 、 消费性支出Y (元) 可支配收入X(元) Pearson相关 性消费性支出Y(元)& .965 ! 从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系,所以建立如下线性模型:Y=a+bX

自回归分布滞后模型(ADL)的运用实验指导

实验六 自回归分布滞后模型(ADL )的运用实验指导 一、实验目的 理解ADL 模型的原理与应用条件,学会运用ADL 模型来估计变量之间长期稳定关系。理解从经济理论上来说,两个经济变量之间的确有长期关系采用使用该模型进行估计。理解ADL 模型的优点:不管回归项是不是1阶单整或平稳都可以进行检验和估计。而进行标准的协整分析前,必须把变量分类成(0)I 和(1)I 。 二、基本概念 Jorgenson(1966)提出的(,p q )阶自回归分布滞后模型ADL(autoregressive distributed lag):011111 i t t p t p t t q t q i t i i y y y ταφφεθεθεβ-----='=++++--+∑x ,其中t i -x 是滞后i 期 的外生变量向量(维数与变量个数相同),且每个外生变量的最大滞后阶数为i τ,i β是参数向量。当不存在外生变量时,模型就退化为一般ARMA (,p q )模型。 如果模型中不含有移动平均项,可以采用OLS 方法估计参数,若模型中含有移动平均项,线性OLS 估计将是非一致性估计,应采用非线性最小二乘估计。 三、实验内容及要求 (1)实验内容 运用ADL 模型研究1992年1月到1998年12月我国城镇居民月对数人均生活费支出yt 和对数可支配收入xt 之间的长期稳定关系。 (2)实验要求 在认真理解模型应用条件的基础上,通过实验掌握ADL 模型的实际应用方法,并熟悉Eniews 的具体操作过程。 四、实验指导 (1)数据录入 打开Eviews 软件,选择“File”菜单中的“New --Workfile”选项,在“Workfile structure type ”栏选择“Dated-regular frequency ”,在“Data specification ”栏中“Frequency ”中选择“Monthly ”即月份数据,起始时间输入1992m1即1992年1月份,止于1998m12,点击ok ,见图6-1,这样就建立了一个工作文件。 图6-1 建立工作文件窗口

第九章 案例分析(分布滞后模型)

第九章 案例分析 【案例7.1】 为了研究1955—1974年期间美国制造业库存量Y 和销售额X 的关系, 用阿尔蒙法估计如下有限分布滞后模型: t t t t t t u X X X X Y +++++=---3322110ββββα 将系数i β(i =0,1,2,3)用二次多项式近似,即 00αβ= 2101αααβ++= 210242αααβ++= 210393αααβ++= 则原模型可变为 t t t t t u Z Z Z Y ++++=221100αααα 其中 3 212321132109432---------++=++=+++=t t t t t t t t t t t t t X X X Z X X X Z X X X X Z 在Eviews 工作文件中输入X 和Y 的数据,在工作文件窗口中点击“Genr ”工具栏,出现对话框,输入生成变量Z 0t 的公式,点击“OK ”;类似,可生成Z 1t 、Z 2t 变量的数据。进入Equation Specification 对话栏,键入回归方程形式 Y C Z0 Z1 Z2 点击“OK ”,显示回归结果(见表7.2)。 表7.2 表中Z0、 Z1、Z2对应的系数分别为210ααα、、的估计值210???ααα 、、。将它们代入

分布滞后系数的阿尔蒙多项式中,可计算出3210? ???ββββ、、、的估计值为: -0.522)432155.0(9902049.03661248.0?9?3??0.736725)432155.0(4902049.02661248.0?4?2?? 1.131142)432155.0(902049.0661248.0????661248.0??2101 21012101 00 =-?+?+=++==-?+?+=++==-++=++===αααβαααβαααβαβ 从而,分布滞后模型的最终估计式为: 32155495.076178.015686.1630281.0419601.6----+++-=t t t t t X X X X Y 在实际应用中,Eviews 提供了多项式分布滞后指令“PDL ”用于估计分布滞后模型。下面结合本例给出操作过程: 在Eviews 中输入X 和Y 的数据,进入Equation Specification 对话栏,键入方程形式 Y C PDL(X, 3, 2) 其中,“PDL 指令”表示进行多项式分布滞后(Polynomial Distributed Lags )模型的估计,括号中的3表示X 的分布滞后长度,2表示多项式的阶数。在Estimation Settings 栏中选择Least Squares(最小二乘法),点击OK ,屏幕将显示回归分析结果(见表7.3)。 表 7.3 需要指出的是,用“PDL ”估计分布滞后模型时,Eviews 所采用的滞后系数多项式变换不是形如(7.4)式的阿尔蒙多项式,而是阿尔蒙多项式的派生形式。因此,输出结果中PDL01、PDL02、PDL03对应的估计系数不是阿尔蒙多项式系数210ααα、、的估计。但同前面分步计算的结果相比,最终的分布滞后估计

第二章(简单线性回归模型)2-3答案

拟合优度的度量 一、判断题 1.当 ()∑-2i y y 确定时,()∑-2 i y y ?越小,表明模型的拟合优度越好。(F ) 2.可以证明,可决系数2R 高意味着每个回归系数都是可信任的。(F ) 3.可决系数2R 的大小不受到回归模型中所包含的解释变量个数的影响。(F ) 4.任何两个计量经济模型的2R 都是可以比较的。(F ) 5.拟合优度2R 的值越大,说明样本回归模型对数据的拟合程度越高。( T ) 6.结构分析是2R 高就足够了,作预测分析时仅要求可决系数高还不够。( F ) 7.通过2R 的高低可以进行显著性判断。(F ) 8.2R 是非随机变量。(F ) 二、单项选择题 1.已知某一直线回归方程的可决系数为,则解释变量与被解释变量间的线性相关系数为( B )。 A .± B .± C .± D .± 2.可决系数2R 的取值范围是( C )。 A .2R ≤-1 B .2R ≥1 C .0≤2R ≤1 D .-1≤2R ≤1 3.下列说法中正确的是:( D ) A 如果模型的2R 很高,我们可以认为此模型的质量较好 B 如果模型的2R 较低,我们可以认为此模型的质量较差 C 如果某一参数不能通过显著性检验,我们应该剔除该解释变量 D 如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量 三、多项选择题 1.反映回归直线拟合优度的指标有( ACDE )。 A .相关系数 B .回归系数 C .样本可决系数 D .回归方程的标准差 E .剩余变差(或残差平方和) 2.对于样本回归直线i 01i ???Y X ββ+=,回归变差可以表示为( ABCDE )。 A .2 2i i i i ?Y Y -Y Y ∑ ∑  (-) (-) B .2 2 1 i i ?X X β∑ (-)

多元线性回归模型的案例讲解

多元线性回归模型的案 例讲解 Document number:NOCG-YUNOO-BUYTT-UU986-1986UT

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/ 千克 X/元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/ 千克 X/元 P 1/(元/千克) P 2/(元/千克) P 3/(元/ 千克) 1980 397 1992 911 1981 413 1993 931 1982 439 1994 1021 1983 459 1995 1165 1984 492 1996 1349 1985 528 1997 1449 1986 560 1998 1575 1987 624 1999 1759 1988 666 2000 1994 1989 717 2001 2258 1990 768 2002 2478 1991 843 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

所以,回归方程为: 123ln 0.73150.3463ln 0.5021ln 0.1469ln 0.0872ln Y X P P P =-+-++ 由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显着。 验证猪肉价格和鸡肉价格是否有影响,可以通过赤池准则(AIC )和施瓦茨准则(SC )。若AIC 值或SC 值增加了,就应该去掉该解释变量。 去掉猪肉价格P 2与牛肉价格P 3重新进行回归分析,结果如下: Variable Coefficient Std. Error t-Statistic Prob.?? C LOG(X) LOG(P1) R-squared ????Mean dependent var Adjusted R-squared ????. dependent var . of regression ????Akaike info criterion Sum squared resid ????Schwarz criterion Log likelihood ????F-statistic Durbin-Watson stat ????Prob(F-statistic)

相关文档
最新文档