实验二 一元回归模型word

实验二 一元回归模型word
实验二 一元回归模型word

实验二一元回归模型

【实验目的】

掌握一元线性、非线性回归模型的建模方法

【实验内容】

建立我国税收预测模型

【实验步骤】

【例1】建立我国税收预测模型。表1列出了我国1985-1998年间税收收入Y和国内生产总值(GDP)x的时间序列数据,请利用统计软件Eviews建立一元线性回归模型。

表1 我国税收与GDP统计资料

年份税收GDP 年份税收GDP

1985 2041 8964 1992 3297 26638

1986 2091 10202 1993 4255 34634

1987 2140 11963 1994 5127 46759

1988 2391 14928 1995 6038 58478

1989 2727 16909 1996 6910 67885

1990 2822 18548 1997 8234 74463

1991 2990 21618 1998 9263 79396

一、建立工作文件

⒈菜单方式

在录入和分析数据之前,应先创建一个工作文件(Workfile)。启动Eviews软件之后,在主菜单上依次点击File\New\Workfile(菜单选择方式如图1所示),将弹出一个对话框(如图2所示)。用户可以选择数据的时间频率(Frequency)、起始期和终止期。

图1 Eviews菜单方式创建工作文件示意图

图2 工作文件定义对话框

本例中选择时间频率为Annual(年度数据),在起始栏和终止栏分别输入相应的日期85和98。然后点击OK,在Eviews软件的主显示窗口将显示相应的工作文件窗口(如图3所示)。

图3 Eviews工作文件窗口

一个新建的工作文件窗口内只有2个对象(Object),分别为c(系数向量)和resid(残差)。它们当前的取值分别是0和NA(空值)。可以通过鼠标左键双击对象名打开该对象查看其数据,也可以用相同的方法查看工作文件窗口中其它对象的数值。

⒉命令方式

还可以用输入命令的方式建立工作文件。在Eviews软件的命令窗口中直接键入CREATE命令,其格式为:

CREATE 时间频率类型起始期终止期

本例应为:CREATE A 85 98

二、输入数据

在Eviews软件的命令窗口中键入数据输入/编辑命令:

DA TA Y X

此时将显示一个数组窗口(如图4所示),即可以输入每个变量的数值

图4 Eviews数组窗口

三、图形分析

借助图形分析可以直观地观察经济变量的变动规律和相关关系,以便合理地确定模型的数学形式。

⒈趋势图分析

命令格式:PLOT 变量1 变量2 ……变量K

作用:⑴分析经济变量的发展变化趋势

⑵观察是否存在异常值

本例为:PLOT Y X

⒉相关图分析

命令格式:SCAT 变量1 变量2

作用:⑴观察变量之间的相关程度

⑵观察变量之间的相关类型,即为线性相关还是曲线相关,曲线相关时大致是哪种类型的曲线

说明:⑴SCAT命令中,第一个变量为横轴变量,一般取为解释变量;第二个变量为纵轴变量,一般取为被解释变量

⑵SCAT命令每次只能显示两个变量之间的相关图,若模型中含有多个解释变量,可以逐个进行分析

⑶通过改变图形的类型,可以将趋势图转变为相关图

本例为:SCA T Y X

图5 税收与GDP趋势图

图5、图6分别是我国税收与GDP时间序列趋势图和相关图分析结果。两变量趋势图分析结果显示,我国税收收入与GDP二者存在差距逐渐增大的增长趋势。相关图分析显示,我国税收收入增长与GDP密切相关,二者为非线性的曲线相关关系。

图6 税收与GDP相关图

三、估计线性回归模型

在数组窗口中点击Proc\Make Equation,如果不需要重新确定方程中的变量或调整样本区间,可以直接点击OK进行估计。也可以在Eviews主窗口中点击Quick\Estimate Equation,在弹出的方程设定框(图7)内输入模型:

Y C X 或 X C C Y *+=)2()1(

图7 方程设定对话框

还可以通过在Eviews 命令窗口中键入LS 命令来估计模型,其命令格式为:

LS 被解释变量 C 解释变量

系统将弹出一个窗口来显示有关估计结果(如图8所示)。因此,我国税收模型的估计式为:

x y

0946.054.987?+= 这个估计结果表明,GDP 每增长1亿元,我国税收收入将增加0.09646亿元。

图8 我国税收预测模型的输出结果

五、估计非线性回归模型

由相关图分析可知,变量之间是非线性的曲线相关关系。因此,可初步将模型设定为指数函数模型、对数模型和二次函数模型并分别进行估计。

在Eviews 命令窗口中分别键入以下命令命令来估计模型:

双对数函数模型:LS log(Y) C log(X) 对数函数模型:LS Y C log(X) 指数函数模型:LS log(Y) C X 二次函数模型:LS Y C X X^2

还可以采取菜单方式,在上述已经估计过的线性方程窗口中点击Estimate 项,然后在弹出的方程定义窗口中依次输入上述模型(方法通线性方程的估计),其估计结果显示如图9、图10、图11图、12所示。

双对数模型:x y

ln 6823.02704.1?ln += (3.8305) (21.0487)

9736.02

=R

9714.02

=R

05.443=F

对数模型:y ln 92.298532.26163?+-=

(-8.3066) (9.6999)

8869.02

=R

8775.02

=R

0875.94=F

指数模型:x y

51007.25086.7?ln -*+= (231.7463) (27.2685)

9841.02

=R

9828.02

=R

57.743=F

二次函数模型:271058.50468.07.1645?x x y

-*++= (7.4918) (3.3422) (3.4806)

9918.02

=R

9903.02

=R

78.661=F

图9 双对数模型回归结果

图10 对数模型回归结果

图11 指数模型回归结果

图12 二次函数模型回归结果

六、模型比较

四个模型的经济意义豆比较合理,解释变量也都通过了T检验。但是从模型的拟合优度来看,二次函数模型的2

R值最大,其次为指数函数模型。因此,对这两个模型再做进一步比较。

在回归方程(以二次函数模型为例)窗口中点击View\Actual,Fitted,Residual\ Actual,Fitted,Residual Table(如图13),可以得到相应的残差分布表。

图13 回归方程残差分析菜单

上述两个回归模型的残差分别表分别如下(图14、图15)。比较两表可以发现,虽然二次函数模型总拟合误差较小,但其近期误差却比指数函数模型大。所以,如果所建立的模型

是用于经济预测,则指数函数模型更加适合。

图14 二次函数回归模型残差分别表

图15 指数函数模型残差分布表

(实验2)多元回归分析实验报告

陕西科技大学实验报告 课 程: 数理金融 实验日期: 2014 年 5 月 22 日 班 级: 数学112 交报告日期: 2013 年 5 月 23 日 姓 名: 常海琴 报告退发: (订正、重做) 学 号: 201112010101 教 师: 刘利明 实验名称: 多元回归分析 一、实验预习: 1.多元回归模型。 2.多元回归模型参数的检验。 3.多元回归模型整体的检验。 二、实验的目的和要求: 通过案例分析掌握多元回归模型的建立方法和检验的标准;并掌握分析解决实际金融问题的能力。 三、实验过程:(实验步骤、原理和实验数据记录等) 软件:Eviews3.1 数据:给定美国机动车汽油消费量研究数据。 实验原理:最小二乘法拟合多元线性回归方程 数据记录: 实例中1950年到1987年机动汽车的消费量、汽车保有量、汽油价格、人口数、国民生产总值 图1各个量之间的关系

陕西科技大学理学院实验报告 - 2 - 1、录入数据 图2录入数据 2、回归分析 443322110X X X X Y βββββ++++= 图3运行结果 Y=24553723+1.418520x1-27995762x2-59.87480x3-30540.88x4 S (25079670) (0.266) (5027085) (198.5517) (9557.981) T (0.979) (5.314) (-5.568) (-0.301) (-3.195) 2R =0.966951 F=241.3764 - R =0.9629 dw=0.6265 四、实验总结:(实验数据处理和实验结果讨论等) 用残差和最小确定直线位置是一个途径。计算残差和有相互抵消的问题。用残差绝对值和最小确定直线位置也是一个途径绝对值计算起来比较麻烦。最小二乘法用绝对值平方和最小确定直线位置。0β、1β、2β、3β、4β具有线性特性,无偏特性,有效性。-R =0.9629基本上接近于1,拟合效果较好。

统计学原理-回归分析案例0204192330

美国各航空公司业绩的统计数据公布在《华尔街日报1998年鉴》(The Wall Street Journal Almanac 1998)上,有关航班正点到达的比率和每10万名乘客投诉的次数的数据如下: 航空公司名称航班正点率(%)投诉率(次/10万名乘客)西南(Southwest)航空公司81.8 0.21 大陆(Continental) 航空公司76.6 0.58 西北(Northwest)航空公司76.6 0.85 美国(US Airways)航空公司75.7 0.68 联合(United)航空公司73.8 0.74 美洲(American)航空公司72.2 0.93 德尔塔(Delta)航空公司71.2 0.72 70.8 1.22 美国西部(America West)航空公 司 环球(TWA)航空公司68.5 1.25 a. 画出这些数据的散点图 b. 根据再(a)中作出的散点图,表明二变量之间存在什么关系? c. 求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程 d. 对估计的回归方程的斜率作出解释 e. 如何航班按时到达的正点率是80%,估计每10万名乘客投诉的次数是多少?

1)作散点图: 2)根据散点图可知,航班正点率和投诉率成负直线相关关系。 3)作简单直线回归分析: SUMMARY OUTPUT 回归统计 Multiple R0.882607 R Square0.778996 Adjusted R Square0.747424 标准误差0.160818 观测值9 方差分析  df SS MS F Significance F 回归分析10.6381190.63811924.673610.001624残差70.1810370.025862 总计80.819156  Coefficient s标准误差t Stat P-value Lower 95%Upper 95%下限95.0%上限95.0% Intercept 6.017832 1.05226 5.7189610.000721 3.5296358.506029 3.5296358.506029 X Variable 1-0.070410.014176-4.967250.001624-0.10393-0.03689-0.10393-0.03689 4)y = -0.0704x + 6.0178

一元线性回归模型习题和答案解析

一元线性回归模型 一、单项选择题 1、变量之间的关系可以分为两大类__________。A A 函数关系与相关关系 B 线性相关关系和非线性相关关系 C 正相关关系和负相关关系 D 简单相关关系和复杂相关关系 2、相关关系是指__________。D A 变量间的非独立关系 B 变量间的因果关系 C 变量间的函数关系 D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。A A 都是随机变量 B 都不是随机变量 C 一个是随机变量,一个不是随机变量 D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。C A 01???t t Y X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+ 5、参数β的估计量?β 具备有效性是指__________。B A ?var ()=0β B ?var ()β为最小 C ?()0β β-= D ?()ββ-为最小 6、对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示回归值,则__________。B A i i ??0Y Y 0σ∑ =时,(-)= B 2 i i ??0Y Y σ∑=时,(-)=0 C i i ??0Y Y σ∑=时,(-)为最小 D 2 i i ??0Y Y σ∑=时,(-)为最小 7、设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是__________。D A ()()()i i 1 2 i X X Y -Y ?X X β--∑∑= B ()i i i i 1 2 2 i i n X Y -X Y ?n X -X β∑∑∑∑∑= C i i 1 2 2 i X Y -nXY ?X -nX β∑∑ = D i i i i 1 2 x n X Y -X Y ?βσ ∑∑∑= 8、对于i 01i i ??Y =X +e ββ+,以?σ表示估计标准误差,r 表示相关系数,则有__________。D A ?0r=1σ =时, B ?0r=-1σ =时, C ?0r=0σ =时, D ?0r=1r=-1σ =时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?Y 356 1.5X -=,这说明__________。D

实验三多元线性回归模型地估计和检验

实验三 多元线性回归模型的估计和检验 一、实验目的:掌握多元线性回归模型的估计和检验方法 二、预备知识:普通最小二乘法(OLS) 三、实验内容:选择方程进行多元线性回归 四、实验步骤: (一)国内生产总值的增长模型 分析广东省国内生产总值的增长,根据广东数据(数据见“表:广东省宏观经济 数据-第三章.xls ”文件,各变量的表示按照试验指导课本上的来表示)选择不变价GDP (GDPB )、不变价资本存量(ZC )和从业人员(RY ),把GDPB 作为因变量,ZC 和RY 作为两个解释变量进行二元线性回归分析。 要求:按照试验指导课本100P ~102P ,分别作: 1、作散点图(GDPB 同ZC ,GDPB 同RY ) 2、进行因果关系检验(GDPB 同ZC ,GDPB 同RY ) 3、作GDPB 同ZC 和RY 的多元线性回归,写出模型估计的结果,并分析模型检验是均否通过?(三个检验) 4、将建立的二元回归模型(GDPB 同ZC 和RY )同一元回归模型(GDPB 同ZC 、GDPB 同RY )相比较,分析优点。 5、结合相关的经济理论,分析估计的二元回归模型的经济意义。

(二)宏观经济模型 根据广东数据,研究广东省居民消费行为、固定资产投资行为、货物和服务净出口行为和存货行为,分别建立居民消费模型、固定资产投资模型、货物和服务净出口模型和存货增加模型。 要求:按照试验指导课本510P ~211P ,分别作出以下模型,并对需要改进的 模型进行改进。写出最终估计的模型结果,并结合相关的经济理论,分析模型的经济意义。(数据见“表:广东省宏观经济数据-第三章.xls ”文件,各变量的表示按照试 验指导课本上的来表示。) 1、居民消费模型 2、固定资产投资模型 3、货物和服务净流出模型 4、存货增加模型

SPSS多元线性回归分析实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件: 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open;

2. Opening excel data source——OK. 第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择Stepwise.

进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.

3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.

一元线性回归模型案例分析

一元线性回归模型案例分析 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表2.5的数据: 表2.52002年中国各地区城市居民人均年消费支出和可支配收入

门限分位数自回归模型及在股市收益自相关分析中的应用

门限分位数自回归模型及在股市收益自相关分析中的应用 摘要:门限分位数自然回归模型是一种非限行分位数回归模型,其可以应用讨论系统之中的门限效应。并且在该模型之中,自然回归阶数以及门限值的确定等都将会为模型的分析效果带来直接的影响。本文主要对门限分位数自然回归模型以及其在股市收益中的相关应用做出分析,希望能够给予同行业的工作人员提供一定参考价值。 关键词:门限分位数;回归模型;股市收益;分析 股市收益的自相关性是金融市场研究中的一个重要问题,研究人员针对于理性预定理论提出了有效的市场假说,奠定了传统的金融学基础。有效的市场假说理论认为在一个有效的市场之中,股市的价格或者收益直接地反映了所有可能会获得的信息,过去的收益以及未来的收益并不相关,股市的收益则是不可以预测的,反而言之如果股市的收益在时间上是自相关的,那么历史收益是可以影响当前的收益的,这也直接表明了有效市场假说是难以成立的,可以采取序列自相关分析的方法,对其有效市场假说做出相应验证。 一、门限分位数自然回归模型的分析 1. 模型的表示分析 主要是记{ yt }作为其1 维响应的变量,然而x =(1,yt -1,yy

-2,…,yt -p)T 主要是为p+1为向量组成的解释变量,然而{ yt }则是为1维门限的白能量,其自然回归模型之中的门限变量通常情况下是需要相应变量{ yt }的滞后项,而γ则表示为门限,其模型如下所示: 和均值自激励门限自然回归的模型进行对比,门限分位数自回归模型存在着下述的优点:一是信息刻画更加全面,回归系数估计在不同的分位点可能存在着不同的表型,同时不同阶段的变量之间关系更加细致。二是具有比较强的稳健性,和均值自激励门限自回归模型要求误差项服从特定分布的不同,其允许误差项服从一般的非对称的分布。 2. 模型的定阶 在门限分位数自然回归之中,最优滞后阶数p的选择是十分重要的,可以通过AIC的准确去进行实现,然而定义AIC的准则则是如下所示: 可以看出,AIC主要由两个部分所组成,一是可以反映出模型的拟合程度,主要是为前半段进行表示。二是反映出模型的复杂城市,则是经过后半段进行表示。 3. 门限效应的诊断检验分析 针对于门限效应而言,其诊断检验主要是包括了以下方面的内容:第一,门限效应存在性检验,主要检验两个阶段的门限效应

matlab多元线性回归模型

云南大学数学与统计学实验教学中心 实验报告 一、实验目的 1.熟悉MATLAB的运行环境. 2.学会初步建立数学模型的方法 3.运用回归分析方法来解决问题 二、实验内容 实验一:某公司出口换回成本分析 对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本. 实验二:某建筑材料公司的销售量因素分析 下表数据是某建筑材料公司去年20个地区的销售量(Y,千方),推销开支、实际帐目数、同类商品

竞争数和地区销售潜力分别是影响建筑材料销售量的因素。1)试建立回归模型,且分析哪些是主要的影响因素。2)建立最优回归模型。 提示:建立一个多元线性回归模型。

三、实验环境 Windows 操作系统; MATLAB 7.0. 四、实验过程 实验一:运用回归分析在MATLAB 里实现 输入:x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00 3.40 6.90]'; X=[ones(13,1) x]; Y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40]'; plot(x,Y,'*'); [b,bint,r,rint,stats]=regress(Y,X,0.05); 输出: b = 2.6597 -0.2288 bint = 1.8873 3.4322 -0.3820 -0.0757 stats = 0.4958 10.8168 0.0072 0.0903 即==1,0?6597.2?ββ,-0.2288,0?β的置信区间为[1.8873 3.4322],1,?β的置信区间为[-0.3820 -0.0757]; 2r =0.4958, F=10.8168, p=0.0072 因P<0.05, 可知回归模型 y=2.6597-0.2288x 成立. 1 1.5 2 2.5 散点图 估计某家公司商品流转费用率是6.5%的出口换汇成本。将x=6.5代入回归模型中,得到 >> x=6.5; >> y=2.6597-0.2288*x y = 1.1725

案例分析 一元线性回归模型

案例分析报告 (2014——2015学年第一学期) 课程名称:预测与决策 专业班级:电子商务1202 学号: 2204120202 学生姓名:陈维维 2014 年 11月 案例分析(一元线性回归模型) 我国城镇居民家庭人均消费支出预测 一、研究目的与要求 居民消费在社会经济的持续发展中有着重要的作用,居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。从理论角度讲,消费需求的具体内容主要体现在消费结构上,要增加居民消费,就要从研究居民消费结构入手,只有了解居民消费结构变化的趋势和规律,掌握消费需求的热点和发展方向,才能为消费者提供良好的政策环境,引导消费者合理扩大消费,才能促进产业结构调整与消费结构优化升级相协调,才能推动国民经济平稳、健康发展。例如,2008年全国城镇居民家庭平均每人每年消费支出为11242.85元,?最低的青海省仅为人均8192.56元,最高的上海市达人均19397.89元,上海是黑龙江的2.37倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定?

我研究的对象是各地区居民消费的差异。居民消费可分为城镇居民消费和农村居民消费,由于各地区的城镇与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城镇居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。 所以模型的被解释变量Y选定为“城镇居民每人每年的平均消费支出”。 因为研究的目的是各地区城镇居民消费的差异,并不是城镇居民消费在不同时间的变动,所以应选择同一时期各地区城镇居民的消费支出来建立模型。因此建立的是2008年截面数据模型。影响各地区城镇居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。 为了与“城镇居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 以下是2008年各地区城镇居民人均年消费支出和可支配收入表

数学建模多元回归模型

实习报告书 学生姓名: 学号: 学院名称: 专业名称: 实习时间: 2014年 06 月 05 日 第六次实验报告要求 实验目的: 掌握多元线性回归模型的原理,多元线性回归模型的建立、估计、检验及解释变量的增减的方法,以及运用相应的Matlab软件的函数计算。 实验内容: 已知某市粮食年销售量、常住人口、人均收入、肉、蛋、鱼的销售数据,见表1。请选择恰当的解释变量和恰当的模型,建立粮食年销售量的回归模型,并对其进行估计和检验。 表1 某市粮食年销售量、常住人口、人均收入、肉、蛋、鱼的销售数据 年份粮食年销售 量Y/万吨 常住人口 X2/万人 人均收 入X3/ 元 肉销售 量X4/万 吨 蛋销售 量X5/ 万吨 鱼虾销 售量 X6/万吨 197498.45560.20153.20 6.53 1.23 1.89 1975100.70603.11190.009.12 1.30 2.03 1976102.80668.05240.308.10 1.80 2.71 1977133.95715.47301.1210.10 2.09 3.00 1978140.13724.27361.0010.93 2.39 3.29 1979143.11736.13420.0011.85 3.90 5.24 1980146.15748.91491.7612.28 5.13 6.83 1981144.60760.32501.0013.50 5.418.36 1982148.94774.92529.2015.29 6.0910.07 1983158.55785.30552.7218.107.9712.57 1984169.68795.50771.1619.6110.1815.12

统计学多元回归分析实例

某农场负责人认为早稻收获量(y:单位为kg/公顷)与春季降雨(x i:单位为mm)和春季温度(X2:单位为C )有一定的联系,通过7组试验获得了相关的数据。利用Excel得到下面的回归结果(a =0.1): 方差分析表 (1)将方差分析表中的所缺数值补齐。 (2 )写出早稻收获量与春季降雨量、春季温度的多元线性回归方程,并解释各回归系数的意义。 (3 )检验回归方程的线性关系是否显著? (4)检验各回归系数是否显著? 2 (5)计算判定系数R,并解释它的实际意义。 (6)计算估计标准误差Se,并解释它的实际意义。 (每个空格为0.5分) 2、设总体回归模型为Y= 口+ P 1X^^ 2X2+ & ?x^ ?x2,由EXCEL输出结果可知,?= -0.39 14.92x1估计回归方程为? = ? 218.45x2,回归系数 ?的意义指在温度不变的条件下,当降雨量每增加1mm早稻收获量平均增加 14.92 kg/公顷;回归系数:?的意义指在降雨量不变的条件下, 2 当温度增加1C,早稻收获量平均增加218.45 kg/公顷。---5 分 3、由于p值=0.000075 < a =0.05,则拒绝原假设,即表明回归方程的线性关系是显著的。

4、由于各回归系数的P值均小于a ( 0.05 ),所以各回归系数是显著的。 ---2 分5、2二§臾二1387849567二0.99,表示早稻收获量的总变异中有99%的部分可以由降 R SST 14000000 雨量、温度的联合变动来解释。---4 分 6、S =」SS E =V MST = J30376.08 =174.29(k为自变量个数),是总体回归模型 e n - k -1 中随机扰动项&的标准差的无偏估计量,用来衡量回归方程拟合程度的分析指标,S e越大,拟合程度越低;S e越小,拟合程度越高? —4 分

实验三多元回归模型

实验三多元回归模型 【实验目的】 掌握建立多元回归模型和比较、筛选模型的方法。 【实验内容】 建立我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为:()ε, f t Y=。其中,L、K分别为生产过程中投入的劳动与资金, L , ,K 时间变量t反映技术进步的影响。表3-1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。 资料来源:根据《中国统计年鉴-1995》和《中国工业经济年鉴-1995》计算整理 【实验步骤】 一、建立多元线性回归模型 ㈠建立包括时间变量的三元线性回归模型; 在命令窗口依次键入以下命令即可: ⒈建立工作文件: CREATE A 78 94 ⒉输入统计资料: DATA Y L K

⒊生成时间变量t : GENR T=@TREND(77) ⒋建立回归模型: LS Y C T L K 则生产函数的估计结果及有关信息如图3-1所示。 图3-1 我国国有独立核算工业企业生产函数的估计结果 因此,我国国有独立工业企业的生产函数为: K L t y 7764.06667.06789.7732.675?+++-= (模型1) t = 9958.02=R 9948.02=R 551.1018=F 模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为,资金的边际产出为,技术进步的影响使工业总产值平均每年递增亿元。回归系数的符号和数值是较为合理的。9958.02=R ,说明模型有很高的拟合优度,F 检验也是高度显着的,说明职工人数L 、资金K 和时间变量t 对工业总产值的总影响是显着的。从图3-1看出,解释变量资金K 的t 统计量值为,表明资金对企业产出的影响是显着的。但是,模型中其他变量(包括常数项)的t 统计量值都较小,未通过检验。因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除t 统计量最小的变量(即时间变量)而重新建立模型。 ㈡建立剔除时间变量的二元线性回归模型; 命令:LS Y C L K 则生产函数的估计结果及有关信息如图3-2所示。

统计学案例——相关回归分析

《统计学》案例——相关回归分析 案例一质量控制中的简单线性回归分析 1、问题的提出 某石油炼厂的催化装置通过高温及催化剂对原料的作用进行反应,生成各种产品,其中液化气用途广泛、易于储存运输,所以,提高液化气收率,降低不凝气体产量,成为提高经济效益的关键问题。 通过因果分析图和排列图的观察,发现回流温度是影响液化气收率的主要原因,因此,只有确定二者之间的相关关系,寻找适当的回流温度,才能达到提高液化气收率的目的。经认真分析仔细研究,确定了在保持原有轻油收率的前提下,液化气收率比去年同期增长1个百分点的目标,即达到12.24%的液化气收率。 2、数据的收集

目标值确定之后,我们收集了某年某季度的回流温度与液化气收率的30组数据(如上表),进行简单直线回归分析。 3.方法的确立 设线性回归模型为εββ++=x y 10,估计回归方程为x b b y 10?+= 将数据输入计算机,输出散点图可见,液化气收率y 具有随着回流温度x 的提高而降低的趋势。因此,建立描述y 与x 之间关系的模型时,首选直线型是

合理的。 从线性回归的计算结果,可以知道回归系数的最小二乘估计值 b 0=21.263和b 1=-0.229,于是最小二乘直线为 x y 229.0263.21?-= 这就表明,回流温度每增加1℃,估计液化气收率将减少0.229%。 (3)残差分析 为了判别简单线性模型的假定是否有效,作出残差图,进行残差分析。

从图中可以看到,残差基本在-0.5—+0.5左右,说明建立回归模型所依赖的假定是恰当的。误差项的估计值s=0.388。 (4)回归模型检验 a.显著性检验 在90%的显著水平下,进行t 检验,拒绝域为︱t ︱=︱b 1/ s b1︱>t α/2=1.7011。 由输出数据可以找到b 1和s b1,t=b 1/ s b1=-0.229/0.022=-10.313,于是拒绝原假设,说明液化气收率与回流温度之间存在线性关系。 b.拟合度检验 判定系数r 2=0.792。这意味着液化气收率的样本变差大约有80%可以由它与回流温度的线性关系来解释。 2r r ==-0.89 这样,r 值为y 与x 之间存在中高度的负线性关系提供了进一步的证据。 由于n ≥30,我们近似确定y 的90%置信区间为: s z y )(?2 α±=21.263-0.229x ±1.282×0.388 = 21.263-0.229x ± 0.497

门限自回归模型及其在水文随机模拟中的应用.王文圣

门限自回归模型及其在水文随机模拟中的应用* 王文圣, 袁 鹏, 丁 晶, 邓育仁 (四川大学水电学院,四川成都 610065) 摘 要:为了客观描述日流量变化的非线性特性,将一种非线性时序模型——门限自回归模型引入日流量随机模拟。根据我国金沙江流域屏山站观测资料建立了日流量随机模拟的门限自回归模型。实用性检验结果表明,该模型用于模拟日流量过程是可行的,成果实用。这种尝试为日流量随机模拟提供了一种考虑日流量非线性变化特性的新模型。 关键词:门限自回归模型;日流量随机模拟;实用性检验 中图分类号:P33;P333.6文献标识码: B文章编号:1001-2184(2001)增-0047-04 1 引 言 日流量随机模拟利用日流量涨落的统计特性,具体说是利用日流量在时序上的统计关系。这种统计关系非常复杂,为简化处理常常以线性来表征前后日流量的关系。在一般情况下,这种简化尚能反映日流量时序变化的主要特性。所以在日流量随机模拟时,当前广泛使用线性时序模型。但是日流量在时序上的前后流量关系是非线性的。例如,对大流域一次洪水的日流量过程涨水段的下部、中部和上部有着明显不同的涨率,前后流量关系显然不是线性的;同样在落水段的下部、中部和上部有着明显不同的退水率,前后流量关系也不是线性的。因此,为更全面地反映日流量时序变化的特性,最好考虑日流量在时序变化上的非线性特性。 近来,非线性时序的分析获得了迅速的发展,并且相继出现了一系列非线性时序模型,比如门限自回归模型,双线性模型,指数自回归模型,状态依赖模型等。对双线性模型曾初步研究了在洪水模拟中应用的可能性[1]。门限自回归模型最近尝试应用于水文预报并获得较好的效果[2]。鉴于门限自回归模型在表征非线性特性上具有其独到之处,笔者将之引入日流量随机模拟并以某站日流量资料为基础,全面探讨了这种模型在日流量模拟中的可行性,模拟效果和优缺点等。 2 门限自回归模型的形式和基本特性 2.1 模型形式 门限自回归模型由汤家豪1978年提出[3],用来解决一类非线性问题。其思路是:对研究对象按照不同区间建立若干个线性时序模型;然后将这些线性时序模型组合起来描述该对象非线性时序变化特性。 对于时间序列{Z t},门限自回归模型的一般形 收稿日期:2000-08-14 * 基金项目:国家自然科学基金(49871018);高速水力学国家重点实验室开放基金资助项目(编号2008)式为: Z t U(1)0+∑ p 1 i=1 U(1)i Z t-i+E(1)t Z t-d F r1 U(2)0+∑ p 2 i=1 U(2)i Z t-i+E(2)t r1

实验报告2多元线性回归模型的估计和统计检验(答案).doc

实验实训报告 课程名称:计量经济学实验 开课学期: 2011-2012学年第一学期开课系(部):经济系 开课实验(训)室:数量经济分析实验室学生姓名: 专业班级: 学号: 重庆工商大学融智学院教务处制

实验题目 实验(训)项目名称多元线性回归模型的估计和统 指导教师 计检验 实验(训)日期所在分组 实验概述 【实验(训)目的及要求】 目的:掌握多元线性回归模型的估计、检验。 要求:在老师指导下完成多元线性回归模型的建立、估计、统计检验,并得到正确的分析结果。 【实验(训)原理】 当多元线性回归模型在满足线性模型古典假设的前提下,最小二乘估计结果具有无偏性、有效性等性质,在此基础上进一步对估计所得的模型进行经济意义检验及统计检验。 实验内容 【实验(训)方案设计】 1、创建工作文件和导入数据; 2、完成变量的描述性统计; 3、进行多元线性回归估计; 4、统计检验:可决系数分析(R2);(2)参数显著性分析(t检验);(3)方程显著性分析(F检验); 5、进行变量非线性模型的线性化处理,并比较不同模型的拟合优度(因变量相同时)。 实验背景 选择包括中央和地方税收的“国家财政收入”中的“各项税收”(简称“TAX”)作为被解释变量,以反映国家税收的增长。选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表(FIN);选择“商品零售物价指数”作为物价水平的代表(PRIC),并将它们设为影响税收收入的解释变量。建立中国税收的增长模型,并对已建立的模型进行检验。

【实验(训)过程】(实验(训)步骤、记录、数据、分析 ) 1、根据实验数据的相关信息建立Workfile ; 在菜单中依次点击File\New\Workfile,在出现的对话框“Workfile range ”中选择数据频率。因为本例分析中国1978-2002年度的税收(Tax )与GDP 、财政支出(FIN )、商品零售物价指数(PRIC )之间关系,因此,在数据频率选项中选择“Annual ”选项。在“start data ”输入“1978”,在“end data ”输入“2002”。 2、导入数据; 在菜单栏中选择“Quick\Empty Group ”,将TAX 、GDP 、FIN 、PRIC 的年度数据从Excel 导入,并将这四个序列的名称分别改为“TAX ” 、“TAX ” 、“GDP ” 、“FIN ” 、“PRIC ” 。 或者在EViews 命令窗口中直接输入“data TAX GDP FIN PRIC ” ,在弹出的编辑框中将这四个个变量的时间数列数据从Excel 中复制过来。 3、给出自变量和因变量的描述性统计结果,并判断数据序列是否服从正态分布 (5%α=) 变量名 Mean Median Std J-B 值 J.B p 值 是否服从正态分布 GDP 35977 18548 34445 3.308 0.191 是 FIN 5855 3084 5968 9.390 0.009 否 PRIC 105 103 7 4.125 0.127 是 TAX 4848 2822 4871 6.908 0.032 否 4、给出自变量和因变量之间的相关系数矩阵: GDP FIN PRIC TAX GDP 1.000 0.957 -0.290 0.969 FIN 0.957 1.000 -0.375 0.997 PRIC -0.290 -0.375 1.000 -0.334 TAX 0.969 0.997 -0.334 1.000 5、假设总体回归模型1为0123TAX GDP FIN PRIC u ββββ=++++,进行多元回归估计 并报告估计结果:

统计学多元回归分析实例

某农场负责人认为早稻收获量(y :单位为kg/公顷)与春季降雨(x 1:单位为mm )和春季温度(x 2:单位为℃)有一定的联系,通过7组试验获得了相关的数据。利用Excel 得到下面的回归结果(α=0.1): 方差分析表 (2)写出早稻收获量与春季降雨量、春季温度的多元线性回归方程,并解释各回归系数的意义。 (3)检验回归方程的线性关系是否显著? (4)检验各回归系数是否显著? (5)计算判定系数2 R ,并解释它的实际意义。 (6)计算估计标准误差Se ,并解释它的实际意义。 (每个空格为0.5分) -----3分 2、设总体回归模型为Y =1 2 1 2 x x αεββ+ ++ 估计回归方程为y ?=1 2 1 2 ???x x αββ++,由EXCEL 输出结果可知,y ?=120.3914.92218.45-++x x ,回归系数1 ?β 的意义指在温度不变的条件下,当降雨量每增加1mm ,早稻收获量平均增加14.92kg/公顷;回归系数 2 ?β 的意义指在降雨量不变的条件下, 当温度增加1℃,早稻收获量平均增加218.45kg/公顷。 ---5分

3、由于p 值=0.000075<α=0.05,则拒绝原假设,即表明回归方程的线性关系是显著的。 ---2分 4、由于各回归系数的P 值均小于α(0.05),所以各回归系数是显著的。 ---2分 5、 2 13878495.67 0.9914000000 = ==SSR SST R ,表示早稻收获量的总变异中有99%的部分可以由降雨量、温度的联合变动来解释。 ---4分 6、 174.29= ===e S (k 为自变量个数) ,是总体回归模型中随机扰动项ε的标准差的无偏估计量,用来衡量回归方程拟合程度的分析指标,e S 越大, 拟合程度越低;e S 越小,拟合程度越高. ---4分

实验三 多元线性回归模型及非线性回归

实验三 多元线性回归模型及非线性回归 一、多元线性回归模型 例题3.2.2 建立2006年中国城镇居民人均消费支出的多元线性回归模型。 数据: 地区 2006年消费支出Y 2006年可支配收入X1 2005年消费支出X2 北京 14825.41 19977.52 13244.2 天津 10548.05 14283.09 9653.3 河北 7343.49 10304.56 6699.7 山西 7170.94 10027.70 6342.6 内蒙古 7666.61 10357.99 6928.6 辽宁 7987.49 10369.61 7369.3 吉林 7352.64 9775.07 6794.7 黑龙江 6655.43 9182.31 6178.0 上海 14761.75 20667.91 13773.4 江苏 9628.59 14084.26 8621.8 浙江 13348.51 18265.10 12253.7 安徽 7294.73 9771.05 6367.7 福建 9807.71 13753.28 8794.4 江西 6645.54 9551.12 6109.4 山东 8468.40 12192.24 7457.3 河南 6685.18 9810.26 6038.0 湖北 7397.32 9802.65 6736.6 湖南 8169.30 10504.67 7505.0 广东 12432.22 16105.58 11809.9 广西 6791.95 9898.75 7032.8 海南 7126.78 9395.13 5928.8 重庆 9398.69 11569.74 8623.3 四川 7524.81 9350.11 6891.3 贵州 6848.39 9116.61 6159.3 云南 7379.81 10069.89 6996.9 西藏 6192.57 8941.08 8617.1 陕西 7553.28 9267.70 6656.5 甘肃 6974.21 8920.59 6529.2 青海 6530.11 9000.35 6245.3 宁夏 7205.57 9177.26 6404.3 新疆 6730.01 8871.27 6207.5 1、 建立模型 01122Y X X βββμ=+++ 2、估计模型 (1)录入数据 打开EViews6,点“File ” “New ”“Workfile ”

实验三 多元线性回归模型和非线性回归模型

实验三多元线性回归模型和非线性回归模型 【实验目的】 掌握建立多元线性回归模型和非线性回归模型,以及比较、筛选模型的方法。【实验内容】 建立我国国有独立核算工业企业生产函数。 根据生产函数理论,生产函数的基本形式为:(,,,) Y f t L Kε =。其中,L、K 分别为生产过程中投入的劳动与资金,时间变量t反映技术进步的影响。表3.1列出了我国1978-1994年期间国有独立核算工业企业的有关统计资料;其中产出Y为工业总产值(可比价),L、K分别为年末职工人数和固定资产净值(可比价)。 表3.1 我国国有独立核算工业企业统计资料 年份时间t 工业总产值 Y(亿元) 职工人数 L(万人) 固定资产 K(亿元) 1978 1 3289.18 3139 2225.70 1979 2 3581.26 3208 2376.34 1980 3 3782.17 3334 2522.81 1981 4 3877.86 3488 2700.90 1982 5 4151.25 3582 2902.19 1983 6 4541.05 3632 3141.76 1984 7 4946.11 3669 3350.95 1985 8 5586.14 3815 3835.79 1986 9 5931.36 3955 4302.25 1987 10 6601.60 4086 4786.05 1988 11 7434.06 4229 5251.90 1989 12 7721.01 4273 5808.71 1990 13 7949.55 4364 6365.79 1991 14 8634.80 4472 7071.35 1992 15 9705.52 4521 7757.25 1993 16 10261.65 4498 8628.77 1994 17 10928.66 4545 9374.34 【实验步骤】 一、建立多元线性回归模型 (一)建立包括时间变量的三元线性回归模型; 在命令窗口依次键入以下命令即可: ⒈建立工作文件:CREATE A 1978 1994

相关文档
最新文档