数据模型与决策课程大作业.docx
数据模型与决策课程大作业
以我国汽油消费量为因变量,乘用车销量、城镇化率和90#汽油吨价与城镇居民人均可支配收入的比值为自变量时行回归(数据为
年度时间序列数据)。试根据得到部分输出结果,回答下列问题:
1)“模型汇总表”中的R方和标准估计的误差是多少?
2)写出此回归分析所对应的方程;
3)将三个自变量对汽油消费量的影响程度进行说明;
4)对回归分析结果进行分析和评价,指出其中存在的问题。
1)“模型汇总表”中的R方和标准估计的误差是多少?
答案:R方为 0.993^2=0.986;标准估计的误差为120910.147^(0.5 )=347.72
2)写出此回归分析所对应的方程;
答案:假设汽油消费量为Y,乘用车销量为a,城镇化率为 b,90#汽油吨价 / 城镇居民人均可支配收入为c, 则回归方程为:
Y=240.534+0.00s027a+8649.895b-198.692c
3)将三个自变量对汽油消费量的影响程度进行说明;
乘用车销量对汽油消费量相关系数只有0.00027 ,数值太小,几乎没有影响,但是城镇化率对汽油消费量相关系数是8649.895 ,具
有明显正相关,当城镇化率每提高 1,汽油消费量增加 8649.895 。乘用
90#汽油吨价/ 城镇居民人均可支配收入相关系数为-198.692 ,呈明显
负相关,即乘用90#汽油吨价/ 城镇居民人均可支配收入每增加1 个单
位,汽油消费量降低 198.692 个单位。 a, b, c 三个自变量的 sig
值为 0.000 、0.000 、0.009 ,在显着性水平0.01 情形下,乘用车消
费量对汽油消费量的影响显着为正。
(4)对回归分析结果进行分析和评价,指出其中存在的问题。
在学习完本课程之后,我们可以统计方法为特征的不确定性决
策、以运筹方法为特征的策略的基本原理和一般方法为基础,结合抽样、参数估计、假设分析、回归分析等知识对我国汽油消费量影响因
素进行了模拟回归,并运用软件计算出回归结果,故根据回归结果,
对具体回归方程,回归准确性,自变量影响展开分析。
Anova 表中, sig值是t统计量对应的概率值,所以t 和sig两者是等效的, sig 要小于给定的显着性水平,越接近于0 越好。 F是检验方程显着性的统计量,是平均的回归平方和平均剩余平方和之
比,越大越好。在图表中,回归模型统计值 F=804.627,p 值为 0.000 ,因此证明回归模型有统计学意义,表现回归极显着。即因变量与三个自变量之间存在线性关系。
系数表中,除了常数项系数显着性水平大于 0.05 ,不影响,其它
项系数都是 0.000 ,小于 0.005 ,即每个回归系数均具有意义。
当然,这其中也存在一定的问题:
在模型设计中,乘用车销量为、城镇化率为、 90#汽油吨价 / 城镇
居民人均可支配收入为三个自变量的单位均不同,因此会造成自变量前
面的回归系数不具有准确的宏观意义,因此需要对模型进行实现标准化,也就是引入β系数,消除偏回归系数带来的数量单位影响。
根据共线性统计量中的变量的容差t 和方差膨胀因子(VIF),自
变量间存在共性问题,容差和膨胀因子为倒数关系,容差越小,膨胀因子越大,尤其是城镇化率 VIF 为 11.213 ,说明共线性明显,可能原因是由于样本容量太小,也可能是城镇化之后乘用车销售量和、 90# 汽油吨价 / 城镇居民人均可支配收入本身就具有相关性。
缺乏模型异方差检验。在多元回归模型中,由于数据质量原因、
模型设定原因,异方差的存在会使回归系数估计结果误差较多,所以在建立模型分析的过程红要对异方差进行检验。
数据模型与决策使我们学会使用科学的分析和决策,对经营管理
活动实现合理化、精细化、科学化,从而避免了盲目的生产活动。通过数据预测、假设检验、公式、分析、验证等一系列的步骤,将数据结果逐一展现。为我们的学习和工作提供了一些非常有用、便捷的,处理问题的方法。
附表: t 分布表:
单尾检验的显着水平
0.0500.0250.0100.005
df
双尾检验的显着水平
0.100.050.020.01
3 2.353 3.182 4.541 5.841
4 2.132 2.776 3.747 4.604
5 2.015 2.571 3.365 4.032
6 1.943 2.44
7 3.143 3.707
7 1.895 2.365 2.998 3.499
8 1.860 2.306 2.896 3.355
9 1.833 2.262 2.821 3.250
10 1.812 2.228 2.764 3.169
11 1.796 2.201 2.718 3.106
12 1.782 2.179 2.681 3.055
13 1.771 2.160 2.650 3.012