数学实验第10次作业-回归分析
回归分析
一实验目的
1 了解回归分析的基本原理,掌握MATLAB实现的方法;
2 练习用回归分析解决实际问题。
二实验内容
1电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),建立回归模型并进行检验,诊断异常点的存在并进行处理。
每周收入
报纸广告费用
初步解决:
首先对于题目作初步分析,题目中电视广告费用和报纸广告费用都会对与每周收入产生影响,但是两者对于每周收入的影响都是独立的。
首先画出散点图如下:
观察散点图之后,假设自变量与因变量满足多元线性关系。设电视广告费用为,报纸
广告费用为,每周收入为,那么每周收入与电视广告费用以及报纸广告费用的关系模型表示如下:
;
下面在MATLAB中输入以下命令:
输出结果如下所示:
结果列表如下:
回归系数回归系数估计值回归系数置信区间
,
,
,
,,,
于是由它得到的预测模型为。
做出残差和置信区间的图像如下:
由图像可以看出,只有第一组数据的置信区间不包括零,改组数据可能有误,去掉之后再进行计算。
在命令栏中输入以下命令:
输出结果如下所示:
将结果列表如下:
回归系数 回归系数估计值
回归系数置信区间
,
,
,
, , ,
由它得到的回归模型为
。
对于实验结果的分析:
回归模型: 。 对比剔除异常点后的分析结果可知,
第一次分析的过程中,第一组数据的置信区间不包括零点,所以该点为异常点,需要剔除再进行一次计算。剔除之后,发现所有点的置信区间都包括了零点。
剔除数据之后计算结果与剔除之前的比较
,,,
原始数据
剔除后,,,纵向比较可以看出,剔除了异常数据之后,置信区间明显的有了缩小,所以说,剔除异常数据可以有利于更加精确地建立模型。
2汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)个月的调查资料见下表,其中是普通型汽车售量(千辆),是豪华型汽车售辆(千辆),是汽油价格(元/),是贷款利率()。
序号
(1)对普通型和豪华型汽车分别建立如下模型:
;
给出的估计值和置信区间,决定系数,值及剩余方差等;
(2)用,表示汽车类型,建立统一模型:,给出估计
值和置信区间,决定系数,值及剩余方差等。以,代入统一模型,将结果与
(1)的两个模型比较,解释二者的区别;
(3)对统一模型就每种类型汽车分别作和与残差的散点图,有什么现象,说明模型有何
缺陷?
(4)对统一模型增加二次项和交互项,考察结果有什么改进。
初步解决:
(1)首先研究,在命令栏中输入以下命令:
输出结果如下:
结果列表如下:
回归系数回归系数估计值回归系数置信区间
,
,
,
,,,
由它得到的回归模型为:。、的置信区间不包含