ARMA模型的应用

ARMA模型的应用
ARMA模型的应用

基于ARMA模型的湖南省工业总产值的时间序列分析

摘要:改革开放以来,湖南省的工业经济增长取得了举世瞩目的成就。故本文以1978-2013年湖南省工业总产值的历史数据为基础,对1978-2009年的数据进行了平稳化处理,并进行了模型的识别、参数估计、显著性检验、优化,建立了适合湖南省工业发展的自回归移动平均模型(ARMA);然后对2010-2013年湖南省工业总产值进行了拟合预测,以检验模型的实际拟合效果;最后对2014-2016年的工业总产值进行了统计预测,得出ARMA模型是一种很好的短期时间序列预测方法,并从中找出了湖南省工业发展的内在规律,提出了工业发展的相关政策建议。

关键词:ARMA模型;工业总产值;时间序列;短期预测

一、引言

2014年湖南省政府工作报告在回顾2013年工作时指出“工业实力增强,全部工业增加值突破1万亿元,规模工业主营业务收入超过3万亿元”。改革开放以来,湖南省工业总产值从1978年的142.78亿元上升到2013年的40004.55亿元,工业增加值占地区生产总值的比重也由1978年的35.3%上升到2013年的40.8%。2013年,湖南省规模以上工业增加值增长11.6%,规模以上工业新产品产值增长23.2%,占工业总产值比重为13.1%,比上年提高1个百分点。可见湖南省工业不断得到发展,并取得了较为瞩目的成就。但是工业的发展也呈现出一系列问题,工业的发展速度从1978年的121.6%呈现波动性下降,这进一步说明湖南省工业经济在取得重大发展的过程中也付出了极大的代价,特别是环境方面的代价,这在某种程度上阻碍了湖南省工业经济的进一步发展。此外,随着我国经济增长中心由东部沿海地区向西部地区推移,作为我国主要的能源基地和原材料工业基地的中部六省必定成为我国工业经济的高速增长点,而湖南省两型社会(资源节约型和环境友好型)的构建,使其面临了更多的机遇和挑战。从某种程度上说,湖南省工业发展的好坏,将会影响我国未来经济的发展和环境友好型社会的构建,这就迫切需要我们对湖南省工业经济发展的模式做出重新选择。为了探索出湖南省工业发展的内在规律和短期波动情况,促进湖南省工业经济的发展,从而更好定位我国未来经济的发展和构建环境友好型社会,本文运用ARMA模型对湖南省工业总产值序列进行了平稳化处理、模型识别、参数估计、模型检验以及模型优化,最终建立起符合湖南省工业经济发展的疏系数模型(ARIMA模型),并对2014-2016年的工业总产值进行了统计预测。

ARMA模型是国际上比较流行的单一时间序列预测模型,特别适合处理复杂时间序列的预测,且在短期预测时精度较高,故在各个领域运用得也非常广泛。从宏观层面来看,张煜(2006)将ARMA模型应用于我国外贸进出口总额的时间序列的分析中,证实了ARMA模型是一种较好的短期预测模型]1[。夏蓉(2008)以1952-2004年我国工业总产值的历史数据为基础,建立ARMA模型,探析出ARMA 模型能较好的分析和计算我国工业的发展波动情况,我国工业总产值在保持稳定速度增长的同时也存在一些问题]2[。陈德艳(2011)]3[、苏雷(2012)]4[等分别将ARMA模型应用于我国城乡收入差距、土地利用需求量的预测中。从微观层面

来看,梁来存等(2003)]5[、沈楠(2009)]6[、李斌(2011)]7[将ARMA 模型分别应用于湖南省人均GDP 、工业废气排放量、产业承接转移等领域中,并证实出ARMA 模型是一种较好的短期预测方法。

综上说述,国内各学者虽将ARMA 模型应用到很多行业领域,并形成了一些较为成熟的理论和方法,但还是存在很多不足,且很多行业领域未涉及到。湖南省作为中部省份之一,近年来工业结构不断改善,新产品开发不断加快。故本文在以往学者研究的基础上,通过借鉴其研究成果及思路,主要从湖南省工业总产值序列展开分析的。

二、研究方法和数据说明

(一)研究方法

如果随机序列{x t }满足:x t =0φ+1φx 1-t +…+p φx p t -+t ε-1θ1-t ε-…-q θq t -ε,其中残差序列{t ε}为零均值白噪声序列。则称时间序列{x t }服从(p,q )阶自回归移动平均模型]8[,简记为ARMA(p,q)。若0φ=0,则模型为中心化ARMA (p,q )模型。引进延迟算子,ARMA (p,q )模型简记为:

t x B )(Φ=t B ε)(Θ

式中,

P P B B B φφ---=Φ...1)(1,为p 阶自回归系数多项式。

q q B B B θθ---=Θ...1)(1,为q 阶移动平均系数多项式。

显然,当p=0时,ARMA(p,q)模型就退化为AR (p )模型,当q=0时,ARMA(p,q)模型就退化为MA (q )模型。AR (p )和MA (q )模型实际上是ARMA(p,q)模型的特例。

本文中,由于所选取的时间序列的特殊性,采用ARIMA (p,d,q )模型,它是指d 阶差分后自相关最高阶数为p ,移动平均最高阶数为q 的模型,其预测方法与ARMA 模型非常相似,该模型的一般表示方法为:

t t d B x B B ε)()1)((Θ=-Φ

(二)数据说明

本文采用的数据是1978-2013年湖南省工业总产值,其中1978-2012年的数

据来自于《2013湖南省统计年鉴》,2013年的数据是根据《湖南省2013年国民经济和社会发展统计公报》中的数据换算求得(原始数据见附录表1)。

三、湖南省工业总产值序列的实证分析

目前最容易分析的一种序列是平稳非白噪声序列,而现实生活中绝大多数序列都是非平稳序列,因而在时间序列建模分析之前,需要先对时间序列进行平稳性处理和白噪声检验,以便进行更深入的分析。

(一)时间序列的预处理

1.平稳性检验

这里首先通过时序图直观的判断工业总产值序列的平稳情况,同时为了精确的判断工业总产值序列是否平稳,运用ADF单位根检验进行平稳性检验。利用Eview6.0软件对数据进行处理,结果如图1和表1所示:

图1 湖南省工业总产值时间曲线图

表1 X序列ADF检验结果

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic 5.757623 1.0000 Test critical values: 1% level -3.737853

5% level -2.991878

10% level -2.635542

从图1可以看到,湖南省工业总产值呈指数递增变化,且从表1可知,单位根统计量ADF=5.757623大于Eviews给出的显著性水平1%-10%的ADF临界值,所以接受原假设,认为该序列是非平稳的。此时需要对数据进行平稳化处理,对于含有指数趋势的时间序列,一般通过取自然对数的方式将时间的指数趋势转化为线性趋势(见图2)。然后用一阶差分消除线性趋势,二阶差分消除二次曲线趋势。

图2 湖南省工业总产值对数曲线图

从图2中可以看出,湖南省工业总产值取完对数后具有明显的趋势变化,因而将其进行一阶差分后得到Y,以消除趋势变化。作出Y的折线图(见图3)和自相关和偏自相关分析图(见图4),并对Y进行ADF单位根检验(见表2)。

图3 湖南省工业总产值对数一阶差分曲线图

图4 y序列的自相关和偏自相关图

表2 Y序列ADF检验结果

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -3.309601 0.0234

Test critical values: 1% level -3.670170

5% level -2.963972

10% level -2.621007

从图3中可以看出,该序列始终在一个常数值附近随机波动,而且波动的范

围有界,因而可以初步认定序列是平稳的,从图4可以看出,序列的自相关系数

一直都比较小,除滞后1阶和6阶的自相关系数落在2倍标准差范围以外,其他

始终控制在2倍的标准差范围以内,可以认为该序列自始至终都在零轴附近波动,

因而认定序列的趋势已基本消除。从表2得到Y序列的单位根统计量

ADF=-3.309601小于Eviews给出的显著性水平5%-10%的ADF临界值,所以拒绝

原假设,进一步判定该序列是平稳的。

2.纯随机性检验

从图4中可以看出,在检验的显著性水平取为0.05的条件下,由于延迟6阶和

12阶的Q统计量的P值为0.002和0.019,小于0.05,所以该差分后序列不能视为白

噪声序列,即差分后序列还蕴涵着不容忽视的自相关信息可供提取。从而可以对

这个平稳非白噪声序列进行进一步分析建模及预测。

(二)模型的建立

根据平稳化后的时间序列y的自相关和偏自相关图的形状,可以对时间序列

的模型作初步的判断。根据图4可知,除了延迟1阶的自相关系数和偏自相关系

数在2倍标准差范围之外,其他阶段数的自相关系数和偏自相关系数均在2倍标

准差范围内波动。为了能得到更加精确的模型,将模型初步认定为

ARIMA(1,1,0),ARIMA(0,1,1),ARIMA(0,1,(1,6))(具体见附录表2-3)。根据AIC

和SBC准则,最终确定建立ARIMA(0,1,(1,6))模型。

采用Eviews软件对1978-2009年湖南省工业总产值的数据进行拟合,结果

如表3所示:

表3 ARIMA(0,1,(1,6))模型回归结果

Dependent Variable: Y

Variable Coefficient Std. Error t-Statistic Prob.

C 0.162146 0.004961 32.68466 0.0000

MA(1) -0.094273 0.086550 -1.089231 0.2853

MA(6) -0.891629 0.055749 -15.99356 0.0000

R-squared 0.471346 Mean dependent var 0.151541 Adjusted R-squared 0.433585 S.D. dependent var 0.073858 S.E. of regression 0.055586 Akaike info criterion -2.849996 Sum squared resid 0.086515 Schwarz criterion -2.711223 Log likelihood 47.17494 Hannan-Quinn criter. -2.804760 F-statistic 12.48233 Durbin-Watson stat 1.626776 Prob(F-statistic) 0.000133

Inverted MA Roots 1.00 .51-.85i .51+.85i -.48-.85i

-.48+.85i -.97

根据表3可知,ARIMA(0,1,(1,6))模型的公式为:

(1-B)lnx

t =0.156142+(1+0.094273B+0.891629B6)

t

ε

(三)模型的检验

1.参数的显著性检验

检验结果如表4所示:

表4 参数检验结果表

从表4可知,除参数

1

φ的t统计量所对应的P值远远大于显著性水平0.05,

认为参数显著为0外,其他两参数的t统计量对应的P值远远小于显著性水平

0.05,认为两参数均显著不为0。剔除

1

φ后(回归结果见附录表4),模型

ARIMA(0,1,6)变为:

(1-B)lnx

t =0.1572+(1+0.855455B6)

t

2.模型的显著性检验

对ARIMA(0,1 ,6))模型的残差序列进行纯随机性检验,如图5所示:

图5 残差序列的自相关和偏自相关图

由图5可知,模型的残差序列的自相关系数和偏自相关系数均在置信区间之内,且其Q统计量的P值都远远大于0.05,因此可以认为残差序列为白噪声序列,模型信息提取比较充分,初步判定模型符合要求。

为了确定模型的精确度,对残差序列进行ADF检验(不包括常数项和趋势项)。结果如表5所示:

表5 残差序列ADF检验结果

Lag Length: 0 (Automatic based on SIC, MAXLAG=7)

t-Statistic Prob.*

Augmented Dickey-Fuller test statistic -4.924051 0.0004 Test critical values: 1% level -3.670170

5% level -2.963972

10% level -2.621007

从表5可以看出,单位根统计量ADF=-4.924051小于Eviews给出的显著性水平1%-10%的ADF临界值,所以拒绝原假设,模型的残差序列不存在单位根,进一步确定模型是符合的。

(四)序列拟合值和序列观察值拟合效果图

将序列拟合值和序列观察值联合作图(如图6所示),可以直观地看出ARIMA(0,1,6)模型对原序列的拟合效果良好。同时可以观察残差曲线,序列拟合值和序列观察值得吻合度较高。

图6 湖南省工业总产值序列拟合效果图

(五)模型的预测

模型建立的最终目的是要对序列进行预测,现就ARIMA(0,1,(1,6))模型使用Eviews软件对2010-2014年湖南省工业总产值进行预测,得到Forecast过程预测效果图(图7)和预测结果(表6):

图7 Forecast过程预测效果图

从图7可以看出,模型的预测值均落在2倍标准差范围内,且2011-2013年湖南省工业总产值呈现出递增趋势,与实际的发展趋势是相吻合的。总体看来,模型的拟合效果比较好。

表6 湖南省工业总产值的拟合值和观察值得比较

根据表6可知,2010-2013年模型的拟合值和观察值的差距很小,预测的精度也很高。2014-2016年,湖南省工业总产值仍将呈现递增趋势,从而进一步证实了ARMA模型是一种很好的短期时间序列的预测方法。(具体预测过程见附录表5)

四、结论与政策建议

(一)结论

1.从ARMA模型本身来看,ARMA模型能较好的分析和计算湖南省工业的发展情况,是一种很好的短期时间序列的预测模型,具有较好的应用前景。

2.从ARMA模型的预测结果来看,2010-2013年湖南省工业总产值的额拟合值和观察值的差距很小,预测精度也很高。2014-2016年湖南省工业总产值将呈

现逐年递增趋势。ARIMA模型的短期预测效果较高。

(二)政策建议

虽然从模型的预测结果显示湖南省工业总产值在近几年内将呈现递增趋势,但是也应看到其中存在的一系列问题。随着资源短缺严重、环境污染加重、国际竞争加剧以及社会矛盾等问题的日益突出,给湖南省工业的发展带来了一定的阻碍作用,现提出如下政策建议:

1.加大发展资金投入。为保证湖南省工业持续健康发展,国家可以设立湖南省工业主导产业专项资金;加大项目资金投入,以促进湖南省重大工业项目的引进与发展。

2.大对外开放。扩大外贸专项资金规模,促进湖南省工业产品出口,适当放宽在湖南生产、制造和加工的工业产品出口限制,制定跟家优惠的政策,促进湖南省相关产业的发展;引进国外高新技术产业,优化产业结构。

3.工业化道路。加强工业体制改革,提高资源利用率;提高劳动者的整体素质,培养专业技术人才和全方位的经营管理人才;充分利用湖南省的地理区位优势,建设大型的国家重要综合化工产业基地,以带动其他相关产业的发展;加大对污染物排放量超标企业的惩罚力度,支持工业企业节能环保的技术创新和改造。

参考文献

[1]张煜.基于ARMA模型的我国外贸进出口总额的时间序列分析[J].当代经理人,2006,(21):1397-1398.

[2]夏蓉.基于ARMA模型的我国工业总产值的时间序列分析[J].软件导刊,2008,(6):143-144.

[3]陈德艳.基于ARMA模型的城乡收入差距的预测[J].辽宁石油化工大学学报,2011,(1):88-91.

[4]苏雷,朱京海,王炜,刘淼. ARMA模型在土地利用需求量预测中的应用 [J].湖南农业科学,2012,(5):61-64.

[5]梁来存,李灿.湖南人均GDP时间序列模型的建立与分析[J].湖南商学院学报(双月刊),2003,(6):74-76.

[6]沈楠.基于ARMA模型的湖南省工业废气排放量统计预测 [J].中国商界,2009,(182):212-213.

[7]李斌,陈超凡,万大艳.低梯度地区承接产业转移影响因素及预测研究——以湖南省为例 [J].湖南师范大学社会科学学报,2011,(2):93-96.

[8]王燕.应用时间序列分析 [M].中国人民大学出版社,2013.

附录

表1 1978-2013年湖南省工业总产值情况表

单位:亿元

表2 ARIMA(1,1,0)回归结果

Dependent Variable: Y

Sample (adjusted): 1980 2009

Convergence achieved after 3 iterations

Variable Coefficient Std. Error t-Statistic Prob.

C 0.151104 0.022177 6.813532 0.0000

AR(1) 0.431497 0.171774 2.512005 0.0180

R-squared 0.183915 Mean dependent var 0.151949 Adjusted R-squared 0.154770 S.D. dependent var 0.075085 S.E. of regression 0.069031 Akaike info criterion -2.444186 Sum squared resid 0.133427 Schwarz criterion -2.350773 Log likelihood 38.66279 Hannan-Quinn criter. -2.414302 F-statistic 6.310168 Durbin-Watson stat 1.809326 Prob(F-statistic) 0.018046

表3 ARIMA(0,1,1)回归结果

Dependent Variable: Y

Sample (adjusted): 1979 2009

MA Backcast: 1978

Variable Coefficient Std. Error t-Statistic Prob.

C 0.150252 0.017664 8.506118 0.0000

MA(1) 0.465401 0.172885 2.691971 0.0117

R-squared 0.192018 Mean dependent var 0.151541 Adjusted R-squared 0.164156 S.D. dependent var 0.073858 S.E. of regression 0.067525 Akaike info criterion -2.490307 Sum squared resid 0.132228 Schwarz criterion -2.397791 Log likelihood 40.59976 Hannan-Quinn criter. -2.460149 F-statistic 6.891869 Durbin-Watson stat 1.869523 Prob(F-statistic) 0.013676

Inverted MA Roots -.47

表4 ARIMA(0,1,6)回归结果

Dependent Variable: Y

Sample (adjusted): 1979 2009

MA Backcast: 1973 1978

Variable Coefficient Std. Error t-Statistic Prob.

C 0.157246 0.006512 24.14708 0.0000

MA(6) -0.855455 0.054364 -15.73577 0.0000

R-squared 0.448182 Mean dependent var 0.151541 Adjusted R-squared 0.429154 S.D. dependent var 0.073858 S.E. of regression 0.055803 Akaike info criterion -2.871629 Sum squared resid 0.090306 Schwarz criterion -2.779114 Log likelihood 46.51025 Hannan-Quinn criter. -2.841472 F-statistic 23.55358 Durbin-Watson stat 1.719997 Prob(F-statistic) 0.000038

Inverted MA Roots .97 .49+.84i .49-.84i -.49-.84i

-.49+.84i -.97

相关主题
相关文档
最新文档