基于时间序列arma模型的分析

基于时间序列arma模型的分析
基于时间序列arma模型的分析

针对乳制品月产量数据的时间序列分析

摘要:随着经济的发展,乳制品产业对国民健康水平的影响逐渐加大。该文从乳制品行业月产量的角度出发,采用时间序列数据分析方法,对我国自1990年至2010年以来的乳制品行业月产量进行了建模分析,并在得到模型后对其进行了预测。从分析结果来看,我国的乳制品产量在2004年发生突变,特定的月份也会对其产生影响,并且在不同的时间,影响会发生变化。

关键词:乳制品;月份特征;产量突变;产量预测;

背景:

纵观自1949年发展至今,整个行业可以分为四个发展阶段:

1、缓慢发展阶段(1949~1977):这段时期,我国乳产业受国家经济状况制约发展缓慢。

2、迅速扩张阶段(1978~1992):由于开始实行多种所有制进行奶牛饲养与奶制品加工,原奶与乳品的产量、种类、质量都有明显的提高

3、结构调整阶段(1993~1998):1993年开始,乳品供给增长明显快于消费增长速度,产能出现比较严重的过剩,乳粉出现滞积,部分乳品企业发展艰难。

4、高速增长阶段(1999~至今):1998年起,乳制品产业经过产品结构大力调整,经济效益明显提高,随着消费需求的迅速增长,乳制品产量也连年增长,乳产业已经从一个传统产业摇身一变成为一个朝阳产业。

从市场格局上看,乳制品企业可以分为4类:1、以伊利、蒙牛为代表的全国性企业;2、以光明、三鹿、维维等为代表的区域性企业;3、以北京三元、济南佳宝为代表的本省省会企业;4、以雀巢为代表的外资企业。在行业中,企业之间的竞争非常激烈,特别地,在近十年中市场竞争引起了市场格局的极大改变。

本文将选取1993年1月起到2010年6月的月产量数据进行时间序列分析,尝试建立该时序的时间序列模型及其详细的建立过程,并对模型结果给出必要的经济意义解释。

建立模型过程:

1、建模过程使用eviews软件,将1990年1月到2010年6月总计246个月度数据输入eviews中,Yt即是产量月度序列,现作出散点图如下:

通过观察上图,认为不同时间下的Yt的数值差异过大,并且波动程度也差别过大,故先将序列作取对数处理,作出散点图如下:

通过观察上图,认为该序列是一个典型的结构突变的过程,突变位置始于2003年12月。故需要加入突变虚拟变量进行检测。从图中我们观察到,突变过程精确来说应属于渐进式的突变,但在突变区间内只有2~3个月份,相对于200多个月份来说可以忽略,故在选择突变类型时认为是水平突变,即从2003年12月开始水平突变。由于不知是否存在斜率突变,故我们一齐将水平突变变量与斜率突变变量加入检验。

2、即建立模型:t b t

u t t DL dl t c Y +-?+++=)(log 210βββ,检验结果如下: Variable

Coefficient Std. Error t-Statistic Prob. C

0.674340 0.034742 19.41010 0.0000 @TREND(1989M12)

0.009680 0.000357 27.14478 0.0000 DL

2.076061 0.061744 3

3.62361 0.0000 DL*@TREND(2003M12)

0.002085 0.001182 1.763334 0.0791

R-squared 0.981355 Mean dependent var 2.554138 Adjusted R-squared

0.981123 S.D. dependent var 1.631446 S.E. of regression

0.224148 Akaike info criterion -0.136897 Sum squared resid

12.15861 Schwarz criterion -0.079899 Log likelihood

20.83828 Hannan-Quinn criter. -0.113946 F-statistic

4245.683 Durbin-Watson stat 0.608538 Prob(F-statistic) 0.000000

可以看到,常数项、时间趋势项及水平突变三个变量均显著,而斜率突变并不显著。故我们将其舍去,接着用模型t t u dl t c Y +++=10log ββ再做一次回归:

现在可以看出,三个变量均显著。即现在认为我们正确的加入趋势项和水平突变变量。

3、考虑到 LOGY 是一个月度数据,并且从散点图上也可以明显观察到存在着季节特征,故我们为了研究其十二个月的特征,我们继续加入11个虚拟变量i D (当月份为i 时等于1,否则为0)继续回归,结果如下:

可以看到,只有d1 ,d2 ,d6三个月度变量在5%的水平下是显著的,所以我们剔除不显著变量再回归一次:

现在得到的这个模型,常数项、趋势项、水平突变变量及月度变量均显著。

4、所以接下来我们要讨论的就是这个突变过程究竟是随机趋势过程还是趋势平稳过程,所以我们将采用Perron检验进行检验,即我们用该模型退势后的残差序列进行单位根检验:

突变点在2003年12月,即大概在整个序列的2/3的位置,根据Perron检验表查得在%5水平下临界值应位于-3.780~-3.76之间,故我们明显可以拒绝原假设即认为该残差序列是一个平稳过程,即LOGY是一个趋势平稳序列。所以,当确定LOGY是一个可以避免很多诸如虚假回归等问题的趋势平稳序列后,我们可以放心继续修正模型。

5、现在,我们开始研究模型中是否存在ARMA成分,故作出LOGY退势后的残差序列的自相关偏相关图如下:

从图中可以看到,残差序列是一个平稳的ARMA过程,可能存在AR(1)、AR(3)、MA(1)、MA(2)、MA(3),故我们继续将这五个ARMA成分加入模型中:

发现常数项开始不显著,AR(3)显著性并不好,MA(3)很不显著,但由于常数项并非关键成分,故我们将其剔除继续尝试:

现在,AR(3)与MA(3)的显著性在%5的水平下完全可以拒绝,故我们将其剔除,余下变量即模型:

t u L L D D D DL t Yt L )1()621)(log 1(2216210??ββββαφ++=-----+

继续回归:

可以看到,现在的模型中,加入的ARMA 成分都显著,接下来我们看看残差序列的自相关与偏相关图:

从图中,我们观察到该模型的残差序列已经接近白噪声,即我们认为我们已经加入了正确的ARMA 成分。所以现在的模型为;

2(10.977)(log 0.017 1.010.25810.15420.0956)(10.160.19)t L Yt t dl D D D L L u ---++-=--其中t u 是白噪声。从回归结果中我们可以看出,无论是系数的显著性,还是模型的拟合度,都令人满意。另外经过检验,没有发现有异方差、序列相关、多重共线性等问题的存在。

6、模型的最终调整:

经过尝试预测,我们发现一个不容忽视的问题,即往往1月的产量往往被低估,而6月份的产量的季节特征似乎又消失了,故我们怀疑是否D1的系数在序列后期已发生变化,而同时D6是否开始变得不显著。

解决方案:所以我们新生成一个DN1序列,DN1与D1的区别就在于2003年12月前均为0,其余不变;新生成一个序列D_6,在2003年12月前,D_6与D6一样,后期其余均为0.我们在原来模型中加入DN1,用D_6代替D6进行回归:

从结果发现,月度特征果然发生了变化,1月虚拟变量的系数果然需要被调高0.102,而6月的季节特征在2004年后就不再显著。从而验证了我们的猜想。经过尝试预测检测,没有出现比较异常的拟合值,故认为已经得到目前最好的模型,即:

t u L L D D DN D t Yt L )225.0145.01()6104.02148.01102.01293.0017.0)(log 995.01(2--=-+-+-- 模型解释:

经过层层分析,我们得到最后的模型,即使一个带有结构突变、季节虚拟变量、ARMA 成分的模型:

t u L L D D DN D t Yt L )225.0145.01()6104.02148.01102.01293.0017.0)(log 995.01(2--=-+-+--

1、首先对于时间趋势项t,其系数为0.017,证明logYt 是有一个稳定的时间增长趋势,对于其它条件保持不变,下一月的产量相对于本月将增加0.017个百分点(可看做一个增长模型),说明我国的乳产业多年来一直保持向上增长的势头。并且由于logYt 的线性增长,Yt 将呈现指数增长。

2、季节虚拟变量D1、D2、D6的系数分别为-0.258、-0.154、0.095,经过查验资料表明,1月、2月是产奶淡季,这时候奶牛的产量会因为气候因素而降低,但是降低的程度在2003年12月以后会减弱;而6月是一个产奶旺季,而且此时社会对乳制品的订单会迅速增加,这反过来也会刺激产量提升,但这个特征会在2003年12月以后消失。即在2003年以前,保持其他条件不变,1月会降低产量的0.258个百分点,2月会降低产量的0.154个百分点,6月会增加0.095个百分点;在2003年12月以后,1月会发生改变,只会降低产量的0.191个百分点,6月份的季节特征会消失。

3、对水平突变变量DL,说明从04年左右开始,乳制品产量出现了一个短时间内的飞跃,这与乳产业经历数年滞积与低迷后发生迅速的行业调整有着紧密的关系。蒙牛企业就是在04年占有的市场份额迅速增加。

4、至于

模型预测:

1、样本内预测:我们采用静态方法进行样本内预测,下图为预测值和真实值的点线图及误差结果:

其中,logY为实际值,logYF为预测值。我们可以看到,采用样本内静态预测得到的预测值十分接近实际值,误差比较理想。

下图是取了反函数得到Y的预测值与真实Y的值:

2、接下来我们采用静态预测方法进行样本外一期预测(左序列为预测值,右序列为真实值):

预测值为184t。通过近一年的真实数据和预测值的比较,我们发现预测值的吻合度还是相当高的,预测误差基本控制在5%以内。通过网上查阅资料,发现2010年7月的产量179吨,预测误差为(184-179)/179=0.027,即2.7%的预测误差。

故可以认为我们得到一个预测效果很好的模型。

多元时间序列建模分析

应用时间序列分析实验报告

单位根检验输出结果如下:序列x的单位根检验结果:

1967 58.8 53.4 1968 57.6 50.9 1969 59.8 47.2 1970 56.8 56.1 1971 68.5 52.4 1972 82.9 64.0 1973 116.9 103.6 1974 139.4 152.8 1975 143.0 147.4 1976 134.8 129.3 1977 139.7 132.8 1978 167.6 187.4 1979 211.7 242.9 1980 271.2 298.8 1981 367.6 367.7 1982 413.8 357.5 1983 438.3 421.8 1984 580.5 620.5 1985 808.9 1257.8 1986 1082.1 1498.3 1987 1470.0 1614.2 1988 1766.7 2055.1 1989 1956.0 2199.9 1990 2985.8 2574.3 1991 3827.1 3398.7 1992 4676.3 4443.3 1993 5284.8 5986.2 1994 10421.8 9960.1 1995 12451.8 11048.1 1996 12576.4 11557.4 1997 15160.7 11806.5 1998 15223.6 11626.1 1999 16159.8 13736.5 2000 20634.4 18638.8 2001 22024.4 20159.2 2002 26947.9 24430.3 2003 36287.9 34195.6 2004 49103.3 46435.8 2005 62648.1 54273.7 2006 77594.6 63376.9 2007 93455.6 73284.6 2008 100394.9 79526.5 run; proc gplot; plot x*t=1 y*t=2/overlay; symbol1c=black i=join v=none; symbol2c=red i=join v=none w=2l=2; run; proc arima data=example6_4; identify var=x stationarity=(adf=1); identify var=y stationarity=(adf=1); run; proc arima; identify var=y crrosscorr=x; estimate methed=ml input=x plot; forecast lead=0id=t out=out; proc aima data=out; identify varresidual stationarity=(adf=2); run;

时间序列作业ARMA模型--.

一案例分析的目的 本案例选取2001年1月,到2013年我国铁路运输客运量月度数据来构建ARMA模型,并利用该模型进行外推预测分析。 二、实验数据 数据来自中经网统计数据库

数据来源:中经网数据库 三、ARMA 模型的平稳性 首先绘制出N 的折线图,如图 从图中可以看出,N 序列具有较强的非线性趋势性,因此从图形可以初步判断该序列是非平

稳的。此外,N在每年同期出现相同的变动方式,表明N还存在季节性特征。下面对N 的平稳性和季节季节性进行进一步检验。 四、单位根检验 为了减少N 的变动趋势以及异方差性,先对N进行对数处理,记为LN其曲线图如下:GENR LN = LOG(N) 对数后的N趋势性也很强。下面观察N 的自相关表,选择滞后期数为36,如下: 从上图可以看出,LN的PACF只在滞后一期是显著的ACF随着阶数的增加慢慢衰减至0,因此从偏/自相关系数可以看出该序列表现一定的平稳性。进一步进行单位根检验,打开LN选择存在趋势性的形式,并根据AIC自动选择滞后阶数,单位根检验结果如下:

T统计值的值小于临界值,且相伴概率为0.0001,因此该序列不存在单位根,即该序列是平稳序列。 五、季节性分析 趋势性往往会掩盖季节性特征,从LN的图形可以看出,该序列具有较强的趋势性,为了分析季节性,可以对LN进行差分处理来分析季节性: Genr = DLN = LN – LN (-1) 观察DLN的自相关表,如下:

DLN在之后期为6、12、18、24、30、36处的自相关系数均显著异于0,因此,该序列是以周期6呈现季节性,而且季节自相关系数并没有衰减至0,因此,为了考虑这种季节性,进行季节性差分: GENR SDLN = DLN – DLN(-6) 再做关于SDLN的自相关表,如下: SDLN在滞后期36之后的季节ACF和PACF已经衰减至0,下面对SDLN建立SARMA模型。 六、滞后阶数的初步确定 观察SDLN的自相关、偏自相关图,ACF 和PACF在滞后期1和滞后期6还有滞后期12异于0,其余均与0无异,因此,SARMA(p,q)(k,m)s 中p和q均不超过1,k和m均不超过2.6考虑到高洁移动平均模型估计较为困难,而且自回归模型的检验可以表示无穷的移动平均过程,因此q尽可能取较小的取值。本例拟选择SARMA(1,0)(1,0)6、SARMA(1,0)(1,1)6、SARMA(1,0)(1,2)6、SARMA(1,0)(2,1)6、SARMA(1,1)(1,0)6、SARMA(1,1)(1,1)6、SARMA(1,1)(1,2)6、SARMA(1,1)(0,1)6八个模型来拟合SDLN。

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 --c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2c λ=3c λ=-

时间序列分析资料报告——ARMA模型实验

基于ARMA模型的社会融资规模增长分析 ————ARMA模型实验

第一部分实验分析目的及方法 一般说来,若时间序列满足平稳随机过程的性质,则可用经典的ARMA模型进行建模和预则。但是, 由于金融时间序列随机波动较大,很少满足ARMA模型的适用条件,无法直接采用该模型进行处理。通过对数化及差分处理后,将原本非平稳的序列处理为近似平稳的序列,可以采用ARMA模型进行建模和分析。 第二部分实验数据 2.1数据来源 数据来源于中经网统计数据库。具体数据见附录表5.1 。 2.2所选数据变量 社会融资规模指一定时期(每月、每季或每年)实体经济从金融体系获得的全部资金总额,为一增量概念,即期末余额减去期初余额的差额,或当期发行或发生额扣除当期兑付或偿还额的差额。社会融资规模作为重要的宏观监测指标,由实体经济需求所决定,反映金融体系对实体经济的资金量支持。 本实验拟选取2005年11月到2014年9月我国以月为单位的社会融资规模的数据来构建ARMA模型,并利用该模型进行分析预测。 第三部分 ARMA模型构建 3.1判断序列的平稳性 首先绘制出M的折线图,结果如下图:

图3.1 社会融资规模M曲线图 从图中可以看出,社会融资规模M序列具有一定的趋势性,由此可以初步判断该序列是非平稳的。此外,m在每年同时期出现相同的变动趋势,表明m还存在季节特征。下面对m的平稳性和季节性·进行进一步检验。 为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下: 图3.2 lm曲线图

对数化后的趋势性减弱,但仍存在一定的趋势性,下面观察lm的自相关图 表3.1 lm的自相关图 上表可以看出,该lm序列的PACF只在滞后一期、二期和三期是显著的,ACF随着滞后结束的增加慢慢衰减至0,由此可以看出该序列表现出一定的平稳性。进一步进行单位根检验,由于存在较弱的趋势性且均值不为零,选择存在趋势项的形式,并根据AIC自动选择之后结束,单位根检验结果如下: 表3.2 单位根输出结果 Null Hypothesis: LM has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic - based on SIC, maxlag=12) t-Statistic Prob.*

典型时间序列模型分析

实验1 典型时间序列模型分析 1、实验目的 熟悉三种典型的时间序列模型:AR 模型,MA 模型与ARMA 模型,学会运用Matlab 工具对对上述三种模型进行统计特性分析,通过对2 阶模型的仿真分析,探讨几种模型的适用范围,并且通过实验分析理论分析与实验结果之间的差异。 2、实验原理 AR 模型分析: 设有 AR(2)模型, X(n)=-0.3X(n-1)-0.5X(n-2)+W(n) 其中:W(n)是零均值正态白噪声,方差为4。 (1)用MA TLAB 模拟产生X(n)的500 观测点的样本函数,并绘出波形 (2)用产生的500 个观测点估计X(n)的均值和方差 (3)画出理论的功率谱 (4)估计X(n)的相关函数和功率谱 【分析】给定二阶的AR 过程,可以用递推公式得出最终的输出序列。或者按照一个白噪声 通过线性系统的方式得到,这个系统的传递函数为: 1 2 1 ()10.30.5H z z z --= ++ 这是一个全极点的滤波器,具有无限长的冲激响应。 对于功率谱,可以这样得到, ()() 2 2 12 12exp 11x w z jw P w a z a z σ--==++ 可以看出, () x P w 完全由两个极点位置决定。 对于 AR 模型的自相关函数,有下面的公式: 这称为 Yule-Walker 方程,当相关长度大于p 时,由递推式求出: 这样,就可以求出理论的 AR 模型的自相关序列。

1.产生样本函数,并画出波形 2.题目中的AR 过程相当于一个零均值正态白噪声通过线性系统后的输出,可以按照上面的方法进行描述。 clear all; b=[1]; a=[1 0.3 0.5]; % 由描述的差分方程,得到系统传递函数 h=impz(b,a,20); % 得到系统的单位冲激函数,在20 点处已经可以认为值是0 randn('state',0); w=normrnd(0,2,1,500); % 产生题设的白噪声随机序列,标准差为2 x=filter(b,a,w); % 通过线形系统,得到输出就是题目中要求的2 阶AR 过程 plot(x,'r'); ylabel('x(n)'); title('邹先雄——产生的AR 随机序列'); grid on; 得到的输出序列波形为: 2.估计均值和方差 可以首先计算出理论输出的均值和方差,得到 x m ,对于方差可以先求出理论自相 关输出,然后取零点的值。

时间序列分析基于R——习题答案

第一章习题答案 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 Au+ocorreliil. i ons Correlation -1 M 7 6 5 4 3 2 1 0 I ; 3 4 5 6 7 9 9 1 1.00000■Hi ■ K. B H,J B ik L L1■* J.1 jA1-.IM L L* rn^rp ■ i>i?iTwin H'iTiii M[lrp i,*nfr 'TirjlvTilT'1 iBrp O.7QOO0■ill. Ii ill ■ _.ill?L■ ill iL si ill .la11 ■ fall■ 1 ■ rpTirp Tp和阳申■丽轉■晒?|?卉(ft 0.41212■强:料榊<牌■ 0.14343'■讯榊* -.07078■ -.25758, WWHOHHf ■ -.375761 marks two 总t and&rd errors 2.2 (1) 非平稳,时序图如下 (2) - ( 3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

Ctorrelat ion LOOOOO n.A'7F1 0.72171 0.51252 Q,34982 0.24600 0.20309 0.?1021 0.26429 0.36433 0.49472 0.58456 0.60198 0.51841 Q ?菲晡 日 0.20671 0.0013& -,03243 -.02710 Q.01124 0,08275 0.17011 Autocorrel at ions raarka two standard errors 2.3 (1) 自相关系数为: 0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2 )平稳序列 (3) 白噪声序列 2.4 LB=4.83 , LB 统计量对应的分位点为 0.9634 , P 值为0.0363。显著性水平 :-=0.05,序列 不能视为纯随机序列。 2.5 (1) 时序图与样本自相关图如下 AuEocorreI ati ons 弗卅制iti 电卅栅冷卅樹 側樹 榊 惟 1 ■ liihCidi iliihQriHi il>LljU_nll Hnlidiili Hialli iT ,, T^,, T^s ?T* iTijTirr ,^T 1 IT * -i> ■> - ■ ■ *畑** ? ■ ■ 耶曲邯 ? ■ ■ ■ >|{和怦I {册卅KHi 笊出恸 mrpmrp 山!rpEHi erp . 卑*寧* a 1 *

时间序列分析及VAR模型

Lecture 6 6. Time series analysis: Multivariate models 6.1Learning outcomes ?Vector autoregression (VAR) ?Cointegration ?Vector error correction model (VECM) ?Application: pairs trading 6.2Vector autoregression (VAR)向量自回归 The classical linear regression model assumes strict exogeneity; hence, there is no serial correlation between error terms and any realisation of any independent variable (lead or lag). As we discovered, serial correlation (or autocorrelation) is very common in financial time series and panel data. Furthermore, we assumed a pre-defined relation of causality: explanatory variable affect the dependent variable? 传统的线性回归模型假设严格的外主性,误差项与可实现的独立变量之间没有序列相关性。金融时间序列及面板数据往往都有很强的自相关性,假定解释变量影响因变量。 We now relax bo什]assumptions using a VAR model. VAR models can be regarded as a generalisation of AR(p) processes by adding additional time series. Hence, we enter the field of multivariate time series analysis. VAR模型可以'"l作是在一般的自回归过程中加入时间序列。 Lefs look at a standard AR(p) process for hvo variables (y( and xj? (1)%= Ql + 琅]仇『一 +仏 (2)x t = a2 + - + £2t The next step is to allow that lagged values of xt can affect y( and vice versa. This means that we obtain a system of equations for two dependent variables(y(and xj?Both dependent variables are influenced by past realisations of y(and x t. By doing that, we violate strict exogeneity (see Lecture 2); however, we can use a more relaxed concept, namely weak exogeneity?As we use lagged values of bodi dependent variables, we can argue that these lagged values are known to us, as we observed them in the previous period? We call these variables predetermined? Predetermined (lagged) variables fulfil weak exogeneity in the sense that they have to be uncorrelated with the contemporaneoiis error term in t? We can still use OLS to estimate the following system of equations, which is called a VAR in reduced form. (3)+y 仇1化_丫+sr=i ^12 +£it (4)X t = a2+2X1021”—, + _i + f2t

基于时间序列模型的中国GDP增长预测分析

第33卷 第178期2012年7月 财经理论与实践(双月刊) THE THEORY AND PRACTICE OF FINANCE AND ECONOMICS Vol.33 No.178 Jul. 2012 ·信息与统计· 基于时间序列模型的中国GDP增长预测分析 何新易 (南通大学商学院,江苏南通 226019)* 摘 要:作为度量一个国家或地区所有常住单位在一定时期之内所生产和所提供的最终产品或服务的重要总量指标,如果能够对GDP做出正确的预测,必然可以有效引导宏观经济健康发展,为高层管理部门提供决策依据。选用适合短期预测的ARIMA模型对中国1952~2010年的GDP进行计量建模分析,预测结果认为未来五年中国的经济增长仍将处于一个水平较高的上升通道。 关键词:时间序列模型;GDP;预测 中图分类号:F234 文献标识码: A 文章编号:1003-7217(2012)04-0096-04 一、引 言 作为度量一个国家或地区所有常住单位在一定时期之内所生产和所提供的最终产品或服务的重要总量指标,国内生产总值(Gross Domestic Product,GDP)对于判断经济态势运行、衡量经济综合实力、正确制定经济政策等诸多方面,以及在经济研究实际工作中,均起着不可替代的重要作用。 熊志斌(2011)深入分析了时间序列模型与神经网络(NN)模型的优势和劣势,按照两种模型的预测特性,在比较的基础之上,分别构建了ARIMA模型和NN模型,并根据一定算法对两种模型进行了集成。将GDP时间序列的数据结构,根据在非线性空间和线性空间的预测优势,进一步分解为线性非线性残差和自相关主体两部分,即首先用ARIMA分析技术构建线性主体模型,然后用NN模型估计非线性残差,再对序列的整个预测结果进行最终集成。仿真实证结果表明:与单一模型相比,集成模型的预测准确率显著提高,进行GDP预测当然使用集成模型更为有效[1]。桂文林和韩兆洲(2011)认为由于迄今为止,包括季度GDP在内的经季节调整之后的经济数据,中国政府尚未进行公布,不但无法进行国际之间的横向比较,也不利于监测中国宏观经济态势。本文运用1996年第1季度至2009年第4季度的中国实际GDP数据,构建了状态空间模型,使用卡尔曼滤波迭代算法对季节调整模型状态向量的 各分量,进行了最优平滑、预测和估计,并使用极大似然方法估计了超参数。经过对GDP的主要季节和趋势特征的分析,计算出了环比增长率指标来监测和分析经济走势,并与国际通用的TRAMO-SEATS季节调整模型进行了对比,以便鉴别趋势拐点,制定相关的经济政策[2]。高帆(2010)运用1952~2008年的上海GDP增长率数据,实证研究其内在变动机制,将GDP增长率分解为纯生产率效应、纯劳动投入效应、纯生产结构效应、纯劳动结构效应,并分析了这四种效应之间的交互影响。结果表明:在上海GDP增长率提高的四种效应之中,纯生产率效应起到了关键作用。上海GDP增长率自1978年改革开放之后,在整体上对纯生产率效应的依赖度趋于增强。在1978~1989年期间,纯劳动结构效应是GDP增长的主要因素,由于市场化改革的进一步加大,劳动力跨部门流转在很大程度上得以实现。在1990~2008年期间,纯生产率效应是GDP增长的主要因素,正是由于在此历史阶段,由于资本深化进一步加速,从而有效提高了部门劳动生产率。基于实证的研究结论,可以针对性地制定出今后上海市经济实现持续增长的若干宏观政策[3]。腾格尔和何跃(2010)利用中国季度GDP数据分别构建了ARIMA和ARCH模型,同时利用GMDH自组织方法尝试建模,经过Bon-ferroni-Dunn检验,表明与单一模型相比,组合模型的拟合能力更强。研究表明,基于GMDH组合的GDP模 *收稿日期: 2012-02-12 作者简介: 何新易(1966—),男,湖北武汉人,南通大学商学院副教授,经济学博士,研究方向:宏观国民经济问题、中国企业集团融资和投资。

时间序列分析——ARMA模型实验

基于ARMA模型的社会融资规模增长分 析 ————ARMA模型实验

第一部分实验分析目的及方法 一般说来,若时间序列满足平稳随机过程的性质,则可用经典的ARMA模型进行建模和预则。但是, 由于金融时间序列随机波动较大,很少满足ARMA模型的适用条件,无法直接采用该模型进行处理。通过对数化及差分处理后,将原本非平稳的序列处理为近似平稳的序列,可以采用ARMA模型进行建模和分析。 第二部分实验数据 2.1数据来源 数据来源于中经网统计数据库。具体数据见附录表5.1 。 2.2所选数据变量 社会融资规模指一定时期(每月、每季或每年)实体经济从金融体系获得的全部资金总额,为一增量概念,即期末余额减去期初余额的差额,或当期发行或发生额扣除当期兑付或偿还额的差额。社会融资规模作为重要的宏观监测指标,由实体经济需求所决定,反映金融体系对实体经济的资金量支持。 本实验拟选取2005年11月到2014年9月我国以月为单位的社会融资规模的数据来构建ARMA模型,并利用该模型进行分析预测。 第三部分ARMA模型构建 3.1判断序列的平稳性 首先绘制出M的折线图,结果如下图:

图3.1 社会融资规模M曲线图 从图中可以看出,社会融资规模M序列具有一定的趋势性,由此可以初步判断该序列是非平稳的。此外,m在每年同时期出现相同的变动趋势,表明m还存在季节特征。下面对m的平稳性和季节性·进行进一步检验。 为了减少m的变动趋势以及异方差性,先对m进行对数化处理,记为lm,其时序图如下: 图3.2 lm曲线图

对数化后的趋势性减弱,但仍存在一定的趋势性,下面观察lm的自相关图 表3.1 lm的自相关图 上表可以看出,该lm序列的PACF只在滞后一期、二期和三期是显著的,ACF随着滞后结束的增加慢慢衰减至0,由此可以看出该序列表现出一定的平稳性。进一步进行单位根检验,由于存在较弱的趋势性且均值不为零,选择存在趋势项的形式,并根据AIC自动选择之后结束,单位根检验结果如下: 表3.2 单位根输出结果 Null Hypothesis: LM has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic - based on SIC, maxlag=12) t-Statistic Prob.*

基于时间序列序列分析优秀论文

梧州学院 论文题目基于时间序列分析梧州市财政 收入研究 系别数理系 专业信息与计算科学 班级 09信息与计算科学 学号 200901106034 学生姓名胡莲珍 指导老师覃桂江 完成时间

摘要 梧州市财政收入主要来源于基金收入,地方税收收入和非税收收入等几方面。近年来梧州市在自治区党委、自治区政府和市委的正确领导下,全市广大干部群众深入贯彻落实科学发展观,抢抓机遇,开拓进取,克难攻坚,使得全市经济连续几年快速发展,全市人民的生活水平也大幅度提高,但伴随着发展的同时也存在一些问题,本文主要通过研究分析梧州财政收入近几年的状况,根据采用时间序列分析中的一次简单滑动平均法研究分析梧州市财政收入和支出的情况,得到的结果是梧州市财政收入呈现下降状态,而财政支出却逐年上涨,这种状况将导致梧州市人民生活水平下降,影响梧州市各方面的发展。给予一些有益于梧州市财政发展的建议。本文首先介绍主要运用的时间序列分析的概念及其一次简单滑动平均法的方法,再用图表说明了梧州市财政近几年的财政收入和支出状况,然后建立模型,分析由时间序列分析方法得出的对2012年财政收入状况的预测结果,最后,鉴于提高梧州市财政收入的思想,给予了一些合理性建议,比如:积极实施工业强县战略,壮大工业主导财源;大力发展第三产业,强化地方财源建设;完善公共财政支出机制,着力构建和谐社会。 关键词:梧州市;财政收入;时间序列分析;建立模型;建议

Based onThe Time Series Analysis of Wuzhou city Finance Income Studies Abstract Wuzhou city, fiscal revenue mainly comes from fund income, local tax revenue and the tax revenue etc. Wuzhou city in recent years in the autonomous region party committee, the government of the autonomous region and the municipal party committee under the correct leadership, the cadres and masses thoroughly apply the scientific outlook on development, catch every opportunity, pioneering and enterprising, g hard, make the crucial economic rapid development for several years, the people's living standard has also increased significantly, but with the development at the same time, there are also some problems, this paper mainly through the research and analysis the condition of wuzhou fiscal revenue in recent years, according to the time series analysis of a simple moving average method research and analysis of financial income and expenditure wuzhou city, the result obtained is wuzhou city, fiscal revenue decline present condition, and fiscal spending is rising year by year, the situation will lead to wuzhou city, the people's living standards decline, influence all aspects of wuzhou city development. Give some Suggestions on the development of the financial benefit wuzhou city. This paper first introduces the main use of the time series analysis of the concept and a simple moving average method method, reoccupy chart illustrates the wuzhou city, in recent years the financial revenue and expenditure situation, then set a model, analysis the time series analysis method to draw 2012 fiscal income condition prediction results, finally, in view of wuzhou city, improve the financial income thoughts, give some advice, for instance: rationality vigorously implement the strategy of industrial county, strengthen the industry leading financial sources, A vigorous development of the third industry, and to strengthen the construction of local revenue;

时间序列:ARIMA模型

实验:建立ARIMA模型(综合性实验) 实验题目:某城市连续14年的月度婴儿出生率数据如下表所示: 26.663 23.598 26.931 24.740 25.806 24.364 24.477 23.901 23.175 23.227 21.672 21.870 21.439 21.089 23.709 21.669 21.752 20.761 23.479 23.824 23.105 23.110 21.759 22.073 21.937 20.035 23.590 21.672 22.222 22.123 23.950 23.504 22.238 23.142 21.059 21.573 21.548 20.000 22.424 20.615 21.761 22.874 24.104 23.748 23.262 22.907 21.519 22.025 22.604 20.894 24.677 23.673 25.320 23.583 24.671 24.454 24.122 24.252 22.084 22.991 23.287 23.049 25.076 24.037 24.430 24.667 26.451 25.618 25.014 25.110 22.964 23.981 23.798 22.270 24.775 22.646 23.988 24.737 26.276 25.816 25.210 25.199 23.162 24.707 24.364 22.644 25.565 24.062 25.431 24.635 27.009 26.606 26.268 26.462 25.246 25.180 24.657 23.304 26.982 26.199 27.210 26.122 26.706 26.878 26.152 26.379 24.712 25.688 24.990 24.239 26.721 23.475 24.767 26.219 28.361 28.599 27.914 27.784 25.693 26.881 26.217 24.218 27.914 26.975 28.527 27.139 28.982 28.169 28.056 29.136 26.291 26.987 26.589 24.848 27.543 26.896 28.878 27.390 28.065 28.141 29.048 28.484 26.634 27.735 27.132 24.924 28.963 26.589 27.931 28.009 29.229 28.759 28.405 27.945 25.912 26.619 26.076 25.286 27.660 25.951 26.398 25.565 28.865 30.000 29.261 29.012 26.992 27.897 (1)选择适当模型拟和该序列的发展 (2)使用拟合模型预测下一年度该城市月度婴儿出生率 实验内容: 给出实际问题的非平稳时间序列,要求学生利用R统计软件,对该序列进行分析,通过平稳性检验、差分运算、白噪声检验、拟合ARMA模型,建立ARIMA模型,在此基础上进行预测。 实验要求: 处理数据,掌握非平稳时间序列的ARIMA建模方法,并根据具体的实验题目要求完成实验报告,并及时上传到给定的FTP和课程网站。 实验步骤: 第一步:编程建立R数据集; 第二步:调用plot.ts程序对数据绘制时序图。 第三步:从时序图中利用平稳时间序列的定义判断是否平稳? 第四步:若不满足平稳性,则可利用差分运算是否能使序列平稳?重复第三步步骤第五步:根据Box.test纯随机检验结果,利用LB统计量和白噪声特性检验最后处理的

时间序列分析法原理及步骤

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

Eviews时间序列分析实例.

Eviews时间序列分析实例 时间序列是市场预测中经常涉及的一类数据形式,本书第七章对它进行了比较详细的介绍。通过第七章的学习,读者了解了什么是时间序列,并接触到有关时间序列分析方法的原理和一些分析实例。本节的主要内容是说明如何使用Eviews软件进行分析。 一、指数平滑法实例 所谓指数平滑实际就是对历史数据的加权平均。它可以用于任何一种没有明显函数规律,但确实存在某种前后关联的时间序列的短期预测。由于其他很多分析方法都不具有这种特点,指数平滑法在时间序列预测中仍然占据着相当重要的位置。 (-)一次指数平滑 一次指数平滑又称单指数平滑。它最突出的优点是方法非常简单,甚至只要样本末期的平滑值,就可以得到预测结果。 一次指数平滑的特点是:能够跟踪数据变化。这一特点所有指数都具有。预测过程中添加最新的样本数据后,新数据应取代老数据的地位,老数据会逐渐居于次要的地位,直至被淘汰。这样,预测值总是反映最新的数据结构。 一次指数平滑有局限性。第一,预测值不能反映趋势变动、季节波动等有规律的变动;第二,这种方法多适用于短期预测,而不适合作中长期的预测;第三,由于预测值是历史数据的均值,因此与实际序列的变化相比有滞后现象。 指数平滑预测是否理想,很大程度上取决于平滑系数。Eviews提供两种确定指数平滑系数的方法:自动给定和人工确定。选择自动给定,系统将按照预测误差平方和最小原则自动确定系数。如果系数接近1,说明该序列近似纯随机序列,这时最新的观测值就是最理想的预测值。 出于预测的考虑,有时系统给定的系数不是很理想,用户需要自己指定平滑系数值。平滑系数取什么值比较合适呢?一般来说,如果序列变化比较平缓,平滑系数值应该比较小,比如小于0.l;如果序列变化比较剧烈,平滑系数值可以取得大一些,如0.3~0.5。若平滑系数值大于0.5才能跟上序列的变化,表明序列有很强的趋势,不能采用一次指数平滑进行预测。 [例1]某企业食盐销售量预测。现在拥有最近连续30个月份的历史资料(见表l),试预测下一月份销售量。 表1 某企业食盐销售量单位:吨 解:使用Eviews对数据进行分析,第一步是建立工作文件和录入数据。有关操作在本

基于时间序列模型与线性回归模型的历史数据预测

基于时间序列模型与线性回归模型的历史数据预测 摘要:本文通过具体案例,简要说明根据时间序列数据建立和相应经济理论建立线性回归模型的简要步骤及基本原则,并着重介绍了在模型建立和模型有效性检验过程中需要注意的三个主要问题,最后简单介绍了进行模型修正的相应方法。 一、引言 多元线性回归模型的一般形式为: Y=β0+β1X1+β2X2+…+βkXk+μi(k,i=1,2,…,n) 其中k为解释变量的数目,βk(k=1,2,…,n)称为回归系数,上式也被称为总体回归函数的随机表达式。 从统计意义上说,所谓时间序列模型就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着统计上的依赖关系。从数学意义上说,如果我们对某一过程中的某一个变量或一组变量X(t)进行观察测量,在一系列时刻t1,t2,…,tn(t为自变量,且t1

相关文档
最新文档