时间序列 预测的基本流程

本文总结了利用时间序列模型进行预测的基本流程及各个步骤的具体操作:
①根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。
②对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行 差分 处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。
③根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。
④进行参数估计,检验是否具有统计意义。
⑤进行假设检验,诊断残差序列是否为白噪声。
⑥利用已通过检验的模型进行预测分析。
总之:拿到一个观察值序列之后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。根据检验的结果可以将序列分为不同的类型,对不同类型的序列我们会采用不同的分析方法。

二、下面介绍时间序列的平稳性检验:
2.1特征统计量
描述时间序列统计特征的方法一般是研究该序列的低阶矩,特别是均值、方差、自协方差和自相关系数等。通过分析这些统计量的统计特性,推断出随机序列的性质。
2.2平稳时间序列的定义及关系
定义:
严平稳定义:严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。
宽平稳定义:宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
然而,在实践中要获得随机序列的联合分布是一件非常困难的事,而且即使知道随机序列的联合分布,计算和应用也非常不便。所以严平稳时间序列通常只具有理论意义,在实践中用得更多的是条件比较宽松的宽平稳时间序列。
二者关系:
严平稳条件比宽平稳条件苛刻。严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对于高于二阶的矩没有任何要求。通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不

能反推严平稳成立。但这不是绝对的,两种情况都有特例,不存在低阶矩的严平稳序列不满足宽平稳条件,严格地讲,只有存在二阶矩的严平稳序列才能保证它一定也是宽平稳序列。当序列服从多元正态分布时,宽平稳可以推出严平稳。
在实际应用中,研究最多的是宽平稳随机序列,以后见到平稳随机序列,如果不加特殊注明,指的都是宽平稳随机序列。如果序列不满足平稳条件,就称为非平稳序列。对于非平稳序列,由于它不具有二阶矩平稳的性质,所以对它的统计分析要周折一些,通常要进行进一步的检验、变换或处理之后,才能确定适当的拟合模型。
2.3平稳时间序列的统计性质
规范性
对称性
非负定性
非唯一性
……
2.4平稳时间序列的意义
由于时间序列数据结构的特殊性(可列多个随机变量,而每个变量只有一个样本观察值)所以,平稳性就显得尤为重要。平稳性极大地减少了随机变量的个数,并增加了待估变量的样本容量;极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度。
2.5平稳性的检验
对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。
①时序图检验
根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征。
②自相关图检验
平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零。一个零均值平稳序列的自相关函数要么是截尾的,要么是拖尾的。因此,如果一个时间序列零均值化以后的自相关函数出现了缓慢衰减或周期性的衰减的情况,则说明序列可能存在某种趋势或周期性。
图检验方法是一种操作简单、运用广泛的平稳性判别方法,它的缺点是判别结论带有很强的主观色彩。所以最好能用统计检验方法加以辅助判断。
三、异常点检验与缺省值的补足
四、纯随机性检验
如果序列平稳,情况就简单多了,有一套非常成熟的平稳序列建模方法。但是,并不是所有的平稳序列都值得建模。只有那些序列值之间具有密切的相关关系,历史数据对未来的发展有一定影响的序列,才值得我们花时间去挖掘历史数据中的有效信息,用来预测序列未来的发展。如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列我们称之为纯随机序列

。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。为了确定平稳序列还值不值得继续分析下去,我们需要对平稳序列进行纯随机性检验。
4.1纯随机序列的定义
纯随机序列也称为白噪声序列,容易证明白噪声序列一定是平稳序列,而且是最简单的平稳序列。
4.2纯随机性的性质
①纯随机性
②各项之间没有任何相关关系,序列在进行完全无序的随机波动。一旦某个随机事件呈现出纯随机运动的特征,就认为该随机事件没有包含任何值得提取的有用信息,我们就应该终止分析了。
如果序列值之间呈现出某种显著的相关关系:就说明该序列不是纯随机序列,该序列间隔期的序列值之间存在着一定程度的相互影响关系,这种相互影响关系,统计上称为相关信息。我们分析的目的就是要想方设法把这种相关信息从观察值序列中提取出来。一旦观察值序列中蕴含的相关信息被我们充分提取出来了,那么剩下的残差序列就应该呈现出纯随机的性质。所以纯随机性还是我们判断相关信息是否提取充分的一个判别标准。
③方差齐性。所谓方差齐性,就是指序列中每个变量的方差都相等。所以我们在进行模型拟合时,检验内容之一就是要检验拟合模型的残差是否满足方差齐性假定。如果不满足,那就说明残差序列还不是白噪声序列,即拟合模型没有充分提取随机序列中的相关信息,这时拟合模型的精度是值得怀疑的。在这种场合下,我们通常需要使用适当的条件异方差模型来拟合该序列的发展。
4.3纯随机性检验
纯随机性检验也称为白噪声检验,是专门用来检验序列是否为纯随机序列的一种方法。我们知道如果一个序列是纯随机序列,那它的序列值之间应该没有任何相关关系。这是一种理论上才会出现的理想状态。实际上,由于观测值序列的有限性,导致纯随机序列的样本自相关系数不会绝对为零。
如果样本自相关图显示这个纯随机序列没有一个样本自相关系数严格等于零。但这些自相关系数确实都非常小,都在零值附近以一个很小的幅度做着随机波动。这就提醒我们应该考虑样本自相关系数的分布性质,从统计意义上来判断序列的性质。
如果一个平稳序列短期延迟的序列值之间都不存在显著的相关关系,通常长期延迟之间就更不会存在显著的相关关系。另一方面,假如一个平稳序列显示出显著的短期相关性,那么该序列就一定不是白噪声序列,我们就可以对序列值之间存在的相关性进行分析。假如此时考虑的延迟期数太长,反而可能淹没了该序列的短期相关性。因为平稳序列只要延迟期足够长,自相关系数都会

收敛于零。




相关文档
最新文档