面板数据的单位根检验

面板数据的单位根检验
面板数据的单位根检验

1

面板数据的单位根检验

1 LLC (Levin-Lin-Chu ,2002)检验(适用于相同根(common root )情形)

LLC 检验原理是仍采用ADF 检验式形式。但使用的却是it y ?和it y 的剔出自相关和确定项影响的、标准的代理变量。具体做法是(1)先从? y it 和y it 中剔出自相关和确定项的影响,并使

其标准化,成为代理变量。(2)用代理变量做ADF 回归,*?ij ε=ρ*ij ε + v it 。LLC 修正的?()t ρ渐近

服从N(0,1)分布。

详细步骤如下:

H 0: ρ = 0(有单位根); H 1: ρ < 0。LLC 检验为左单端检验。 LLC 检验以如下ADF 检验式为基础:

? y it = ρ y i t -1 +∑=i

k j j i 1γ? y i t -j + Z it 'φ + εit , i = 1, 2, …, N ; t = 1, 2, …, T (38)

其中Z it 表示外生变量(确定性变量)列向量,φ 表示回归系数列向量。

(1)估计代理变量。首先确定附加项个数k i ,然后作如下两个回归式,

? y it =

∑=i

k j j

i ?

1

γ? y i t -j + Z it '?φ

+t i ε?

1

y i t -1 = ∑=i

k j j

i ~1

γ

? y i t -j + Z it 'φ+1

~-it ε 移项得

t i ε

?= ? y it -∑=i

k j j i ?1

γ? y i t -j - Z it '?φ 1

~-it ε= y it -∑=i

k j j i ~1

γ? y i t -j - Z it 'φ 把t i ε?和1

~-it ε标准化, *

?ij ε= t i ε?/s i *ij ε= 1~-it ε/s i

其中s i , i = 1, 2, …, N 是用(38)式对每个个体回归时得到的残差的标准差,从而得到? y it 和y it -1

的代理变量*?ij ε和*

ij ε。

1

(2)用代理变量*?ij ε和*ij ε作如下回归,

*?ij ε

=ρ*

ij ε+ v it LLC 证明,上式中估计量ρ?的如下修正的ρ?t ~统计量渐近地服从标准正态分布。

ρ?t ~=

**)?(?)~

(~~2?T

m T m N s S T N t σμρσ

ρ-→ N (0, 1)

其中ρ?t 表示标准的t 统计量;N 是截面容量;T ~

=T -??

? ??∑i i N k /-1,(T 为个体容量);S N 是每个

个体长期标准差与新息标准差之比的平均数;2?σ

是误差项v it 的方差;)?(ρs 是ρ?标准误差;T m ~μ和T

m ~σ分别是均值和标准差的调整项。

见图21输出结果,LLC = 9.7 > -1.65,所以存在单位根。

图21 LLC检验的EViews 5.0输出结果(部分)

EViews 5.0操作步骤:在面板数据窗口点击View选Unit Root Test功能。在Test Type中选Common root –Levin, Lin, Chu。

1

1

2 Breitung 检验(2002)(适用于相同根(common root )情形)

Breitung 检验法与LLC 检验法类似。先从it y ?和it y 中剔出动态项it j y -?,然后标准化,再

退势,最后用ADF 回归t i ε?*=ρ1

~-it ε* + v it 。检验单位根。 用每个个体建立的单位根检验式的误差项之间若存在同期相关,上述面板数据的单位根检验方法都不再适用。主要是统计量的分布发生变化,检验功效降低。为此提出一些个体同期相关面板数据的单位根检验方法。

3 Hadri 检验(适用于相同根(common root )情形)

Hadri 检验与KPSS 检验相类似。原假设是面板中的所有序列都不含有单位根。计算步骤是用原面板数据的退势序列(残差)建立LM 统计量。

退势回归是

y it = α1 +α2 t + u it

1

利用上式中的残差it u

?计算如下LM 统计量, 22011()N i i t LM S t T f N =????=

????????

∑∑ (39) 其中1

?()t

i it s S t u

==∑是残差累积函数,0f 是频率为零时的残差谱密度。 Hadri 给出,在一般假定条件下

Z =

b

a LM N )(-→N (0, 1) (40) 其中a=1/6,b=1/45,LM 由(39)式计算。

Hadri 检验的原假设是没有单位根。以案例1为例,图22给出检验结果。EViews 给出假定同方差和克服异方差两种情形下的Z 统计量。因为Z 渐近服从正态分布,Z = 7.5和7.6落在拒绝域,结论是存在共同单位根。

图22 Hadri检验的EViews 5.0输出结果(部分)

EViews 5.0操作步骤:在面板数据窗口点击View选Unit Root Test功能。在Test Type中选Common root – Hadri。

1

1

不同根(individual unit root )情形的面板数据单位根检验方法 4 IPS (Im-Pesaran-Shin )检验(1997,2002)

IPS 检验克服了LL 检验的缺陷,允许面板中不同个体(序列)的ρi 不同。IPS 检验式是

? y it = ρi y i t -1 +∑=i

k j j i 1

γ? y i t -j + X it 'α + εit , i = 1, 2, …, N ; t = 1, 2, …, T , εit ~IID(0,σ2) (43)

H 0: ρi = 0, i = 1, 2, …, N ; (存在单位根)

H 1: 1110,1,..., 0,1,2,...,i i

i n i n n N ρρ==??<=++?。

利用(41)式对N 个个体估计N 个ρi 及相应的ρ?t 。计算平均值∑==N

i t N

t 1

)

?()

?(1

ρ

ρ。再用)?(ρt 构造面

板IPS 检验用统计量N

t Var t E t Z t /)()]([)?()?()?(ρρρ-=

t Z 渐近服从N(0,1)分布。临界值与N 、T 以及检验式中是否含有确定项有关系。IPS 检验

面板数据的F检验-固定效应检验

面板数据模型(PANEL DATA)F检验,固定效应检验 1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y i t, i= 1, 2, …, N; t= 1, 2, …, T N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i= 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。

面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)

面板数据分析简要步骤与注意事项(面板单位根检验—面板协整—回归分析) 面板数据分析方法: 面板单位根检验—若为同阶—面板协整—回归分析 —若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小,固定效应模型为误差项和解释变量是相关,而随机效应模型表现为误差项和解释变量不相关。先用hausman检验是fixed 还是random,面板数据R-squared值对于一般标准而言,超过0.3为非常优秀的模型。不是时间序列那种接近0.8为优秀。另外,建议回归前先做stationary。很想知道随机效应应该看哪个R方?很多资料说固定看within,随机看overall,我得出的overall非常小0.03,然后within是53%。fe和re输出差不多,不过hausman检验不能拒绝,所以只能是re。该如何选择呢? 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al.(2002)的改进,提出了检验面板单位根的LLC法。Levin et al.(2002)指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250之间,截面数介于10~250之间)的面板单位根检验。Im et al.(1997)还提出了检验面板单位根的IPS法,但Breitung(2000)发现IPS法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher和PP-Fisher5种方法进行面板单位根检验。 其中LLC-T、BR-T、IPS-W、ADF-FCS、PP-FCS、H-Z分别指Levin,Lin&Chu t*

单位根过程和单位根检验

第二章 单位根过程和单位根检验 第一节 单位根过程 从本章开始我们进入时间序列的非平稳分析和建模研究。前面的章节的内容主要考虑的是平稳时间序列的建模和预测问题,但对于非平稳的时间序列,只有先进行差分处理,将其转换为平稳的时间序列模型。这样会损失部分信息。本章从理论上介绍非平稳时间序列的性质,讨论非平稳时间序列数据建模的伪回归问题。 非平稳序列的分析建立在维纳过程(布朗运动)和泛函中心极限定理之上。 一. 若干定义 定义1: (1)白噪声过程(white noise ,如图1)。属于平稳过程。 εε2 t t,t y =~iid(0,σ) 图3是日元兑美元差分序列(收益序列),近似于白噪声序列。 (2)随机游走过程(random walk ,如图2)。属于非平稳过程。 εε+2 t t-1t,t y =y ~iid(0,σ) 随机游走的差分过程是平稳过程(白噪声过程)。?yt =t ε。 -3 -2 -1 012 3 100120140160180200220240260280300 white noise -10 -50 510 20 40 60 80 140160y=y(-1)+u 图 1 白噪声序列(σ2=1) 图2 随机游走序列(σ2=1) 随机游走过程是非平稳的,这是因为: +t 012t y =y +u +u +u +t 012t 0E(y )=E(y +u +u +u )=y →∞22t 012t 12t D(y )=D(y +u +u ++u )=E(u +u ++u )=t σ 定义2:单位根过程

随机过程t,{y t =1,2,} 是一单位根过程,若t t-1t y =y +u t =1,2 t u 为一平稳过程,且t t t-s s E(u )=0,cov(u ,u )=μs =0,1,2 定义3:维纳过程 维纳过程(Wiener Process)也称为布朗运动过程(Brownian Motion Process)。 设W(t)是定义在闭区间[0,1]上一连续变化的随机过程,若该过程满足: (a) W(0)=0; (b) 对闭区间[0,1]上任意一组分割 12k 0≤t

MATLAB空间面板数据模型操作介绍

MATLAB空间面板数据模型操作简介 MATLAB安装:在民主湖资源站上下载MA TLAB 2009a,或者2010a,按照其中的安装说明安装MATLAB。(MATLAB较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局: 首先我们说一下MA TLAB处理空间面板数据时,数据文件是怎么布局的,熟悉eviews的同学可能知道,eviews中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中“1-94”“1-95”“1-96”“1-97”中,1是省份的代号,94,95,96,97表示年份,eviews是将每个省份的数据放在一起,再将所有省份堆放在一起。 与eviews不同,MATLAB处理空间面板数据时,面板数据的布局是(在excel中说明):先排放一个横截面上的数据(即某年所有省份的数据),再将不同年份的横截面按时间顺序堆放在一起。如图:

这里需要说明的是,MA TLAB中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。 二、数据的输入: MATLAB与excel链接:在excel中点击“工具→加载宏→浏览”,找到MA TLAB的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为:C:\Programfiles\MATLAB\R2009a\toolbox\exlink,点击excllink.xla即可完成excel与MATLAB的链接。这样的话excel中的数据就可以直接导入MATLAB中形成MATLAB的数据文件。操作完成后excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB”即表示我们希望excel 与MATLAB实现链

面板数据的F检验固定效应检验

面板数据的F检验固定 效应检验 标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y , i= 1, 2, …, N; t= 1, 2, …, T i t N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y , ( i i . = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i = 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。

面板数据的F检验固定效应检验

面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y i t, i= 1, 2, …, N; t= 1, 2, …, T N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。

对于面板数据y i t, i= 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失 若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。 例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7 年的,每一年都有15个数据,共105组观测值。 人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消 费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。 表1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消 费数据(不变价格) 地区人均消费1996 1997 1998 1999 2000 2001 2002 CP-AH(安徽) CP-BJ(北京) CP-FJ(福建) CP-HB(河北)

面板数据分析简要步骤与注意事项 面板单位根—面板协整—回归分析

面板数据分析简要步骤与注意事项 (面板单位根—面板协整—回归分析)步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量、Hadri Z统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程,Hadri Z 统计量的检验原假设为不存在普通的单位根过程。 有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC(Levin-Lin-Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含截距项,T&I代表两项都含,N(none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应检验模式。 但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均

单位根检验内容及标准规定样式分析

第八章 单位根检验 由于非平稳过程可能存在严重的伪回归问题,所以在对序列进行估计之前,需要检验序列的平稳性。本章介绍了严格的平稳性的统计检验方法--单位根检验。在简要介绍四种主要的非平稳随机过程以产输出单位根检验原理之后,文章主要介绍ADF 检验及PP 检验法,以及介结构突变和单位根检验。 8.1 四种典型非平稳过程简介 前面我们知道,若一个时间序列含有某种变动趋势,即该序列的均值或自协方差函数随时间而改变,则称该序列为非平稳序列。下面介绍四种典型的非平稳过程。 8.1.1随机游走过程 t t t y y ξ+=-1,t=1,2,... (8.11) 若}{t ξ为独立随机分布,即()0=t E ξ,()∞<=2σξt D 。则称}{t y 为随机游走过程(Random Walk Process )。随机游动过程是单位根过程的特例。在现实经济社会中,如股票价格的走势便是随机游走序列。下图是t t t y y ξ+=-1, ()1,0∈t ξ生成的序列。

图8.11 随机游走过程t t t y y ξ+=-1,()1,0∈t ξ生成的序列图 8.1.2随机趋势过程 t t t y y ξα++=-1,),0(2 σξIID t ∈, (8.12) 其中α称为漂移项,由于序列一阶差分后便趋于平稳,又称随机趋势过程为差分平稳过程。 图8.12 t t t y y ξ++=-11.0,()1,0∈t ξ生成的序列 8.1.3趋势平稳过程 t t t y ξβα++= ,其中t t t νρξξ+=-1,1<ρ,),0(2σν∈t (8.13) 由于t t t y ξαβ+=-,即当减去退势后为平稳过程,故趋势平稳过程又称为退势平稳过程。 由t t t y ξβα++=,t t t νρξξ+=-1知: 11)1(--+-+=t t t y ξβα (8.14) 将(4)两边同时乘以ρ,与(3)两边同时相减,整理可得: t t t y t y νρβα+++=-1'' , ),0(2σν∈t (8.15) 其中,ρβρααα+-=',ρβρβ-=' 这样便得出趋势平稳过程的另一种形式。

Evew面板数据操作

Eviews6.0面板数据操作 一、数据输入 1、创建工作文档。如下图操作,在” workfile create”文本框的“workfile structure type”选择“balanced panel”,”panel specification”的”start date”和”end date”输入数据的起止期间,”wf”输入工作文档的名称,点击”OK”即跳出新建的工作文档a 界面。 2、创建新对象。操作如下图。在”new object”文本框的”type of object”选择”pool”,”name for object ”输入新对象的名称。创建成功后的界面如下面第3张图所示。 - 3、输入数据。双击”workfile”界面的,跳出”pool”界面,输入个体。一般输入方式为如下:若上海输入_sh,北京输入_bj,…。个体输入完成后,点击该界面的键,在跳出的”series list”输入变量名称,注意变量后要加问号。格式如下:y? x?。点击”OK”后,跳出数据输入界面,如下面第4张图所示。在这个界面上点击键,即可以输入或者从EXCEL处复制数据。 在输入数据后,记得保存数据。保存操作如下:

在跳出的“workfile save”文本框选择“ok”即可,则自动保存到我的文档。 然后在“workfile”界面如下会显示保存路径:d:\my documents\a.wf1。 若要保存到自己选择的路径下面,则在保存时选择“save as”, 在跳出的文本框里选择自己要保存的路径以及命名文件名称。 4、单位根检验。一般回归前要检验面板数据是否存在单位根,以检验数据的平稳性,避免伪回归,或虚假回归,确保估计的有效性。单位根检验时要分变量检验。(补充:网上对面板数据的单位根检验和协整检验存在不同意见,一般认为时间区间较小的面板数据无需进行这两个检验。) (1)生成数据组。如下图操作。点击”make group”后在跳出的”series list”里输入要单位根检验的变量,完成后就会跳出如下图3所示的组数据。 (2)生成时序图。如下图操作。在”gragh options”界面的”specifi”下选择生成的时序图的形状,一般都默认设置,生成的时序图如下图3所示。观察时序图的趋势,以确定单位根检验的检验模式。 (3)单位根检验。单位根检验时,在”group unit root test”里的”test for root in”按检验结果一步步检验,如果原值”level”的检验结果符合要求,即不存在单位根,则单位根检验就不需要检验下去了,如果不符合要求,则需继续检验一阶差分”1st difference”、二阶差分”2nd difference”。”include in test equation”是检验模式的选择,根据上面时序图的形状来选择。从上面的时序图可以看出,原值的检验模式应该选择含有截距项和趋势的检验模式,即”include in test equation”选择”individual intercept and trend”。检验结果如下图3所示。从检验结果可以看出,检验结果除了levin 检验方法外其他方法的结果都不符合要求(Prob.xx小于置信度(如0.05),则认为拒绝单位根的原假设,通过检验)。所以继续检验一阶差分和二阶差分,直到检验结果达到要求。如果变量原值序列通过单位根检验,则称变量为0阶单整;如果变量一阶差分后的序列通过单位根检验,则称变量为一阶单整,以此推之。

面板数据的单位根检验

;. 面板数据的单位根检验 1 LLC (Levin-Lin-Chu ,2002)检验(适用于相同根(common root )情形) LLC 检验原理是仍采用ADF 检验式形式。但使用的却是it y ?和it y 的剔出自相关和确定项影响的、标准的代理变量。具体做法是(1)先从? y it 和y it 中剔出自相关和确定项的影响,并使 其标准化,成为代理变量。(2)用代理变量做ADF 回归,*?ij ε=ρ*ij ε% + v it 。LLC 修正的?()t ρ 渐近服从N(0,1)分布。 详细步骤如下: H 0: ρ = 0(有单位根); H 1: ρ < 0。LLC 检验为左单端检验。 LLC 检验以如下ADF 检验式为基础: ? y it = ρ y i t -1 +∑=i k j j i 1γ? y i t -j + Z it 'φ + εit , i = 1, 2, …, N ; t = 1, 2, …, T (38) 其中Z it 表示外生变量(确定性变量)列向量,φ 表示回归系数列向量。 (1)估计代理变量。首先确定附加项个数k i ,然后作如下两个回归式, ? y it = ∑=i k j j i ? 1 γ? y i t -j + Z it '?φ +t i ε?

;. y i t -1 = ∑=i k j j i ~1 γ ? y i t -j + Z it 'φ%+1 ~-it ε 移项得 t i ε ?= ? y it -∑=i k j j i ?1 γ? y i t -j - Z it '?φ 1 ~-it ε= y it -∑=i k j j i ~1 γ? y i t -j - Z it 'φ% 把t i ε?和1 ~-it ε标准化, * ?ij ε= t i ε?/s i *ij ε%= 1~-it ε/s i 其中s i , i = 1, 2, …, N 是用(38)式对每个个体回归时得到的残差的标准差,从而得到? y it 和y it -1 的代理变量*?ij ε和* ij ε%。

面板数据分析简要步骤与注意事项面板单位根面板协整回归分析

面板数据分析简要步骤与注意事项 面板单位根—面板协整—回归分析) 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实 际意义的。这种情况称为称为虚假回归或伪回归( spurious regression )。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述:在非平稳的面板数据渐进过程中 ,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布 , 这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002) 的改进, 提出了检验面板单位根的LLC法。Levin et al. (2002)指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25?250之间,截面数介于10?250之间)的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的 IPS 法, 但 Breitung(2000) 发现 IPS 法对限定性趋势的设定极为敏感 , 并提出了面板单位根检验的 Breitung 法。Maddala and Wu(1999)又提出了 ADF-Fisher 和 PP-Fisher 面板单位根检验方法。 由上述综述可知,可以使用 LLC、IPS、Breintung 、ADF-Fisher 和 PP-Fisher5 种方法进行面板单位根检验。其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS、H-Z 分 别指 Levin, Lin & Chu t* 统计量、 Breitung t 统计量、 lm Pesaran & Shin W 统 量、计 ADF- Fisher Chi-square 统计量、PP-Fisher Chi-square 统计量、Hadri Z 统计 量,并且 Levin, Lin & Chu t* 统计量、 Breitung t 统计量的原假设为存在普通的单位根过程, lm Pesaran & Shin W 统计量、 ADF- Fisher Chi-square 统计量、 PP-Fisher Chi-square 统计量的原假设为存在有效的单位根过程, Hadri Z 统计量的检验原假设为不存在普通的单位根过程。 有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验 LLC(Levin-Lin-Chu )检验和不同根单位根检验 Fisher-ADF 检验(注:对普通序列(非面板序列)的单位根检验方法则常用 ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我 们说此序列是平稳的,反之则不平稳。 如果我们以 T(trend )代表序列含趋势项,以 I (intercept )代表序列含截距项, T&I 代表两项都含,N (none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应检验模式。 但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一检验。具体操作可以参照李子奈的说法:ADF检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的模型。并且认

MATLAB空间面板数据模型操作介绍

MATLAB 空间面板数据模型操作简介 MATLAB 安装: 在民主湖资源站上下载 MA TLAB 2009a ,或者 2010a ,按照其中的安装说明 安装 MATLAB 。( MATLAB 较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局 首先我们说一下 MA TLAB 处理空间面板数据时,数据文件是怎么布局的,熟悉 eviews 的同学 可能知道, eviews 中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间 序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中 “1-94”“1-95” “1-96” “ 1-97”中, 1是省份的代号, 94,95,96,97 表示年份, eviews 是将每个省 份的数据放在一起,再将所有省份堆放在一起。 与 eviews 不同, MATLAB 处理空间面板数据时,面板数据的布局是(在 excel 中说明): 先排 放一个横截面上的数据(即某年所有省份的数据) ,再将不同年份的横截面按时间顺序堆放在一起。 如图:

这里需要说明的是, MA TLAB 中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。二、数据的输入: MATLAB 与 excel链接:在 excel中点击“工具→加载宏→浏览” ,找到 MA TLAB 的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为: C:\Programfiles\MATLAB\R2009a\toolbox\exlink ,点击 excllink.xla 即可完成 excel 与 MATLAB 的链接。这样的话 excel 中的数据就可以直接导入 MATLAB 中形成 MATLAB 的数据文件。操作完成后 excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB ”即表示我们希望 excel 与

面板数据的分析步骤

面板数据的分析步骤 面板数据的分析方法或许我们已经了解许多了,但是到底有没有一个基本的步骤呢?那些步骤是必须的?这些都是我们在研究的过程中需要考虑的,而且又是很实在的问题。面板单位根检验如何进行?协整检验呢?什么情况下要进行模型的修正?面板模型回归形式的选择?如何更有效的进行回归?诸如此类的问题我们应该如何去分析并一一解决?以下是我近期对面板数据研究后做出的一个简要总结,和大家分享一下,也希望大家都进来讨论讨论。 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。 其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square 统计量、Hadri Z统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程,Hadri Z统计量的检验原假设为不存在普通的单位根过程。 有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC (Levin-Lin-Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我们

空间面板数据分析——R的splm包资料

空间面板数据分析——R的splm包 (任建辉,暨南大学) The splm package provides methods for fitting spatial panel data by maximum likelihood and GM. 安装R软件及其编辑器Rstudio 网址:https://www.360docs.net/doc/fd6535087.html, https://www.360docs.net/doc/fd6535087.html,/ 下载好Rstudio以后,操作都可以Rstudio中完成了,包括命令的编写、命令运行、图形展示,最方便的要数查看数据了。 R界面 Rstudio界面,形如matlab

下面进入正题,了解splm包中的数据、命令及结果展示。所有命令都写在编辑窗口(studio 左上区域),可以单独的运行每行命令,也可选取一段一起执行,点run按钮。 1、首先,安装splm包并导入,命令如下: intall.packages(“splm”),选择最近的下载点 library(splm) > library(splm) 载入需要的程辑包:MASS 载入需要的程辑包:nlme 载入需要的程辑包:spdep 载入需要的程辑包:sp 载入需要的程辑包:Matrix 载入需要的程辑包:plm 载入需要的程辑包:bdsmatrix 载入程辑包:‘bdsmatrix’ 下列对象被屏蔽了from ‘package:base’: backsolve 载入需要的程辑包:Formula 载入需要的程辑包:sandwich 载入需要的程辑包:zoo 载入程辑包:‘zoo’ 下列对象被屏蔽了from ‘package:base’: as.Date, as.Date.numeric 载入需要的程辑包:spam 载入需要的程辑包:grid Spam version 0.40-0 (2013-09-11) is loaded. Type 'help( Spam)' or 'demo( spam)' for a short introduction and overview of this package. Help for individual functions is also obtained by adding the suffix '.spam' to the function name, e.g. 'help( chol.spam)'. 载入程辑包:‘spam’ 下列对象被屏蔽了from ‘package:bdsmatrix’:

面板数据模型设定检验方法

1:(ST ATA 的双固定效应)xi :xtreg y x1 x2 i.year ,fe 2:变系数模型 (1)生成虚拟变量 tab id,gen(id) gen open1=id1*open gen open2=id2*open (2)变系数命令 xtreg y open1 open2。。。,fe 面板数据模型设定检验方法 4.1 F 检验 先介绍原理。F 统计量定义为 ()()/~, (30)/() R U U RSS RSS J F F J N k RSS N k -= -- 其中RSS r 表示施加约束条件后估计模型的残差平方和,RSS u 表示未施加约束条件的估计模型的残差平方和,J 表示约束条件个数,N 表示样本容量,k 表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下,F 统计量渐近服从自由度为( J , N – k )的F 分布。 以检验个体固定效应回归模型为例,介绍F 检验的应用。建立假设

H 0:αi =α。模型中不同个体的截距相同(真实模 型为混合回归模型)。 H 1:模型中不同个体的截距项αi 不同(真实模型为个体固定效应回归模型)。 F 统计量定义为: F = ) /()] ()/[()(k N NT SSE k N NT k NT SSE SSE u u r --------1= ) /()/()(k N NT SSE N SSE SSE u u r ----1 (31) 其中SSE r 表示约束模型,即混合估计模型的残差平方和,SSE u 表示非约束模型,即个体固定效应回归模型的残差平方和。非约束模型比约束模型多了N -1个被估参数。 以案例1为例,已知SSE r = 4824588,SSE u = 2270386, F = ) /()/()(11----N NT SSE N SSE SSE u u r =) /() /()(115105227038611522703864824588 ---- = 22510 182443= 8.1 (32) F 0.05(6, 87) = 1.8 因为F = 8.1 > F 0.05(14, 89) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。 4.2 Hausman 检验 对同一参数的两个估计量差异的显著性检验称作

单位根与协整检验

一、单位根检验的回顾 1、在实际应用中,何种情况下需要对单位根进行检验? 答:理论上,你在实际应用过程中,如果你遇到的样本是时间序列形式的,都要进行单位根检验。原因是,如果你的时间序列数据是单位根的话,类似于你的数据的变化是很不规则的,好像一个“醉汉”。从计量角度看,它影响了我们假设检验当中的“仪器”的准确性。 2、单位根检验的数学形式,或说你应当用数学方式会表述单位根检验的原假设。 3、学会在eviews上对一个时间序列变量进行单位根检验。 (1)如果一个变量具有单位根的特征,那么表示这个变量经过一次差分,就会变成平稳的。 (2)在eviews中,单位根检验的对象是series object。也就是,你要先打开一个series object,然后,在打开的窗口中点击view来观察这个序列是否具有单位根的特征。(3)要特别注意的是,eviews上如果你不

能拒绝你所检验的变量对象是一个单位根,那么此时并不一定表明你所检验的变量一定是I(1),也可能是I(2)或I(3)等更高阶的单整。要注意的是,只要你检验的变量是非平稳的,都会接受原假设。 (4)在eveiws单位根检验要遵循如下的步骤:第一,先对变量(比如Y)进行水平数据的单位根检验(level);第二,如果水平数据拒绝原假设(即不存在单位根),那么检验停止,说明水平数据是一个平稳的时间序列变量;第三,如果水平数据的检验接受原假设,仅能说明你检验的变量是非平稳的,此时需要继续对这个变量的一阶差分进行单位根检验(1S difference)。如果此时拒绝原假设,那么,检验停止,表明这个变量要经过两次差分才会平稳,否则,继续对二阶差分进行单位根检验(1S difference)。总之,检验的目的是判断,到底你所检验的变量经过几次差分后才会平稳?所以,检验一定要到差分平稳后为止。 (5)对你而言,由于有不同的单位根检验方法,所以一个不错的选择是,你同时用不

相关文档
最新文档