门限自回归模型及其在水文随机模拟中的应用.王文圣

门限自回归模型及其在水文随机模拟中的应用.王文圣
门限自回归模型及其在水文随机模拟中的应用.王文圣

门限自回归模型及其在水文随机模拟中的应用*

王文圣, 袁 鹏, 丁 晶, 邓育仁

(四川大学水电学院,四川成都 610065)

摘 要:为了客观描述日流量变化的非线性特性,将一种非线性时序模型——门限自回归模型引入日流量随机模拟。根据我国金沙江流域屏山站观测资料建立了日流量随机模拟的门限自回归模型。实用性检验结果表明,该模型用于模拟日流量过程是可行的,成果实用。这种尝试为日流量随机模拟提供了一种考虑日流量非线性变化特性的新模型。

关键词:门限自回归模型;日流量随机模拟;实用性检验

中图分类号:P33;P333.6文献标识码: B文章编号:1001-2184(2001)增-0047-04

1 引 言

日流量随机模拟利用日流量涨落的统计特性,具体说是利用日流量在时序上的统计关系。这种统计关系非常复杂,为简化处理常常以线性来表征前后日流量的关系。在一般情况下,这种简化尚能反映日流量时序变化的主要特性。所以在日流量随机模拟时,当前广泛使用线性时序模型。但是日流量在时序上的前后流量关系是非线性的。例如,对大流域一次洪水的日流量过程涨水段的下部、中部和上部有着明显不同的涨率,前后流量关系显然不是线性的;同样在落水段的下部、中部和上部有着明显不同的退水率,前后流量关系也不是线性的。因此,为更全面地反映日流量时序变化的特性,最好考虑日流量在时序变化上的非线性特性。

近来,非线性时序的分析获得了迅速的发展,并且相继出现了一系列非线性时序模型,比如门限自回归模型,双线性模型,指数自回归模型,状态依赖模型等。对双线性模型曾初步研究了在洪水模拟中应用的可能性[1]。门限自回归模型最近尝试应用于水文预报并获得较好的效果[2]。鉴于门限自回归模型在表征非线性特性上具有其独到之处,笔者将之引入日流量随机模拟并以某站日流量资料为基础,全面探讨了这种模型在日流量模拟中的可行性,模拟效果和优缺点等。

2 门限自回归模型的形式和基本特性

2.1 模型形式

门限自回归模型由汤家豪1978年提出[3],用来解决一类非线性问题。其思路是:对研究对象按照不同区间建立若干个线性时序模型;然后将这些线性时序模型组合起来描述该对象非线性时序变化特性。

对于时间序列{Z t},门限自回归模型的一般形 收稿日期:2000-08-14

* 基金项目:国家自然科学基金(49871018);高速水力学国家重点实验室开放基金资助项目(编号2008)式为:

Z t

U(1)0+∑

p

1

i=1

U(1)i Z t-i+E(1)t Z t-d F r1

U(2)0+∑

p

2

i=1

U(2)i Z t-i+E(2)t r1

……

U(L)0+∑

p

L

i=1

U(L)i Z t-i+E(L)t r L-1F Z t-d

(1)

式中 r1,r2……,r L-1为门限值;d为门限迟时;L为门限区间数;U(j)0,U(j)1,……U(j)p j为第j区间自回归系数;P\-j为第j区间模型阶数(j=1,2,……,L); E(j)t是独立随机变量。从(1)式可看出,门限自回归模型是将{Z t}按{Z t-d}值的大小采用对应区间的线性自回归模型来描述整个系统。

2.2 模型特性

门限自回归模型是具有广泛意义的一种非线性时序模型,实质上是以分区间线性自回归模型来描述研究对象在整个区间的非线性变化特性。下面以简单的一阶非线性自回归模型(NLAR(1))说明。

NLAR(1)模型的形式为:

Z t=f(Z t-1)+a t(2)式中 f(Z t-1)为区间[a,b]上的连续非线性函数。{a t}为白噪声序列。若将{Z t-1}(t=2,3……,N)的取值区间划分成L个小区间,见图1。当某一Z落在j区间(r j-1,r j)时,f(Z)由f

d

(Z)任意逼近,即f(Z)≈f

d

(Z)=f(r j-1)+A j Z(j=1,2……,L),其中f(r j-1)和A j的取值由第j区间(r j-1,r j)决定。因此: Z t=f(r j-1)+A(j)j Z t-1+a(j)t (j=1,2,……,L)(3)取f(r j-1)=U(j)0,A(j)j=U(j)1,则NLAR(1)模型可由下式近似表达:

Z t=U(j)0+U(j)1Z t-1+a(j)t

r j-1

(4)式(4)即所谓的一阶门限自回归模型。类似地,对于

第20卷增刊2001年7月四 川 水 力 发 电

Sichuan Water Pow er

Vol.20,S upplemen t

Jul., 2001

一般高阶非线性自回归模型可用高阶门限自回归模

型逼近。

图1 非线性自回归示意图

3 门限自回归模型建立

门限自回归模型是分区间的自回归模型(AR 模型),因此在建模中,只需沿用一般AR 模型的参数估计方法和模型检验准则。目前多采用最小二乘法和A IC 准则。与AR 建模有所不同的是,建立门限自回归模型的关键不在于参数估计和模型检验,而在于确定门限参数(门限区间数L ,门限值r 1,r 2,……,r L -1和门限迟时d )。严格讲,这是一个对L ,

r 1,r 2,……,r L -1和d 的多维寻优问题[5]

。通常以A IC 准则作为模型定阶(确定各门限区间AR 模型

阶数P 1,P 2,……P L )和确定L ,r 1,r 2,……,r L -1,d 参数的目标函数,即:

A IC =f (P 1,P 2,……,P L ,d ,r 1,r 2,……r L -1)

(5)

A IC 值最小时对应的模型参数、

门限参数为所求。可见,上述寻优工作量相当大,它是多维空间中超曲面的极小点的寻找。为减少工作量,近来出现了一些改进办法,如D .D .C 方法,局部区间搜索法等[5],其目的是缩小寻优区间,但这些方法在实际计算时工作量仍很大且较繁琐,有时甚至无法实现。鉴于此,笔者在建模过程中提出了一些改进。为了减少寻优工作量,门限区间数L 和门限迟时d 的选取要结合研究对象的物理成因和一般变化规律,取值范围可得到有效的缩小。比如结合研究对象L 取2,3,4等,d 取1,2,3等。门限值可按研究对象在变幅范围内取值的经验频率分布来确定。一般要求在各区间内样本的资料数据大致相当,以便可靠地估计模型参数。为此,先均匀划分经验频率,然后据经验频率在频率分布曲线上找出相应的门限值。所以,关键是确定门限值所对应的频率。如L =2时,门限值对应的频率可取0.5;L =3,门限值对应的频率可取0.33和0.67。上述结合实际问题初选门限参数的考虑,使寻优工作量大大降低了。

综上所述,门限自回归模型建模过程如下:首先固定一组d ,L ,r j (j =1,2,……,L -1),由最小二乘法和A I C 准则分别确定各区间AR 模型,从而得到相应的门限自回归模型;然后再分别改变d ,L ,r j (j =1,2,……,L -1),同样,建立分区间AR 模型以得到门限自回归模型。比较各种d ,L ,r j 情况下的A I C 值,其中AI C 值最小对应的模型即为所求。4 模型应用

以我国金沙江流域屏山站日流量资料为例,将门限自回归模型尝试于日流量过程的随机模拟。4.1 基本资料预处理

选用屏山站53年(1940~1992年)日流量序列作为建模的基本资料。为方便,每年2月份取28d ,故每年共365d 。以X i ,j 表示第i 年j 截口日流量,并假定同一截口所有元素来自同一总体,各截口具有相同的分布型式。

由基本资料用概率权重矩法[4]

计算截口统计参数(X -j ,S j ,Cv j ,Cs j ,j =1,2,……365)。结果表明,它们随截口有明显的变化,即该站日流量过程是非平稳的,其分布是非正态的。为便于建模需要对原始日流量作标准化和正态化预处理。前者消除日流量过程均值和标准差的非平稳性,后者将偏态分布转换为正态分布。标准化由(6)式进行:

Y i ,j =X i ,j -X -j

S j

(6)

式中 Y i ,j 为标准化日流量序列;X -j ,S j 分别为第j

截口均值和标准差;X i ,j 同前。将偏态序列转换为正态序列的方法较多,本文用H-W 逆变换法[6]

,式为:

Z i ,j =6Cs j

Cs j

2

Y i ,j +11

3-1+Cs j 6

(7)式中 Cs j 为截口j 的偏态系数;Y i ,j 同前;Z i ,j 为标准化正态序列。

经(6)和(7)式预处理后的{Z i ,j }为平稳正态序列,用它即可进行模型参数估计和建立门限自回归模型。

4.2 模型建立及其模拟

4.2.1 模型建立

对日流量时序过程,前后流量统计关系的差异,一般说来,在过程上、中和下三部分之间表现较为明显。因此,门限区间数不宜定得太多,以3左右为宜,即L =2,3,4三个优选备用值。门限区间数确定后,相应的门限值可由均匀划分的经验频率估计。至于门限迟时由于日流量前后关系密切,取1或2即可。

根据上面选定的各种门限参数,互相组合便可以用前述的A I C准则进行优化最后确定所求的门限自回归模型。由该站预处理日流量序列{Z i,j}通过优化得到d=1,L=3,r1=-0.520,r2=0.533和相应的门限自回归模型:

Z t=-0.08+0.9674Z t-1-0.0501Z t-2+0.013Z t-3

+0.0348Z t-4-0.0537Z t-5+E(1)t

Z t-1F-0.520,R(1)E=0.300

1.3678Z t-1-0.3524Z t-2-0.0714Z t-3

+0.0365Z t-4+E(2)t

-0.520

0.01+1.3371Z t-1-0.4428Z t-2+0.0799Z t-3

-0.0653Z t-4+0.0589Z t-5+E(3)t

Z t-1>0.533,R(3)E=0.208

(8)

式中 E(1)t,E(2)t,E(3)t是均值为0,方差为0.3002, 0.2002,0.2082的独立正态序列。

4.2.2 模型模拟程序

模型建立后,就可以进行全年日流量序列随机模拟。模拟程序如下:1由模型式(8)模拟标准正态日流量Z i,j(i=1,2,……,N;j=1,2,……,365);o由式(9)进行H-W变换,获得均值为0,方差1的P-Ⅲ型分布Y i,j;?由逆标准化(X i,j=X-j+S j Y i,j)求得日流量过程X i,j。实际计算按1~?步一年一年地模拟。根据模拟序列估计有关参数和统计有关特征。H-W变换式为:

Y i,j=

2

Cs j

(1+

Z i,j Cs j

6

-

Cs2j

36

)

3

-

2

Cs j

(9)

4.3 模型检验

对建立的门限自回归模型是否满足建模要求,是否反映日流量过程的各种统计特性和客观变化规律,必须进行检验。

4.3.1 模型残差特性检验

建模时假定残差是独立正态随机变量。根据建立的模型由样本反求残差序列,用自相关函数检验法[7]和偏态系数法检验知,残差序列是独立正态的,满足建模要求。

4.3.2 模型实用性检验

本文采用长序列法[7]对模型进行实用性检验,模拟序列长度为5200年。

(1)截口统计参数检验。截口统计参数有截口均值、Cv、Cs和一、二阶自相关系数R1、R2。检验成果见表1。由表1知,各参数的通过率都很高,说明模型对截口参数保持很好。模拟序列截口参数由矩法估计。通过率定义为小于容许误差的截口数与总截口数的百分比。

表1 截口统计参数通过率表

容许

误差

截口统计参数通过率

均值C v C s R1R2 E<10%10090.174.199.797.8

E<15%100100100100100

(2)时段径流量统计参数检验。时段径流量统计参数属于间接参数,它的检验是模型实用性分析的重要组成部分。检验的时段有1、3、7、15和30d共5种,检验指标有时段径流量均值、C v、C s。检验成果见表2,模拟序列估值由矩法获得。模拟成果介于适线法成果和概率权重矩法(PWM)成果之间,与适线法成果接近,较PWM成果略大。可见模型能保持时段径流量统计参数。

(3)年最大日流量季节性变化检验。年最大日流

表2 时段径流量统计参数实用性检验表

时段径流量W1日(108m3)W3日(108m3)W7日(108m3)W15日(108m3)W30日(108m3)参 数均值C v C s均值C v C s均值C v C s均值C v C s均值C v C s

实测适线法

PW M

15.30.30 1.2044.20.30 1.20970.30 1.201860.29 1.163270.28 1.12

14.60.240.8242.40.240.8092.50.230.871810.220.873190.220.75

模拟序列估值14.80.28 1.1742.70.28 1.1693.60.27 1.171850.26 1.083360.250.97

量季节性变化的定量表征,本文用它在各月中出现的频率表示。对模拟和实测过程分别加以统计,成果见表3。模拟与实测在各月出现的频率基本一致。

(4)日流量过程形状特性检验。模拟的日流量过程形状是否合理有待检验。从以下两方面进行分析。

表3 年最大日流量各月中出现的频率表(%)月5678910

实测0.0 1.920.841.532.1 3.7

模拟0.0 2.725.738.028.9 4.6

峰出现次数检验。分别统计模拟过程与实测过程中峰在汛期及汛期各月平均出现次数,结果见表4。从表4知,模拟与实测十分接近,说明模拟日流量过程形状比较合理。

表4 峰平均出现次数检验表

月678910汛期(6~10月)

实测序列4443219

模拟序列4555425

峰型特征统计检验。峰型特征指洪水过程的峰的数量,主峰位置和两峰间隔历时等。本文以年最大30d洪量为准,选择对应30d洪水过程进行洪水峰型特征统计分析,成果见表5。由表5显示,模拟的洪水过程具有天然洪水过程的峰型特征。

表5 洪水过程峰型特征检验表

项 目峰 型/%

主峰出现位置

/%

两峰间隔历时

/%

单峰双峰三峰多

峰前中后

2~3天4~5天5天以上实测0.022.625.641.129.7

洪水15.162.333.321.249.1模拟0.025.830.643.129.1

洪水

16.158.126.317.453.5 以上对大量模拟日流量过程形状作了定量分析,表明模拟过程形状是合理的,从而说明模型是优

良的。从定性上分析,模拟日流量过程与实测过程在总的径流变化趋势、涨落快慢、过程峰形及其分散程度等方面都比较一致。图2和图3分别示出两条实测与模拟日流量过程。

总之,以上各种检验表明,该模型不仅能保持好直接参数,也能优良地保持间接参数,而且模拟的日流量过程形状合理,符合流域实际水文特性。因而门限自回归模型用于模拟日流量过程是可行的,

成果

图2 实测日流量过

程图

图3 模拟日流量过程图

是令人满意的。

5 结 语

笔者首次尝试将门限自回归模型用于日流量随机模拟。通过分析和实例计算可得到如下初步结论:

(1)门限自回归模型是一种结构简单、概念清楚的非线性时序模型,可用此模型反映日流量在时序上的非线性性;

(2)建立门限自回归模型的关键在于确定门限参数(门限区间个数,门限值和门限迟时)。这些参数可根据研究对象的变化特性和参数的物理意义并结合统计优化合理确定;

(3)应用实例显示,门限自回归模型能很好地表征日流量在时序上的随机变化特性。故它是值得进一步研究和在实际工作中尝试应用的一种新型随机模型。

参考文献:

[1] 袁 鹏,王 勇,等.一种洪水随机模拟的新模型——双线性模

型[J].成都科技大学学报,1996,(6).

[2] 丁 晶,邓育仁.黄河干流中长期径流预报的研究[R ].四川联合大学研究报告,1995,(4).

[3] H .T ong ,K .S .Lim ,Th res hold au toregressive :limit cycles

and cyclical data.J.of Royal Statis tical S ociety,B,42,pp245-292,1980.[4] 水利部和能源部.水利水电工程设计洪水计算规范[S ].北京:

水利电力出版社,1993,18-19.[5] 杨叔子,等.时间序列分析的工程应用(下册)[M ].武汉:华中

理工大学出版社,1992.[6] 丁 晶,等.水库防洪安全设计时设计洪水过程线适用性的探讨[J ].水科学进展,1992,3(1).

[7] 丁 晶,邓育仁.随机水文学[M ].成都:成都科技大学出版社,

1988.

作者简介:

王文圣(1970年-),男,四川宣汉人,四川大学水电学院讲师,博士,

从事水文水资源新理论新方法研究;

袁 鹏(1950年-),男,北京人,四川大学水电学院副教授,从事水文

分析计算教学科研工作;

丁 晶(1935年-),男,江苏扬州人,四川大学水电学院教授,博士生

导师,从事水文计算和预测研究;

邓育仁(1938年-),男,四川成都人,四川大学水电学院教授,从事水

文计算和预测研究.

■简讯

四川“十五”计划中的水电发展

在省九届人大四次会议上通过的《四川省国民经济和社会发展第十个五年计划纲要》中,水电产业被列为支柱产业之一,并提出:“水电业:

以国家实施‘西电东送’为契机,重点加快金沙江、雅砻江、大渡河水电资源的滚动开发,积极促进溪洛渡、瀑布沟、锦屏一级等一批大中型水电站早日开工,建设国家水电能源基地。”在2000年,大渡河流域开发公司和杂谷脑河水电开发公司相继成立;二滩的售电状况正在改善,2001年计划安排发电127亿kW ?h;溪洛渡、瀑布沟、锦屏一级的业主都在积极争取这些电站早日开工。

本刊记者 李燕辉

ABSTRACT

Trends in Development of Engineering Hydraulics in the 21th Century

Y A NG Y ong-quan

(State Key Hydrau lic Laboratory of High Velocity Flow ,S ichuan University,Chengdu,Sich uan ,610065,China)

Abstract :T rend s in development of engineer ing hydraulics in the 21th century are discuss ed in as pects of new theor y,new tech nology and mathematical model .Framew or k for th eory of engineering hydraulics at the 21th cen tu ry w ill be ch anged thorough ly .S ubject investigated w ill be evolved from normal scale to fin e scale.Conven tional ass umption for h om ogeneous contin uum w ill be improved and non-linear th eory and stoch as tic th eory w ill be ex tensively used.Clos e combination of hydraulics and computer technolog y w ill es tablish new and modern k now ledge sys tem.Along w ith in depth s tud y on fundamen tal research,new ad vances w ill b e made in turbu len t flow res earch in engineer ing hydraulics an d gr eat advances w ill b e made in study on interaction of flow,solid and air.T her efore,modernization of h ydrau lics w ill b e realiz ed.Key words :engineering hydr aulics ;trends in development ;new theor y ;new tech nology

Undertaking Popular Science Work C onstantly at Dif ferent Levels and Main Points

XIO N G D ao -shu

(Ch engdu Hydroelectric College,Ch eng du,S ichu an,610072,C hina)

Abstract :Th e Cen tral Comm ittee of the Communis t Party of Chin a and th e State Council pay great attention to popular s cience work ,so it is obligatory for acad emic organizations at different levels to make a good job of popular s cience.T he author sum marizes and review s experiences in popu lar science w ork undertaken s ince fou nding of S ichuan S ociety of Hydr oelectric Engineerin g 20years ago and proposes opinions and sug ges tions .

Key wrods :popular scien ce of h ydropower;practice;exp erience;understandins

Study on Optimum Design of Francis Turbine Runner in Sandy Water and Development of Its Software Package

L IU X iao -bing CHEN Ci-chang L I Q ing -g an Z HA N G Li-da

(Sich uan Indus try Ins titu te,Chengdu,S ichuan,610039,Chin a)

Abstract :M easures for improving tu rbine abras ion conditions are provided by analyz ing s ilt abrasion mechanism and conditions in turbin e.Design m ethod for runn er buck et of Francis turbine in sandy w ater is s tudied bas ed on tw o-dimen sional theory.Ru nner flow field comp utation,bucket num erical integration an d buck et thick enin g are conducted by reliable numerical computation m ethod .Effectivenes s and abras ion prediction are carr ied ou t for runn er during preliminary design.C omputer-aided sys tem for hydraulic design of Francis turbine ru nner bucket in sandy w ater is developed .An in stan ce for application of the d esig ned softw are is p resented .Key words :s ilt abrasion;Francis r unner;optimum des ign;softw are pack age

Insisting of Publication Aim and Establishment of High Quality Periodical to

Make Contribution to Development of Sichuan Water Power

L I Yan-hui

(E ditorial Office of Sichuan Water Power ,Chengdu ,S ichu an ,610072,Ch ina )

Abstract :Achievemen ts and counter measures for Sichuan W ater Pow er during 20Years are pres ented and experiences and future aims are des crib ed.

Key words :periodical running;aim ;periodical;society;contribution

Application of Threshold Auto -regressive Model in Hydrologic Stochastic Simulation

W AN G Wen -sheng Y U A N Peng D IN G jing DEN G Yu -ren

(College of Hydroelectric Engin eering,Sichuan Univer sity,Chengdu,Sichuan,610065,Chin a)

Abstract :In order to characterize th e nonlinear beh avior of daily flow ,a new nonlin ear tim e series model ,i .e .thres hold auto -regress ive model

has been introduced firs tly into daily flow s tochastic simulation in this paper.Based on the observed data at Pings han S tation at Jin sha River in Chin a,the th res hold au to-regressive m odel has been s et up to conduct s tochas tic sim ulation of daily flow.The res ults from model verification have show n that the s ugges ted model is fun ctional and ap plicable for daily flow sim ulation.Key words :thresh old auto-regres sive model;daily flow stoch as tic simulation;model verification

Study on Inf luence of Forest System on Slope Flow L EI Xia o-zhang 1 Y A N G Y u-po 1 ZHA O Wen-qian 2

(1.Sich uan Forest Res earch Ins titu te,Chengdu,S ichuan,610081,China;

2.State Key Hydr aulic Lab or atory of High Velocity Flow ,S ichuan University,Chengdu ,S ich uan ,610065,Chin a)

Abstract :By us e of dynam ic-w ave equation ,the general s lope flow equation is derived by matrix theory.Based on the function of forest ecological sys tem ,local s lope flow loss es and its total friction are am alyzed to offer theoretical base for research on control of non -point source pollution transportation in fores t.

Key words :s lope flow ;total fr iction;fores t vegetation

Coupling Analysis on Seepage and Stress Fields in Longtan Roller Compacted Concrete Gravity Dan

CHA I Jun-r ui L IU Hao -w u

(C ollege of Hydroelectric Engineerin g,S ichu an University,Ch engdu ,S ich uan ,610065,Ch ina)

Abstract :Based on permeability of L on gtan RC C gravity dam an d taking into account of s eepage on RCC lift s urface and its m echan ical effect,an d influen ce of stress con dition of dam on p ermeab ility of lift surface ,the cou pling analysis on s eepage an d stres s fields in Long tan dam are condu cted by means of m athematical m odel and its n umer ical solution of finite element method.T he analysis res ults are the references of dam des ign.

Key words :RCC dam ;s eepage field;s tres s field;cou pling analysis

第20卷增刊2001年7月四 川 水 力 发 电Sichuan Water Pow er Vol.20,S upplemen t Jul., 2001

门限分位数自回归模型及在股市收益自相关分析中的应用

门限分位数自回归模型及在股市收益自相关分析中的应用 摘要:门限分位数自然回归模型是一种非限行分位数回归模型,其可以应用讨论系统之中的门限效应。并且在该模型之中,自然回归阶数以及门限值的确定等都将会为模型的分析效果带来直接的影响。本文主要对门限分位数自然回归模型以及其在股市收益中的相关应用做出分析,希望能够给予同行业的工作人员提供一定参考价值。 关键词:门限分位数;回归模型;股市收益;分析 股市收益的自相关性是金融市场研究中的一个重要问题,研究人员针对于理性预定理论提出了有效的市场假说,奠定了传统的金融学基础。有效的市场假说理论认为在一个有效的市场之中,股市的价格或者收益直接地反映了所有可能会获得的信息,过去的收益以及未来的收益并不相关,股市的收益则是不可以预测的,反而言之如果股市的收益在时间上是自相关的,那么历史收益是可以影响当前的收益的,这也直接表明了有效市场假说是难以成立的,可以采取序列自相关分析的方法,对其有效市场假说做出相应验证。 一、门限分位数自然回归模型的分析 1. 模型的表示分析 主要是记{ yt }作为其1 维响应的变量,然而x =(1,yt -1,yy

-2,…,yt -p)T 主要是为p+1为向量组成的解释变量,然而{ yt }则是为1维门限的白能量,其自然回归模型之中的门限变量通常情况下是需要相应变量{ yt }的滞后项,而γ则表示为门限,其模型如下所示: 和均值自激励门限自然回归的模型进行对比,门限分位数自回归模型存在着下述的优点:一是信息刻画更加全面,回归系数估计在不同的分位点可能存在着不同的表型,同时不同阶段的变量之间关系更加细致。二是具有比较强的稳健性,和均值自激励门限自回归模型要求误差项服从特定分布的不同,其允许误差项服从一般的非对称的分布。 2. 模型的定阶 在门限分位数自然回归之中,最优滞后阶数p的选择是十分重要的,可以通过AIC的准确去进行实现,然而定义AIC的准则则是如下所示: 可以看出,AIC主要由两个部分所组成,一是可以反映出模型的拟合程度,主要是为前半段进行表示。二是反映出模型的复杂城市,则是经过后半段进行表示。 3. 门限效应的诊断检验分析 针对于门限效应而言,其诊断检验主要是包括了以下方面的内容:第一,门限效应存在性检验,主要检验两个阶段的门限效应

应用回归分析

第五章 自变量选择对回归参数的估计有何影响 答:全模型正确而误用选模型时,我们舍去了m-p 个自变量,用剩下的p 个自变量去建立选模型,参数估计值是全模型相应参数的有偏估计。选模型正确而误用全模型时,参数估计值是选模型相应参数的有偏估计。 自变量选择对回归预测有何影响 (一)全模型正确而误用选模型的情况 估计系数有偏,选模型的预测是有偏的,选模型的参数估计有较小的方差,选模型的预测残差有较小的方差,选模型预测的均方误差比全模型预测的方差更小。 (二)选模型正确而误用全模型的情况 全模型的预测值是有偏的,全模型的预测方差的选模型的大,全模型的预测误差将更大。 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣 答:应该用自由度调整复决定系数达到最大的准则。当给模型增加自变量时,复决定系数也随之增大,然而复决定系数的增大代价是残差自由度的减小,自由度小意味着估计和预测的可靠性低。应用自由度调整复决定系数达到最大的准则可以克服样本决定系数的这一缺点,把2 R 给予适当的修正,使得只有加入“有意义”的变量时,经过修正的样本决定系数才会增加,从而提高预测的精度。 试述前进法的思想方法。 解:主要是变量由少到多,每次增加一个,直至没有可引入的变量为止。 具体做法是:首先将全部m 个自变量,分别对因变量y 建立m 个一元线性回归方程,并分别计算这m 个一元回归方程的m 个回归系数的F 检验值,记为 111 12{,,,} m F F F ,选其最大者 1111 12max{,, ,} j m F F F F =,给定显著性水平α,若 1(1,2) j F F n α≥-,则首先将 j x 引入回 归方程,假设 1 j x x =。其次,将 12131(,),(,),,(,)m y x x x x x x 分别与建立m-1个二元线性 回归方程,对这m-1个回归方程中 23,, ,m x x x 的回归系数进行F 检验,计算F 值,记为 222 23{,, ,} m F F F ,选其最大的记为 2222 23max{,, ,} j m F F F F =,若 2(1,3) j F F n α≥-,则 接着将j x 引入回归方程。以上述方法做下去。直至所有未被引入方程的自变量的F 值均小

Stata门限模型的操作和结果详细解读(完整资料).doc

【最新整理,下载后即可编辑】 一、门限面板模型概览 如果你不愿意看下面一堆堆的文字,更不想看计量模型的估计和检验原理,那就去《数量经济技术经济研究》上,找一篇标题带有“双门槛(或者双门限)”的文章,浏览一遍,看看文章计量部分列示的统计量和检验结果。这样,在软件操作时,你就知道每一步得到的结果有什么意义,怎么解释了,起码心里会有点印象。 一般情况下,一个研究生花费在研究上的时间越多,他的成果越丰富,也就是说,研究成果和研究时间存在某种正向关联。但是,这种关联是线性的吗?在最初阶段,他可能看了两三年的文献,也没有写出一篇优秀的文章,但是一旦过了这个基础期,他的能量和成果将如火山爆发一样喷涌出来,此时,他投入少量的时间,就能产出大量优质文章。再过几年,他可能会进入另外一种境界,虽然比以前有了极大提高,但是研究进入新的瓶颈期,文章发表的数量减少。由此可以看出,研究成果与研究年限存在一种阶段性的线性关系。这个基础期的结点、瓶颈期的起点就像“门槛”一样把研究阶段分成三个部分,在不同部分,成果和时间的线性关系都不同。这个效应被称为门槛效应或门限效应。 门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象。作为原因现象的临界值称为门限值。在上面的例子中,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。 汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。了解门限模型最好的办法,首先就要阅读他的文章。他的文章很有特点:条理很清晰,推导过程详细,语言简练,语法不复杂。有关他的论文、程序、数据可以参考Hansen的个人网站:

线性回归模型应用

线性回归模型的应用 一、数据来源与处理 数据均来源于中华人民共和国国家统计局网站公布的《2008年中国统计年鉴》。选取1999年至2007年的相关数据,其中人均消费支出、人均年总收入、政府对农业的投入均采用当年年末新增值;商品零售价格指数、恩格尔系数均采用原值;为避免数据本身过小造成误差增大,用年末累计参加农村养老保险人数除以当年农村人口数后,再乘以一千。利用SPSS16.0软件进行数据统计处理。 二、模型变量的选择和说明 被解释变量:农村居民人均消费支出(E); 解释变量:人均年总收入(Y)、政府对农业的投入(C)、商品零售价格指数(P)、农村恩格尔系数(D)、参加养老保险人数占农村总人口的千分比(I)。 采用以下函数表达式表示各解释变量与被解释变量的关系:E=F(Y,C,P,D,I) 经简单测算和经验分析,发现农村居民人均消费支出除了与传统的人均年总收入成一元线性相关外,政府对农业的投入影响农民人均收入水平、商品零售价格指数影响消费者价格心理、农村恩格尔系数影响农村消费者消费行为、参加养老保险人数占农村总人口的千分比影响农村及其购买能力,这些因素在单独情况下,均与人均消费支出成一元线性相关。因此,猜想以上各被解释变量在综合作用情况下与解释变量成多元线性线性相关是完全可行、合理的。 三、线性回归模型形成的步骤 (1)相关性分析。线性回归方程拟引入一个因变量,即人均消费;五个自变量,即人均收入、政府投入、CPI、农村恩格尔系数和养老保险投保率。经计算得加权平均值及方差如表1。 由表2看出,人均消费与五个因变量相关性均较大。其中,人均收入与人均消费相关性高达99%,政府投入次之,达98.4%,恩格尔系数与CPI与人均消费的相关性分别达83%和80.6%,远高于养老保险参保率的47.8%。

S门限模型的操作和结果详细解读

一、门限面板模型概览? 如果你不愿意看下面一堆堆的文字,更不想看计量模型的估计和检验原理,那就去《数量经济技术经济研究》上,找一篇标题带有“双门槛(或者双门限)”的文章,浏览一遍,看看文章计量部分列示的统计量和检验结果。这样,在软件操作时,你就知道每一步得到的结果有什么意义,怎么解释了,起码心里会有点印象。 一般情况下,一个研究生花费在研究上的时间越多,他的成果越丰富,也就是说,研究成果和研究时间存在某种正向关联。但是,这种关联是线性的吗?在最初阶段,他可能看了两三年的文献,也没有写出一篇优秀的文章,但是一旦过了这个基础期,他的能量和成果将如火山爆发一样喷涌出来,此时,他投入少量的时间,就能产出大量优质文章。再过几年,他可能会进入另外一种境界,虽然比以前有了极大提高,但是研究进入新的瓶颈期,文章发表的数量减少。由此可以看出,研究成果与研究年限存在一种阶段性的线性关系。这个基础期的结点、瓶颈期的起点就像“门槛”一样把研究阶段分成三个部分,在不同部分,成果和时间的线性关系都不同。这个效应被称为门槛效应或门限效应。 门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象。作为原因现象的临界值称为门限值。在上面

的例子中,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。 汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。了解门限模型最好的办法,首先就要阅读他的文章。他的文章很有特点:条理很清晰,推导过程详细,语言简练,语法不复杂。有关他的论文、程序、数据可以参考Hansen的个人网站: 。 Hansen于1996年在《Econometrica》上发表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了时间序列门限自回归模型(TAR)的估计和检验。之后,他在门限模型上连续追踪,发表了几篇经典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》,2000年的《Sample splitting and threshold estimation》和2004年与他人合作的《Instrumental Variable Estimation of a Threshold Model》。 在这些文章中,Hansen介绍了包含个体固定效应的静态平衡面板数据门限回归模型,阐述了计量分析方法。方法方面,首先要通过减去时间均值方程,消除个体固定效应,然后再利用OLS(最小二乘法)进行系数估计。如果样本数量有限,那么可以使用自举法(Bootstrap)重复抽取样本,提高门限效应的显著性检验效率。 在Hansen(1999)的模型中,解释变量中不能包含内生解释变量,无法扩展

(完整版)Stata门限模型的操作和结果详细解读

一、门限面板模型概览 如果你不愿意看下面一堆堆的文字,更不想看计量模型的估计和检验原理,那就去《数量经济技术经济研究》上,找一篇标题带有“双门槛(或者双门限)”的文章,浏览一遍,看看文章计量部分列示的统计量和检验结果。这样,在软件操作时,你就知道每一步得到的结果有什么意义,怎么解释了,起码心里会有点印象。 一般情况下,一个研究生花费在研究上的时间越多,他的成果越丰富,也就是说,研究成果和研究时间存在某种正向关联。但是,这种关联是线性的吗?在最初阶段,他可能看了两三年的文献,也没有写出一篇优秀的文章,但是一旦过了这个基础期,他的能量和成果将如火山爆发一样喷涌出来,此时,他投入少量的时间,就能产出大量优质文章。再过几年,他可能会进入另外一种境界,虽然比以前有了极大提高,但是研究进入新的瓶颈期,文章发表的数量减少。由此可以看出,研究成果与研究年限存在一种阶段性的线性关系。这个基础期的结点、瓶颈期的起点就像“门槛”一样把研究阶段分成三个部分,在不同部分,成果和时间的线性关系都不同。这个效应被称为门槛效应或门限效应。 门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象。作为原因现象的临界值称为门限值。在上面的例子中,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。 汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。了解门限模型最好的办法,首先就要阅读他的文章。他的文章很有特点:条理很清晰,推导过程详细,语言简练,语法不复杂。有关他的论文、程序、数据可以参考Hansen的个人网站: https://www.360docs.net/doc/af7285290.html,/~bhansen/progs/progs_subject.htm。 Hansen于1996年在《Econometrica》上发表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了时间序列门限自回归模型(TAR)的估计和检验。之后,他在门限模型上连续追踪,发表了几篇经典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》,2000年的《Sample splitting and threshold estimation》和2004年与他人合作的《Instrumental Variable Estimation of a Threshold Model》。 在这些文章中,Hansen介绍了包含个体固定效应的静态平衡面板数据门限回归模型,阐述了计量分析方法。方法方面,首先要通过减去时间均值方程,消除个体固定效应,然后再利用OLS(最小二乘法)进行系数估计。如果样本数量有限,那么可以使用自举法(Bootstrap)重复抽取样本,提高门限效应的显著性检验效率。 在Hansen(1999)的模型中,解释变量中不能包含内生解释变量,无法扩展应用领域。Caner和Hansen在2004年解决了这个问题。他们研究了带有内生变量和一个外生门限变量的面板门限模型。与静态面板数据门限回归模型有所不同,在含有内生解释变量的面板数据门限回归模型中,需要利用简化型对内生变量进行一定的处理,然后用2SLS(两阶段最小二乘法)或者GMM(广义矩估计)对参数进行估计。 当然,有关门限回归模型的最新研究,还可以参考《Inflation and Growth: New Evidence From a Dynamic Panel Threshold Analysis》(Stephanie Kremer,Alexander Bick,Dieter Nautz,2009)。 二、计量模型的假设、估计和检验 略

回归模型在统计分析中的应用

回归模型在统计分析中的应用 摘要 在人们研究对象的内在特性和个因素间的关系时,通常会建立数学模型。在无法分析实际对象内在的因果关系时,往往会基于对数据的统计分析去建立模型。回归分析作为统计数据寻求变量间关系的近似表达式的一种方法,其广泛用途使得回归模型成为了数据统计分析中的一种常见模型。 本论文分别从数学模型,回归分析,统计分析等的基本概念出发,进一步阐述了数学建模的基本方法和一般步骤,回归分析的基本模型、步骤和分类,以及统计分析的步骤。最后借用MATLAB软件,以一个关于人们对某种品牌食品的评价的实例,用合理的步骤详细描述了在解决回归模型在统计分析中的应用的问题中该如何具体去做。 关键词:数学模型;统计分析;回归分析;回归模型;MATLAB软件

APPLICATION OF REGRESSION MODEL IN STATISTICAL ANALYSIS ABSTRACT In the process of researching the relationship between the inner characteristics and factors of the object,people usually build mathematical model. In the case of the inner causality that people can not analyse of actual object,we often to build model based on statistical analysis of data. As a method for seeking a approximate expressions of the statistical data,the wide applications of regression analysis made regression model become a common model in statistical analysis of data. This paper starts from the the basic concept such as the mathematical model,regression analysis and statistical analysis.Then further elaborated the basic methods and general steps of mathematical modeling, the basic model, steps and classification of regression analysis, and the steps of statistical analysis. Finally, applying MATLAB software,using reasonable steps to describe how to solve the problem that the application of regression models in statistical analysis in detail,by using a example about people's evaluation towards a certain brand of food. Key words: mathematical model; statistical analysis; regression analysis; regression model; MATLAB software

S门限模型的操作和结果详细解读

S门限模型的操作和结果详细解读 文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

一、门限面板模型概览? 如果你不愿意看下面一堆堆的文字,更不想看计量模型的估计和检验原理,那就去《数量经济技术经济研究》上,找一篇标题带有“双门槛(或者双门限)”的文章,浏览一遍,看看文章计量部分列示的统计量和检验结果。这样,在软件操作时,你就知道每一步得到的结果有什么意义,怎么解释了,起码心里会有点印象。? 一般情况下,一个研究生花费在研究上的时间越多,他的成果越丰富,也就是说,研究成果和研究时间存在某种正向关联。但是,这种关联是线性的吗在最初阶段,他可能看了两三年的文献,也没有写出一篇优秀的文章,但是一旦过了这个基础期,他的能量和成果将如火山爆发一样喷涌出来,此时,他投入少量的时间,就能产出大量优质文章。再过几年,他可能会进入另外一种境界,虽然比以前有了极大提高,但是研究进入新的瓶颈期,文章发表的数量减少。由此可以看出,研究成果与研究年限存在一种阶段性的线性关系。这个基础期的结点、瓶颈期的起点就像“门槛”一样把研究阶段分成三个部分,在不同部分,成果和时间的线性关系都不同。这个效应被称为门槛效应或门限效应。? 门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象。作为原因现象的临界值称为门限值。在上面的例

子中,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。? 汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。了解门限模型最好的办法,首先就要阅读他的文章。他的文章很有特点:条理很清晰,推导过程详细,语言简练,语法不复杂。有关他的论文、程序、数据可以参考Hansen的个人网站:。? Hansen于1996年在《Econometrica》上发表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了时间序列门限自回归模型(TAR)的估计和检验。之后,他在门限模型上连续追踪,发表了几篇经典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》,2000年的《Sample splitting and threshold estimation》和2004年与他人合作的《Instrumental Variable E s t i m a t i o n o f a T h r e s h o l d M o d e l》。? 在这些文章中,Hansen介绍了包含个体固定效应的静态平衡面板数据门限回归模型,阐述了计量分析方法。方法方面,首先要通过减去时间均值方程,消除个体固定效应,然后再利用OLS(最小二乘法)进行系数估计。如果样本数量有限,那么可以使用自举法(Bootstrap)重复抽取样本,提高门限效应的显着性检验效率。?

回归分析在数学建模中的应用

摘要 回归分析和方差分析是探究和处理相关关系的两个重要的分支,其中回归分析方法是预测方面最常用的数学方法,它是利用统计数据来确定变量之间的关系,并且依据这种关系来预测未来的发展趋势。本文主要介绍了一元线性回归分析方法和多元线性回归分析方法的一般思想方法和一般步骤,并且用它们来研究和分析我们在生活中常遇到的一些难以用函数形式确定的变量之间的关系。在解决的过程中,建立回归方程,再通过该回归方程进行预测。 关键词:多元线性回归分析;参数估计;F检验

回归分析在数学建模中的应用 Abstract Regression analysis and analysis of variance is the inquiry and processing of the correlation between two important branches, wherein the regression analysis method is the most commonly used mathematical prediction method, it is the use of statistical data to determine the relationship between the variables, and based on this relationship predict future trends. introduces a linear regression analysis and multiple linear regression analysis method general way of thinking and the general steps, and use them to research and analysis that we encounter in our life, are difficult to determine as a function relationship between the variables in the solving process, the regression equation is established by the regression equation to predict. Keywords:Multiple linear regression analysis; parameter estimation;inspection II

门限自回归模型及其在水文随机模拟中的应用.王文圣

门限自回归模型及其在水文随机模拟中的应用* 王文圣, 袁 鹏, 丁 晶, 邓育仁 (四川大学水电学院,四川成都 610065) 摘 要:为了客观描述日流量变化的非线性特性,将一种非线性时序模型——门限自回归模型引入日流量随机模拟。根据我国金沙江流域屏山站观测资料建立了日流量随机模拟的门限自回归模型。实用性检验结果表明,该模型用于模拟日流量过程是可行的,成果实用。这种尝试为日流量随机模拟提供了一种考虑日流量非线性变化特性的新模型。 关键词:门限自回归模型;日流量随机模拟;实用性检验 中图分类号:P33;P333.6文献标识码: B文章编号:1001-2184(2001)增-0047-04 1 引 言 日流量随机模拟利用日流量涨落的统计特性,具体说是利用日流量在时序上的统计关系。这种统计关系非常复杂,为简化处理常常以线性来表征前后日流量的关系。在一般情况下,这种简化尚能反映日流量时序变化的主要特性。所以在日流量随机模拟时,当前广泛使用线性时序模型。但是日流量在时序上的前后流量关系是非线性的。例如,对大流域一次洪水的日流量过程涨水段的下部、中部和上部有着明显不同的涨率,前后流量关系显然不是线性的;同样在落水段的下部、中部和上部有着明显不同的退水率,前后流量关系也不是线性的。因此,为更全面地反映日流量时序变化的特性,最好考虑日流量在时序变化上的非线性特性。 近来,非线性时序的分析获得了迅速的发展,并且相继出现了一系列非线性时序模型,比如门限自回归模型,双线性模型,指数自回归模型,状态依赖模型等。对双线性模型曾初步研究了在洪水模拟中应用的可能性[1]。门限自回归模型最近尝试应用于水文预报并获得较好的效果[2]。鉴于门限自回归模型在表征非线性特性上具有其独到之处,笔者将之引入日流量随机模拟并以某站日流量资料为基础,全面探讨了这种模型在日流量模拟中的可行性,模拟效果和优缺点等。 2 门限自回归模型的形式和基本特性 2.1 模型形式 门限自回归模型由汤家豪1978年提出[3],用来解决一类非线性问题。其思路是:对研究对象按照不同区间建立若干个线性时序模型;然后将这些线性时序模型组合起来描述该对象非线性时序变化特性。 对于时间序列{Z t},门限自回归模型的一般形 收稿日期:2000-08-14 * 基金项目:国家自然科学基金(49871018);高速水力学国家重点实验室开放基金资助项目(编号2008)式为: Z t U(1)0+∑ p 1 i=1 U(1)i Z t-i+E(1)t Z t-d F r1 U(2)0+∑ p 2 i=1 U(2)i Z t-i+E(2)t r1

应用回归分析,第5章课后习题参考答案

第5章自变量选择与逐步回归 思考与练习参考答案 自变量选择对回归参数的估计有何影响 答:回归自变量的选择是建立回归模型得一个极为重要的问题。如果模型中丢掉了重要的自变量, 出现模型的设定偏误,这样模型容易出现异方差或自相关性,影响回归的效果;如果模型中增加了不必要的自变量, 或者数据质量很差的自变量, 不仅使得建模计算量增大, 自变量之间信息有重叠,而且得到的模型稳定性较差,影响回归模型的应用。 自变量选择对回归预测有何影响 答:当全模型(m元)正确采用选模型(p元)时,我们舍弃了m-p个自变量,回归系数的最小二乘估计是全模型相应参数的有偏估计,使得用选模型的预测是有偏的,但由于选模型的参数估计、预测残差和预测均方误差具有较小的方差,所以全模型正确而误用选模型有利有弊。当选模型(p元)正确采用全模型(m 元)时,全模型回归系数的最小二乘估计是相应参数的有偏估计,使得用模型的预测是有偏的,并且全模型的参数估计、预测残差和预测均方误差的方差都比选模型的大,所以回归自变量的选择应少而精。 如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣 C统计量达到最小的准则来衡量回答:如果所建模型主要用于预测,则应使用 p 归方程的优劣。 试述前进法的思想方法。 答:前进法的基本思想方法是:首先因变量Y对全部的自变量x1,x2,...,xm建立m 个一元线性回归方程, 并计算F检验值,选择偏回归平方和显着的变量(F值最大且大于临界值)进入回归方程。每一步只引入一个变量,同时建立m-1个二元线性回归方程,计算它们的F检验值,选择偏回归平方和显着的两变量变量(F 值最大且大于临界值)进入回归方程。在确定引入的两个自变量以后,再引入一个变量,建立m-2个三元线性回归方程,计算它们的F检验值,选择偏回归平方和显着的三个变量(F值最大)进入回归方程。不断重复这一过程,直到无法再引入新的自变量时,即所有未被引入的自变量的F检验值均小于F检验临界值

空间计量经济学模型归纳

空间计量经济学模型 空间相关性是指 () ,i j y f y i j =≠即i y 与j y 相关 模型可表示为() (),1i j j i i y f y x i j βε=++≠ 其中,()f 为线性函数,(1)式的具体形式为 () ()2,0,2i ij j i i i i j y a y x N βεεδ≠=++∑ 如果只考虑应变量空间相关性,则(2)式变为(3)式 ()()21 ,0,,1,2...3n i ij j i i i y W y N i n ρεεδ==+=∑ 式中 1 n ij j i W y =∑为空间滞后算子,ij W 为维空间权重矩阵n n W ?中的元素,ρ为待估的空间自相 关系数。0ρ≠,存在空间效应 (3)式的矩阵形式为() ()2 1,0,4u n y Wy N I ρεδ?= (4)式称为一阶空间自回归模型,记为FAR 模型 当在模型中引入一系列解释变量X 时,形式如下 () ()2,0,5n y Wy X N I ρβεεδ=++ (5)式称为空间自回归模型,记为SAR 模型 当个体间的空间效应体现在模型扰动项时有 () ()21,,0,6u n y X u u Wu N I βλεδ?=+= (6)式成为空间误差模型,记为SEM 模型 当应变量与扰动项均存在空间相关时有 () ()2121,,0,7u n y W y X u u W u N I ρβλεεδ?=++=+ (7)式称为一般空间模型,记为SAC 模型 当0X =且20W =时,SAC →FAR ;当20W =时,SAC →SAR 当10W =时,SAC →SEM 当空间相关性还体现在解释变量上时,则有 () ()2,0,8n y Wy X WXr N I ρβεεδ=+++ (8)式成为空间杜宾模型,记为SDM 模型

时间序列分析第一章

1. 什么是时间序列?请收集几个生活中的观察值序列。 按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。例如我把每天的生活费记录下来;零售商把每个月的销售额记下来,重要的是时间间隔和量纲要相同。 2. 时域方法的特点是什么? 时域分析方法具有理论基础扎实、操作步骤规范、分析结果易于解释,是时间序列分析的主流方法等特点。 3、时域方法的发展轨迹是怎样的? 1927年,英国统计学家G. U. Yule 提出AR模型(自回归(autoregressive, AR)模型); 1931年,英国统计学家、天文学家G. T. Walker提出MA模型(移动平均(moving average, MA)模型); 1931年,英国统计学家、天文学家G. T. Walker提出ARMA模型(自回归移动平均(autoregressive moving average, AR MA)模型) 1970年,美国统计学家G.E.P.Box和英国统计学家G.M.Jenkins提出ARIMA模型(求和自回归移动平均(autoregressive integrated moving average, ARIMA)模型,又称(Box—Jenkins 模型))出版了《Time Series Analysis Forecasting and Control》; 美国统计学家,计量经济学家Robert F.Engle在1982年提出了自回归条件异方差(ARCH)模型,用以研究英国通货膨胀率的建模问题; Bollerslov在1985年提出了广义自回归条件异方差(GARCH)模型; Nelson等人指数广义自回归条件异方差(EGARCH)模型,方差无穷广义自回归条件异方差(IEGARCH)模型,依均值广义自回归条件异方差(EGARCH-M)模型。 在非线性场合,Granger和Andersen在1978年提出了双线性模型;Howell Ttong在1978年提出了门限自回归模型(分段线性化构造)等等。 模型分类主要有单变量、同方差场合的线性模型:AR, MA, ARMA, ARIMA;异方差场合的线性模型:ARCH, GARCH, EGARCH, IGARCH, GARCH-M;多变量场合的线性模型:协整(co-integration)理论,Granger, Engle 2003Nobel奖;非线性的时间序列分析:(分段线性化)门限自回归模型。 还有时间序列分析软件SAS(Statistical Analysis System)系统专门模块:SAS/ETS(Econometric & Time Series)。

应用回归分析

第五章 5.1自变量选择对回归参数的估计有何影响? 答:全模型正确而误用选模型时,我们舍去了m-p 个自变量,用剩下的p 个自变量去建立选模型,参数估计值是全模型相应参数的有偏估计。选模型正确而误用全模型时,参数估计值是选模型相应参数的有偏估计。 5.2 自变量选择对回归预测有何影响? (一)全模型正确而误用选模型的情况 估计系数有偏,选模型的预测是有偏的,选模型的参数估计有较小的方差,选模型的预测残差有较小的方差,选模型预测的均方误差比全模型预测的方差更小。 (二)选模型正确而误用全模型的情况 全模型的预测值是有偏的,全模型的预测方差的选模型的大,全模型的预测误差将更大。 5.3如果所建模型主要用于预测,应该用哪个准则来衡量回归方程的优劣? 答:应该用自由度调整复决定系数达到最大的准则。当给模型增加自变量时,复决定系数也随之增大,然而复决定系数的增大代价是残差自由度的减小,自由度小意味着估计和预测的可靠性低。应用自由度调整复决定系数达到最大的准则可以克服样本决定系数的这一缺点,把2 R 给予适当的修正,使得只有加入“有意义”的变量时,经过修正的样本决定系数才会增加,从而提高预测的精度。 5.4 试述前进法的思想方法。 解:主要是变量由少到多,每次增加一个,直至没有可引入的变量为止。 具体做法是:首先将全部m 个自变量,分别对因变量y 建立m 个一元线性回归方程,并分别 计算这m 个一元回归方程的m 个回归系数的F 检验值,记为11112{,,,}m F F F L ,选其最大者1111 12max{,,,} j m F F F F =L ,给定显著性水平α,若 1(1,2) j F F n α≥-,则首先将 j x 引入回 归方程,假设 1 j x x =。其次,将 12131(,),(,),,(,)m y x x x x x x L 分别与建立m-1个二元线性回归方程,对这m-1个回归方程中 23,,,m x x x L 的回归系数进行F 检验,计算F 值,记为 22223{,,,}m F F F L ,选其最大的记为222223max{,,,}j m F F F F =L ,若2(1,3)j F F n α≥-,则 接着将j x 引入回归方程。以上述方法做下去。直至所有未被引入方程的自变量的F 值均小 于 (1,1)F n p α--为止。 5.5 试述后退法的思想方法。 首先用全部m 个变量建立一个回归方程,然后在这m 个变量中选择一个最不重要的变量,将它从方程中剔除。 5.6 前进法、后退法各有哪些优缺点? 解:都可以挑选出对因变量有显著性影响的自变量,逐个挑选并排除显著性较低的自变量。 前进法的缺点:不能反映引进新的自变量后的变化情况。 后退法的缺点:开始把全部自变量引入回归方程,计算量很大。一旦自变量被剔除,就不会再被引入回归方程。 5.7 试述逐步回归的思想方法。

实验12 向量自回归模型

实验12 向量自回归模型 【实验目的】通过本实验,使学生掌握向量自回归模型(V AR)的分析方法;能够较熟练利用Eviews,以及实际数据,针对现实问题进行向量自回归模型(V AR)分析。 【实验内容】根据中国GDP、宏观消费与基本建设投资等实际数据,建立向量自回归模型,并根据建立的模型进行分析。具体内容为: (1) V AR模型估计。 (2) V AR模型最佳滞后期的选择。 (3) V AR模型的稳定性检验。 (4) V AR模型残差检验。 (5) Granger因果性检验。 (6) 脉冲响应分析。 (7) 协整性检验。 (8) 建立VEC(向量误差修正)模型。 【实验步骤】 步骤一、数据处理 1.原始数据为国内生产总值GDP、消费总量CONS、基本建设投资INVES。 2. 为消除通货膨胀的影响,用价格指数进行调节,选择了定基价格指数(1997=1),并用三个时间序列分别除以价格指数,调整之后的序列分别命名为GDPP,CONSP,INVESP。3.三个数据变动幅度较大,为了减少可能存在的异方差性和自相关性影响,对三个序列取对数,取对数的数据序列分别命名为LNGP,LNCP和LNIP。数据如图1 图1 LNGP,LNCP和LNIP数据图 步骤二、建立V AR模型 1.在work file文档界面下,点击快捷键quick,会出现quick菜单,在quick菜单中选择估计V AR(estimate V AR)项,选择方法如图2。

图2 估计V AR选择方法 2.V AR模型设置。在V AR模型设置选项中(basics),有五个基本选项,(1)V AR类型(V AR Type)。包含无约束无约束V AR(Unrestricted V AR)和向量误差修正模型(Vector Erroe Correc)两个选项。本实验选择在V AR类型(V AR Type)选择无约束V AR(Unrestricted V AR)。 (2)样本时间范围。设定样本数据的时间范围。本实验选择1953年到1997年。 (3)模型中包含的内生变量(Endogenous Variables)。V AR模型包含的内生变量。本例在内生变量中(Endogenous Variables)输入Lngp,lncp,lnip)。 (4)内生变量滞后期区间(lag intervals for Endogenous )。设置V AR模型中各变量的滞后区间。本案例在变量滞后期框中输入“1 3”,表明建立的模型最大滞后期是3期。 (5)外生变量(Exogenous Variables)。V AR模型中包含的外生变量。在外生变量框中(Exogenous Variables)输入常数项C。 设置结果如图3

风速时程模拟自回归法空间20个点-AR模型

%风速时程模拟自回归法空间20个点-AR模型 %自回归模型阶p=4,模拟空间20个点,时间步长ti=0.1,频率步长f=0.001, %空间相干系数采用与频率无关的shiotani相关系数,脉动风速谱为Davenport谱 clear tic k=0.005; v10=25; n=0.001:0.001:10; xn=1200*n./v10; s1=4*k*25^2*xn.^2./n./(1+xn.^2).^(4/3); %Davenport谱 %产生空间点坐标 for i=1:20 x(i)=5+i; z(i)=8+i; end %求R矩阵 syms f R0=zeros(20); for i=1:20 for j=i:20 H0=inline('(4*1200^2*f*k)./(1+(1200*f/v10).^2).^(4/3)','f','k','v10'); k=0.005; %地面粗糙度长度 v10=25; R0(i,j)=quadl(H0,0.001,10,0.001,0,k,v10); R0(j,i)=R0(i,j); end end R1=zeros(20); for i=1:20 for j=i:20 H1=inline('(4*1200^2*f*k).*exp(-sqrt(dx^2/50^2+dz^2/60^2)).*cos(2*pi*f* ti)./(1+(1200*f/v10).^2).^(4/3)','f','k','dx','dz','ti','v10'); k=0.005; ti=0.1; %时间步长 v10=25; dx=x(i)-x(j); dz=z(i)-z(j); R1(i,j)=quadl(H1,0.001,10,0.001,0,k,dx,dz,ti,v10); R1(j,i)=R1(i,j); end

相关文档
最新文档