融合马尔科夫链_蒙特卡洛算法的改进通用似然不确定性估计方法在流域水文模型中的应用

融合马尔科夫链_蒙特卡洛算法的改进通用似然不确定性估计方法在流域水文模型中的应用
融合马尔科夫链_蒙特卡洛算法的改进通用似然不确定性估计方法在流域水文模型中的应用

2009年4月

水 利 学 报

SHUILI XUEBAO 第40卷 第4期

收稿日期:2008-04-23

基金项目:国家自然科学基金重点项目(40730632);教育部新世纪优秀人才支持计划(NCET-05-0624);霍英东青年教师基金资助

项目(101077)

作者简介:卫晓婧(1984-),女,山西阳泉人,硕士生,主要从事水文水资源方面的研究。E -mail:hellomuki@to https://www.360docs.net/doc/4c1464978.html,

文章编号:0559-9350(2009)04-0464-10融合马尔科夫链-蒙特卡洛算法的改进通用

似然不确定性估计方法在流域水文模型中的应用

卫晓婧,熊立华,万 民,刘 攀

(武汉大学水资源与水电工程科学国家重点实验室,湖北武汉 430072)

摘要:本文在Blasone 研究工作的基础上,进一步提出了基于马尔科夫链-蒙特卡洛算法的改进通用似然不确定性估计方法(Markov Chain -Monte Carlo based Modified Generalized Likelihood Uncertainty Esti mation,MMGLUE)。该方法结合近年来被广泛用于推求参数后验分布的MC MC 方法,对基于Mon te Carlo 随机取样方法的传统GLUE 方法进行改进,并以预测区间性质最优为标准,对可行参数组阈值进行判断与选择,提出了衡量预测区间对称性的标准,并就预测区间性质与可行参数组个数的相关关系进行了探索。在汉江玉带河流域的实例研究证明,MMGLUE 方法较传统的GLUE 方法能够推求出性质更为优良的预测区间,从而更真实合理地反映水文模型的不确定性。

关键词:MC MC;GLUE;MMGLUE;预测区间;覆盖率;区间宽度;区间对称性

中图分类号:P333文献标识码:A

1 研究背景

近10年来,流域水文模型的不确定性研究逐渐成为当今水文界广泛研究的热点之一,各国的水文学家就此做了大量的工作[1]。Beven [2-3]于1992年率先提出了流域水文模型/异参同效性0的观点,并针对流域水文模型的不确定性研究问题提出了通用似然不确定性估计(Generalized Likelihood Uncertainty Estimation,GLUE)方法。该方法结合Monte Carlo 随机取样技术与Bayesian 框架,对由模型结构、参数冗余及相关性、输入输出误差等因素造成的不确定性进行综合分析。GLUE 方法原理简单,易于操作,但由于其自身理论结构的缺陷,越来越多的研究者就GLUE 方法提出了质疑[4-5],即并非经典的Bayesian 方法、主观判断参数可行域阈值和推求的参数后验概率分布不具有显著的统计特征。因此,基于不同假设的其他不确定性研究方法,如:基于经典Bayesian 理论的Ba RE(Bayesian Recursive Estimation)方法

[6],基于全局卡尔曼滤波理论的EnKF(Ense mble Kalman Filter )方法[7]

,多目标方法如MOSCE M (Mult-i objective Shuffled Complex Evolution Metropolis)方法[8]等被用于估计模型的不确定性工作中。然而,上述方法尽管

理论结构相对复杂,应用效果与GLUE 方法相比却并没有明显的提高。

同时期另一种基于经典Bayesian 理论的马尔科夫链-蒙特卡洛(Markov Chain Monte Carlo,MC MC)方法也被广泛应用于推求参数后验分布的研究中。特别是SCE M -UA (The Shuffled Complex E volution

Metropolis Algorithm)方法[9]能够有效地探索参数空间,使Markov Chain 能够朝着高概率密度区进化,从而

推导出具有显著统计特征的水文模型参数的后验分布。

因此,Blasone [10]提出将两种方法结合起来,采用SCE M -UA 采样方法替代传统的GLUE 方法中的)

464)

Monte Carlo随机取样方法,并根据估计的预测区间的覆盖率来控制可行参数组个数的选择,对传统的GL UE方法进行改进。本文在Blasone所做工作基础之上,进一步提出以预测区间性质最优为指标来控制可行参数组个数的选取。

2方法

211贝叶斯统计推断贝叶斯学派是数理统计中的一个重要学派,其重要观点是[11]:任一未知参数H 都可以看作随机变量,因为任一未知量都有不确定性,因此可以用概率分布来描述。人们根据先验信息对未知参数H的先验分布P(H),通过实验获得样本x1,x2,,,x n,对H的先验分布进行调整,调整的结果是H的后验分布h(H|x1,x2,,,x n)。在这个过程中,人们的认识由P(H)调整到h(H|x1,x2,,, x n)。贝叶斯方法中样本x1,x2,,,x n对H的条件密度p(x,x2,,,x n|H)就是经典方法中H已知时样本的联合密度。一旦样本已知,就只有H在变化,把联合密度看成参数H的似然函数,用l(H|x1,x2,,, x n)来表示。参数的后验分布表示为[12]

h(H|x1,x2,,,x n)=

P(H)l(H|x1,x2,,,x n)

Q P(H)l(H|x1,x2,,,x n)d H(1)

因为参数的后验分布综合了总体信息、样本信息和先验信息,因此对H的统计推断就应建立在后验分布的基础上。

贝叶斯假设:参数的无信息先验分布P(x)所在的取值范围内是/均匀0分布的。根据最大熵原则,无信息如果意味着不确定性最大,那么,无信息的先验分布应是最大熵的相应分布,因为只有在分布是均匀时,熵才达到最大值,故本文中两种方法所采用的先验分布都是均匀分布。

经典统计学中处理点估计与区间估计方法不同,但在贝叶斯学派却是统一的。对于贝叶斯统计中的区间估计,只要存在后验分布,就可以用相应分布的分位点给出参数H的置信区间,就模型参数不确定性分析而言,也就是预测区间。问题就在于评判估计效果的标准。本文中采用预测区间覆盖率、区间宽度、区间对称性作为最优后验分布判定的标准。

当后验分布已知时,对于给定的置信概率1-A可以求出很多置信区间。由于参数H的最大后验区域估计集中了分布密度似然函数值取值尽可能最大的点,因此H的最大后验区间一定是在统一置信概率下区间宽度最狭窄的区间。进而,推求参数的最大后验估计,成为不确定性分析方法研究的最终目的和手段。

212GL UE方法GLUE方法是目前最常用于不确定性估计的经验频率方法,它的原理与步骤如下:首先假设参数服从某一先验分布,通过Monte Carlo取样方法生成一定数目的可行参数组,然后利用流域降雨、蒸发、径流资料,计算各组参数值的对应的似然值。那些与实际过程越接近的模型参数被认为具有越高的可信度与似然度。最后主观选定一阈值,对似然度低于该阈值的参数组,令其相应的似然度为0;对高于该阈值的参数组,按照似然函数值由高到低排序,并标准化,再按照其似然值赋予相应的权重。通过更新样本信息,从而取得参数的后验分布。

213MC MC方法MC MC是为了获得参数后验分布一系列后验量而发展起来的一种行之有效的计算方法,主要适用于多变量,非标准形式,且各变量间相互不独立时的分布模拟。显然,MC MC方法非常适用于推求流域水文模型各参数的后验量。

Markov链具有如下特性:(1)无后效性:由随机变量序列组成的Markov链{X(0),X(1),X(2),,},在任一时刻t(t\0),序列中下一时刻处的X(t+1)由条件分布产生,它只依赖于时刻t处的当前状态而与时刻t之前的历史状态{X(0),X(1),,X(t-1)}无关;(2)各态遍历性:从不同的X(0)出发,链经过一段时间的迭代后,历经各种状态的Markov链最终收敛于平稳分布[13]。

MC MC方法的基本原理就是基于建立的平稳分布为P(x)的Markov链来获得P(x)的样本。产生若干条独立并行的Markov链来探索模型参数空间,通过不断更新样本信息而使Markov链收敛于高概率

)

465

)

密度区,也就是Bayesian 方法中的最大后验估计。MC MC 方法中的SCE M -UA 取样方法能够更有效的探索未知参数空间,因此本文采用该种方法推求实验模型参数的后验分布及其预测区间。

214 MC MC -based Modified GLUE (MMGLUE )方法 MMGLUE 方法,采用SCE M -UA 取样方法代替传统的GL UE 方法中的Monte Carlo 随机取样,并采用预测区间性质作为可行参数组数目x 的选取标准。从而推求出有统计学意义的、性质优良的预测区间。方法流程如图1所示,具体步骤如下:

图1 MMGLUE 方法结构流程

(1)选择实验模型以及相应的流域资料。

(2)确定似然函数,本文采用模型效率系数R 2作为似然函数:

R 2

=1-E M i =1(Q i -Q ^i )2P E M i =1(Q i - Q )2(2)

式中:Q i 为实测径流量;Q ^i 为预测径流量; Q 为实测径流序列的均值;M 表示实测系列长度。

(3)根据先验分布随机产生s 个决策变量H t (t =1,2,,

,s )。(4)将s 个样本点划分为q 个区,每个区采用SCEM -UA

[14-18]方法独立并行演化L 次以获得L #q 个样本点。

(5)将这些样本点掺混。

(6)将掺混后的样本点按照似然值由高到低排序。

(7)以预测区间对观测值覆盖率最合理、预测区面宽度最窄、区间对称性最优为标准,选取一合理初值x 带入模型进行预测区间性质检验,调整x 的值,使之达到既定标准。

覆盖率CR [19]及区间宽度IW 计算公式为

CR =E M t =1J [Q obs,t ]P M ;IW =E M t =1(Q u p,t -Q low,t )P M (3)

其中:J [Q obs,t ]=1,Q low,t

0,其它

式中:Q ob s,t 为时段t 实测径流量;Q low,t 为时段t 预测区间下界;Q up,t 为时段t 预测区间上界。

为了更好的反映预测区间的偏移程度,本文提出预测区间对称性IS 计算公式如下:)

466)

IS =

E M t =1I [Q up,t ]P E M t =1I [Q low,t ](4)其中:I [Q low,t ]=1,Q ob s,t Q up ,t 0,其它

. 由式(4)可以看出,当IS =1时,区间对称,当0[IS <1时,区间较实际观测值偏高,IS >1时,区间偏低。为了便于理解,下面就几种极限情况下的预测区间予以解释,如图2所示。

IS =lim E M t =1I [Q up,t ]y M

lim E M t =1I [Q low,t ]y 0

=+](a)所有观测值位于预测区间之上IS =lim E M t =1I [Q up,t ]y 0li m E M t =1I [Q low,t ]y 0=1(b)所有观测值位于预测区间之中IS =li m E M t =1I [Q up,t ]y 0lim E M t =1I [Q low,t ]y M

=0(c)所有观测值位于预测区间之下

图2 预测区间各种典型情况示意图及IS 取值(图中阴影部分为预测区间,黑色实线表示实测流量过程线)

需要指出的是:在传统的GLUE 方法中,预测区间的上下界选取可遵循如下原则:设预测区间置信度为A ,各组参数按照其相应的似然值获得相应权重,将其所求的径流量由小到大排序,得预测区间上界Q up ,t =Q (1+

A )P 2,t

,预测区间下界Q low,t =Q (1-A )P 2,t ,其中(1+A )P 2与(1-A )P 2为前若干组参数组的累积权重,即

E m i =1R 2

i P x =1+A 2与E m i =1

R 2i P x =1-A 2,m =1,2,,,x 处的模拟值。改进的GL UE 方法由于采用MC MC 取样方法,因此认为Markov 链收敛达到稳定后的各个位置的点都是具有后验统计意义的,因此具有相同的权重。将各组参数值代入SMAR 模型进行模拟,按照模拟值由小到大进行排序,则相应的预测区间上界Q up,t =Q (1+

A )P 2,t ,预测区间下界Q low,t =Q (1-A )P 2,t ,其中Q (1+A )P 2,t 与Q 1-A )P 2,t

分别为排序为x #(1+A )P 2与x #(1-A )P 2处的模拟值。SCE M -UA 方法步骤如下[7]:(1)产生样本点。利用随机产生的s 个决策变量H t (t =1,2,,,s ),将其

存储在数组D (1:s ,1:n )中,其中n 为参数个数。计算其相应的似然函数值f (H t ),按照函数值大小由高到低排序;(2)种群分区。将整个种群划分为q 个分区,每个分区包含m 个点,其中任何一个分区C k 包含如下个体:D (q (j -1)+k ,1:n ),j =1,2,,,m ,每个分区对应一条Markov 链S k (k =1,2,,,q ),链的起始点为数组D 中似然函数值为第k 高的个体,即S i (0)=D (k ,1:n )。手工设置链长L 。;(3)SE M (Sequence Evolution Metropolis,序列独立并行演化采样法)演化。由生成的Markov 链进行SE M 独立并行演化,根据每条链所属区的样本协方差信息,反复产生所需的随机样本(记为Q t +1),更新种群样本,从而产生新的样本组合。SE M 演化方法详见参考文献[9];(4)将更新后的种群分区掺混,按照目标函数值由高到低的顺序将L #q 个样本点进行排列。其相应的参数组随之排序,根据后验信息选取适当的x 值进行不确定性区间估计。

3 应用实例

311 实验流域 实验流域采用位于汉江源头的玉带河流域。流域面积433km 2

。多年平均年降雨量1148mm,年径流深773.5mm 。采用该流域1980)1984年共5年的降雨径流资料作为率定期,1985)1990的资料作为检验期。)467)

312SMAR模型本文采用SMAR模型作为实验模型,因其结构简单,参数个数较少,便于分析模型不确定性。SMAR模型(The Soil Moisture Accounting and Routing model)[20]以土壤水分含量为核心理论,模型结构简单,参数个数较少,是一种集总式概念性水文模型。模型将土壤层划分为若干个水平层,土壤水分蒸发采用分层计算。模型产汇流机制可简单概述为:净雨强度按照直接径流系数划分为直接径流与非直接径流,非直接径流大于下渗强度的部分与直接径流共同作为地表径流汇入河道。剩余非直接径流部分渗入地下,土壤张力水蓄满后产生饱和径流,按地下径流系数划分为地表径流与地下径流。模型汇流采用二水源划分,将径流划分为地下径流与地表径流。流域汇流地面径流采用Nash瞬时单位线汇流,地下径流汇流采用滞后线性水库汇流。各参数意义及取值范围如表1所示。

表1SMAR模型参数意义及其取值范围

参数意义取值范围

C P(mm/d)地表水蒸发速率0~1

Z P mm土壤水蓄水容量0~160

Y P(mm/h)下渗速率0~160

H直接径流系数0~1

T蒸发折算系数0~1

G地下径流系数0~1

K g地下径流消退系数0~1

N线性水库调节次数1~20

K线性水库蓄泄系数1~20

4结果与讨论

411Markov链统计学性质采用MMGLUE方法得到参数N、K以及Y的Markov链演化过程如图3所示。由图3可以看出,参数N、K的各条Markov链在演化过程中逐渐收敛于范围狭窄的区间,即高概率密度区,参数N集中分布在113附近,参数K集中分布在210附近。参数Y的Markov链尽管收敛于一稳定的后验分布,但后验分布的区间较宽,在区间[0,160](mm P h)范围内几乎等概率取值。通过对比以上3个参数的后验分布,可以认为,相对于后验分布取值范围较窄的参数N和K,后验分布取值范围较宽的参数Y具有更大的不确定性,更易于导致/异参同效0现象。

412可行参数组个数x与区间性质关系一般认为,预测区间的区间宽度随着所选可行参数组个数x 的增加而增加,相应的覆盖率也越来越高。这是因为能够推求出与实际过程越相近的参数组具有越高的似然度,所选的可行参数组个数越少,也就是仅选取似然度高的参数组作为可行参数组,其所推求的模拟值上下界都与实际值接近,因此区间宽度越窄,相对而言,选择的可行参数组个数越多,相应地模拟值上下界与实际值相距越远,因此区间宽度越宽。但根据实验结果与原先的推断是不相符的。经分析认为是由如下原因所致:由不确定分析方法推求的预测区间对于实际值来说通常是不对称的。就MMGLUE方法在本次实验中而言,当x取值偏大时,估计出的预测区间相对于实际值是偏高的(IS< 1),当降低可行参数点个数x时,x#(1+A)/2与x#(1-A)/2也就相应降低,也就是说预测区间相对于原来降低,纠正了原先偏高的预测区间。区间的偏离程度与区间宽度作为两种互为矛盾的因子决定着预测区间的覆盖程度,因此虽然区间宽度变窄了,但覆盖率却不一定降低。

由图4不难看出,虽然随着可行参数组个数选取越来越少,区间宽度越来越窄,但随着区间对称性的提高,覆盖率却随之增高。也就是说,预测区间宽度与可行参数组个数x成正相关关系,而覆盖率则不然,在IS>1或IS=1的情况下,随着x的增加,预测区间的上下限也相应增加,纠正了原本偏低的预测区间,可行参数组个数x与覆盖率成正相关关系。而在IS<1的情况下,由于区间的偏离程度与区间宽度的共同作用,覆盖率与x不一定为正相关关系。

由图5可以看出,当x取值过大时,预测区间最宽,但与实际过程偏离较大,覆盖率较低。x取值较小时,预测区间过窄,覆盖率较低。当取得一个最佳值时,可以取得一个覆盖率高且区间宽度较窄的预)

)

468

图3各参数M arkov链演化序列

测区间。笔者认为,预测区间的不对称程度与预测分析方法本身的框架结构、采用的实验模型结构及各

参数的取值范围存在必要联系。

图4两种方法可行参数组个数与预测区间性质关系(A=90%,L#q=5000)

413参数后验分布采用GLUE和MMGLUE方法推求的部分模型参数的后验分布如图6所示。由图6可以看出,对于同一个参数而言,通过GLUE方法推求的后验分布基本为均匀分布;而经改进后的MMGLUE方法推求的后验分布则是呈现显著的非均匀分布,一般都具有/峰值0,二者区别显著。导致GL UE方法推求的参数后验分布往往过于平坦的主要原因是由于GL UE对模型模拟结果的输出项不加选择的接受为输入项,从而导致其无显著的统计特征。这是GLUE方法被归类为伪贝叶斯方法的原因

)

)

469

图5基于不同x M MGLUE推求的预测区间(A=90%,L#q=50000)

之一。而改进后的MMGLUE方法由于采用了SC EM-UA算法,使得随机抽样朝着目标(似然度最高)方向有序进化,不断的根据先验信息收敛于后验分布,从而使得到的参数后验分布易于存在/峰值0(即参数的高似然值区域),符合经典贝叶斯理论后验分布的特征。这样的参数值后验分布有助于推求出性质最优的最大后验估计区间。

414结果比较由前述结论可知,所选的x值越小,则区间宽度越窄。本着区间性质最优的原则,在所得后验样本点的范围内,可选择较低的x值作为起点。由图7可以看出,当x取值为4927~4939之间时,区间对称性水平和覆盖率水平达到最高,又因为x值越小,则区间宽度越窄,因此本文选择x= 4927作为本次实验的可行参数组个数。

采用GLUE和MMGLUE方法得到的预测区间指标如表2,可知以预测区间性质为评判标准的MMGLUE方法估计的预测区间对称性优良,区间宽度较窄,并且能够恰当的覆盖实测数据。

表2两种方法预测区间估计效果比较(L#q=50000,A=90%)

率定期检验期

方法

覆盖率P%区间宽度P(m3P s)对称性覆盖率P%区间宽度P(m3P s)对称性

G LUE92.933.5 4.3888.822.0 1.73

M MGLUE89.629.10.90187.519.60.83检验期典型峰值和非峰值径流预测区间如图8所示,可以看出MMGLUE方法推导的预测区间可以更精确地包含实测资料,对SMAR模型不确定性的估计效果要明显优于传统的GL UE方法。

5结语

基于Monte Carlo随机取样方法的GLUE方法原理简单,易于操作。在GLUE方法中Monte Carlo随机)

470

)

图6两种方法推求的SMAR模型部分参数后验概率分布

图7MMG LUE方法预测区间性质与x关系图(L#q=50000,A=90%)

取样方法虽然相对简单,但却具有较高探索参数空间能力,并且可以间接地对模型结构、模型输入、输出误差所造成的不确定性进行估计。但由于对模拟结果不加选择,并不能使取样朝着既定目标)))最大

)

)

471

图8两种方法检验期预测区间(L#q=50000,A=90%)

后验估计区进化。将SCE M-UA方法代替Monte Carlo随机取样,通过不断更新样本各个分区的信息,使得各条Markov链独立并行的朝着高概率密度区进化,从而推导出具有明显统计学意义的、性质最优的后验分布及其相应后验量,SC EM-UA方法的不足之处在于过度依赖于模型结构,而忽略了模型输入、输出、以及模型结构的不确定性[6]。结合两种不确定性研究方法的优势,既可以全面分析模型的不确定性,又可以推求出具有优良统计学性质的不确定区间。由于基于GL UE不确定性分析方法推求的参数后验分布的高概率区域是非连续的,因此无法准确区分其可行参数组的概率分布的区域边界,故参数可行域的阈值往往由人为确定。这样推求的参数后验分布不但不具有明确的统计学意义,还会造成所选可行参数组冗余或必要信息量的丢失。采用预报置信区间的优劣作为评判参数可行域阈值的标准,将不确定性估计效果作为参数可行的约束条件,大大改善了由主观选定的可行域阈值而造成的误差。实)

)

472

验结果表明:就SMAR模型而言,采用自适应MC MC方法改进的GLUE方法能够推导出性质更为优良的不确定区间,从而更好的分析模型参数的不确定性。

参考文献:

[1]Montanari https://www.360docs.net/doc/4c1464978.html,rge sample behaviors of the generalized likelihood uncertainty estimation(GLUE)in assessing the

uncertainty of rainfal-l runoff simulations[J].Water Resources Research,2005,41(8):W08406,doi:10.1029/

2004WR003826.

[2]Beven K,Freer J.Equifinality,data assimilation,and uncertainty esti mation in mechanistic modeling of complex

environmen tal systems using the GLUE methodology[J].Joumal of Hydrology,2001,249:11-29.

[3]Beven K,Binley A.Future of distributed models:Model calibration and uncertainty prediction[J].Hydrological Processes,

1992,6(3):279-298.

[4]Mantovan P,Todini E.Hydrological forecasting uncertainty assess ment:Incoherence of the GLUE methodology[J].Journal

of Hydrology,2006,330:368-381.

[5]Beven K,Smith P,Freer https://www.360docs.net/doc/4c1464978.html,ment on/Hydrological forecasting uncertainty assessmen t:Incoherence of the GLUE

methodology0by Pietro Mantovan and Ezio Todini[J].Journal of Hydrology,2007,338:315-318.

[6]Thiemann M,Trosset M,Gup ta H,Sorooshian S.Bayesian recursive parameter estimation for hydrological models[J].Water

Resources Research,2001,37(10):2521-2535.

[7]Vrugt J A,Robinson B A.Treatment of uncertainty using ensemble methods:comparison of sequential data assi milation and

Bayesian model averaging[J].Water Resources Research,2007,43(1):W01411,doi:10.1029P2005WR004838.

[8]Vrugt J A,Gupta H V,Bouten W,Sorooshian S.Effective and efficien t algorithm for mul tiobjective opti mization

ofhydrologic models[J].Water Resources Research,2003,39(8):1214,doi:10.1029P2002WR001746.

[9]Vrugt J A,Gupta H V,Bouten W,Sorooshian S.A shuffled complex evolution metropolis algorithm for optimization and

uncertain assessment of hydrologic model parameters[J].Water Resources Research,2003,39(8):1201,doi:10.1029P 2002WR001642.

[10]Blasone R S,Vrugt J A.Generalized likelihood uncertai nty estimation(GLUE)using adaptive Markov Chain Monte Carlo

sampling[J].Advances in Water Resources,2008,31:630-648.

[11]张尧庭,陈汉峰.贝叶斯统计推断[M].北京:科学出版社,1991.

[12]张洪刚.贝叶斯概率水文预报系统及其应用研究[D].武汉:武汉大学,2006.

[13]茆诗松,王静龙,濮晓龙.高等数理统计[M].北京:高等教育出版社,1998.

[14]邢贞相,芮孝芳,崔海燕,等.基于AM-MC MC算法的贝叶斯概率洪水预报模型[J].水利学报,2007,38(12):

1500-1506.

[15]Duan Q,Gup ta V K,Sorooshian S.Effective and efficient global optimization for conceptual rainfal-l runoff models[J].

Water Resources Research,1992,28(4):1015-1031.

[16]Vrugt J A,Diks C G H,Gupta H V,et al.Improved treatment of uncertainty in hydrologic modeli ng:Combinin g the

strengths of global opti mization and data assi milation[J].Water Resources Research,2005,41(1):W01017,doi:10.1029/

2004WR003059.

[17]李向阳.水文模型参数优选及不确定性分析方法研究[D].大连:大连理工大学,2006.

[18]李向阳,程春田,林建艺.基于BP网络的贝叶斯概率水文预报模型[J].水利学报,2006,37(3):354-359.

[19]Xiong L H,O.Connor K M.An empirical method to improve the prediction limits of the GLUE methodology in rainfal-l

runoff modeling[J].Journal of Hydrology,2008,349:115-124.

[20]王光生,夏士谆.SMAR模型及其改进[J].水文,1998,18(S1):28-30.

(下转第480页)

)

)

473

[10]许士国,刘建卫,张柏良.洪水资源利用及其风险管理研究[J].水力发电,2007,33(1):10-13.

[11]游中琼,汪新宇.浅析鄱阳湖湖口建闸控制后的防洪作用与影响[J].人民长江,2006,37(9):35-37.

[12]胡广熙.鄱阳湖建闸蓄水的可行性研究[J].水利规划与设计,2007,(1):22-24.

Investigation on potentiality and utilization approaches

of floodwater resources in Poyang Lake

X U J-i jun1,C HE N Jin1,HUANG S-i ping2

(1.Changjiang Rive r Sc ienti fic Re searc h Institute,Wuhan430010,China;

2.Changjiang W ate r Resourc es Committee,Wuhan430010,China)

Abstract:The problems of seasonal uneven distribution of water resources and continuous drought in recent yeats in the Poyang Lake are analyzed.Based on the assessment on the potentiality of floodwater resources,an idea from the vie w point of giving attention both to flood prevention and drought fighting is suggested.The core of this suggestion is to reasonably utilize the floodwa ter by means of engineering and non-engineering measures,since the floodwater of the lake is abundant.Under the conditions of flood prevention is ensured and the waterways linking the lake and rivers will not be blocked.B y establishing and effective controlling adjustable spillways at the inlets and outlets of the lake,the floodwater can be reasonably detained in the lake for mitigating the problem of seasonal drought and fulfill the need of ec o-environment.

Key words:floodwater resources utilization;potentiality assessment;poyang lake

(责任编辑:王成丽)

(上接第473页)

Application of Markov Chain Monte Carlo method based modified generalized

likelihood uncertainty estimation to hydrological models

WEI Xiao-jing,XIONG L-i hua,WAN Min,LI U Pan

(W uhan U nive rsity,W uhan430072,China)

Abstract:A modified generalized likelihood uncertainty estimation(GLUE)based on Markov Chain Monte Carlo(MC MC)method for regional hydrological model is suggested.The method uses the Markkov Chain Monte Carlo for sampling rather than the Monte Carlo random sampling to infer the posterior probability distribution and selects the behavior parameters threshold according to the property of predic tion interval.Then,the relationship between the properties of predicted interval and the threshold for choosing behavior parameters are explored.The c riteria of describing the prediction interval symmetry are also proposed.The application to the Yudaihe River watershed demonstrates that the proposed modified GLUE,comparing with the original GLUE,can derive more accurate prediction bounds and more proper estimation of the uncertainty in hydrological model.

Key words:Morkov Chain Monte Carlo method;predicted interval;contained ratio;interval width;interval symmetry

(责任编辑:王成丽) )

)

480

马尔可夫链蒙特卡罗在实践中的应用

2012年第12期 吉林省教育学院学报 No.12,2012 第28卷JOURNAL OF EDUCATIONAL INSTITUTE OF JILIN PROVINCE Vol .28(总300期) Total No .300 收稿日期:2012—11—14 作者简介:孟庆一(1989—),女,吉林长春人,新加坡籍华人,英国伦敦大学数学系,本科生,研究方向:MCMC 统计学。 浅议马尔可夫链蒙特卡罗在实践中的应用 孟庆一 (英国伦敦大学,英国伦敦) 摘要:本文概括地介绍了马尔可夫链蒙特卡罗(Markov chain Monte Carlo ———MCMC ),一种随机模拟贝叶斯推断的方法。主要的抽样方法包括吉布斯采样(Gibbs Sampling )和Metropolis -Hastings 算法。本文也对MCMC 主题和应用的拓展进行了讨论。 关键词:马尔可夫链;蒙特卡罗;Gibbs 抽样;Metropolis -Hastings 中图分类号:O29 文献标识码:A 文章编号:1671—1580(2012)12—0120—02 统计学中的贝叶斯推理在过去的几十年里有前 所未有的突破,统计学家们发现了一种非常简单,但又非常强大的模拟技术,统称为MCMC 。这种技术可以运用到各种复杂的贝叶斯范例和实际情况。 贝叶斯推理: 贝叶斯方法把所给的模型里所有的未知量的不确定性联系在一起。利用所知的信息,贝叶斯方法用联合概率分布把所有未观察到的数量综合起来,从而得出的推论。在这里,给定已知的未知分布被称为后验分布。有关未知量的推理被称为预测,它们的边缘分布称作为预测分布。 贝叶斯推理根据贝叶斯规则计算后验概率: P (H |E )= P (E |H )·P (H ) P (E )然而,在大多数情况下,所给的模型的复杂性不允许我们运用这个简单的操作。因此,我们需要使用随机模拟, 或蒙地卡罗技术来代替。概述MCMC : MCMC 采用未知量的高维分布,为难度极高的模拟复杂模型的问题提供了一个答案。 一个马尔可夫链是一个序列的随机变量X 1,X 2,X 3,...这个序列有马尔可夫的属性———给予目前的状态,未来和过去的状态是独立的。从数学公 式上看, Pr (X n +1=x |X 1=x 1,X 2=x 2,…,X n =x n )=Pr (X n +1=x |X n =x n )X i 的可能的值可数的集合S 称 为链的状态空间。 幸运的是,在马尔可夫链里,我们也有与大数定律和中心极限定理类似的定理。 另外一个问题存在于如何建立一个马尔可夫链的极限分布与所需的分配一模一样。一种可行的解决方案是Gibbs 抽样。它是基于一个马尔可夫链,其前身的依赖性是由模型中出现的条件分布所决定的。另一种可能性是Metropolis -Hastings 算法。它是基于一个马尔可夫链,其前身的依赖性是分裂成两个部分:一个是建议,另一个是接受这一建议。 Metropolis -Hastings 算法: Metropolis -Hastings 算法,可以从任何概率分布中抽取样品,只要求是可计算函数的密度成正比。在贝叶斯的应用程序中,归一化因子计算往往是非常困难的,所以,和其他常用的抽样算法一样,能够在不知道这个比例常数的情况下产生样本是Metropolis -Hastings 算法的重要特征。 该算法的总体思路是产生一系列在一个马尔可 夫链里的样品。在足够长的时间后,所生成的样品的分布与分布相匹配。 该算法基本上按如下方式工作(这是一个特殊 的例子,其建议密度是对称的情况下):首先,选择一个任意的概率密度Q (x'|x t ),这表明一个新的采样值x'给定样本值x t 。对于简单的Metropolis 算法,这个建议密度必须是对称的Q (x'| 21

基于汉密尔顿蒙特卡洛方法的随机波动模型

基于汉密尔顿蒙特卡洛方法的随机波动模型经济金融系统中潜在风险的防范和控制十分必要,而我国股票市场的波动特征在一定程度上能体现和折射出我国经济及金融系统的稳定性。因此,用以描述股市波动的模型和方法一直是学者关注的焦点。 更为重要的是,运用新的模型和方法更为准确深入地研究我国股市波动,对于投资者入市选股和制定投资决策、相关人员制定应对措施有效控制股市风险有一定的指导作用。波动模型是分析刻画经济金融系统潜在风险的重要工具。 不少国内外实证研究表明,传统的波动模型不能客观描述具有时变性和异方差特点的金融时序特征。目前研究收益率波动的主流模型有随机波动模型(SV)和ARCH族模型两大类。 SV模型在其方差方程中引进潜在的随机变量,较ARCH族模型更适合描述股市收益率的波动情况。SV模型下参数的似然函数是难解的高维积分,常用求解模型的算法是马尔科夫链蒙特卡洛(MCMC)方法。 但传统的MCMC方法具有不可避免的随机游走行为,容易使马尔可夫链在更新迭代过程中陷入局部最优,收敛效果不太理想。汉密尔顿蒙特卡洛(HMC)方法是将汉密尔顿动力学系统和Metropolis准则相结合的算法。 它通过将虚拟的动量变量引入汉密尔顿系统,利用汉密尔顿系统的内在物理特性和蛙跳技术完成状态更新。动力系统的能量守恒特性使得状态转移的概率较高,可逆性和保体积性也有助于潜在状态更新,在某种程度上减少了传统MCMC方法的随机游走行为,改进了马尔科夫链的有效性,确保算法能迅速收敛。 HMC算法充分考虑了状态空间的各敏感因素,能够遍历探索目标分布轨迹,尤其适用于目标分布处于高维状态空间或变量之间存在强相关性的情形。因其是

基于马尔可夫链蒙特卡洛方法的数据关联算法研究

第31卷第6期2007年12月 武汉理工大学学报(鸯望霾差) JournalofWuhanUniversityofTechnology (TransportationScience&Engineering) V01.3lNo.6 Dec.2007 基于马尔可夫链蒙特卡洛方法的 数据关联算法研究* 李景熹1’2’王树宗D王航宇3’ (海军工程大学海军兵器新技术应用研究所"武汉430033) (海军驻426厂军代室2’大连116005)(海军工程大学电子工程学院∞武汉430033) 摘要:数据关联是杂波环境下多目标跟踪问题的难点之一.文中提出了一种基于马尔可夫链蒙特卡洛(MCMC)方法的数据关联算法(MCMCDA),该算法通过在相应的关联事件空问中采样,可以有效地估计数据的边际关联概率,而且算法的估计精度可根据需要进行调节.仿真结果表明。在需要跟踪的目标数目较多.探测概率较低、杂波概率较高的情况下,JPDA算法因出现“组合爆炸”问题而难以在实际中应用;MCMCDA算法则能在保持较高估计精度的情况下降低计算负荷,从而能够较好地满足实时跟踪系统的要求. 关键词:数据关联;马尔可夫链蒙特卡洛;多目标跟踪;杂波 中图法分类号:TP301.6 0引言 数据关联是杂波环境下多目标跟踪问题的难点之一.一直以来,联合概率数据关联算法(JPDA)是解决数据关联问题的经典算法Ⅱ砣].但是,当目标数目增多、杂波概率提高、观测值数目增大时,目标与观测值之间的假设关联事件的数目将呈指数增长甚至出现“组合爆炸”现象,从而极大地加重了(JPDA)算法的计算负荷,使其无法满足实际工程应用的需要. 马尔可夫链蒙特卡洛方法(MCMC)是一种贝叶斯网络计算方法,广泛应用于统计学、经济计量学和计算科学领域,尤其适于处理高维和复杂概率分布问题[3。].其基本思想是通过建立一个平稳分布为,r(z)的马尔可夫链,通过某种统计采样方法(MH,Gibbs)得到平稳分布万(z)的样本,然后基于这些样本做出各种统计推断. 针对JPDA算法存在的问题,本文提出了一种基于马尔可夫链蒙特卡洛方法的数据关联算法(MCMCDA).该算法以统计抽样思想近似估计关联概率,解决了JPDA算法以解析思想处理数据关联问题所引发的“组合爆炸”问题[5].仿真算例表明,在保持较高跟踪性能的同时,MCMCDA算法大大降低了计算负荷,具有很高的工程实用价值. 1问题描述 在杂波环境下多目标跟踪问题中,如果丁个目标的跟踪门出现交集,且交集内有候选回波,这就是典型的数据关联问题.观测值落入跟踪门相交区域,说明某些观测值在不同情况下可能来源于不同目标,数据关联算法的目的就是计算每一个观测值与其可能的各种源目标相关联的概率.设口(志)一{Oi(五))筵。为k时刻所有联合事件的集合.式中:巩为侈(奄)中元素的个数 坍({) 矾(屉)一n只。(志)(1) 』皇0 为第i个联合事件.其中:以(志)为观测值7在第i 收稿a期{2007—05—22 李景熹:男,28岁,博士生.主要研究领域为武器系统仿真试验技术、机动目标跟踪’国防顼研项目资助(批准号:4010804040101)   万方数据

基于蒙特卡罗方法的气象问题应用研究

基于蒙特卡罗方法的气象问题应用研究 冯圆1,龚晓燕2 (1. 空军雷达学院 ,武汉 430019; 2. 二炮指挥学院,武汉 430012) Email:fy_science@https://www.360docs.net/doc/4c1464978.html, 摘要:基于蒙特卡罗方法在气象研究中的应用,本文分析了蒙特卡罗方法的主要计算步骤,列举了该方法在气象中应用的实例,讨论了蒙特卡罗方法在气象领域应用的局限性,展望了该方法在未来气象研究中的应用。 关键词:蒙特卡罗,气象,反演,概率 1.引言 由于气象问题研究的复杂性,人们很早就认识到在实验的计划和分析中引用统计的方法是必要的。的确,许多知名的统计专家、学者投身于将统计的方法应用于气象问题。在过去的几十年里统计科学取得了巨大进步,统计方法和计算技术的革命为气象的进一步发展开阔了前所未有的许多新境界。例如,对一切不可控制的误差源有效地进行随机化处理、考虑用复杂的统计模式解释显著的效应、用随机化方法减轻空间相关的效应等等。很多的统计学、概率的方法被广泛应用,如线性最小二乘回归的自适应方法、分对数(logit)回归模型的自适应算法、卡尔曼滤波方法等。[1] 近十年统计学在气象领域的应用得到了更“革命性”的发展,尤其是一些传统的统计方法得到了新的发展。比如,马尔科夫链蒙特卡罗法(Markov Chain Monte Carlo,MCMC)用于Bayes统计模式、柯克帕特里克(Kirkpatrick)模拟退火方法、罗斯曼(Rothman)模拟退火方法、约翰·霍兰(John Holland)提出和发展的遗传算法等等。此类算法的基本特征是,对所求问题的同一实例,用同一概率算法求解多次,得到的结果可能完全不同,甚至效果差别相当大。但通过多次执行反复求解,会使正确性和精确性达到满意的程度,而失败或误差的概率接近任意小。 本文以蒙特卡罗方法在气象研究中的应用为研究对象,探索该方法在气象应用中的发展情况,探求蒙特卡罗方法在气象领域的进一步发展和应用。 2. 蒙特卡罗方法的基本原理 2.1蒙特卡罗方法的定义 蒙特卡罗方法(Monte Carlo)是用来解决数学和物理问题的非确定性的(概率统计的或随机的)数值方法,也称为统计试验方法,是理论物理学两大主要学科的合并:即随机过程的概率统计理论(用于处理布朗运动或随机游动实验)和位势理论,主要是研究均匀介质的稳定状态。它是用一系列随机数来近似解决问题的一种方法,是通过寻找一个概率统计的相似体并用实验取样过程来获得该相似体的近似解的处理数学问题的一种手段,也就是说:当所求问题的解是某个事件的概率,或者是某个随机变量的数学期望,或者是与概率、数学期望有关的量时,通过某种试验的方法,得出该事件发生的频率,或者该随机变量若干个具体观察值的算术平均值,通过它得到问题的解。运用该近似方法所获得的问题的解更接近于物理实验结果,而不是经典数值计算结果[2]。 2.2蒙特卡罗方法的主要计算步骤 蒙特卡罗方法的计算过程需要有可得的、服从特定概率分布的、随机选取的数值序列。该方法既能求解确定性的问题,也能求解随机性问题以及科学研究中的理论问题,比如计算

用Python入门不明觉厉的马尔可夫链蒙特卡罗_光环大数据python培训

https://www.360docs.net/doc/4c1464978.html, 用Python入门不明觉厉的马尔可夫链蒙特卡罗_光环大数据python培训 在过去几个月里,我在数据科学的世界里反复遇到一个词:马尔可夫链蒙特卡洛(Markov Chain Monte Carlo , MCMC)。在我的研究室、podcast和文章里,每每遇到这个词我都会“不明觉厉”地点点头,觉得这个算法听起来很酷,但每次听人提起也只是有个模模糊糊的概念。 我屡次尝试学习MCMC和贝叶斯推论,而一拿起书,又很快就放弃了。无奈之下,我选择了学习任何新东西最佳的方法:应用到一个实际问题中。 通过使用一些我曾试图分析的睡眠数据和一本实操类的、基于应用教学的书(《写给开发者的贝叶斯方法》,我最终通过一个实际项目搞明白了MCMC。 《写给开发者的贝叶斯方法》 和学习其他东西一样,当我把这些技术性的概念应用于一个实际问题中而不是单纯地通过看书去了解这些抽象概念,我更容易理解这些知识,并且更享受学习的过程。 这篇文章介绍了马尔可夫链蒙特卡洛在Python中入门级的应用操作,这个实际应用最终也使我学会使用这个强大的建模分析工具。 此项目全部的代码和数据: https://https://www.360docs.net/doc/4c1464978.html,/WillKoehrsen/ai-projects/blob/master/bayesian/ bayesian_inference.ipynb

https://www.360docs.net/doc/4c1464978.html, 这篇文章侧重于应用和结果,因此很多知识点只会粗浅的介绍,但对于那些想了解更多知识的读者,在文章也尝试提供了一些学习链接。 案例简介 我的智能手环在我入睡和起床时会根据心率和运动进行记录。它不是100%准确的,但现实世界中的数据永远不可能是完美的,不过我们依然可以运用正确的模型从这些噪声数据提取出有价值的信息。 典型睡眠数据 这个项目的目的在于运用睡眠数据建立一个能够确立睡眠相对于时间的后验分布模型。由于时间是个连续变量,我们无法知道后验分布的具体表达式,因此我们转向能够近似后验分布的算法,比如马尔可夫链蒙特卡洛(MCMC)。 选择一个概率分布 在我们开始MCMC之前,我们需要为睡眠的后验分布模型选择一个合适的函数。一种简单的做法是观察数据所呈现的图像。下图呈现了当我入睡时时间函数的数据分布。 睡眠数据 每个数据点用一个点来表示,点的密度展现了在固定时刻的观测个数。我的智能手表只记录我入睡的那个时刻,因此为了扩展数据,我在每分钟的两端添加了数据点。如果我的手表记录我在晚上10:05入睡,那么所有在此之前的时间

融合马尔科夫链_蒙特卡洛算法的改进通用似然不确定性估计方法在流域水文模型中的应用

2009年4月 水 利 学 报 SHUILI XUEBAO 第40卷 第4期 收稿日期:2008-04-23 基金项目:国家自然科学基金重点项目(40730632);教育部新世纪优秀人才支持计划(NCET-05-0624);霍英东青年教师基金资助 项目(101077) 作者简介:卫晓婧(1984-),女,山西阳泉人,硕士生,主要从事水文水资源方面的研究。E -mail:hellomuki@to https://www.360docs.net/doc/4c1464978.html, 文章编号:0559-9350(2009)04-0464-10融合马尔科夫链-蒙特卡洛算法的改进通用 似然不确定性估计方法在流域水文模型中的应用 卫晓婧,熊立华,万 民,刘 攀 (武汉大学水资源与水电工程科学国家重点实验室,湖北武汉 430072) 摘要:本文在Blasone 研究工作的基础上,进一步提出了基于马尔科夫链-蒙特卡洛算法的改进通用似然不确定性估计方法(Markov Chain -Monte Carlo based Modified Generalized Likelihood Uncertainty Esti mation,MMGLUE)。该方法结合近年来被广泛用于推求参数后验分布的MC MC 方法,对基于Mon te Carlo 随机取样方法的传统GLUE 方法进行改进,并以预测区间性质最优为标准,对可行参数组阈值进行判断与选择,提出了衡量预测区间对称性的标准,并就预测区间性质与可行参数组个数的相关关系进行了探索。在汉江玉带河流域的实例研究证明,MMGLUE 方法较传统的GLUE 方法能够推求出性质更为优良的预测区间,从而更真实合理地反映水文模型的不确定性。 关键词:MC MC;GLUE;MMGLUE;预测区间;覆盖率;区间宽度;区间对称性 中图分类号:P333文献标识码:A 1 研究背景 近10年来,流域水文模型的不确定性研究逐渐成为当今水文界广泛研究的热点之一,各国的水文学家就此做了大量的工作[1]。Beven [2-3]于1992年率先提出了流域水文模型/异参同效性0的观点,并针对流域水文模型的不确定性研究问题提出了通用似然不确定性估计(Generalized Likelihood Uncertainty Estimation,GLUE)方法。该方法结合Monte Carlo 随机取样技术与Bayesian 框架,对由模型结构、参数冗余及相关性、输入输出误差等因素造成的不确定性进行综合分析。GLUE 方法原理简单,易于操作,但由于其自身理论结构的缺陷,越来越多的研究者就GLUE 方法提出了质疑[4-5],即并非经典的Bayesian 方法、主观判断参数可行域阈值和推求的参数后验概率分布不具有显著的统计特征。因此,基于不同假设的其他不确定性研究方法,如:基于经典Bayesian 理论的Ba RE(Bayesian Recursive Estimation)方法 [6],基于全局卡尔曼滤波理论的EnKF(Ense mble Kalman Filter )方法[7] ,多目标方法如MOSCE M (Mult-i objective Shuffled Complex Evolution Metropolis)方法[8]等被用于估计模型的不确定性工作中。然而,上述方法尽管 理论结构相对复杂,应用效果与GLUE 方法相比却并没有明显的提高。 同时期另一种基于经典Bayesian 理论的马尔科夫链-蒙特卡洛(Markov Chain Monte Carlo,MC MC)方法也被广泛应用于推求参数后验分布的研究中。特别是SCE M -UA (The Shuffled Complex E volution Metropolis Algorithm)方法[9]能够有效地探索参数空间,使Markov Chain 能够朝着高概率密度区进化,从而 推导出具有显著统计特征的水文模型参数的后验分布。 因此,Blasone [10]提出将两种方法结合起来,采用SCE M -UA 采样方法替代传统的GLUE 方法中的) 464)

蒙特卡洛模拟法

蒙特卡洛模拟法 蒙特卡洛(Monte Carlo)模拟是一种通过设定随机过程,反复生成时间序列,计算参数估计量和统计量,进而研究其分布特征的方法。具体的,当系统中各个单元的可靠性特征量已知,但系统的可靠性过于复杂,难以建立可靠性预计的精确数学模型或模型太复杂而不便应用时,可用随机模拟法近似计算出系统可靠性的预计值;随着模拟次数的增多,其预计精度也逐渐增高。由于涉及到时间序列的反复生成,蒙特卡洛模拟法是以高容量和高速度的计算机为前提条件的,因此只是在近些年才得到广泛推广。 这个术语是二战时期美国物理学家Metropolis执行曼哈顿计划的过程中提出来的。 蒙特卡洛模拟方法的原理是当问题或对象本身具有概率特征时,可以用计算机模拟的方法产生抽样结果,根据抽样计算统计量或者参数的值;随着模拟次数的增多,可以通过对各次统计量或参数的估计值求平均的方法得到稳定结论。 蒙特卡洛模拟法的应用领域 蒙特卡洛模拟法的应用领域主要有: 1.直接应用蒙特卡洛模拟:应用大规模的随机数列来模拟复杂系统,得到某些参数或重要指标。 2.蒙特卡洛积分:利用随机数列计算积分,维数越高,积分效率越高。 3.MCMC:这是直接应用蒙特卡洛模拟方法的推广,该方法中随机数的产生是采用的马尔科夫链形式。 (也叫随机模拟法)当系统中各个单元的可靠性特征量已知,但系统的可靠性过于复杂,难以建立可靠性预计的精确数学模型或模型太复杂而不便应用则可用随机模拟法近似计算出系统可靠性的预计值。随着模拟次数的增多,其预计精度也逐渐增高。由于需要大量反复的计算,一般均用计算机来完成。 应用此方法求解工程技术问题可以分为两类:确定性问题和随机性问题。解题步骤如下: 1.根据提出的问题构造一个简单、适用的概率模型或随机模型,使问题的解对应于该模型中随机变量的某些特征(如概率、均值和方差等),所构造的模型在主要特征参量方面要与实际问题或系统相一致 2 .根据模型中各个随机变量的分布,在计算机上产生随机数,实现一次模拟过程所需的足够数量的随机数。通常先产生均匀分布的随机数,然后生成服从某一分布的随机数,方可进行随机模拟试验。

蒙特卡罗马尔科夫链模拟方法MCMC

Monte Carlo Simulation Methods (蒙特卡罗模拟方法) 主要内容: 1.各种随机数的生成方法. 2.MCMC方法. 1

2 从Buffon 投针问题谈起 Buffon 投针问题:平面上画很多平行线,间距为a .向此平面投掷长 为l (l < a) 的针, 求此针与任一平行线相交的概率p 。 22[0,/2] [0,] sin ,{:sin }. l l a X A X 随机投针可以理解成针的中心 点与最近的平行线的距离X 是均匀 地分布在区间 上的r.v.,针 与平行线的夹角是均匀地分布 在区间 上的r.v.,且X 与相互独立, 于是针与平行线相交的充要条件为 即相交

3Buffon 投针问题 2sin 0022(sin ) 2l l l p P X dxd a a 于是有: 2l ap 若我们独立重复地作n 次投针试验,记 ()n A 为A 发生的次数。()n f A 为A 在n 次中出现的频率。假如我们取 ()n f A 作为()p P A 的估计,即?()n p f A 。 然后取2?() n l af A 作为的估计。根据大数定律,当n 时,..?().a s n p f A p 从而有2?()P n l af A 。这样可以用随机试验的方法求得的估计。历史上 有如下的试验结果。

4 3.14159292 180834080.831925Lazzarini 3.1595148910300.751884Fox 3.15665121832040.601855Smith 3.15956253250000.801850Wolf π的估计值相交次数投针次数针长时间(年)试验者

_马尔可夫链蒙特卡洛_MCMC_方法在估计IRT模型参数中的应用

IRT自20世纪60年代出现以来,由于其理论模型的科学性和精确性见长,一开始就受到心理和教育测量学的研究者和实际工作者的关注和兴趣。至今已成为考试技术学研究领域中最有影响的一种现代测量理论。但理论的严谨性又导致了计算的复杂性,因而也影响了IRT的普及和应用乃至它的考试研究2006年10月第2卷第4期ExaminationsResearchOct.2006Vol.2,No.4 “马尔可夫链蒙特卡洛”(M CM C)方法在估计IRT 模型参数中的应用[1][2] 王权编译【摘要】本文介绍和阐述怎样运用“马尔可夫链蒙特卡洛”(MCMC)技术,并结合Bayes方法来估计IRT的模型参数。首先简要地概述了MCMC方法估计模型参数的基本原理;其次介绍MCMC方法估计模型参数的一般方法,涉及Gibbs抽样、取舍抽样、Metropolis-Hastings算法等概念和方法;最后以IRT的“二参数逻辑斯蒂”(2PL)模型为例,重点介绍了用“Gibbs范围内的M-H算法”估计项目参数(β1jβ2j)的算法过程。结束本文时还解说了MCMC方法的特点。 阅读本文需具有随机过程、Markov链、Bayes方法等概率论的基本知识。 【关键词】项目反应理论 马尔可夫链蒙特卡洛Gibbs抽样取舍抽样作者简介王权,教授,浙江大学教育系。浙江杭州,310028。45

《考试研究》第2卷第4期 发展速度。令我们欣喜的是在20世纪90年代,国外统计学家又推陈出新地提出了参数估计的新方法,使IRT的应用和发展又迈出了新的一步。 模型参数的估计是IRT的核心内容。以往的参数估计方法主要有“条件极大似然估计”(CMLE)、“联合极大似然估计”(JMLE)、“边际极大似然估计” (MMLE)和“条件期望—极大化算法”(E-MAlgorithm)等,大致上后一种算法均是前一种算法的改进[3]。E-M算法是由R.D.Bock和M.Aitkin于1981年创立,它是以MMLE方法为基础发展而成。在E-M算法中,E步要涉及精确的数字积分计算,或者在M步要涉及偏导计算,当模型较复杂时,计算就十分困难。加之,它还难以将项目参数估计中的“不可靠性”(uncertainty)结合进能力参数估计时不可靠性的计算;反之亦然。 “马尔可夫链蒙特卡洛”(MarkovChainMonteCarlo,MCMC)方法是一种动态的计算机模拟技术,它是根据任一多元理论分布,特别是根据以贝叶斯(Bayes)推断为中心的多元后验分布来模拟随机样本的一种方法。它在估计IRT模型参数的应用中,一方面继承了以往估计能力参数和项目参数时所采用的“分而治之”(divide-and-conquer)的策略,采用能力参数与项目参数交替迭代计算的方法生成Markov链;然后采取迥然不同于极大似然方法的思路,充分发挥计算机模拟技术的优势,采集充分大的状态样本,用初等的方法来估计模型参数,绕开了E-M算法中的复杂计算,从而提高了估计的成功率。 —“Gibbs采样1992年统计学家J.H.Albert首先将一种特殊的MCMC方法—— 法”应用于IRT问题的研究。现在它已被推广应用于多种复杂的IRT模型,在应用于大范围的教育测验评价中尤显它的长处。本文主要介绍MCMC方法的基本原理和基本方法,为说明方便,只列举应用于较为简单状况的二参数逻辑斯蒂模型,它是进一步推广应用的基础。 一、MCMC方法的基本原理 用MCMC方法估计IRT的模型参数的基本思路是:首先定义一Markov链,M0,M1,M2,…,Mk,…状态Mk=(θk,βk),k=1,2,…其中θ为能力参数,β为项目参数,θ和β可以为多维;然后根据Markov链模拟观测(即模拟状态);最后用所得的模拟观测推断参数θ和β。在一定的规则条件下,随着k的增长,状态Mk的46

蒙特卡洛抽样方法

重要抽样法(3.5.3):积分可以代表一个参数的期望值,因此,在可靠性评估中使用蒙特卡洛法去评估积分和充分性参数是等价的。重要抽样法可以用评估积分的问题来说明。 考虑以下积分: 1 ()I g x dx =? (1-1) 使用估计期望值的方法,可以将I 表示如下: 1 1(())()N i i I E g U g x N ==≈∑ (1-2) U 表示[0,1]区间上均匀分布的随机数序列,()g U 表示在均匀分布区间内产生随机数,并带入()g x ,结合上式计算积分。如果抽样的概率密度函数从均匀分布变成了()f x ,()f x 与()g x 具有相同的曲线形状,那么所产生的对于积分式结果影响较大的随机数出现概率也会更大。()f x 称为重要抽样密度函数。 如果()f x 与()g x 具有相似的形状,那么积分值的方差也越小。 分层抽样法(3.5.4):分层抽样法的思想与重要抽样法相似,为了减小方差,尽量地使更多的样本落在对模拟结果有重要影响的区间内。分层抽样法的方差比在整个区间上使用平均值估计法更小,并且当j N 满足下式时,方差取得最小值。 1j j j m j j j d N N d σσ==∑ (1-3) j N 表示第j 号区间内取点的个数,j σ表示第j 号区间内采用均匀分布抽样 的方差,j d 表示第j 号区间的长度。由上式可以看出,当j j j N d σ∝时,总体的方差取值最小。 在电力系统中,年度负荷曲线上的高负荷水平点对不可靠参数的评估比低负荷点影响更大,因此,分层抽样法适用于基于年度负荷曲线的可靠性评估。 截断抽样法(3.5.6):这种方法适用于两状态变量和小概率事件。电力系统可靠性评估中,系统元件状态可以用两个状态变量来表示(0和1),并且系统元件发生故障是小概率事件。 可靠性评估中的三种模拟方法: 状态抽样法:系统的状态取决于所有组成元件的状态,并且每个元件的状态都可以通过元件状态的概率分布来抽样决定。 每个元件的状态可以用[0,1]区间上的均匀分布来描述。假定元件具有故障和正常运行两个状态,并且元件故障是相互独立的事件。设i S 表示第i 个元件的状

蒙特卡洛模拟法简介

蒙特卡洛模拟法简介 蒙特卡洛(Monte Carlo)模拟是一种通过设定随机过程,反复生成时间序列,计算参数估计量和统计量,进而研究其分布特征的方法。具体的,当系统中各个单元的可靠性特征量已知,但系统的可靠性过于复杂,难以建立可靠性预计的精确数学模型或模型太复杂而不便应用时,可用随机模拟法近似计算出系统可靠性的预计值;随着模拟次数的增多,其预计精度也逐渐增高。由于涉及到时间序列的反复生成,蒙特卡洛模拟法是以高容量和高速度的计算机为前提条件的,因此只是在近些年才得到广泛推广。 这个术语是二战时期美国物理学家Metropolis执行曼哈顿计划的过程中提出来的。 蒙特卡洛模拟方法的原理是当问题或对象本身具有概率特征时,可以用计算机模拟的方法产生抽样结果,根据抽样计算统计量或者参数的值;随着模拟次数的增多,可以通过对各次统计量或参数的估计值求平均的方法得到稳定结论。 蒙特卡洛模拟法的应用领域 蒙特卡洛模拟法的应用领域主要有: 1.直接应用蒙特卡洛模拟:应用大规模的随机数列来模拟复杂系统,得到某些参数或重要指标。 2.蒙特卡洛积分:利用随机数列计算积分,维数越高,积分效率越高。 3.MCMC:这是直接应用蒙特卡洛模拟方法的推广,该方法中随机数的产生是采用的马尔科夫链形式。 蒙特卡洛模拟法的概念 (也叫随机模拟法)当系统中各个单元的可靠性特征量已知,但系统的可靠性过于复杂,难以建立可靠性预计的精确数学模型或模型太复杂而不便应用则可用随机模拟法近似计算出系统可靠性的预计值。随着模拟次数的增多,其预计精度也逐渐增高。由于需要大量反复的计算,一般均用计算机来完成。

蒙特卡洛模拟法求解步骤 应用此方法求解工程技术问题可以分为两类:确定性问题和随机性问题。解题步骤如下: 1.根据提出的问题构造一个简单、适用的概率模型或随机模型,使问题的解对应于该模型中随机变量的某些特征(如概率、均值和方差等),所构造的模型在主要特征参量方面要与实际问题或系统相一致 2 .根据模型中各个随机变量的分布,在计算机上产生随机数,实现一次模拟过程所需的足够数量的随机数。通常先产生均匀分布的随机数,然后生成服从某一分布的随机数,方可进行随机模拟试验。 3. 根据概率模型的特点和随机变量的分布特性,设计和选取合适的抽样方法,并对每个随机变量进行抽样(包括直接抽样、分层抽样、相关抽样、重要抽样等)。 4.按照所建立的模型进行仿真试验、计算,求出问题的随机解。 5. 统计分析模拟试验结果,给出问题的概率解以及解的精度估计。 在可靠性分析和设计中,用蒙特卡洛模拟法可以确定复杂随机变量的概率分布和数字特征,可以通过随机模拟估算系统和零件的可靠度,也可以模拟随机过程、寻求系统最优参数等。 蒙特卡洛模拟法的实例 资产组合模拟: 假设有五种资产,其日收益率(%)分别为 0.02460.0189 0.0273 0.0141 0.0311 标准差分别为 0.95091.4259, 1.5227, 1.1062, 1.0877 相关系数矩阵为 1.0000 0.4403 0.4735 0.4334 0.6855 0.4403 1.00000.7597 0.7809 0.4343 0.4735 0.75971.0000 0.6978 0.4926 0.4334 0.78090.6978 1.0000 0.4289 0.6855 0.43430.4926 0.4289 1.0000 假设初始价格都为100,模拟天数为504天,模拟线程为2,程序如下%run.m

量子力学中的蒙特卡洛方法

3.5在量子力学中的蒙特卡洛方法 量子力学中的波函数是直接与几率密度相关的量, 与波函数相关的分布密度函数具有关系式 x d t x c x d t x p G G G G 2),(),(Ψ=. 波函数),(t x G Ψ也被称为几率幅度。因此人们很自然地想到可以利用蒙特卡洛方法来求解量子力学问题。 3.5.1量子力学回顾 量子力学的基本方程是薛定格方程 t i t x H ??Ψ=Ψ= G ),(? . 其哈密顿量算符 H 可以写为 V m H ?2?2 2 +??==. 从费曼的观点来看,一个粒子在某个时刻t ,某空间位置G x 的波函数应当是来自所有的初始态位置“传播”到该时空点的幅度。即 ()()()00000,,;,,x d t x t x t x D t x F G G G G G Ψ=Ψ∫+∞∞?. 上式中的称为“传播子”。该传播子可以表示为 (D x t x t F G G ,;,0 ) ()D x t x t x i H t t x F (,;,)exp G G G = G 0000=?? . 如果()x n G ψ为与时间无关的哈密顿量 H 的本征态波函数,则它满足的薛定格方程为 ()()x E x H n n n G G ψψ=?, 波函数也可以用展开式表示为 ()()x t c t x n n n G G ψ∑=Ψ)(,. 其中c 。由这些表达式,我们得到传播子的一个精确表示为 ()()t x x x d t n n ,)(* G G G Ψ=∫+∞ ∞ ?ψ()()()= =G G G G G G /0*0/00||0,;,t iE n n n n n t iE n F n n e x x x e x t x t x D ??∑∑===ψψψψ. 假定该等式在延拓到t 为虚值时仍成立,令t i =?τ,则有 ()()()= G G G G /0*000,;,τψψn E n n n F e x x t x t x D ?∑==.

蒙特卡洛模拟法及其Matlab案例

一蒙特卡洛模拟法简介 蒙特卡洛(Monte Carlo)模拟是一种通过设定随机过程,反复生成时间序列,计算参数估计量和统计量,进而研究其分布特征的方法。具体的,当系统中各个单元的可靠性特征量已知,但系统的可靠性过于复杂,难以建立可靠性预计的精确数学模型或模型太复杂而不便应用时,可用随机模拟法近似计算出系统可靠性的预计值;随着模拟次数的增多,其预计精度也逐渐增高。由于涉及到时间序列的反复生成,蒙特卡洛模拟法是以高容量和高速度的计算机为前提条件的,因此只是在近些年才得到广泛推广。 这个术语是二战时期美国物理学家Metropolis执行曼哈顿计划的过程中提出来的。 蒙特卡洛模拟方法的原理是当问题或对象本身具有概率特征时,可以用计算机模拟的方法产生抽样结果,根据抽样计算统计量或者参数的值;随着模拟次数的增多,可以通过对各次统计量或参数的估计值求平均的方法得到稳定结论。 二蒙特卡洛模拟法求解步骤 应用此方法求解工程技术问题可以分为两类:确定性问题和随机性问题。 解题步骤如下: 1.根据提出的问题构造一个简单、适用的概率模型或随机模型,使问题的解对应于该模型中随机变量的某些特征(如概率、均值和方差等),所构造的模型在主要特征参量方面要与实际问题或系统相一致 2 .根据模型中各个随机变量的分布,在计算机上产生随机数,实现一次模拟过程所需的足够数量的随机数。通常先产生均匀分布的随机数,然后生成服从某一分布的随机数,方可进行随机模拟试验。 3. 根据概率模型的特点和随机变量的分布特性,设计和选取合适的抽样方法,并对每个随机变量进行抽样(包括直接抽样、分层抽样、相关抽样、重要抽样等)。 4.按照所建立的模型进行仿真试验、计算,求出问题的随机解。 5. 统计分析模拟试验结果,给出问题的概率解以及解的精度估计。 三蒙特卡洛模拟法的应用领域 蒙特卡洛模拟法的应用领域主要有: 1.直接应用蒙特卡洛模拟:应用大规模的随机数列来模拟复杂系统,得到某些参数或重要指标。 2.蒙特卡洛积分:利用随机数列计算积分,维数越高,积分效率越高。 3.MCMC:这是直接应用蒙特卡洛模拟方法的推广,该方法中随机数的产生是采用的马尔科夫链形式。 四资产组合模拟 假设有五种资产,其日收益率(%)分别为 0.0246 0.0189 0.0273 0.0141 0.0311 标准差分别为 0.9509 1.4259, 1.5227, 1.1062, 1.0877 相关系数矩阵为 1.0000 0.4403 0.4735 0.4334 0.6855 0.4403 1.0000 0.7597 0.7809 0.4343 0.4735 0.7597 1.0000 0.6978 0.4926 0.4334 0.7809 0.6978 1.0000 0.4289 0.6855 0.4343 0.4926 0.4289 1.0000 假设初始价格都为100,模拟天数为504天,模拟线程为2,程序如下 %run.m ExpReturn = [0.0246 0.0189 0.0273 0.0141 0.0311]/100; %期望收益

相关文档
最新文档