现代气象统计方法

一、EOF

1、寻找Vk特征向量的原则:使得这些空间型为基向量展开该场时,场的总误差方差达最

小,或使空间型和时间系数表示出场的总方差最小。

2、场的总方差:用特征值表示

方差贡献率计算公式:

Vk的方差贡献率:,前K个空间型的累积方差贡献率

3、特征向量性质:相互正交,各自归一

时间系数性质:相互正交,各自的方差等于对应的特征值,方差自大到小排列。

4、写出标准化距平场EOF主要结果(特征向量、时间系数)的两种表达式:

对于场的EOF展开,分量形式:,i=1,2,3.....m, t=1,2,3.....n

矩阵形式:

对于空间型的表示,1、Vk图,采用距平为分析对象,只给出分布形式,其分量值大小没有意义。2、图,取为新的空间型,如果分析对象是标准化的这时的图又是每个格点上的原变量与第k个主成分的相关系数分布图,值在-1到+1之间,所以,图也称特征向量图或EOF 图,它的空间分布形式与Vk图完全一样,但包含了更多的数量信息。

5、时空转换技术:当空间格点m远大于样本数n时,计算矩阵的特征根很困难,使用时空转换技术。

6、求特征值、特征向量、方差贡献率、相关系数

二、主成分分析(PCA)

1、概念:对于反映某现象的所有变量(设为m个,m≥2),构成k个新变量,一则要求k 各新变量相互相关,二则要求k个新变量在反映现象的信息尽可能保持原有信息的原则下,使k<m,"信息"的大小用离差平方和或方差来衡量。这种方法称为主成分分析或主分量分析。

2、主成分的定义和性质:

在EOF展开中,把m个格点上给定值的气象变量场看作PCA里的m维随机变量,则EOF 展开的时间序列完全满足PC的定义,就死这里要寻求的新变量,就是第k个主成分。

性质1:主成分的协方差矩阵是对角矩阵

性质2:所有原变量方差之和等于所有主成分方差之和

性质3:第k个主成分与第i个原变量之间的相关系数

性质4:

性质5:

3、EOF和PCA的功能。EOF:经验正交函数,从气象变量场的资料集中识别出主要的相互正交的空间分布。PCA:主成分分析,从多变量序列中提取主要的相互独立的新变量序列,用少数几个新变量序列反映原多个变量的变化信息,或者说降低资料的自由度和维数。

4、PCA和EOF的异同

在原理上,气象变量场的EOF展开和PCA的出发点原本是不同的,只有当被分析场是零均值时,两者的算法是相同的,由于大多数气候变率场分析的对象是距平场,是零均值的,所以一般将EOF和PCA看做同一个方法。

5、第k个归一化的特征向量图和场的每个格点序列与第k个主成份序列之间的相关系数分布图有何关系?

把时间系数标准化之后,取为新的空间型,如果分析对象是标准化的这时的图又是每个格点上的原变量与第k个主成分的相关系数分布图,值在-1到+1之间,所以,图也称特征向量图或EOF图,它的空间分布形式与Vk图完全一样,但包含了更多的数量信息。

6、某个特征向量图与以哪个格点为定点的"一点相关图"最相似?"一点相关图"是以研究气象场上的一个点为固定点,定点的气象变量序列与其他格点变量序列间的相关系数分布图,Vk图与以它的分量绝对值达最大的点为定点的"一点相关图"最相似。

三、RFOF

1、概念:对k个EOF再做调整的过程在数学上是在他们之间再做线性化,几何形象是在做旋转。

2、EOF和REOF用途和优缺点:EOF(PCA)能够将气象变量场或多维随机变量的时间与空间变化分离出来,并且用尽可能少的模态表达出它们主要的空间和时间变化,是便表示场的空间相关结构或多变量综合信息的有用方法。EOF在有些情况下,往往得不到接近实际的空间结构或多变量的相互关系,REOF能够客服。

3、旋转中截取多少个模态旋转是如何确定的?

①使前k个EOF和PC对原场的累计方差贡献率达一定量。

②选≥1对应的EOF和PC参考旋转,这个规则的基础是原变量是标准化的,每个原变量的方差为1,主成分的方差为。

③在特征值随序号变化的曲线上,重大的不连续性点作为有用信息与噪声分割点,有用信息参考旋转,称为Scree法,Graddock建议在特征自然对数曲线上尾部变为线性时为分割点,分割点的序号为k。

3、旋转的原则(旋转EOF分析问题的提法)是什么?

保持k个空间型累计解释原场总方差的百分率保持不变,而单个空间型尽量反映场的局部相关结构,在k个主成分之间再做调整。使他们累计反映出m个原变量的方差数量不变,而使调整后的每个主成分能侧重反映出某些原变量的信息(方差)

4、REOF结果的分析

表示方法:载荷向量Ak。很好的揭示了局部相关,第一EOF方差贡献率是无条件最大的,旋转后方差贡献率一定变小,一般而言,前几个特征成分旋转后方差贡献率变小,序号较大的特征成分方差变大。

未旋转:在整个区域有较多中心,绝对值分布相对对称

旋转:中心个数减少,中心绝对值增大。更多地反映局部地区的变化。

四、奇异值分解(SVD)

1、在气象研究中的功能:可分离出两个场内变量的线性组合,使线性组合的新变量成对地线性相关。

2、SVD模态的性质:每个场内部的空间型相互正交;只有同一对SVD模态的两个时间系数序列之间存在相关,不属于同一对的时间序列之间不相关。

3、SVD中两个场之间总的联系用什么衡量?

两个场整体上的相关程度用S场上Ns个格点上的样本序列与Z场Nz个格点上的样本序列之间协方差的平方和表示,即Csz或Czs矩阵的模方来表示。

4、两个场之间交叉协方差矩阵的奇异值有什么关系?

由矩阵奇异值分解的性质,C矩阵的模方等于所有奇异值的平方和,

,分解到各个SVD模态的部分为。

5、每一对SVD模态解释两个场总协方差平方和的百分率,以及解释左右场各自方差的百分率怎么确定?

第k对SVD模态解释总协方差平方和和数量为,解释两个场总协方差平方和的百分率为,

为场对S场的方差贡献率,为Qk场对Z场的方差贡献率。

6、SVD原理保障反映出两个场之间的联系达最大,而非方差量最大:原因是SVD方法的原理是保障展开系数之间的协方差达最大,而不是保障展开的误差平方和达最小。

7、SVD结果的变现形式:左、右奇异向量图,左、右异类相关图

左右同类和异类相关图与左右奇异向量图有何关系?

左右异类相关图与左右奇异向量图是平行的或成比例的,即等于某个与格点无关的常数乘以Pk,等于常数乘以Qk,而左右同类相关图与Pk,Qk无简单关系。

五、谐波,滤波,小波

1、频谱:X(t)的傅氏变换X(f),称为X(t)的频谱。

2、能量谱:x(t)在(-∞,∞)时间内的总能量为

,是x(t)中频率介于f和f+df的周期成分对总能量的贡献,为功率谱,表示频率f处的能量密度。

3、随机过程:一族取决于时间t的无线多个随机变量或随机向量。在一个固定时间t,一维随机过程是一个随机变量Xt,称为随机过程的一个截口,随机过程也是无限多个截口的集合。

严平稳随机过程:随机过程所有统计性质与时间t无关。

弱平稳随机过程:随机过程的数学期望和方差是与时间无关的常数,自协方差函数和自相关函数只与时间间隔tao=t2-t1有关。

白噪声过程:是一种特殊的,很有用的平稳随机过程,它的数学期望值为零,方差是常数,没有任何记忆力,每个时间截口与其他截口相互独立。

中心化:资料处理为距平。

标准化:消去量纲不同的影响,变成同一水平无单位量。

标准化的必要性:气象变量场X的各个分量可能单位不同,或单位相同但标准下差不同,一般标准差在中纬大,低纬小,当分析对象X的各分量的标准差相差大时,分析结果会重点反映标差准大的分量信息,影响分析结果。

正态化:使资料正态分布,便于统计检验。

正态化的必要性:各类统计预报模型和统计检验方法要求资料是符合正态分布。

日降水和少雨地区的月降水通常偏态

资料正态化处理的方法:立方根或四次方根;双曲正切转换;化为有序数后的正态转换。4、平稳随机过程的功率谱:

如果X(t)是一个平稳随机过程,假设是中心化的,μ=0,则E(XtXs)=c(t-s)=c(tao), 则有

只含有参数f,与时间无关,g(f)即为平稳随机过程的功率谱,可见,对于平稳随机过程,它的功率谱与自协方差函数互为傅氏变换和逆变换。

5、滤波器

低通:从原序列中滤出低于某个频率成分

带通:从原序列中滤出两个频带之间的一个频带成分的频率成分

二项式滤波:取低通滤波器的权重Ck与二项式系数成正比,并取所有Ck之和为1,可以完整的反映不同频率成分经过滤波器运算引起的振幅,位相,功率变化。

高斯滤波:低通,取权重系数为正态分布。

6、小波分析

傅里叶分析:频谱、功率谱、滤波,缺陷:纯频域分析,在频率域内分解,描述时间函数的频率局部化特征,对于给定某个频率或周期,不能给出振幅,功率贡献随时间变化的信息;某频率的位相也是变化的。

小波分析:能描述时间序列在局部时段的频率特征,能表示强度和初相位随时间变化。7、检验突变的方法:滑动T检验法,滑动f检验,Yamamoto法,Mann-Kendall法(蒙特卡洛)

相关文档
最新文档