股票市场多重分形性的统计描述

股票市场多重分形性的统计描述
股票市场多重分形性的统计描述

中国股市运行的分形特征实证解析

经济研究导刊 ECONOMIC RESEARCH GUIDE 总第54期2009年第16期Serial No.54 No.16,2009中国股市在2007—2008年度出现了罕见的暴涨暴跌过程,从最高6100多点跌到1600多点,跌幅达75%以上,给中国的广大投资者带来了巨大的损失。同时, 使得中国的资本市场几乎丧失基本的融资功能。暴涨或暴跌都不正常,无论是管理者还是投资者都应该从中吸取教训,清楚地认识中国股市运行的规律,以作前车之鉴。为此,本文对暴涨暴跌期间的上证指数序列进行了分形估计,并对估计结果进行了进一步的分析研究。 一、分形分布及其参数估计 在经济文献中,分形分布(fractaldistribution )又称为Pareto 分布、Pareto-Levy 分布或Stable-Pareto 或stable (稳定或平稳)分布。该分布的性质最早是由Levy (1937)推导出来的,而他的工作又是以Pareto (1896)有关收入分布的研究工作为基础的。 若正数,s 1,s 2,s 具有加法平稳性s 1a +s 2a =s a ,则称满足关系f (s 1X +s 2X )=f (sX )的随机变量为X 平稳过程,其分布称为平稳分布。柯西分布和高斯分布分别是a =1和a =2时的解,因此,柯西分布和高斯分布都是平稳分布。 Levy 发现,当0<a ≤2时,满足f (s 1X +s 2X )=f (sX )的通解的对数特征函数为: ln φ(t )=ln (E exp (itX )) = i δt -γa t a 1-i βt t tan πa 2 ,a ≠1i δt -γt 1+i β2π t t ln t t t ,a =t t t t t t t t t t t 1(1) 其中X 为随机变量,t 为任意实数,i 为虚数单位。分形分布的特征函数由四个参数决定,即α、β、γ、δ,并且α、β是两个关键参数,四个参数的不同组合产生不同的分形分布形式。 所以分形分布就是一种平稳分布,而分形分布的尾分布(尾部概率或尾部概率密度)具有负幂形式,而负幂分布又具有标度不变性,即分形,与后来M andelbrot 发现的分形概念具有相同的内涵,以及由于M andelbrot 对Levy 平稳分布的广泛使用所起的重要作用,所以Levy 平稳分布又称为分形分布。需要澄清的是,平稳与分形是不同的概念,比如独立正态变量相加依然服从正态分布,虽然相加以前的正态分布与相加以后的正态分布在形状上相似,但这是两个形体之间的相似,而不是形体内部之间的相似,所以平稳分布是相似的,但不是自相似。作为平稳分布的分形分布只有在尾部区域才具有自相似性,亦即分形。 分形分布各参数的取值范围及意义: 1.稳定性指数或特征指数或尾指数a ∈[0,2],既刻画了分布的尖峰、 厚尾程度,也决定分布的矩、随机变量之和的分布及其标准化等特征,最重要的是反应了分形分布长尾区域的自相似性或标度不变性,这一点是之所以称为“分形”分布的关键所在。当a =2时,分形分布退化成正态分布;当0<a <2时,分形分布具有比正态分布更厚更长的尾部,而且a 值越小,远离中心位置的观察值越多,分布的尾部相比正态分布而言就越厚,尾部也越长。当1≤a <2时,有稳定均值,但方差不确定或无穷,只有当a =2时,方差有限且稳定,且方差为2γ2。因此,当a <2时,作为离中趋势或风险尺度的样本方差近乎无意义;当0<a ≤1时,连均值都不存在,此范围中的a 较为罕见。在 1<a ≤2的参数范围内,有稳定均值,此范围中的非整数a 对 应于具有长程相关性和统计上自我相似特征的有偏布朗运动。 2.偏斜指数β∈[-1,+1],决定着分形分布的对称程度。当β=0时,分形分布关于δ对称;当α≠1,β>0时,分形分布为左偏,分布是右厚尾的;当α≠1,β<0时,分形分布为右偏,分布左厚尾;当α=1,β>0时,分形分布为右偏;当α=1,β<0时,分形分布为左偏。β的绝对值越大,分布的偏斜程度就越大。当α=1,β=0时,即为柯西分布。柯西分布是均值和方差都 收稿日期:2009-02-18 作者简介:钟春仿(1977-),男,湖北天门人,博士研究生,从事数理金融研究。中国股市运行的分形特征实证解析 钟春仿 (东北财经大学数学与数量经济学院,辽宁大连116025) 摘要:在分形分布的基础上,对中国2006—2008年来的上证指数日收益率数据进行了分形分布的参数拟合估计,估计结果表明,上证指数收益率呈现明显的尖峰厚尾的特征。就上述现象进行详细的分析,有助于对中国股市泡沫形成的内在机理和规律获得一个更直观更贴近现实的认识。 关键词:对数收益率;分形;中国股市中图分类号:F830.91 文献标志码:A 文章编号:1673-291X (2009)16-0072-02 72——

股票市场的分形特征和股票价格的FIGARCH模型研究

股票市场的分形特征和股票价格的FIGARCH模型研究 股票市场投资的目的是获取最大投资收益,然而收益与风险相伴,在收益与风险之间决策常常是不容易的。传统的股票投资理论认为股票市场是有效的,均衡的,收益是风险的线性函数,收益的波动符合布朗运动,收益的分布是独立同分布的,方差和均值是稳定的。实际情况却是股票市场影响因素以及各因素之间相互作用关系复杂,受投资者个人及群体心理因素影响明显,股票的波动以及收益与风险的关系常常是非线性的,非均衡的,收益的方差和均值是自相关的、不稳定的,收益的波动符合分形布朗运动,表现出分形和混沌的特征。本文分析了股票市场的波动的非线性、非均衡、分形和混沌特征,建立并检验了几种股票的分形差分异方差时间序列模型。 第一章回顾了股票定价理论的发展过程,介绍了九种在不同阶段具有代表性的股票定价理论,为把握股票定价理论的发展趋势,为以后各章的研究奠定基础。第二章分析了股票市场波动的一般特征和非线性非均衡特征,分析了股票投资收益和风险的影响因素,提出“虚拟性”、“风险性”、“流动性”和“投机性”是股票市场的核心特征。提出股票市场是远离平衡的、具有分形特征的非线性系统。投机是股票市场存在的前提和股票市场的天性。 第二章分析了有效市场理论产生的背景,就有效市场理论成立的基本假设进行了检验,提出股票价格收益是不稳定的随机序列,收益分布不是正态分布,股票价格收益表现出非性,序列自相关性,异方差性。提出有效市场理论失灵的主要原因是投资者的非理性行为,信息反映的羊群效应,投资者存在反应过度和反应不足现象,股票市场的非均衡特征和股票市场的非线性特征。第四章分析并检验了股票市场的分形混沌特征,推导了投资函数,计算了表征股票市场分形特征的Hurst指数,关联维和最大Lyapunov指数,分析了股票价格的自相似性、长期记忆和循环周期,分析了股票价格的波动对初始条件的敏感性,提出中国股票市场具有混沌分形的特性,用传统的方差法度量股票风险是无效的,必须使用混沌分析能够理论来刻画股票收益的风险,建立收益模型。第五章介绍了股票价格的分形时间序列模型,介绍了检验时间序列平稳性的方差分析和单位根检验方法以及非平稳的处理方法,ARFIMA,GARCH和FIGARCH模型的建模方法和股票市场的分形特征和股票价格的FIGARCll模型叭

分形分析的几个重要原理

分形分析的几个重要原理 金融市场的分形分析方法依据分形的基本原理和市场 的分形特性,其方法最大的优点是可以准确完整地界定市场的主流趋势性质,也就是市场变化的稳定方向;并且可以较准确地界定市场的趋势边界以找到最好的进场位置,从而融入并顺应趋势交易。它的可信度以及客观全面的分析方法源自几个重要的原理。 其一是市场的极端最大化原理。这主要指的是市场的自激励、自扩张、自强化作用。这是众多的交易者可以直接从市场中经验到的作用。作为开放系统的金融交易市场,只要有机会,只要出现明确的趋势,就会吸引交易者并活跃成交。一个盈利者会带动3—5个交易者入市,而3—5个交易者同样会成倍数地吸引更多的交易者,使趋势不断被强化。最后,所有对趋势有推动作用的题材和资金全部被发掘完毕,市场走到自己的反面,也就是极端最大化的地方。在这个地方,市场对立的交易双方会进行性质截然相反的交换(交易就是交换),而迅速改变市场性质。这就是物极必反。但是相反的交换一旦开始,就会立即扭转为相反的趋势。相反的交换又会产生新的自激励作用,新的趋势又开始运行了。市场就是以这种形式寻求价值发现的。分形是有主体和层次的。在极端最大化的地方,分形的主体和层次会发生极其强烈的分

形矛盾,市场会用分形来预示市场到了极端最大化的地方。分形结构、分形边界、分形空间等都可以明确预示市场的极端。但在趋势未到极端最大化之前,任何对趋势的主观臆断都是违背市场真相的。市场是不受控制的,没有谁可以改变市场的极端最大化的作用机制。有了这样的原理机制,就可以运用分形对市场的趋势做完整的界定,找到市场的主流趋势分形,而避免发生根本的市场错误。 其二,偏差与反偏差的必然交替原理。趋势绝不是一条直线,市场更不是通常的线性事物。对于主流趋势而言,市场由偏差和反偏差组成。与趋势同方向的偏差会不断出现,也就是趋势在运行中短时间向前走得太远的偏差,或者叫正偏差。反偏差就是向趋势相反方向出现的偏差。反偏差相对于趋势而言是一种错误。市场总会诱惑许多交易者向反偏差方向交易而犯这样的错误。对于交易者而言,交易的根本目标就是市场的错误,也是其他交易者的错误。在对手交易错了的地方,自己才会有机会。而反偏差就是市场的错误。市场由一连串的反偏差所组成。反偏差总会发生的,其根源在与人性和人性所组成的市场本性。它的出现是必然的。所以一个趋势总是给交易者许多机会,并附带许多陷阱。有了这样的原理,交易者就有许多机会可以加入趋势的行列,并且有许多机会可以纠正自己的错误。所以人人有机会,时时有机会。

分形理论

分形理论及其在水处理工程中的应用 凝聚和絮凝是混凝过程的两个重要阶段, 絮凝过程的完善程度直接影响后续处理(沉淀和过滤)的处理效果。但絮凝体结构具有复杂、易碎和不规则的特性,以往对絮凝的研究中由于缺乏适用的研究方法,通常只考虑混凝剂的投入和出水的混凝效果, 而把混凝体系当作一个―黑箱‖, 不做深入研究。即使考虑微观过程, 也只是将所有的胶粒抽象为球形, 用已有的胶体化学理论及化学动力学理论去加以解释[1],得出的结论与实验中实际观察到的胶体和絮凝体的特性有较大的差别。尽管有的研究者在理论推导和形成最终的数学表达式时引入了颗粒系数加以修正, 但理论与实验结果仍难以一致。而分形理论的提出,填补了絮凝体研究方法的空白。作为一种新兴的絮凝研究手段, ,分形理论启发了研究人员对絮凝体结构、混凝机理和动力学模型作进一步的认识。 1 分形理论的概述 1.1 分形理论的产生 1975年[2],美籍法国数学家曼德布罗特(B. B. Mandelbrot)提出了一种可以用于描绘和计算粗糙、破碎或不规则客体性质的新方法,并创造了分形(fractal) 一词来描述。 分形是指一类无规则、混乱而复杂, 但其局部与整体有相似性的体系, 自相似性和标度不变性是其重要特征。体系的形成过程具有随机性,体系的维数可以不是整数而是分数[3]。它的外表特征一般是极易破碎、无规则和复杂的,而其内部特征则是具有自相似性和自仿射性。自相似性是分形理论的核心,指局部的形态和整体的形态相似,即把考察对象的部分沿各个方向以相同比例放大后,其形态与整体相同或相似。自仿射性是指分形的局部与整体虽然不同, 但经过拉伸、压缩等操作后, 两者不仅相似, 而且可以重叠。 分形理论给部分与整体、无序与有序、有限与无限、简单与复杂、确定性与随机性等概念注入了新的内容,使人们能够以新的观念和手段探索这些复杂现象背后的本质联系。 1.2 絮凝体的分形特性 絮凝体的成长是一个随机过程, 具有非线性的特征。若不考虑絮凝体的破碎, 常规的絮凝过程是由初始颗粒通过线形随机运动叠加形成小的集团, 小集团又碰撞聚集成较大集团, 再 进一步聚集,一步一步成长为大的絮凝体。这一过程决定了絮凝体在一定范围内具有自相似性和标度不变性, 这正是分形的两个重要特征[4], 即絮凝体的形成具有分形的特点。 2 絮凝体的模拟模型 2.1 絮凝体的分形结构模型 为了更好地了解絮凝体的形成过程并尽可能地加以预测, 经过大量的研究提出了众多的絮

股票市场多重分形研究论文

股票市场多重分形研究论文 内容摘要:本文通过对我国和美国股票的收益率序列进行多重分形分析,得出结论:两国股票市场均具有多重分形性,我国股票市场的多重分形特征更明显。实 证研究又发现股票市场收益率不遵循随机游动,标准差作为风险的度量不完全合适。结合两国股票市场实际风险的情况,得到风险与多重分形之间的对应关系。 关键词:收益率风险多重分形 资本市场理论认为收益率遵循随机游动,其分布近似于正态或对数正态。实 证研究发现证券收益率不服从正态分布,标准差作为风险的度量不再合适。随着 对资本市场混沌特性的研究,人们开始用分形来研究风险问题。现阶段随着对金 融市场分形性质研究的进一步加深,又产生多重分形问题,多重分形分析向人们 展现了各个股市的混沌现象,使人们感觉到风险的存在。 本文研究的问题是:不同股票市场的风险不一样,它们的多重分形特征也不同,那么风险与多重分形间有什么关系呢?利用MF-DFA方法对中、美两国股票 市场的多重分形特性进行研究与比较,结合二者的实际风险情况,得到多重分形 与风险的关系。 证券市场风险的分形分析 当今资本市场理论是以理性投资者、有效市场和随机游动三个关键概念为基础,由于投资者的理性和市场的有效,收益率遵循随机游动。因此,收益率的概 率分布近似于正态或对数正态,风险用收益率的标准差度量。但是,在对股票市 场收益率分布进行正态性检验时,发现其明显地不拟合于正态分布的。只有在其 背后的系统是随机的时候,标准差作为风险的度量才有意义。股票市场收益率的 分布不呈现正态,所以我们关于风险的统计测度——标准差——亟需修正。 英国水文学家赫斯特在20世纪40年代研究了有偏随机游走,提出一种新的 统计量即Hurst指数(H)。赫斯特指数有三个不同的类型:(1)H=0.5;(2)0≤H 证券市场的多重分形分析 随着对金融市场分形性质研究的进一步加深,又产生了下述问题:一个分形 维数能否很好地描述市场的分形结构,价格增量的不同部分的相关性及其在时间 轴上的分布是否一致。要回答这些问题必须对分形局部结构进行更细致的研究。

SAS数据的描述性统计分析答案

实验一数据的描述性统计分析 一、选择题 1、以下( B )语句对变量进行分组,在使用前需按分组变量进行排序? 以下( C )语句可对变量进行分类,在使用前不必按分类变量进行排序? 用( A )语句可以选择输入数据集的一个行子集来进行分析? (A)WHERE语句(B)BY语句(C)CLASS语句(D)FREQ语句2、排序过程步中必须用什么语句对变量进行排序?( A ) (A)BY语句(B)CLASS语句(C)WHERE语句 3、如果要对数据集中的数据进行正态性检验,需要使用哪个过程?( B )(A)MEANS (B)UNIV ARIATE (C)FREQ 4、用UNIV ARIATE过程进行数据分析,要求此过程输出茎叶图、正态概率图等,应在语句中加上什么选项?(plot ) 5、用UNIV ARIATE过程进行数据分析,在输出结果中哪个统计量是对样本均值 为零的T检验的概率值?( A ) (A)T: Mean (B)Prob>|S| (C)Sgn Rank (D)Prob>|T| 二、假设某校100名女生的血清总蛋白含量(g/L)服从均值为75,标准差为3的正态分布,试产生样本数据,并利用SAS软件解决下面问题: 1、计算样本均值、方差、标准差、极差、四分位极差、变异系数、偏度、峰度; 2、画出直方图(垂直条形图); 3、画出茎叶图、盒形图和正态概率图; 4、试进行正态性检验。 Data N; DO i=1to100; x=75+3*normal(12345); output; end; proc print; run; proc univariate data=N; var x; run; proc gchart data=N; block x; run; proc univariate data=N plot; var x;

描述性统计分析报告--Descriptive Statistics菜单详解

第六章:描述性统计分析-- Descriptive Statistics菜单详解 描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs 过程则完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。 本章讲述的四个过程在9.0及以前版本中被放置在Summarize菜单中。 §6.1 Frequencies过程 频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图,圆图等统计图。 和国内常用的频数表不同,几乎所有统计软件给出的均是详细频数表,即并 不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用Frequencies过程得到我们所熟悉的频数表,请先用第二章学过的Recode过程产生一个新变量来代表所需的各组段。 6.1.1 界面说明 Frequencies对话框的界面如下所示:

该界面在SPSS中实在太普通了,无须多言,重点介绍一下各部分的功能如下:【Display frequency tables复选框】 确定是否在结果中输出频数表。 【Statistics钮】 单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。 现将各部分解释如下:

股票市场分形特征实例分析

股票市场分形特征实例分析 分形理论的创始人美籍法国数学家Mandelbrot1967年在美国《科学》杂志上发表了“英国的海岸线有多长”的划时代的论文。1975年他出版了分形几何的第一部著作《分形:形状、机遇和维数》,标志着分形理论的诞生。分形是用以描述那种不规则的、破碎的、琐屑的几何特征。分形是相对于整形而言的,它的基本特征是不可微性、不可切性、不光滑性,甚至是不连续性。 很多学者研究了我国股票市场的混沌特征,不仅说明了股市运行过程中的混沌特征,而且还给出了混沌特征的数量指标。但他们并没有给出混沌吸引子的结构,而它却是混沌状态的基本特征,是描述混沌的基本工具。混沌吸引子具有分形结构,混沌与分形是密切相关的。本论文以上海股市为例,来分析我国股票市场的分形特征。 股市混沌吸引子的分形维 我国股市具有复杂的混沌结构,而且我们还给出了股票指数收益率序列的混沌结构的数量指标。“这些数量指标都是混沌度的特征指标”。混沌的另一个特征是具有混沌吸引子,吸引子是一个分形,而分形维是刻划分形最重要的指标。 分形维数有多种定义,两种最常用的分形维数是豪斯道夫(Hausdorff)维数和盒维数。1983年,Grassberger和Procaccia利用了嵌入理论和相空间重构技术,提出了从时间序列直接计算关联维数的算法。本文也是用此法来计算我国股市混沌吸引子的分形维。 设{xk:k=1,…N}是观测某一系统得到的时间序列,将其嵌入到m维欧氏空间中,得该空间中的点集,其元素为:xn(m,τ)=(xn+τ,xn,…,xn+(m-1)τ),n=1,…Nm,其中:Nm=N-(m-1)τ. 从Nm个点中任选一个点xi计算其余每个点到该点的距离rij,对所有xi(i=1,…,Nm)重复这一过程,可得到关联积分函数 其中的H(x)当x>0时取1,当x≤0时取0,关联维数D为当r→0时函数logCm(r)/logr的极限。 Grassberger和Procaccia证明了当嵌入维数大于分形维时,所求的分形维不

05.第五讲 描述性统计分析评价方法

第五讲描述性统计分析评价方法——综合指标 实际上,从这一讲开始的教学内容都是介绍教育评价技术中的重要方法——教育统计分析方法,也即是分析资料的方法。其中包括描述性统计分析方法和推断性统计分析方法两大部分。 一、描述性统计分析评价方法的主要特点。对数据资料计算综合指标,然后根据综合指标值对教育客观事物给予评价。所谓综合指标指的是从数量方面综合说明事物特征的指标。常用的综合指标有绝对数、相对数、平均数和标准差。重点介绍后面两种。 二、综合指标的计算及解释 (一)绝对数(规模) (二)相对数(程度) (三)平均数(水平) 通常可用符号表示平均数 1.算术平均数(未经分类汇总的测量数据资料)计算方法见p62的(4.1)公式。 2.加权平均数(已经分类汇总的资料)

①组距数列平均数(对测量数据分组统计人数)例如P63表4-1的资料。计算方法如P63的(4.2)公式及83名教师平均年龄的计算。 * 为了减少计算的麻烦,在此介绍计算器统计功能的使用: A、操作步骤 计算器的统计功能的计算只能得到如下六个统计结果:n(数据个数)、(数据和)、(数据平方和)、(平均数)、(总体标准差)和S(样本标准差)。操作步骤如下:1)显示统计状态:2ndF STAT(或SD) 2)输入数据:每输入一个数据按DATA 3)取出统计结果:这时六个统计结果均处于待取状态,可根据需要取出其中的结果。 B、注意事项 1)若需继续进行第二组数据的统计运算时,需取消统计状态,再按上述步骤操作。按2ndF STAT即可取消统计的状态。 2)若不需要计算、、、、和S时(即进行 其他一般运算时),也应取消统计状态)。

利用Excel进行数据整理和描述性统计分析

实训一利用Excel进行数据整理和描述性统计分析 一、实训目的 目的有三:(1)掌握Excel中基本的数据处理方法;(2)学会使用Excel进行统计分组;(3)学会使用Excel计算各种描述性统计指标,能以此方式独立完成相关作业。 二、实训要求 1、已学习教材相关内容,理解数据整理中的统计计算问题;理解描述性统计指标中的统计计算问题;已阅读本次实训指导书,了解Excel中相关的计算工具。 2、准备好一个统计分组问题、准备好一个或几个描述性统计指标计算问题及相应数据(可用本实训所提供问题与数据)。 3、以Word文件形式(其中的统计表和统计图用Excel制作)提交实训报告(含:实训过程记录、疑难问题发现与解决记录(可选))。此条为所有实训所要求。 三、实训内容和操作步骤 (一)问题与数据 有顾客反映某家航空公司售票处售票的速度太慢。为此,航空公司收集了解100位顾客购票所花费时间的样本数据(单位:分钟),结果如下表。

航空公司认为,为一位顾客办理一次售票业务所需的时间在五分钟之内就是合理的。上面的数据是否支持航空公司的说法顾客提出的意见是否合理请你对上面的数据进行适当的分析,回答下列问题。 (1)对数据进行等距分组,整理成频数分布表,并绘制频数分布图(直方图、折线图、饼图)。 (2)根据分组后的数据,计算中位数、众数、算术平均数和标准差。 (3)分析顾客提出的意见是否合理为什么 (4)使用哪一个平均指标来分析上述问题比较合理 答:(1): 2:

从表中我们可以得到中位数为众数为1平均数为标准差为 (3):合理,虽然他的平均数是<5属于正常范围,但是依旧有将近20%的购票时间>5分钟属于超过正常范围,那就是速度太慢了。平均数不能代表一切。 所以顾客提出的理由是正确的,购票太慢的现象确实存在。 (4):平均数比较合理,它能较好的反映购票的大概时间。比较有代表性! 实训二用Excel数据分析功能进行统计整理 和计算描述性统计指标 一、实训目的 学会使用Excel数据分析功能进行统计整理和计算各种描述性统计指标,能以此方式独立完成相关作业。 二、实训要求 1、已学习教材相关内容,理解统计整理和描述性统计指标中的统计计算问题;已阅读本次实验导引,了解Excel中相关的计算工具。 2、准备好一个统计分组问题、准备好一个或几个数字特征计算问题及相应数据(可用本实验导引所提供问题与数据)。 3、以Word文件形式(其中的统计表和统计图用Excel制作)提交实训报告(含:实训过程记录、疑难问题发现与解决记录(可选))。此条为所有实训所要求。 三、实训内容和操作步骤

分形理论

分形理论 在多年大量实践与探索的基础上,我于96年年底完成了论文<<大系统随机波动理论>>, 随后又在近一年的运作实践中不断进行了修正与完善,自信已经形成一个比较合乎现实逻辑的理论体系。该论文结合当今数学与物理学界最热门的研究领域之一--- 以变化多姿杂乱无章的自然现象为研究对象的分形理论,从最基本的概念与逻辑出发阐明了波动是基本的自然法则, 价格走势的波浪形态实属必然;阐明了黄金分割率的数学基础及价值基础, 价格波动的分形、基本形态及价量关系, 并总结了应用分析的方法与要点等等;文中也多次引用我个人对分形问题的研究成果;另外也指明了市场中流行的R.N. 埃劳特的波浪理论的基本点的不足之处。在国内基金业即将进入规范的市场化的大发展时期之际,就资金运作交易理论进行广泛的交流与探讨,肯定与进行有关基金的成立、组织、规范管理等方面的交流与探讨同样有意义。我尽力用比较通俗的语言描述并结合图表实例分析向读者介绍有关价格波动理论研究的基本内容与使用要点,供读者朋友参考。 一、分形理论与自然界的随机系统 大千世界存在很多奇形怪状的物体及扑溯迷离的自然景观, 人们很难用一般的物质运动规律来解释它们, 象变换多姿的空中行云, 崎岖的山岳地貌, 纵横交错的江河流域, 蜿蜒曲折的海岸线, 夜空中繁星的分布, 各种矿藏的分布, 生物体的发育生长及形状, 分子和原子的无规运动轨迹, 以至于社会及经济生活中的人口、噪声、物价、股票指数变化等等。欧氏几何与普通的物理规律不能描述它们的形状及运动规律, 这些客观现象的基本特征是在众 多复杂因素影响下的大系统(指包括无穷多个元素)的无规运动。通俗一点讲, 这是一个复杂的统计理论问题, 用一般的思维逻辑去解决肯定是很困难的或者说是行不通的。70年代曼德尔布罗特(Mandelbrot,B.B.)通过对这些大系统的随机运动现象的大量研究,提出了让学术界为之震惊的“分形理论”, 以企图揭示和了解深藏在杂乱无规现象内部的规律性及其物理本质,从而开辟了一个全新的物理与数学研究领域,引起了众多物理学家和数学家的极大兴趣。 所谓分形, 简单的讲就是指系统具有“自相似性”和“分数维度”。所谓自相似性即是指物体的(内禀)形似,不论采用什么样大小的测量“尺度”,物体的形状不变。如树木不管大小形状长得都差不多, 即使有些树木从来也没见过, 也会认得它是树木;不管树枝的大小如何,其形状都具有一定的相似性。所谓分形的分数维, 是相对于欧氏几何中的直线、平面、立方而言的, 它们分别对应整数一、二、三维,当然分数维度“空间”不同于人们已经习惯的整数维度空间,其固有的逻辑关系不同于整数维空间中的逻辑关系。说起来一般人可能不相信,科学家发现海岸线的长度是不可能(准确)测量的,对一个足够大的海岸线无论采用多么小的标尺去测量其长度发现该海岸长度不趋于一个确定值!用数学语言来描述即是海岸线长度与测量标尺不是一维空间的正比关系,而是指数关系,其分形维是1.52;有理由相信海岸线的形状与这个分数维有内在关系。 一个全新的概念与逻辑的诞生,人们总是有一个适应过程,但是无数事实已经证明,合理的(或者说不能推翻的)逻辑在客观现实中总能找到其存在或应用的地方的。本世纪初, 爱因斯坦将物质运动从三维空间引到四维空间去描述, 从而产生了一场科学与认识上的革命, 爱因斯坦的相对论不仅让人类“发现”了原子能,而且更重要的是其极大地推动了人们对太空与原子(和微观粒子)的认识层次与能力的提高,但愿分形理论的诞生也具有同样意义,也许在生命(生物)科学与环境科学领域将发现分形理论的重大价值。 下面结合三分法科赫曲线(KOCH)来进一步说明自相似性的意义。如附图一所示, 将一条1个单位长度的线段, 分三等份, 去掉中间的一份并用同等长度的等边三角形的两条边取代之, 随后用同样的方法不断循环地操作五次, 即得这些图形。由科赫曲线明显可以看出,

分形理论及岩石破碎的分形特征

第22卷第1期武汉冶金科技大学学报(自然科学版) Vol.22,No.11999年3月J.of Wuhan Y ejin Uni.of Sci.&T ech.(Natural Science Edition ) Mar.,1999 收稿日期:1998-11-17 作者简介:盛建龙(1964-),武汉冶金科技大学资源工程系,副教授. 文章编号:1007-5445(1999)01-0006-03分形理论及岩石破碎的分形特征 盛建龙1 刘新波1 朱瑞赓2 (1.武汉冶金科技大学资源工程系,武汉,430081;2.武汉工业大学建筑学院,武汉,430070) 摘要:介绍了分形的基本概念,分析了4种分维数的确定方法,进而探讨了岩石破碎过程中的分形特征。关键词:分形;分维;岩石破碎 中图分类号:O18;P616.3 文献标识码:A 分形几何(fractal geometry )创立于本世纪70年代,是由法国数学家曼德尔布罗特(B.B.Man 2delbrot )提出的。分形(fractal )一词是B.B.Mandel 2brot 从拉丁文fractus (断裂)创造的新词[1],意思是破碎、细片、分数、分级,等等。分形几何学主要研究一些具有自相似性(self 2similar )的不规则曲线和形状,具有自反演性(self 2reverse )的不规则图形以及具有自平方性(self 2squaring )的分形变换和自仿射(self 2affine )分形集,等等。而自相似性的不规则曲线和形状是分形几何研究的主体内容[2]。因此,分形几何学的出现,为更准确地研究自然现象的内在机理提供了一种新方法。 近年来,分形几何被广泛地应用于物理学、生物学、地理学、冶金学、材料学、计算机图形学等领域。从几何学的角度来研究不可积系统即耗散结构图形或浑沌吸引子图形的自相似性,并把复杂多变的自然现象看作是无限嵌套层次的精细结构[3],使分形理论与耗散结构理论、协同论、混沌理论、渗透理论等这些与非线形复杂现象有关的理论成为新的思想和理论模型。 1 分形与分维 分维(fractal dimension )是分形几何学定量描 述分形集合特征和几何复杂程度的参数。经典的欧几里德几何的研究对象是极规则的几何图形,是拓扑学意义下的整数维(记为D T )。它反映的是确定一个点在空间的位置所需独立坐标的数目或独立方向的数目。在经典几何学中,一个点是 零维的,一条(光滑)曲线是一维的,一个曲面是二维的。豪斯道夫(Hausdorff )于1919年引入维数概念,以Hausdoff 度为基础,提出了维数可以是分数,即分数维。下面简要介绍4种常见的分维定义。1.1 相似性维首先以Von K och 曲线为例,通过曲线的构造过程来分析相似维数。如图1所示,起始于n =0的单位长度线段称为Von K och 曲线的零阶生成;将直线段中间的1/3用边长为1/3直线段长的等边三角形的另外两段取代,得到n =1的Von K och 曲线生成元,称为第一阶生成;把第一阶生成的4个直线段类似于第一阶生成进行变形,就得到Von K och 曲线的第二阶生成;类似地无穷变形下 去,最后得到的曲线(n →∞)就是Von K och 曲线 。 图1 V on K och 曲线的构造过程 由Von K och 曲线可以看出,每一折线与整

描述性统计分析-Eviews

主讲人:刘莎莎 第三讲 描述性统计分析
一、 序列窗口下的描述性统计分析
知识点 1:如何以建立组对象的方式将数据导入到 Eviews 中去(第二种导入数 据的方式) 。 知识点 2:如何在序列窗口下实现简单描述性统计量和直方图,将直方图和正态 分布曲线叠加在一起,从而更直观地观察数据的分布特征。 (如何将 EViews 图形 复制粘贴到 word 中) 知识点 3:如何在序列窗口下实现描述性统计量的假设检验 知识点 4:如何实现将单序列按某一变量分类后再进行描述性统计分析(本案例 的分类变量是该天是星期几) 知识点 5:如何实现将单序列按某一变量分类后再进行假设检验 知识点 6:如何画上证综指日对数收益率的 QQ 图 知识点 7:如何估计数据的经验分布函数的参数 案例数据说明:2003 年 1 月 6 日-2009 年 6 月 26 日上证综指日对数收益率。
二、序列组窗口下的描述性统计分析
知识点 1:如何通过打开 excel 文件的方式将数据导入到 Eviews 中去。 (第三种 导入数据的方式) 。 知识点 2:如何实现多变量的描述性统计量 知识点 3:如何实现多变量描述性统计量的假设检验 案例数据说明:国家统计调查队分别在两个地区调查了 10 个家庭的收入 知识点 4:如何计算当前序列组的相关系数矩阵,协方差矩阵

主讲人:刘莎莎
案例数据说明:1983-2000 年我国粮食生产与相关投入的数据,变量包括粮食产 量(单位:万吨)、农业化肥施用量(单位:万千克)、粮食播种面积(单位: 公顷)
附注:描述性统计量的计算公式
标准差(Std.Dev.)的计算公式是:
s=
2 ( y ? y ) ∑ t t =1
T
T ?1
其中,
yt 是观测值, y 是样本平均数。
偏度(Skewness)的计算公式是:
1 T yt ? y 3 S = ∑( ) T t =1 s
其中,
yt 是观测值, y 是样本平均数,s 是样本标准差,T 是样本容量。对
称分布的偏度是零,比如正态分布。
峰度(Kurtosis)的计算公式是:
1 T yt ? y 4 S = ∑( ) T t =1 s
其中,
yt 是观测值, y 是样本平均数,s 是样本标准差,T 是样本容量。
正态分布的峰度值是 3。

分形交易策略-选股步骤

分形交易策略选股步骤 第一步:证券行情60列表,调整为涨幅%、涨速%、现价等的排序;

1、过滤器A:5分钟涨速在分时线上是否出现连续的自相似结构,其中五分钟涨速的在坐标系中的斜率非常重要。 第一个5分钟涨速买入与第二个5分钟涨速买入,买入价格会有较大的差异。 2、投资偏好: ⑴5分钟涨速出现日涨幅比率,譬如当天超过7%涨幅是否还需要买入 ⑵股票价格绝对值的高低区间,譬如低价股上涨明显不如中高价股 ⑶每股收益在亏损附近区域,譬如亏损时,一旦实现盈利,那么就是转折性的感受 ⑷行业,譬如化工、酿酒、有色、农业等大部分表现优于其他行业 ⑸地区,譬如海南三沙开发板块等等 ⑹政策,譬如开放金融综合改革试验 …… 3、交易周期特点很短: 无论哪一种偏好,其偏好的股票在风尚转化的过程中,上涨时间周期较短。

二、是否处于基本分形结构 1、标准价格下分形 具体分形结构参照教材 2、出现不标准价格分形的使用方法 按照统一的价格线删除方法进行删除后是否找到符合标准分形结构的分形

从图中观察,plb<pla,其中a删除,不做计算 删除规则: ⑴股票价格下分形中,当次日的股票价格的最低价低于当日的股票价格最低价时,当日价格线删除; ⑵股票价格上分形中,当次日的股票价格的最高价高于当日的股票价格最高价时,当日价格线删除; ⑶应用删除方法时,存在不同层次的股票价格分形结构;

三、连续上涨分形中的价幅 pcd-poc=0.70 未来可能到达的f价格=poe+0.70=8.49+0.70=9.19 1、价格幅度计算规则 同一级别的价格分形终止价格线的收盘价-分形的起点(0)的价格线的开盘价 2、价幅相对于当前的价格幅度满足度 这个与使用分形交易策略的决策人不同有很大的差异,更确切的说,与对未来股票价格的期望值有关系。 3、计算价格的幅度一个最重要的原则,在未来的价格中,可以顺利的把持有的股票在一定的收益下全部卖出。 即便买入股票后,价格上涨了10%,没有卖出,结果又下跌到买入价之下被套,也不是上涨了, 4、在价幅计算中,对于因为自相似分形中,由于市场气候因素及分形结构后面的群体因为信息导致产生分形变异,给出更加窄幅的计算方法,最大限度的保证股票卖出。

多组和分类数据的描述性统计分析

§3.2多组和分类数据的描述性统计分析17 ?盒子图 盒子图能够直观简洁地展现数据分布的主要特征.我们在R 中使用boxplot()函数作盒子图.在盒子图中,上下四分位数分别确定中间箱体的顶部和底部,箱体中间的粗线是中位数所在的位置.由箱体向上下伸出的垂直部分为“触须”(whiskers),表示数据的散布范围,其为1.5倍四分位间距内距四分位点最远的数据点.超出此范围的点可看作为异常点(outlier). §3.2多组和分类数据的描述性统计分析 在对于多组数据的描述性统计量的计算和图形表示方面,前面所介绍的部分方法不能够有效地使用,例如许多函数都不能直接对数据框进行操作.这时我们需要一些其他的函数配合使用. 1.图形表示: ?散点图:前面介绍的plot,可直接对数据框操作.此时将绘出数据框中所对应的所有变量两两之间的散点图.所做图框中第一行的散点图是以第一个变量为纵坐标,分别以第二、三...个变量为横坐标的散点图.这里数据举例说明. library(DAAG);plot(hills) ?盒子图:前面介绍的boxplot,亦可直接对数据框操作,其在同一个作图区域内画出各组数的盒子图.但是注意,此时由于不同组数据的尺度可能差别很大,这样的盒子图很多时候表达出来不是很有意义.boxplot(faithful).因此这样做比较适合多组数据具有同样意义或近似尺度的情形.例如,我们想做某一数值变量在某个因子变量的不同水平下的盒子图.我们可采用类似如下的命令: boxplot(skullw ~age,data=possum),亦可加上参数horizontal=T,将该盒子图横向放置. boxplot(possum$skullw ~possum$sex,horizontal=T) ?条件散点图:当数据集中含有一个或多个因子变量时,我们可使用条件散点图函数coplot()作出因子变量不同水平下的多个散点图,当然该方法也适用于各种给定条件或限制情形下的作图.其调用格式为 coplot(formula,data)比如coplot(possum[[9]]~possum[[7]] possum[[4]]),或 coplot(skullw ~taill age,data=possum); coplot(skullw ~taill age+sex,data=possum)

描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。

一、描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势、离散趋势、偏度、峰度。 1、缺失值填充:常用方法:剔除法、均值法、最小邻居法、比率回归法、决策树法。 2、正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。 二、假设检验 1、参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。 1)U验使用条件:当样本含量n较大时,样本值符合正态分布 2)T检验使用条件:当样本含量n较小时,样本值符合正态分布 A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别; B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似; C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。 2、非参数检验 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一股性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。 适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。

A 虽然是连续数据,但总体分布形态未知或者非正态; B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下; 主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。 三、信度分析 检査测量的可信度,例如调查问卷的真实性。 分类: 1、外在信度:不同时间测量时量表的一致性程度,常用方法重测信度 2、内在信度;每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如 何,常用方法分半信度。 四、列联表分析 用于分析离散变量或定型变量之间是否存在相关。 对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。 五、相关分析 研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。 1、单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量; 2、复相关:三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关; 3、偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。 六、方差分析

数据的描述性统计分析

统计分析往往是从了解数据的基本特征开始的。描述数据分布特征的统计量可分为两类:一类表示数量的中心位置,另一类表示数量的变异程度(或称离散程度)。两者相互补充,共同反映数据的全貌。 这些内容可以通过SPSS中的“Descriptive Statistics”菜单中的过程来完成。 1 频数分析 (Descriptive Statistics - Frequencies) 频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各 种统计量来描述数据的分布特征。 下面我们通过例子来学习单变量频数分析操作。 1) 输入分析数据 在数据编辑器窗口打开“data1-2.sav”数据文件。 2)调用分析过程 在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。 图3-4 “Frequencies” 对话框 3)设置分析变量 从左则的源变量框里选择一个和多个变量进入“Variable(s):”框里。在这里我们选“三化 螟蚁螟[虫口数]”变量进入“Variable(s):”框。 4)输出频数分布表

Display frequency tables,选中显示。 5)设置输出的统计量 单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量: 图3-5 “Statistics”对话框 ①选择百分位显示“Percentiles Values”栏: Quartiles:四分位数,显示25%、50%和75%的百分位数。 Cut points for 10 equal groups:将数据平分为输入的10个等份。 Percentile(s)::用户自定义百分位数,输入值0—100之间。选中此项后,可以利用“Add”、“Change”和 “Remove”按钮设置多个百分位数。 ②选择变异程度的统计量“Dispersion”:(离散趋势) Std.deviation标准差 Minimum 最小值 Variance 方差 Maximum 最大值 Range 极差 S.E.mean均值标准误 ③选择表示数据中心位置的统计量“Central Tendency”:(集中趋势) Mean 均值 Median 中位数 Mode 众数 Sum 算术和

相关文档
最新文档