Chinascope数库多因子量化投资平台

Chinascope数库多因子量化投资平台
Chinascope数库多因子量化投资平台

1. 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(无需平均)时:

所有指标取最近报告期值即可

2. 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(需平均)时:

资产负债表平均指标=(期初值+最近报告期值)/2,其他指标取最近报告期值

3. 同时涉及利润表(或现金流量表)指标和资产负债表指标(无需平均)时:资

产负债表非平均指标直接取最近报告期值;利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1.

4. 同时涉及利润表(或现金流量表)指标和资产负债表指标(需平均)时:资产

负债表平均指标=(年初值+本期期末值)/2;利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1.

?LTM:后缀为LTM的因子表示该因子计算所需指标的取值逻辑为LTM

1. LTM因子同时涉及利润表(或现金流量表)指标和资产负债表指标时:利润表

指标取最近12个月数值;资产负债表指标取平均值,平均值=(本期报告值+上年同期值)/2

2. LTM因子仅涉及利润表和现金流量表指标时:利润表和现金流量表指标取最近

12个月数值。

财务因子数据映射说明

由于财务数据一般每季度公布一次,且通常会延迟公布(一季度与上一年四季度数据一般在今年4月底全部公布,二季度在8月底公布,三季度在10月底公布),所以将季度数据转换为更高频率数据时采用以下逻辑:

?1、2、3月底采用上一年Q3的数据;

Ⅱ. 因子目录

1. 数据概览

单因子有效性评价首页为数据概览界面,基本参数设置同上,该界面呈现如下内容:

?近12期所选股票池的因子值分布箱形图

?近12期所选股票池的收益率分布箱形图

?近12期股票覆盖率序列图(股票覆盖率:即每期被纳入到选股范围的股票占股票池所有股票的百分比)

?单期因子值分布直方图

?单期股票收益率和因子值散点图

?单期各档收益率分布:横轴为按照所选‘因子方向’排序后划分为10组,纵轴为每组内股票收益率的分布

箱形图

又称为盒须图,如上图所示,自上而下分别为离群点(异常值)、上界(最大值)、上四分位数、均值、中位数、下四分位数、下界(最小值)。

7种量化选股模型

7种量化选股模型 1、【多因子模型】 2、【风格轮动模型】 3、【行业轮动模型】 4、【资金流模型】 5、【动量反转模型】 6、【一致预期模型】 7、【趋势追踪模型】 1、【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。

候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2 个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为: (1)先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高 (2)按月计算个股的不同因子得分间的相关性矩阵; (3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值 (4)设定一个得分相关性阀值 MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

7种量化选股模型

【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。 同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余

多因子量化选股模型建立及优化

多因子量化选股模型建立及优化 股市在不断的变化,所以从目前来看,不断探讨哪些指标在量化选股中更为有效,是具有现实意义的。这也是本文研究工作开始的初衷。 在整个研究过程中,保持数据的严谨性、中立性、数据处理方法的科学性对于研究结论的准确性来说至关重要。本文首先构建了一个比较全面的候选因子库,通过对候选因子数据进行异常值、缺失值、标准化、市值中性化、行业中性化等一系列的处理之后,本文对候选因子进行有效性检验及再筛选,最终认为 RP_TTM(净利润TTM/总市值)、BP_LF(净资产TTM/总市值)、operete_profin gr_TM(营业利润增长率TTM)、sales_gr_TTM(营业收入增长率)、BOOK_LEVEL(账面杠杆)、stock_to market_volatility(个股与市场波动率比值)、 REV_LAST1M_MAX(近一个月日收益率最大值)、RSI(相对强弱)等八个因子是较为有效的因子。 在得出有效因子之后,本文利用打分法来构建八因子选股模型,回测区间选定为2016年1月至2019年4月。通过对模型的回测,我们发现本文构建的八因子模型相比于沪深300,有着较为稳定的超额收益。 在整个回测时间段内,八因子模型的总收益为41.02%,年化收益为11.07%。相比于基准的收益情况,八因子模型相对总收益为32.28%,年化平均超额收益为8.92%。 为了深入研究,我们对原有模型进行优化,优化方案为“在利用八因子模型进行正式选股之前,首先以增长率-经营活动产生的现金流量净额(TTM)指标对股票池进行初步筛选”。通过对优化八因子模型进行回测,我们发现加入增长率-经营活动产生的现金流量净额(TTM)指标优化后的八因子模型回测表现更好。

Wind量化平台-交易专题

Wind 量化接口交易专题 上海万得信息技术股份有限公司 Shanghai Wind Information Co., Ltd. 地 址: 上海市浦东新区福山路33号建工大厦9楼 邮编Zip: 200120 电话Tel: (8621) 6888 2280 传真Fax: (8621) 6888 2281 Email: sales@https://www.360docs.net/doc/b69111117.html, https://www.360docs.net/doc/b69111117.html, ——中国金融数据及解决方案首席服务商

目录 1交易接口概览 (1) 1.1函数说明 (1) 1.1.1tlogon(登录) (1) 1.1.2tlogout(登出) (2) 1.1.3torder(下单) (2) 1.1.4tcancel(撤单) (3) 1.1.5tquery(查询) (3) 1.2L OGON ID、R EQUEST ID和O RDER N UMBER (4) 1.2.1LogonID (4) 1.2.2RequestID (4) 1.2.3OrderNumber (4) 2账户登录与登出 (6) 2.1登录模拟交易账户 (6) 2.1.1登录单个模拟交易账户 (6) 2.1.2登录多个模拟交易账户 (6) 2.2登录实盘交易账户 (6) 2.2.1登录单个实盘交易账户 (7) 2.2.2登录多个实盘交易账户 (7) 2.3查询登录账户 (7) 3交易与查询 (8) 3.1下单 (8) 3.2查询委托 (8) 3.3撤单 (10) 3.4查询成交 (10) 3.5查询资金 (11) 3.6查询持仓 (11)

1交易接口概览 Wind交易接口包括5个函数,分别为tlogon(登录)、tlogout(登出)、torder(下单)、tcancel(撤单)、tquery(查询)。将这5个函数串联起来的是LogonID、RequestID和OrderNumber。 1.1函数说明 1.1.1tlogon(登录) 【登录函数】tlogon(BrokerID,DepartmentID,LogonAccount,Password,AccountType) 【参数说明】 模拟交易账号规则和支持的市场品种见下表: 【例】如果Wind金融终端账号是W0813652,那么W081365201是证券模拟账号,W081316502是期货模拟账号,W081316503是衍生品模拟账号。 【注2】AccountType参数

最新 基于多因子模型的量化选股分析-精品

基于多因子模型的量化选股分析 随着中国资本市场复杂程度日渐加深和规模日益庞大,投资品种和数量与日俱增,无论是个人或是机构投资者所拥有的投资渠道与投资方法也在逐渐增多。量化投资作为一种来自海外资本市场的先进技术,在海外资本市场中受到了广泛追捧,著名的西蒙斯与大奖章基金便是利用了量化投资技术,于1989~2007年间获得了高达38.5%的平均年收益率。中国的量化投资发展虽仍在起步阶段,、金融学、科学相结合的优势来寻求超额收益。据统计显示,截至2016年10月,中国公募基金中共有48支基金以“量化”命名,其中长信量化先锋基金(519983),申万菱信量化小盘股票基金(163110)与大摩多因子策略混合基金(233009)等均表现出色,具有较高的年化收益率。而无论是在个体投资或是基金投资中,多因子选股模型均是较为广泛的量化模型之一。本文基于多因子模型策略,利用2011~2015年的数据对投资过程中的常用因子进行有效性检验,并使用有效因子构建基本多因子模型,根据假设创造性地使用简单打分法构建投资组合,基于2014~2016年的历史数据进行实证分析,为广大一般投资者提供了一种简单可行且收益率超过市场表现的投资策略。最后结合行业轮动效应与面板数据的多元回归分析对基本模型进行了深化与修正,创新性地提出了基于多因子模型的更多投资策略,也为较深层次的理论研究者提供了思路与数据参考。 一、文献综述 关于量化投资选股策略的研究涉及许多方面,常见的包括多因子模型、风格轮动模型、动量反转模型、趋势追踪模型等。对于多因子模型,最重要的环节便是有效因子的选取。大多数论文对于有效因子的选取通常采用因子评分法,此方法最早由Piotroski(2000)提出,常见操作为:将股票池中的股票按N个候选因子的大小依次排序,按照每个排序选取排名靠前的股票等权重构建N个极端的股票组合持有到期末,计算N个组合的平均收益率并与基准的指数收益率进行比较,用此方法能成功获取alpha收益组合所使用的排序因子即为有效因子[1]。另外一种方法则是回归法,通过计量模型求得单个因子对股价波动的贡献与显著性。丁鹏曾在其《量化投资——策略与技术》一书中使用1997~2006年的历史数据对常用的因子进行了有效性检验

缠中说禅量化交易系统

缠中说禅量化交易系统 函数使用说明 1.Chdlm 缠论动力调用函数, CHDLM(CLOSE,1):返回的动力数值, CHDLM(CLOSE,2):返回值1表示动力底,返回值-1表示动力顶, CHDLM(CLOSE,3):返回值1表示底背离买点,返回值-1表示顶背离卖点。 可以结合其他函数,进行画线,画标识,选股,预警等。 使用例子:CHDL 2.Macdnum 返回MACD的参数 MACDNUM(1):返回周期数值1,供MACD函数调用 MACDNUM(2):返回周期数值2,供MACD函数调用 MACDNUM(3):返回周期数值3,供MACD函数调用 使用例子:三级别MACD 3.Kxian K线的初始化 KXIAN(HIGH,LOW); 所有与笔有关的调用,必须先进行此函数的调用 使用例子:CHFB 4.Chbi 返回缠论笔顶底,返回值1笔的顶,返回值-1笔的底 CHBI(P):P参数可以选择11,12,21,22,31,32;51(高级版选用) CHBI(11) 严格新笔 CHBI(12) 严格老笔 CHBI(21) 不考虑第一元素和第三元素对顶底的包含的新笔 CHBI(22) 不考虑第一元素和第三元素对顶底的包含的老笔 CHBI(31) 考虑第一元素不考虑第三元素对顶底的包含的新笔 CHBI(32) 考虑第一元素不考虑第三元素对顶底的包含的老笔 CHBI(51) 将分型直接相连,不考虑包含及共用K线 使用例子:CHFB 5.Chbinum 返回缠论一笔中K线的根数 CHBINUM(P):P参数可以选择11,12,21,22,31,32;51(高级版选用) P的取值参考CHBI 使用例子见:CHFB 6.Chibs 返回缠论笔的状态(向上,向下,顶分型,底分型) CHBIS(P):P参数可以选择11,12,21,22,31,32;51(高级版选用) P的取值参考CHBI 返回值1,代表顶分型, 返回值-1,代表底分型

多因子选股策略经典梳理

多因子选股策略经典梳理 股市之道无非三点:1择时,2选股,3 仓控。精通这 三点中的任何一点,都足以在股市中所向披靡。但是精通二 字何其艰难。 在量化选股策略中。多因子策略作为一个主要武器,被各种 公募基金和私募基金长期使用(小编注:国内策略同质化相 当严重,本文仅作为交流探讨推荐)。在此我们为不熟悉多 因子的各位朋友梳理一下不同风格的因子,以及他们的有效 性。 股价是由资金推动的(上涨为正向推动,下跌为反向推动)。但是影响资金进入和推出的因子确实千千万万,有基本面 的,有消息面的,有人看国家政策,有人看分析师预测,有 人听朋友介绍,有人跟风大V等等不一二足。 下面我将从9大类33个因子来给各位逐一分析。首先给出 在长时间来看表现优秀的因子。 1、规模因子,小市值效应。(推荐指数5颗星)。 在国内外不管是成熟市场还是我国的不成熟市场,小市值效 应一直存在。并且小市值的逻辑也很清晰,市值越小被操纵 的可能性就越来大,推动的估价上涨的资金需求就越小。试 用注意事项(震荡市或牛市表现优秀,下跌市跌幅大幅快于 大盘---牛市买小股,熊市进蓝筹)2、动量反转因子。(推荐

指数5颗星) 前一个月的涨跌幅度的反转效应明显。长得多了当然要跌, 跌得多了当然要涨,均值回归远离。这个其实和我们所说的 补跌补涨类似,从长期来看如果牛市来了,大家都会涨,只 不过有的先涨,有的后涨;熊市来了大家一块跌(贪婪与恐 惧的典型表现) 3 、交投因子,即换手率因子。(推荐指数4颗星) (我们选取一个月日均换手率)。换手率高的后面表现的貌 似都不佳(但经过测算新股和次新股貌似并不适用)。逻辑依然很清晰,长期换手率高,总让人觉得有点出货的嫌疑, 不是么?4、预测因子。(推荐指数5颗星) 预测当年主营业务收入增长率(平均值)。预测收入增长但 是是利好了,预测收入增长越高,利好越高。不是么,逻辑 依然清晰。这个因子在万德等软件上有统计,各位可能不太 容易获得。因子包括9类,规模因子,估值因子,成长因子,盈利因子,动量反转因子,交投因子,波动率因子,分析师 预测因子。 1.规模类因子。包括:总市值,流通市值,自由流通市值 2.估值类因子。包括:市盈率(TTM),市净率,市销率,市现率,企业价值倍数 3.成长类因子。营业收入同比增长率、营业利润同比增长率,归属于母公司的近利润同比增长率、经营活动产生的现金流

国内量化交易软件补充 (1)

1.天软量化研究和交易平台 天软量化研究和交易平台采用天软特有的TSL语言开发策略模型,通过天软的交易网关,实现量化交易的执行。在量化模型研发方面,采用高性能数据仓库提供的历史和TICK 行情基础资料数据、宏观数据等数据源,同时提供了7000种开源的函数库,进行策略的研发、回测、绩效分析。在量化交易方面,其基本实现了自动交易、程序化交易、算法交易等量化交易方式。 2.大智慧DTS 起初由龙软软件公司开发,后被大智慧收购。DTS采用LUA脚本语言开发策略模型,通过平台提供的历史和实时行情、基本资料数据、宏观数据的统计分析,实现投研和交易。在量化模型研发方面,DTS既可使用平台自有的数据源,也可以接入第三方数据源。DTS还提供了一些金融工具包,进行复杂策略开发、回测和绩效评价。在量化交易方面,DTS提供的可以扩展的服务器端技术架构,保证了策略的高并发和高速执行,其在程序化交易、量化交易、算法交易、对冲和套利交易方面都有实际应用。 大智慧特色: 1、多市场行情和套利分析,资讯分析系统; 2、DDE深度数据挖掘决策系统,基于新行情,对已成交委托单的统计和分析功能; 3、SuperView(超赢)数据分析系统; 4、主力资金流向实时监控。 3.eSignal 除了欧美市场之外,eSignal 在亚洲市场的支援度很广。除了常见的日本、香港、新加坡的股票及期货交易所之外,泰国、越南、马来西亚、印尼、菲律宾的主要交易所都有支援。在台湾部分,台股、台指期、台指选择权、股票选择权都有。大陆股市部分则涵盖了上证、深交所及大连商品交易所等几个主要交易所。不过很遗憾的它目前并没有 CSI300 期货报价,没有中文接口。 4.同花顺 同花顺引进欧美技术,推出汉化量化交易,产品采用近百种高端交易算法,提供选股择时、统计套利、跨市场交易(股票、基金、期货)、多资金账户。能为投资者提供文本、超文本(HTML)、信息地雷、财务图示、紧急公告、滚动信息等多种形式的资讯信息,能同时 提供多种不同的咨询产品(如港澳资讯、巨灵资讯等),能与券商网站紧密衔接,向用户提供券商网站的各种资讯。同花顺为中国投资者提供专业的证券信息服务,专注于金融数据分析、平台系统集成建设、提升信息服务品质,是一家以互联网为平台的高科技软件服务提供

量化投资概述与简单回测平台的搭建

龙源期刊网 https://www.360docs.net/doc/b69111117.html, 量化投资概述与简单回测平台的搭建 作者:熊国皓 来源:《经营管理者·上旬刊》2017年第01期 摘要:量化投资就是用数量化的方式确定交易的时机、对象和数量. 量化投资的核心在于投资策略的构建. 量化投资策略研究中需要避免过拟合与欠拟合,避免使用未来信息. 策略研究需要进行基于历史数据的回测,因此在研究之前要搭建回测的平台. 回测代码编写需要模拟实际交易过程中的操作,并记录下历史仓位信息. 最后建立一系列的指标从收益、风险的角度对一个策略的优劣进行评价. 关键词:量化投资回测平台策略评价 一、量化投资简述 要达成一项投资和交易,需要确定交易对象,交易价格,交易的时间和地点. 量化投资就是通过量化的方法确定交易对象、价格和时间,而不是主观随意确定的. 投资策略的量化与计算机相结合能极大地提升投资的范围和执行效率. 沪深两市有数千只股票,金融衍生品交易也是种类繁多. 利用计算机与量化投资策略能够把握住这其中产生的一些投资机会,而这是人力难以做到的。不仅可以通过将投资者的过往投资经验加以量化从而在计算机上实现程序自动交易,还可以将时下热门的许多数据挖掘分析的方法引入来构建量化投资策略. 从历史数据中,用数学方法分析出难以直接观察到的规律再编程实现自动交易是当下量化投资策略研究的热点,比如深度学习,支持向量机等机器学习方法. 也可以运用数据挖掘、时间序列分析或者一些常规的统计分析方法来构造投资策略。投资策略的构建是量化投资的核心. 但无论是将一些投资经验加以量化并实现,还是从历史数据中发现投资规律,都需要搭建一个回测的平台来让一个投资策略在过去一段时间里面执行,并最终根据投资策略的执行结果来对一个策略进行评价,找出问题最终再加以改进. 二、量化投资研究中需要注意的问题 1.欠拟合与过拟合。欠拟合的模型没有充分反映两个序列之间关系. 原因在于欠拟合对数 据的描述和挖掘能力不足. 过拟合的模型在用于对新的样本进行预测或描述时误差很大,模型泛化能力下降. 这两种情况都使模型没有很好得反映数据之间的关系,也就很难将其加以运用. 在实践中获得的数据往往是非常复杂的,不知道其关系的,也就使得对模型是否过拟合或欠拟合加以判断变得比较困难. 欠拟合在实践中是相对容易发现并解决的,因为一个欠拟合的模型往往不能较好地描述数据的特征. 解决的方法主要是尝试各种各样的数学模型,增强模型对数据的描述能力. 而过拟合则相对较难发现,因为往往过拟合的模型非常好地描述了数据的特征和信息. 解决的方法主要是将建立好的模型在新的数据样本中进行测试,检验其能否较好地描述新的数据样本的特征.

量化多因子选股简论(下)

太极量化多因子选股模型简论B 第二:因子的选取 候选因子的选取 (一)大数据因子搜索数据因子,搜索频率因子,搜索关键词因子,关注度因子,大众情绪因子等。其中搜索数据因子影响较为显著。 (二)规模因子通过对给定时间内(时间为为6年)市场的分析,不管是从总市值、还是流通市值和自由流通市值看,A股市场存在较为显著的小盘股效应。市值较小股票构造的组合整体上大幅超越沪深300指数,也**优于总市值较大股票构造的组合。规模因子(总市值、流通市值、自由流通市值)是影响股票收益的重要因子,其中总市值因子最为显著。 (三)估值因子通过6年内市场的分析,整体上来说,从市盈率、市净率、市销率、市现率、企业价值倍数等估值指标看,估值较低的股票组合表现较好。估值较低股票构造的组合整体上超越沪深300指数,也优于估值较高股票构造的组合。估值因子(市盈率、市净率、市销率、市现率、企业价值倍数)是影响股票收益的重要因子,其中市盈率(PE,TTM)因子最为显著,其次是市现率(PCF,TTM)。 (四)成长类因子,营业收入同比增长率、营业利润同比增长率,归属于母公司的近利润同比增长率、经营活动产生的现金流金额

同比增长率。 (五)盈利因子通过对时间内市场的分析,整体上来说,从净资产收益率、总资产报酬率和销售毛利率等盈利性指标看,盈利能力较强的股票组合表现较好。盈利能力较强股票构造的组合整体上超越沪深300指数,也优于盈利能力较弱股票构造的组合。但销售净利率较高股票构造的组合表现反而较差,落后于沪深300指数,也落后于销售净利率较低股票构造的组合。盈利因子(净资产收益率、总资产报酬率、销售毛利率)对股票收益的影响不是特别显著,其中净资产收益率指标较为显著。 (六)股东因子户均持股比例、、户均持股比例变化、机构持股比例变化。其中机构持仓比例变化影响较为显著。 (七)分析师预测因子分析师预测因子(预测当年净利润增长率、预测当年主营业务收入增长率、最近1个月预测净利润上调幅度、最近1个月预测主营营业收入上调幅度、最近1个月盈利预测调高占比、最近1个月上调评级占比)是影响股票收益的重要因子,其中最近1个月净利润上调幅度是最为显著的正向因子。(八)动量反转因子通过对时间内市场的分析,整体上来说,A 股市场上存在较为显著的反转效应,从前1个月涨跌幅、前两个月涨跌幅、前3个月涨跌幅、前6个月涨跌幅看,前期涨幅较小的股票组合表现较好,而前期涨幅较大的股票组合表现较差。前期涨幅较小的股票构造的组合整体上超越沪深300指数,也优于盈前期涨幅较大的股票构造的组合。动量反转因子(前1个月

量化交易系统构建思路1-7(待续)

程序化交易策略构建思路 1.基于商品价差的通道突破系统 1)公式名称:CL_SpreadChannelBreakout 2)策略构建思路: 本策略是以通道突破为基础的“四周规则”交易系统的价差交易版,策略本身和经典的“四周规则”并无区别,不同之处是将交易标的从单个商品合约变为两个商品的价差。 3)建立系统的步骤 首先,策略会按照设定的两个商品的交易手数计算出商品的价差,并根据价差的开盘价、最高价、最低价、收盘价画出价差K线图。由于价差的计算是基于两个商品的K线数据而不是详细的Tick数据,所以只有价差的开盘价和收盘价能够准确计算,最高价和最低价则取开盘价差和收盘价差的最高和最低。 4)进场策略 计算价差的一定周期的最高价和最低价,形成上下两条通道,当价差突破上通道时做多,价差突破下通道时做空,突破时反向仓位先平仓再反手。

5)出场策略 止损方面,引入价差的更小周期的最高价和最低价作为止损点。 至此,本策略的构建描述完毕,本策略是基于对外盘行情的观察和理解进行的K线组合交易策略,由于策略特性和国内行情的特性,该策略会出现丢失行情的情况发生,但不失为一种交易思路供使用者思考,请使用者仔细理解口进行选择、修改和使用。 2.基于均线交叉与通道突破相结合的交易系统 1)公式名称:CL_MovingAverageCrossOver【MACO】 2)策略构建思路: 传统的移动平均线交叉系统寻找快速均线和慢速均线的交叉来捕捉趋势,在快速均线上传慢速均线时买入,期待市场趋势上涨,反之卖出,期待趋势下跌。 这种技术在有趋势的市场很有效果,但当市场横向整理或者起伏不定时,均线反复交叉从而产生许多导致亏损的假信号。 【MACO】系统充分利用趋势的同时尽量避免或者减少假信号的产生,方法是识别趋势后并不立即进场,而是确定这是一波行情的开始之后再作为。 系统使用快速均线和慢速均线的交叉来识别一波潜在趋势,直到上升趋势或者下降趋势确定后才发出买入或者卖出的信号。

量化投资入门到进阶

教材目录第一章:量化基础知识 第一节 量化投资的概念和优势 第二节 量化投资的历史和未来 第三节 量化投资的流程与应用 第二章:量化策略入门 第一节:MindGo量化交易平台 第二节:MindGo API介绍 第三节:我的第一个量化策略 第三章:Python编程 第一节:Python介绍 第二节:数据类型 第三节:条件与循环 第四节:函数 第五节:numpy 第六节:pandas基础 第七节:pandas进阶 第四章:经典量化策略集锦 第一篇:投资高股息股票 第二篇:从“二八轮动”中学择时 第三篇:网格交易—动态调仓策略 第四篇:进军交易系统,从Dual Thrust中学“趋势”第五篇:布林强盗,一个霸道的交易系统 第六篇:交易系统终结者—海龟交易法则 第七篇:向彼得林奇投资大师学习PEG选股 第八篇:CAPM模型的应用 第九篇:Fama-French三因子模型应用 第十篇:动量类多因子之择时中选股 第五章:量化研究专题 第一篇:用matplotlib绘图函数实现数据可视化 第二篇:运用Scipy模块实现统计技术 第三篇:10分钟学会用Python做线性回归 第四篇:统计套利:利用相关系数进行配对交易 第五篇:数据处理专题:去极值、标准化、中性化

第六篇:数据挖掘专题:分类与预测 第七篇:算法交易入门—VWAP 第八篇:Python实现马克维兹投资组合理论 第九篇:隐马尔科夫模型【机器学习+数据挖掘】 第十篇:机器学习之神经网络入门

第一章:量化基础知识 第一节 量化投资的概念和优势 量化投资的概念 量化投资是指通过数量化方式及计算机程序化发出买卖指令,以获取稳定收益为目的的交易方式。 量化投资区别于定性投资的鲜明特征就是模型,对于量化投资中模型与人的关系,打个比方来说明,我们先看一看医生治病,中医与西医的诊疗方法不同,中医是望、闻、问、切,最后判断出的结果,很大程度上基于中医的经验,定性程度上大一些;西医就不同了,先要病人去拍片子、化验等,这些都要依托于医学仪器,最后得出结论,对症下药。 医生治疗病人的疾病,投资者治疗市场的疾病,市场的疾病是什么?就是错误定价和估值,没病或病得比较轻,市场是有效或弱有效的;病得越严重,市场越无效。投资者用资金投资于低估的证券,直到把它的价格抬升到合理的价格水平上。 但是,定性投资和定量投资的具体做法有些差异,这些差异如同中医和西医的差异,定性投资更像中医,更多地依靠经验和感觉判断病在哪里;定量投资更像是西医,依靠模型判断,模型对于定量投资基金经理的作用就像CT机对于医生的作用。在每一天的投资运作之前,我会先用模型对整个市场进行一次全面的检查和扫描,然后根据检查和扫描结果做出投资决策。 量化投资的优势 量化投资的优势在于纪律性、系统性、及时性、准确性和分散化。 1.纪律性:严格执行投资策略,不是投资者情绪的变化而随意更改。这样可以克服人性的弱点,如贪婪、恐惧、侥幸心理,也可以克服认知偏差。 2.系统性:量化投资的系统性特征包括多层次的量化模型、多角度的观察及海量数据的观察等。多层次模型包括大类资产配置模型、行业选择模型、精选个股模型等。多角度观察主要包括对宏观周期、市场结构、估值、成长、盈利质量、市场情绪等多个角度分析。此外,海量数据的处理能力能够更好地在广大的资本市场捕捉到更多的投资机会,拓展更大的投资机会。 3.及时性:及时快速地跟踪市场变化,不断发现能够提供超额收益的新的统计模型,寻找新的交易机会。 4.准确性:准确客观评价交易机会,克服主观情绪偏差,从而盈利。

国外量化投资著名公司资料

国外成功量化投资公司案例 吴昊编 90 年代,随着金融工程理论和信息技术的发展,程序化交易逐步走向成熟,美国,英国等出现了专门从事程序化交易的经纪公司。到今天,程序化交易已经在美国和欧洲得到相当的普及,有数据显示,2008 年在全球期货期权市场交易中,程序化交易占到70%的比例;而在套利交易领域,这个比例高达80%。现代的量化投资研究已经发展为一种跨学科的金融研究,借用统计学、数学、物理、电子计算机学、生物学、行为科学和认知科学的方法,来研究金融价格的变化。目前,关于量化投资定义主要有三种:含义最窄的量化投资定义就是以布莱克-舒尔斯-默顿公式为基础的投资方式;最宽的量化投资定义就是指一切使用数学、统计学等工具进行投资决策的投资方式;居中的一种是指按照事先设定的数学公式或者逻辑来投资的方式。量化基金就是指主要按照量化投资方式来投资的基金。 而国内程序化交易起步较晚,最近几年才发展起来,目前在期货市场已有一定的应用积累,在证券市场的应用尚处在起步阶段,但发展之初即显示出旺盛的生命力。中国期货协会会长刘志超2011 年11 月19 日透露,截至目前,我国期货市场的保证金已经突破了2000 亿元,今年前10 个月,我国期货市场成交量为24.95 亿手,成交金额为236.15 万亿元,投资者开户达115.28 万户,根据美国期货行业协会(FIA)摘录的信息,中国期货市场在2010 年的商品期货交易总量超过22 万亿人民币,已经超过美国,成为世界最大的商品期货市场。目前国内程序化交易平台供应商主要有文华财经、交易开拓者、金狐等,参与对象主要以高端投资者为主。证券交易模式主要包括权证日内交易、股票趋势交易、股指期货套利、ETF 套利交易、算法交易和国债做市商交易等。可以预见到的是,随着国内融资融券、股指期货等创新业务的开展和深入,程序化交易将会成为今后国内程序化交易的主流,程序化交易必将迎来一个新的发展阶段。

7种量化选股模型

7种量化选股模型

业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011 年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动

等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2 个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体

行业轮动多因子选股模型及投资效果实证分析

行业轮动多因子选股模型及投资效果实证分析量化投资因其非凡的业绩表现引起了投资者的广泛关注,在过去的40年里颠覆了传统的投资哲学,被誉为“投资界的革命”。随着计算机技术的高速发展,该模式得到了更加迅速的进步和发展。许多把量化策略作为主要投资技术的资产管理公司已经发展成为同行中的佼佼者,这也说明了量化投资理念已经深入人心,量化投资技术渐渐成为主要的投资方法之一虽然我国在量化投资方面开始较晚,起点较低,且在量化投资策略研究、开发工具人才及交易技术等方面相较于国际水平比较落后,但是通过各方努力,已经在迅速发展了且取得了不错的成绩。根据统计资料可知,到2014年上半年为止我国资本市场上已有超过200只私募量化基金、87只公募量化基金和将近200只券商理财量化产品,去除大量小型化专户理财和有限合伙人投资企业等,这些量化产品管理着近千亿元人民币。 从量化产品占理财资金的比例和资本市场上现有量化策略方法的多少、量化投资思想的普及和认可度等多个角度都可以看出量化投资在我国有着非常大的发展空间。作为资本市场发展的必经阶段,量化投资也是市场有效性不断进步和发展的一种趋势。本文构建了多因子选股模型和行业轮动多因子选股模型,并采用沪深300指数成分股数据进行实证分析,实证结果表明文中构建的多因子选股模型和行业轮动多因子选股模型均可战胜沪深300指数表现,并且从多方面证明了行业轮动多因子选股模型的投资效果要好于多因子选股模型。文中第二章主要介绍了国内外量化投资的发展、经济周期的相关概念与货币周期的划分,从经济逻辑上论证了行业轮动策略的有效性及行业周期性非周期性划分依据,详细地说明了多因子选股模型的构建步骤。 第三章是对第二章中阐述的方法原理的实证检验。由实证结果可得,无论是战胜基准的概率还是信息比率和累计收益率,行业轮动多因子选股模型都好于多因子选股模型。在实证过程中还发现,行业轮动多因子选股模型优于多因子选股模型的关键之处在于当经济处于收缩阶段时非周期性行业的风险防御效果较好。

量化交易系统系列-期货交易者的资金管理策略

量化交易系统系列-期货交易者的资金管理策略 一、引言 最近在研究CTA策略,发现资金管理这块还是挺欠缺的,就买了两本资金管理的书籍:《期货交易者的资金管理策略》和《资金管理方法及其应用》。目前刚刚看了资金管理策略,收获蛮大的,那就把这里的一些内容整理下。这本小册子有效页数就100张左右,内容比较简单,没有涉及太多的数学内容,里面有一些小例子有助于理解。 这本书认为资金管理的步骤可以分为5步: 商品合约的选择。通过考察预期利润、风险和投资数额等来设定客观标准,选择交易品种。 控制总体暴露风险。这里要确认一个最优的暴露风险比率和考虑各个品种之间的相关性。 各个品种之间风险资本的分配。通过胜率和报酬率确定各个品种交易之间的差异,然后根据差异分配每个品种的风险资金。 评估和制定每一笔交易的最大损失水平。主要通过止损策略进行。 确定每个品种交易的数量。确定每个品种交易的数量后,再根据盈利情况使用金字塔加仓法进行加仓。

二、破产风险 在讲资金管理之前,作者介绍了破产风险相关知识。人们常说:想要避免破产的最好办法就是至少经历过一次破产,但是这对交易者心理和经济方面影响巨大。所以了解破产的相关理论和知识意义重大。破产风险是以下因素的函数: 成功概率 报酬率(平均盈亏比) 用于交易的资本比例 通过现有破产风险模型模拟的方法,可以发现:交易成功概率越高,破产风险越低。报酬率越高,破产风险越低。交易成功概率和报酬率是决定性因素。在此基础上,用于交易的资本比例能够减轻破产风险,比例越小,越不容易破产。活下去比赚大钱对于投资来说是更紧迫的需求。 三、商品合约的选择 期货交易中降低风险有两种方式:第一,减少用于投资的比例。第二,分散投资。投资单独商品的历史回报波动率高于非正相关的多个商品。首先应明确不要同时交易正相关或者相关性非常高的两个品种。除了用常规的统计学检验外,确认相关性是否真实的一个好方法是:在更小的时间范围内再次计算相关性,如果互斥且连续的时间区间内相关性不连续,应该质疑长期的相关性水平。

量化投资

中小盘低估成长 量化投资 项目报告书 ——成就50%的年度复合增长 交易要像壁虎一样,平时趴在墙上一动不动,蚊子一旦出现就迅速将其吃掉,然后恢复平静,等待下一个机会。 --西蒙斯 2012-06-26

前言:西蒙斯和量化投资 沃伦·巴菲特是人人皆知的股神,但可能很多投资者不知道詹姆斯·西蒙斯(James Simons )。这位创造了华尔街投资神话的传奇人物,他所管理的大奖章基金(Medallion )的平均年收益率比巴菲特的收益率要高的多,1989-2009年的平均收益率高达35%(若考虑高达44%的收益提成,则实际基金的年收益率超过60%,而股神巴菲特在同期的平均年复合回报率也不过为20%),较同期标普500指数年均回报率高20多个百分点,比金融大鳄索罗斯和股神巴菲特的操盘表现都高出10余个百分点。即便是在次贷危机爆发的2008年,该基金的回报率仍高达80%。 这个回报率是在扣除了5%的资产管理费和44%的投资收益分成以后得出的,并且经过了审计。值得一提的是,西蒙斯收取的这两项费用应该是对冲基金界最高的,相当于平均收费标准的两倍以上。 西蒙斯是位数学天才。他出生于波士顿郊区,是一个制鞋厂老板的儿子,3岁就立志成为数学家。1958年,20岁的西蒙斯获得麻省理工学院学习数学学士学位,仅仅三年后,他就拿到了加州大学伯克利分校的博士学位,一年后他成为哈佛大学数学系的教授,时年24岁。1974年,36岁的西蒙斯与陈省身联合发表了著名论文《典型群和几何不变式》,创立了著名的陈—西蒙斯理论,该几何理论对理论物理学具有重要意义,广泛应用于从超引力到黑洞。 在理论研究之余,他开始醉心于股票和期货交易。1988年西蒙斯创立了自己的大奖章基金,针对不同市场设计量化的投资管理模型,并以电脑运算为主导。在全球各种市场上进行操作是西蒙斯的成功秘诀。不过西蒙斯对交易细节一直守口如瓶,除了公司的200多名员工之外,没有人能够得到他们操作的任何线索。对于数量分析型对冲基金而言,交易行为更多是基于电脑对价格走势的分析,而非人的主观判断。西蒙斯亲自设计了最初的数学模型,他同时雇用了超过70 位拥有数学、物理学或统计学博士头

量化选股系列报告之六:基于纯技术指标的多因子选股模型

证券研究报告 | 金融工程 量化投资基于纯技术指标的多因子选股模型 2014年4月11日——量化选股系列报告之六 样本内各策略累计超额收益 资料来源:聚源数据、招商证券 样本外各策略累计超额收益 资料来源:聚源数据、招商证券 综合策略与沪深300收益 资料来源:聚源数据、招商证券 相关报告 《量化选股因子测试系列报告之 五-基于股票风格特征的量化评 分模型》2011/8/1 传统的多因子选股,主要考虑使用价值、成长、质量以及市场等四大类因子, 采用打分模型,构建月度选股策略。本报告尝试仅使用技术指标构建多因子选 股策略。在本报告中主要考察超买超卖型和趋势型指标的月度选股效果。 ?技术指标选股策略构建框架:在对单个技术指标测试时,使用优化后的参 数计算相应指标。为避免空仓月份较多的问题,提出以相对价格方式。在 考虑多个指标叠加的问题上,本文尝试:指标等权叠加、个股阈值限制、 资金等权分配以及个股多倍权重共四种方法检验模型效果。 ?趋势型指标死叉组合优于金叉组合:无论在哪种价格下,趋势型指标金叉 组合月均超额收益和累计超额收益几乎均为负,反而死叉信号给出组合这 两者基本为正值。显示股票反转效应更为明显:在趋势性指标给出买入信 号后的一个月时间,股价很可能已经反转,并且反转效应大于之前的动量 效应,导致持有金叉组合收益为负。因此基于反转效应,在处理趋势型指 标的问题上本文以死叉信号作为构建Top组合的依据。 ?样本内策略表现:在综合价格下以综合策略Ⅱ为例,样本内月均超额收益 为1.79%,月胜率在65%左右,年化信息比率达1.47。若以年化信息比率、 月均超额收益为评价标准,该方法具有明显优势。因此本文选择综合价格 下的综合策略Ⅱ作为样本内建模。 ?样本外策略检验:策略依然保持着相对于沪深300稳定的优势。过去15 个月沪深300收益率为-15%左右,而同期综合策略Ⅱ累计收益11.09%, 超额收益达26%左右,月均超额收益为1.85%,年化信息比率为1.57。 ?整体收益特征分析:综合策略Ⅱ与沪深300月收益的相关系数高达 92.36%,由此来看二者相关性非常显著。从回归方程的结果来看,相对于 沪深300的β系数为1.07,略大于1;α为1.13%,显著大于0。此外值 得注意的是,回归方程的拟合优度R 为0.853,拟合效果非常好。 ?未来可改进的方向:1、可以考虑以滚动5年作为样本内进行参数优化,并 用接下来1年作为样本外测试,构造动态选股模型;2、可在中证500、中 证800乃至全市场股票池中验证本文提出的选股策略效果;3、继续挖掘其 他类型指标。 陈军华 0755-******** chenjh2@https://www.360docs.net/doc/b69111117.html, S1090513080001 罗业华 0755-******** luoyh@https://www.360docs.net/doc/b69111117.html, -14% -12% -10% -8% -6% -4% -2% 0% 0% 50% 100% 150% 200% 250% 300% 350% 回撤超买超卖型趋势型 综合策略Ⅰ综合策略Ⅱ

相关文档
最新文档