首页 存档 技术 查看内容

遗传算法用于CTA策略参数优化

2018-3-30 13:00 |来自: 互联网 459 0

摘要: 遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。遗传算法是从代表问题可能潜在的解集的一个种群(population ...

遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。遗传算法是从代表问题可能潜在的解集的一个种群(population)开始的,而一个种群则由经过基因(gene)编码的一定数目的个体(individual)组成。每个个体实际上是染色体(chromosome)带有特征的实体。染色体作为遗传物质的主要载体,即多个基因的集合,其内部表现(即基因型)是某种基因组合,它决定了个体的形状的外部表现,如黑头发的特征是由染色体中控制这一特征的某种基因组合决定的。因此,在一开始需要实现从表现型到基因型的映射即编码工作。由于仿照基因编码的工作很复杂,我们往往进行简化,如二进制编码,初代种群产生之后,按照适者生存和优胜劣汰的原理,逐代(generation)演化产生出越来越好的近似解,在每一代,根据问题域中个体的适应度(fitness)大小选择(selection)个体,并借助于自然遗传学的遗传算子(genetic operators)进行组合交叉(crossover)和变异(mutation),产生出代表新的解集的种群。这个过程将导致种群像自然进化一样的后生代种群比前代更加适应于环境,末代种群中的最优个体经过解码(decoding),可以作为问题近似最优解。


遗传算法是解决搜索问题的一种通用算法,对于各种通用问题都可以使用。搜索算法的共同特征为:

① 首先组成一组候选解

② 依据某些适应性条件测算这些候选解的适应度

③ 根据适应度保留某些候选解,放弃其他候选解

④ 对保留的候选解进行某些操作,生成新的候选解。

在遗传算法中,上述几个特征以一种特殊的方式组合在一起:基于染色体群的并行搜索,带有猜测性质的选择操作、交换操作和突变操作。这种特殊的组合方式将遗传算法与其它搜索算法区别开来。

遗传算法还具有以下几方面的特点:

(1)遗传算法从问题解的串集开始搜索,而不是从单个解开始。这是遗传算法与传统优化算法的极大区别。传统优化算法是从单个初始值迭代求最优解的;容易误入局部最优解。遗传算法从串集开始搜索,覆盖面大,利于全局择优。

(2)遗传算法同时处理群体中的多个个体,即对搜索空间中的多个解进行评估,减少了陷入局部最优解的风险,同时算法本身易于实现并行化。

(3)遗传算法基本上不用搜索空间的知识或其它辅助信息,而仅用适应度函数值来评估个体,在此基础上进行遗传操作。适应度函数不仅不受连续可微的约束,而且其定义域可以任意设定。这一特点使得遗传算法的应用范围大大扩展。

(4)遗传算法不是采用确定性规则,而是采用概率的变迁规则来指导他的搜索方向。

(5)具有自组织、自适应和自学习性。遗传算法利用进化过程获得的信息自行组织搜索时,适应度大的个体具有较高的生存概率,并获得更适应环境的基因结构。

(6)此外,算法本身也可以采用动态自适应技术,在进化过程中自动调整算法控制参数和编码精度,比如使用模糊自适应法。


(CTA Fund),期货投资基金简称期货基金或商品基金,是指广大投资者将资金集中起来,委托给专业的期货投资机构,并通过商品交易顾问(CTA)进行期货投资交易,投资者承担投资风险并享有投资利润的一种集合投资方式。


CTA基金分类:

1.按照市场参与面

专业化:专注于一个特殊的市场。如贵金属。

多元化:投资于多个市场,多个期货合约。

2.按照交易方法

计算机自动交易:在基本和统计分析中导入量化模型,根据其产生的多,空信号进行交易。

人工自主交易:在基本分析或关键经济数据分析的基础上进行投资。

3.CTA基金按交易策略

宏观策略:是指利用宏观经济原理,识别经济发展趋势,或金融资产价格的失衡错配,通 过对股票,债券,外汇,利率,期货和期权等品种的投资,争取获取高额收益的策略。

事件驱动:利用重大消息如:国家政策,汇率政策,自然现象发生前后对不同交易品种价格影响进行交易。

市场中性:从不同期货市场或是同一市场内不同期货合约间的价差中寻求利润。

趋势交易:运用大量不同指标去除市场噪音并寻找当前市场趋势,建立多头或空头头寸。

4.按基金管理人盈利模式

收取管理费,不收取业绩提成,管理人盈利模式主要靠 扩大规模。

收取管理费,也收取业绩提成,基金管理人无论业绩如何,旱涝保收。

收取低 管理费,主要靠收取业绩提成,基金管理人要努力保证基金有业绩才有收益.


那么遗传算法和CTA基金结合,会有什么样的效果呢?

下文转载自:量化投资与机器学习



投资策略基于指数移动平均线的交易系统

  • 多头开仓条件:短期均线上穿长期均线同时长期均线大于更长期均线的值

  • 空头开仓条件:短期均线下穿长期均线同时长期均线小于更长期均线的值


为了达到分散风险的目的,选取价格走势相关性较小的品种,本文将标的池选为RBM0, CUM0, RMM0, SRM0 等主力合约。获取2014年1月1日止2014年12月31日这些合约的日行情。




标的之间的相关系数矩阵









参数优化

  • 网格优化
    那么参数设为多少合适?指数移动平均线交易系统涉及到三个参数,短周期,长周期,更长的周期。下面我们设置为更长的周期为25,来对短周期和长周期进行网格化的遍历,设定短周期范围为5至10,长周期范围为15-25。

  • 遗传算法
    通过机器学习的方法来进行参数优化求解。





网格算法




max_drawdown




sharpe




annualized_return




最后本文选择了5日短线,20日长线来作为回测的参数。下面画出其累计收益率的走势,以及具体风险指标。







遗传算法


那么有没有不遍历的方法进行参数优化?本文以机器学习的遗传算法为例,旨在提供一个思路,具体效果可能并没有那么理想,而且容易陷入局部最优解,后续还将多加调整。



遗传算法介绍


遗传算法是通过模拟大自然中生物进化的历程,来解决问题的。大自然中一个种群经历过若干代的自然选择后,剩下的种群必定是适应环境的。把一个问题所有的解看做一个种群,经历过若干次的自然选择以后,剩下的解中是有问题的最优解的。当然,只能说有最优解的概率很大。




几点说明

  • 编码方式:我们考虑两个参数,短周期与长周期。短周期的范围为[5,10],长周期范围为[15,25]。采用普通的二进制编码,码长为6位。

  • 解码方式:对于6位的二进制编码可以表示[0,63]内的任意正整数,所以还需构造映射进行转换至相应的区间。

  • 适应度函数:这里的适应度函数即回测,函数的因变量为策略的年化收益率








['000000', '101011']0.5451

['000010', '101101']0.5451

['000010', '000010']0.5451

['000000', '000100']0.5451


可以看到6次繁衍后,遗传算法最后也收敛到了最优解上。



来源:量化投资与机器学习



声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部