基于自适应遗传算法的股票预测模型研究

作者:张炜;范年柏;汪文佳 刊名:计算机工程与应用 上传者:房宁

【摘要】为了解决单一神经网络模型很难满足股票预测建模要求的问题,提出一种基于遗传算法的粗糙集属性约简方法和神经网络相结合的预测模型。在该模型中,改进了自适应性遗传算法的交叉算子与变异算子。基于该遗传算法的粗糙集属性约简相比传统的粗糙集属性约简,其具有更强的求解最小属性约简的能力,解决了神经网络预测时训练速度慢、内存开销大等问题;在数据预处理过程中,引入聚类分析,有效解决了连续属性离散化的问题。实验结果证明,该预测模型具有较高的预测精度,在时间序列的股票预测中是相当有效的。

全文阅读

1引言股票是国民经济发展变化的“晴雨表”,股票价格预测一直是投资者及学术研究人员研究的热点。股票市场是一个高度复杂的非线性系统,其变化既有内在的规律性,同时也受到政治事件、宏观经济情况、交易员的心理状况等诸多因素的影响。在过去的几十年里,许多研究人员使用人工智能(AI)方法处理类似这种不确定性的问题[1]。股价序列有着极端的动态性以及较强的波动性等特点,使得传统时间序列模型难以有效描述上述股市的变化规律,所以单一神经网络模型很难满足股票预测建模的要求。粗糙集(RoughSet)理论是一种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则[2]。它无需提供问题数据集合之外的任何先验信息,所以它能更客观地描述金融类不确定性问题的特征。本文将粗糙集理论与遗传算法有效地结合在一起,与神经网络[3-4]建立起时间序列股票预测模型[5],并进行股票价格预测。2粗糙集理论介绍粗糙集理论是由波兰数学家Z.Pawlak于1982年提出的。它建立在分类机制的基础上,将分类理解为在特 定空间上的等价关系,而等价关系构成了对该空间的划分。属性约简和属性集求核是粗糙集理论研究及应用的重要研究内容之一。信息系统中的“核”是信息系统不可或缺的部分,包含在该系统的任一属性约简形式之中。下面简单介绍一下粗糙集理论的相关概念[6]。定义1设S=(UAVf)是一个知识表达系统,其条件属性和决策属性分别为C和D,称D在S中关于C的依赖度定义为:rC(D)=card(POSC(D))/card(U)(1)式(1)中,rC(D)?[01],POSC(D)是D的C正区域。当rC(D)=0时,表示决策信息完全独立于条件信息;当rC(D)=1时,表示决策信息完全依赖于条件信息。定义2设S=(UAVf)是一个知识表达系统,A=CD,CD=,C称为条件属性集,D称为决策属性集;C的属性子集B是信息系统的约简,当且仅当IND(B)=IND(C),并且B中的任意属性是必不可少的。用REDS表示信息系统S的约简的集合,用REDS(B)表示属性集B(BC)的约简集合。定义3设S=(UAVf)是一个知识表达系统,A=CD,CD=,C称为条件属性集,D称为决策属性集。属性c?C在C中对D的重要性定义为:sigDC-{c}(c)=rC(D)-rC-{c}(D)(2)所有C的属性约简的交集B称为C的核CORE(C),表示为CORE(C)=REDS(C),即C的核包含在C的所有约简集合中。3遗传属性约简算法仅仅凭借传统粗糙集自身的方法,很难得到满意的最小属性约简集合,寻找最小属性约简是个NP难问题。遗传算法(GeneticAlgorithm)是模拟生物的遗传进化过程而形成的一种自适应搜索算法,主要特点是群体搜索策略和群体中个体之间的信息交换,它在全局优化搜索方面的能力突出[7]。遗传算法的交叉概率和变异概率的选择是影响遗传算法行为和性能的关键,也直接影响算法的收敛性。Srinvivas等学者提出一种自适应遗传算法,交叉概率与变异概率能够随着适应度大小而改变,有效解决了传统遗传算法收敛速度慢、容易早熟等问题。3.1基于粗糙集的自适应遗传算法即使在最复杂的解空间中,遗传算法也有着极强的求解能力。将遗传算法与粗糙集理论相互结合,往往能取得较好的效果。3.1.1编码采用二进制的个体定长编码。用一个二进制串来表示每个个体,条件属性的总数即为个体的长度。个体二进制串上的每一位对应一个条件属性,某位取1表示选择该属性,取0则表示不选择该属性。例如:假设有10个条件

参考文献

引证文献

问答

我要提问