基于机器学习的股票交易时机研究.doc
《基于机器学习的股票交易时机研究.doc》由会员分享,可在线阅读,更多相关《基于机器学习的股票交易时机研究.doc(48页珍藏版)》请在沃文网上搜索。
1、目 录摘 要IABSTRACTII第一章 前 言11.1 研究背景11.2 股市预测的发展概况11.3 支持向量机简介31.4 本文的主要内容3第二章 股市知识的准备52.1 引言52.1.1 我国股票市场的发展52.1.2 进行股票投资分析的必要性62.2 股票的相关知识62.2.1 股票常用术语72.2.2 股票价值和股票指数72.3 企业财务指标92.4 股市技术指标简介9第三章 股市预测问题研究方法123.1 引言123.2 投资分析法123.2.1 技术分析法123.2.2 基本面分析法123.2.3 组合分析法133.3 时间序列分析法133.3.1 ARMA模型简介143.4 非
2、线性系统分析法143.4.1 神经网络预测方法概述143.4.2 多层前馈神经网络(BP网络)15第四章 统计学习理论与支持向量机174.1 理论背景174.1.1 机器学习分类174.1.2 机器学习存在的基本问题174.2 统计学习理论184.2.1 VC维194.2.2 推广性的界194.2.3 结构风险最小化(Structural Risk Minimization,SRM)204.3 支持向量机基本原理214.3.1 基本概念224.3.2 线性支持向量机234.3.3 非线性支持向量机254.3.4 基于支持向量机的回归分析28第五章 基于支持向量机的股市预测315.1 基于支持向
3、量机的股市预测流程315.2 基于向量机的分析预测工具Libsvm325.3 实际预测结果与数据验证分析335.4 股票交易时机的确定38结束语39致 谢40参考文献41I2010届信息与计算科学专业毕业论文摘 要股票市场是一个复杂的非线性动态系统,但由于传统的预测技术并没有准确的揭示股票市场的内在规律,导致最终的预测结果并不十分理想。本文采用了支持向量机的方法对股市进行预测。支持向量机是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。特别是近年来支持向量机在回归算法的研究方面也表现了极好的性能,但是将其应用到股市预测中却并不多。本文介绍了股市的相关背景知识,然后对股市里的
4、常用术语作了介绍以及对传统的股市预测的方法进行了介绍,特别详细介绍了基于神经网络的预测方法。接着全面介绍了统计学习理论和建立在其上的支持向量机方法,详细描述了支持向量机方法的基本原理。 最后,对支持向量机方法用于股市预测问题进行了尝试。提出了使用支持向量机的方法进行股市预测的基本流程,然后通过使用实际的股市交易数据进行预测,在具体股价的预测都表现出很好的效果。 关键词:股票,股市预测,支持向量机,核函数佘开勇:基于机器学习的股票交易时机研究ABSTRACTStock market is a complex non-linear system, and is affected by many f
5、actors. The traditional prediction technologies cannot disclose the inherent rule of stock market. In this paper, a new prediction technology based on Support Vector Machine (SVM) has been proposed.The support vector machine is a data mining new technology; it is a new tool that draws support the op
6、timized method to solute the machine learning questions. Specially in recent years, supported the vector machine also to display the extremely good performance in the return algorithm research aspect, but applied it the stock market to forecast certainly were not actually many.This paper introduce t
7、he background knowledge of stock market, then common terms on the stock market was introduced and traditional prediction technologies are introduced in detail, especially the technology based on neural network, and then the basic principles of SVM are discussed.Finally, this paper uses SVM to predic
8、t the price of stock, and propose a common framework to solve stock market prediction problems using SVM. Data from real stock market is used to evaluate the exactness of the algorithm. Result shows that SVM is an effective method, and get precise result.Key Words:Stock, Prediction of Stock market,
9、Support Vector Machine, Kernel functionII2010届信息与计算科学专业毕业论文第一章 前 言1.1 研究背景股票是市场经济的产物,股票的发行和交易促进了市场经济的方展。自从股票 1773 年在英国率先发行以来,已有二百多年的历史。现在已经成为整个社会经济的“晴雨表”和“报警器”,其对于经济发展的作用不可估量。随着股票市场的不断规范壮大和计算机技术的发展,越来越多的人进入到股票交易市场,也相应产生了很多股票分析和预测系统。由于股市行情受经济政治等因素的影响,其内部规律非常复杂,变化周期无序,同时我国资本市场投资者结构具有特殊性,个人投资者的比例很高,投资者
10、的心里状态不同,对股票交易的行为会产生直接的影响,导致股价波动。 在信息爆炸的今天,迫切需要一种方法能从大量的数据信息中提取出有用的信息,数据挖掘技术在这种情况下诞生了。确切的说, 数据挖掘 (Data Mining)是指从大型数据仓库中提取出隐含的、未知的、非平凡的及有潜在的应用价值的信息或者模式,它是数据库研究中一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。在最近十几年间,成熟的技术和高性能的关系数据库引擎以及广泛的数据集成,使数据挖掘技术的研究工作取得了很大的发展,各种数据挖掘技术的应用极大的提高了分析、处理大量数据信息的能力,并为人们的生产生
11、活带来了很大的经济效益,数据挖掘技术在股市预测中也具有很强的应用价值。1.2 股市预测的发展概况预测是指从已知事件测定未知事件。预测理论作为一种通用的方法论,既可以应用于研究自然现象,也可以应用于研究社会现象。将预测理论应用于各个领域,就产生了预测的各个分支,如人口预测、经济预测、气象预测等等。在金融经济学的发展上,人们对金融预测作了大量的探索,取得了丰硕的成果。典型的金融预测时是时间序列预测。时间序列是按照时间顺序取得的一系列观察值。 时间序列的典型特征是相邻观测值之间的依赖性。 为了研究这种依赖性,人们提出了许多时间序列模型,并对这模型的性质及分析方法进行了深入的研究。传统的金融时间序列大
12、致上有两种研究方法,一种方法是从基本的经济原理出发建立金融时间序列服从的数学模型,像 Markovitz的投资组合理论1,资本资产定价模型(CAPM)1、套利定价理论(APT)1、期权定价模型1等。实际上,这部分成果就是确定金融时间序列的趋势项。另一种方法是从统计角度对金融时间序列进行研究。这种方法直接从实际数据出发,应用概率统计推断出市场未来的变化规律。虽然这种方法从经济学角度来讲缺乏理论性,但是在实际应用中效果较好。而且,统计方法还可以对经济模型的好坏进行检验和评价。二十世纪 80 年代以前,人们对时间序列的研究主要集中在一种线性模型,即自回归移动平均模型(AutoRegressive M
13、oving Average Modes,ARMA),这种模型结构简单,有着完善的统计推断技术,应用非常广泛。但是 ARMA 模型毕竟是一种线性模型,有些实际现象在模型中得不到反映。在这种情况下人们开始提出并研究非线性时间序列,最重要的就是 R.F.Engle 在八十年代初提出的自回归条件异方差模型(AutoRegressive Conditionally Heteroscedastic Models ,ARCH),由于ARCH模型将方差看作随时间变动的量,而不是一个常量,从某种程度上克服了线性模型的局限性。与实际情况更相符,从而得到了广泛的应用。 股市预测,是金融经济预测的一个重要分支。它对股
14、票市场所反映的各种资讯进行收集、整理、综合等工作,从股市的历史、现状和规律性出发,运用科学的方法,对股市未来发展前景进行测定。股市预测一般基于以下三点假设2:(1) 有效市场假设:指股票市场会对每一条有可能影响股价的信息都会作出反映,而各种价格的变动正是这种反映的结果。(2) 供求决定假设:指一切信息都会对股票市场的供求双方力量对比产生影响,供求决定交易量和交易价格。(3) 历史相似原则:指由历史资料所概括出来的规律已经包含了未来股票市场的一切变动趋势。股市预测按不同的标准可以有不同的分类。按涉及的范围不同可分为:指数预测和个股预测;按预测时间长短不同可分为:长期预测、中期预测和短期预测;按预
15、测方法的不同可分为:定性预测和定量预测等等。Charles Dow在 1900 年到 1902年,写了一系列的评论来阐述他的市场观。Sam Nelson 收集了他的评论并将他的观点发展为市场行为原则,这就是成为技术分析基础的道氏理论。Richard Schabacker 第一个将通用图表形态分类,研究出“缺口”理论,被称作技术分析科学之父。瑞夫N艾略特通过研究市场波动和循环的形态,提出了“波浪理论”。WDGann 研究了时间要素的重要性,提出了“价格时间等价”的概念。随后,又出现了各种分析方法,包括 K 线图分析法、柱状图分析法、点数图分析法、移动平均法、形态分析法、趋势分析法、角度分析法、神
16、秘级数与黄金分割比螺旋历法、四度空间法等。这些分析方法主要依赖于图表,图表信息具有明显的直观化优点,但图表的分析与指标的选择却要依靠主观的判断,这是这些分析方法面临的主要问题。由于股票交易的模式和相关信息的复杂性,这样一种严重依靠经验的方法,其可靠性在很大程度上是要受到质疑的2。从 60 年代开始,人们尝试使用各种时间序列分析方法来预测股市。在时间序列分析中,线性模型的研究比较成熟。但是股市是一个非线性系统,用线性模型逼近容易丢失有用信息。为了更确切描述实际系统特性,又发展了阈值自回归模型、多项式自回归模型和指数自回归模型3等,用这些方法对股市进行建模和预测也取得了比较好的结果。1.3 支持向
17、量机简介支持向量机4-7(support vector machine ,SVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。它最初于世纪年代由Vapnik提出,近些年来在其理论研究和算法实现方面都取得了突破性进展,并开始成为克服“维数灾难”和“过学习”等传统困难的有利办法,虽然他还处在飞速发展的阶段,但它的理论基础和实现途径的基本框架已经形成。支持向量机目前主要来解决分类问题(模式识别,判别分析)和回归问题。支持向量机的最大特点是改变了传统的经验风险最小化原则,而是针对结构风险最小化原则提出的,因此具有很好的泛化能力。另外,支持向量机在处理非线性问题时,首先将非线性
18、问题转化为高维空间中的线性问题,然后用一个核函数来代替高维空间中的内积运算,从而巧妙地解决了复杂计算问题,并且有效地克服了维数灾难以及局部极小问题。尽管支持向量机有以上的优点,但是在金融时间序列预测这方面研究还很少。Tay和Cao8证明5种金融时间序列数据可以用支持向量机进行预测,并指出,支持向量机在标准均方误差,均方绝对误差,趋势正确率,加权趋势正确率标准下优于人工神经网络。Kyoung-jae Kim用支持向量机对股市指数的运动趋势进行预测。1.4 本文的主要内容股票市场受很多因素影响,变化规律很难把握。本文采用统计学习理论的支持向量机方法进行了股市预测问题的研究。主要完成了以下工作: (
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 股票交易 时机 研究
