基于神经网络训练的非线性时间序列预测的实验设计.doc
《基于神经网络训练的非线性时间序列预测的实验设计.doc》由会员分享,可在线阅读,更多相关《基于神经网络训练的非线性时间序列预测的实验设计.doc(31页珍藏版)》请在沃文网上搜索。
1、基于神经网络训练的非线性时间序列预测的实验设计A P.P.Balestrassi, E.Popova, A.P.Paiva, J.W.MarangonLima摘要: 在这项研究中,应用于实验设计(DOE)中的统计学方法更好地确定了人工神经网络(ANN)在非线性时间序列预测问题中的各种参数。取代了最常见的试错法,DOE被认为是人工神经网络训练的一个更好的方法。此研究的主要目的是预测季节性的非线性时间序列,也就是有关如短期电力负荷,每日价格和收益,耗水量等许多实际问题的预测。采用了此体系的个案研究中有六个时间序列,代表了巴西生产公司的工业用户的用电负荷。1.介绍对于解决试验在实际运用中的问题的研究
2、员来说,DOE被认为是最重要的方法之一,因为它已有过大量成功的案例。如今,DOE资源被纳入统计软件包,方便了数据的计算和结果的解释。同样,人工神经网络在时间序列预测的问题中也起着重要作用。然而,人们也经常提到应用人工神经网络的弊端,那就是对其参数的优化。在一般情况下,大多数的实践者会利用长时间的试错过程来实现参数的优化。这项工作的主要目的是利用人工神经网络预测非线性时间序列和季节性时间序列,这正是许多实际应用中需要解决的真正问题。通常日季节性,月度或年度季节性都与固有的几个问题有关,如价格,收益,用电负荷,耗水量,需求等。非线性结构也存在于大多数的案例研究中。在这里DOE可以通过模拟估算出AN
3、N的参数。由于缺乏相关文献对此进行阐述,还有一些问题也有待研究,此外以下问题也将在本文得到解决:如何利用ANN解决非线性季节性时间序列问题?如何设计ANN来解决这个问题呢?在这种方法中有哪些重要因素呢?是否有需要考虑的影响因素呢?在论文的第二部分回顾了基于ANN的实验设计进行非线性时间序列预测的最新文献。第三部分展示了整个实验过程的数据及图像结果。第四部分阐述了在ANN实验设计的框架内进行短期电力负荷的个案分析。第五部分陈述了我们的主要结论。2.背景及文献回顾2.1.实验设计的仿真一个人工神经网络的训练过程包括改变计算机算法的输入参数,运行算法,并检查结果。这可以被看做是ANN问题的模拟研究。
4、尽管在工业应用中DOE不乏成功的案例,但是它还并未被广泛应用于仿真领域。Kleijnenetal 34指出DOE在仿真领域的缺失主要由于以下原因:(一)仿真分析家不相信DOE能够带来益处。 (二)关于DOE的研究往往刊登在仿真分析家很少涉猎的专业期刊。 (三)大多数的DOE最初是被用来研究真实世界的实验,而非仿真设备。上述研究还指出了在模型研制和仿真方面实验设计的主要优点,并预测说,DOE的使用可能在这个方面变DOE可以揭示详尽的模型行为,使建模团队详细讨论各种模型假设的影响,当分析师可能提前不知道应该问什么问题时,帮助构思问题,质疑或确认预期方向的正确性和因子效应的相关重要性,甚至发现在程序
5、设计中的逻辑问题.DOE更适合特定的应用程序,它比试错法或一个小而简单的设计更好。因此,从业者应该开放观念,相信DOE是复杂的仿真分析中有用且必要的组成部分。仿真术语的翻译可以看成是将仿真模拟中的一个输入或参数对应DOE中的一个因子。通常在仿真中的因子要比现实试验中更多。因子可以是定性的或定量的。每个因子可以别赋于两个或两个以上的值,称为因子水平,通常用数字编码进行分析。一个方案或设计点是所有因子水平的结合。随机模拟复制指的是将不同的伪随机数(PRNs)用于模拟相同的情况。对各种情况的数据收集不是随机的,但是是连续的。除另有规定外,和大多数统计方法的假设一样,我们假设复制使用的是不重叠的伪随机
6、码流,所以通过复制的输出属于独立同分布(IID)。要对仿真有基本的理解就得测试DOE中因子效应的假设。另一个重要问题是,使用DOE进行模拟仿真的主要目的并不是优化。使用DOE我们应力求找到稳健的方法或策略,而非最佳方法。诚然,找到模拟系统的最优方法是一个热门话题,而且许多方法也曾被提议过。Fu和Spall对当前仿真优化的研究和实践进行了探讨。这些方法包括启发式搜索技术如遗传算法,响应面法(RSM),模拟退火,禁忌搜索以及通过分析模拟模型来估计梯度,如扰动分析和评价函数。优化的结果是以特定的分布和(通常假定独立)和多种输入变量为前提的。当所有这些假设在现实中甚至是在有限的时间内出现的概率为零时,
7、“最优”一词就存在问题了。与此相反,稳健的设计方法会将这些假设全部看做实验中的附加因素。这些被认为是噪声因素(而不是决定因素),因为他们在真实环境中是不可预知或无法控制的。尽管可能会遇到一系列噪声条件但是稳健的体系或方法仍能正常运行,因此,实施稳健的解决方案是不太可能导致意想不到的结果的。这个稳健的设计理念是受到Taguchi的启发65,他使用了简单的设计就确定了丰田汽车强大的产品配置。2.2.人工神经网络的时间序列预测问题人工神经网络,首先在认知科学和工程领域中被使用,是普遍的和高度灵活的函数逼近器。正如Tsay56所说,人工神经网络是预测应用中普遍和灵活的工具:ANN是现代数据分析中的热点
8、问题,它被归为半参数法。相对于基于模型的非线性方法,人工神经网络是数据驱动的办法,它不用事先对特殊问题中的隐含关系进行假设,直接就可以捕捉非线性数据结构。图.1显示了本研究中采用的ANN结构图:多层前向反馈网络结合反向传播训练。人工神经网络分三层,即输入层,输出层和隐蔽层,隐蔽层是输入和输出之间的中间层。隐蔽层通常有1到2层。每个层由神经元组成,两个相邻层的神经元是完全连接的,并有各自的权重,而在同一层的神经元没有连接。在本文中,输出层只有一个单一的神经元,它代表了基于前面节点的一步预测。输入层的每一个神经元被赋予了一个数据属性,产生一个输出,其值等于相应的属性(缩放)值。对于每一个在隐蔽层或
9、输出层的神经元,下面是输入-输出的转换函数:其中V是输出,H是前一层神经元的总数,h是上一个神经元第h个神经元的输出,Wh是相应的连接权重,Wo是偏差(或拦截)。f为非线性转换函数(或激活函数)也用于输出层。例如下面的转换函数就经常使用:当人工神经网络使用BP算法进行训练时,权重和误差得到了优化。采用优化的目标函数为期望输出与预计输出的差值的平方和。可以从统计学和计量经济学的观点看待ANN。如今,ANN被大量使用在建模和预测的问题中。尽管在现实问题中使用的许多模型一般是线性的,大多数真实数据集的性质表明,非线性问题更能进行准确预测和恰当的描述。ANN在这种预测中起着重要的作用。关于ANN的文献
10、不计其数,它被广泛应用于许多科学领域,并取得了不同程度的成功。在M -比赛39,M2比赛40和M3的比赛38中许多参与者都使用了人工神经网络。对于这种人工神经网络的不断普及的主要原因是,这些模型已被证明能够任意地逼近几乎任何一个非线性函数。因此,当应用到一个具有真正的非线性动态关系的特点的时间序列时,ANN将检测到,并提供优于线性模型的选择,而不需要构造一个特定的参数非线性时间序列模型。对于解决时间序列预测问题,一些重要的论文认为ANN是一个很有希望的方法和重要的议题。Franses和van Homelen 17探究过ANN具有捕获非线性的能力,这可由SETAR,Markov-Switchin
11、g和GARCH模型得到启示。在一个预测经济时间序列数据的神经网络设计中共有八个步骤Kaastra和Boyd 28提供了一个入门指南。Bodyanskiy和Popov66在阐述了序列准周期分量的基础上,提出了一种特殊的人工神经网络的方法来预测金融时间序列。Tsengetal。 57提出了一种混合预测模型,它结合了季节性时间序列ARIMA(SARIMA)和神经网络反向传播(BP)的模型,命名为SARIMABP。 Karunasinghe和Liong30研究了在广泛使用的局部模型(局部平均技术和局部多项式技术)中ANN作为全球模型,在混沌时间序列中的应用。在Aitkenhead等人的著述中 1,利用
12、数据记录器和其他测量仪器,在苏格兰东北部几个月的时间内对两种情形下的石油,水流,气候变量每个小时监测一次。使用三种方法用数据集来训练神经网络,包括一中新型的合理的生物学系统。BuHamra等 7结合Box-Jenkins(BJ)和ANN方法,对科威特的耗水量时间序列数据进行建模。Shi等人 49研究了使用状态相关自回归模型对非线性时间序列建模。Niska 等人 43使用ANN对空气质量建模,由于他们的混沌状态和非线性现象以及高维样本空间,使得这变成一项艰难的任务。Zhang61提出了一种混合的方法,将ARIMA模型和ANN模型结合起来,分别利用两者在线性建模和非线性建模中的独特优势。Kim32
13、使用支持向量机(SVM)用于金融时间序列预测。这项研究应用SVM预测股价指数。Ho等人 23对利用ANN建模和ARIMA建模进行时间序列预测进行了比较研究。与ARIMA相比,BP法和周期性的ANN的表现更令人满意。Kohzadi等人分别比较了ARIMA和ANN在价格预测中的表现。Terasvirta等人 54研究了线性自回归的预测准确性,平稳过渡自回归(STAR)的预测准确性,和ANN预测47个月内G7经济宏观变量的准确性。Ghiassi等人 19提出了一种动态神经网络模型来预测时间序列,使用了一种不同于传统模型的特别的构架。Aalkin和Ord3解释了一种ANN自动调用方法,它试图开发一种自
14、动程序,根据不同的预测目的来选择ANN的架构。Cubiles-de-la-Vega等人 67 提出了设计多层感知器来预测时间序列的步骤。它是根据ARIMA模型中事先设定好的一些列规则,衍生出非线性预测模型的一系列规则。Kalaitzakis等人 29阐述了先进的神经网络的发展和应用,利用希腊克里特岛上电力系统的实际小时电力负荷数据,成功地解决了短期电力负荷的问题。Qi和Zhang46揭露了一般使用信息化样本内模型的选择标准来选择ANN预测金融时间序列的模型的问题。Zhang和Qi62调查了季节性的问题,表明了只有有限的实证研究显示利用神经网络预测季节性时间序列会产生混合效果。在Chiang等人
15、的报告中证明, 12当数据的可用性有限时,人工神经网络优于回归模型,例如,新推出的共同基金的历史数据有限。这项研究部分出于下文中提出的结果。张60,使用模拟和真实数据验证了ANN预测线性时间序列的能力,并指出,人工神经网络在建模和预测各种情形下的线性时间序列是相当有效的,对于预测简单的神经结构往往也有效。Hwarng和Ang 27和Hwarng 26主要对线性时间序列预测提出了一些与目前工作相关的想法:(一) BP神经网络(BPNNs)普遍表现良好,其时间序列始终与ARMA(p,q)的结构保持一致,主要是当在网络训练中考虑到某个特定的噪音水平时。” (二)“鉴于多层前馈神经网络的概念可能作为通
16、用的逼近器,我们可以合理地预计BPNNs可能至少对线性数据的预测是有用的。如果是这样,我们可以发现,当不考虑数据的属性,尤其是数据的函数形式未知时,使用BPNN法非常方便。张等人63对过去十年中利用ANN预测时间序列的艺术调查做了综合分析,在这里有以下几点考虑:(一)整体而言,人工神经网络预测给予令人满意的绩效。 (二)有许多因素会影响人工神经网络的性能。但是并没有这些问题的系统调查。这种应对特殊问题的散弹法(试错法)通常被大多数研究者采用,这是文献表述不一致的主要原因。(三)在这方面已经有过大量的研究。2.3.非线性时间序列在过去的二十年,线性时间序列方法已被广泛的使用。然而,最近已经有越来
17、越多的兴趣放在了扩展Box-Jenkins的古典框架,使之与非标准属性相结合,如非线性,非高斯性,多相性。大量非线性模型都是用这种方法开发的,如Granger和Anderson的双线性模型20,Tong的阈值自回归(TAR)模型55,Priestley的状态依赖模型45 ,Hamiltion的马可夫转换模型22,Chen和Tsay的功能系数自回归模型,此外还有很多其他模型。虽然这些模型的性能往往有所重叠,但每一个都能够捕捉各种各样的非线性行为。然而,在大多数时间序列,然而,这种建模方式更加复杂,因为它具有高频率,日和周季节性,节假日的日历效应,高波动性和出现异常值等特征。它已经表明,特别是AN
18、N模型能够逼近任意功能良好的非线性关系到一个任意的准确程度,用同样的方式ARMA模型对一般的线性关系也能提供良好的逼近。9,24这就是所谓的人工神经网络通用逼近性。总之,隐蔽层的前馈神经网络可以被看作是一个将一般的连续非线性函数参数化的方法。当考虑使用非线性时间序列模型后,我们马上要面临的问题就是可能模型的数量问题,如果不是无限多,那也是巨大的。考虑一个单变量时间序列Xt,其简单性在于每隔相等的时间对其进行一次观察。我们分别观察了当t=1,.T时Xt的值,其中T是样本大小。一个纯粹的随机时间序列可以说是线性的可以写成如下式子: 其中u是一个常数,是实数,且= 1,是独立同分布(IID)的随机变
19、量数列,且是定义明确的分布函数。我们假设 的分布是连续的且E()= 0。 在许多情况下,我们进一步假设或者甚至更强,即为高斯。 如果则是弱平稳(即前两个时间段是定常)。基于ARMA过程是线性的,因为它有一个方程中提到的MA表示法。任何不能满足这个方程的条件的随机过程则被认为是非线性的。更多细节见56。有关以前的非线性时间序列模型的更全面的调查,有兴趣的读者可以参考55,21。表1显示了该研究采用和仿真的非线性时间序列集合。在每一种情况下,N(0,1)假定为IID。我们选择了这八个时间序列模型代表了不同的问题,这些问题有不同的时间序列特征。例如,其中一些序列具有纯自回归(AR)或纯移动平均线(M
20、A)的相关性结构,而另一些则混合AR和MA两者的组成结构。张60对具有不同滞后的相似模型进行过探究。上述模型的典型曲线图见图2.,图中执行了具有自回归组件和一个滞后24季节性(通常为每小时季节性)的STAR模型。2.4 利用ANN进行非线性时间序列预测的实验设计尽管表1中的非线性模型,对特定的问题和数据是有用的,但是不能普遍适用于其他应用中。模型形式的前一种规格限制了这些参数非线性模型的用处,因为非线性模式存在太多的可能性。事实上,形成一个合适的特定数据集的非线性模型公式是一项非常艰巨的任务,与之相比,线性模型的建立会容易一些,因为有了更多的可能性,就有更多的参数,从而可能犯更多的错误 38。
21、此外,一个特定的非线性规格可能不足以捕捉所有数据的非线性。正如Diebold和Nason14所指出的,“绝大多数的非线性模型的各种可能的选择使得逼近真实的数据生成过程变得困难,且实际上看似种类繁多的参数非线性模型似乎是非线性数据生成过程的一个非常小的子集。”一些文献已经研究了人工神经网络的使用,在不同的环境下通过实验设计进行仿真,探索了不同因素和水平。许文远等人31在这一开创性的论文中描述了Taguchi法的一项创新应用,确定了包括微观结构和宏观结构两方面的设计参数。这种方法的可行性,可以通过优化BP法的设计参数来确定制造系统的操作方法得以证明。从这项研究得出的结果表明,Taguchi法提供了
22、一种有效的手段,提高神经网络获取的快速性和记忆的准确性。Kim和Yum 33有写过类似的文章。Sukthomya和Tannock52,53使用相同的Taguchi实验设计思想,经过复杂的形成过程,设置了ANN的参数。Lin和Tseng37也使用相同的Taguchi法将“学习矢量量化”ANN应用于自行车变速器系统。Enemuoh和El- Gizawy 16描述了一种方法,可利用有效的ANN设计预测钻入碳纤维增强环氧树脂时钻井的分层,损坏宽度和孔表面粗糙程度。对神经元的数目,隐蔽层,激活函数以及模型预测中均方误差的学习算法的影响进行了量化。利用上述方法,开发了一个强大的人工神经网络,可以高精度地预
23、测过程中引起的损坏。Zhang和张Zhang等人 64提出了利用神经网络进行线性及非线性时间序列预测的实验评价。通过计算机模拟实验对三个主要的ANN参数进行了检查:输入节点,隐藏节点和样本大小。同样,为了在目前的工作便于比较,这些论文中使用的模型(见表2)转载。较之前的文件相比,目前的研究主要有以下几点创新:l 使用的是混合的方法,而不是使用Taguchi法的DOE。l 人工神经网络的参数的数量增加;l 季节性因素包含模拟真实的非线性问题;l 允许和评价人工神经网络参数之间的互动关系。3.实验设计这一节将探讨ANN训练的实验设计。首先,提出工业实验的指导原则,以及在ANN训练情境下建议做出的调
24、整。最后阐述如何实施指导原则及其产生的结果。3.1指导原则科尔曼和蒙哥马利68提出了一些关于实验设计的指导,尽管这些指导原则主要用于工业性实验,但也可用于计算机模拟实验中:(一)问题的提出和阐述(二)因素,层次和范围的选择(三)应变量的选择(四)实验设计的选择(五)执行试验(六)数据的统计分析(七)结论和建议在实验的实际应用中,这些准则通常是相互影响的,其结构也不是一成不变的。有些步骤常常同时进行,或者也可以以相反的顺序进行。步骤a,b和c称为实验前的计划。下面是关于人工神经网络训练的一些意见。3.1.1问题的提出和陈述这点在工业性试验中可能很明显在计算机模拟中也一样它不是简单地获得一个问题的
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 神经网络 训练 非线性 时间 序列 预测 实验设计