1、随机过程课程设计随机过程 课程设计(论文)题 目: 利用平稳时间序的 ARMA (p,q)模型的预报 学 院: 理学院 专 业: 数学与应用数学 班 级: 09-1班 学 生 姓 名: 杨振亚 学 生 学 号: 2009026219 指 导 教 师: 蔡吉花 2011 年 12 月 22日目录摘 要3第一章、 绪论4第 二章、基本原理52.1模型判断原理52.2模型定阶原理62.3模型参数的估计62.3.1初估计72.3.2精估计72.3.3ARMA(p,q)序列预报7第三章、问题分析83.1问题分析83.2问题提出8第四章、计算结果和程序4.1程序941.1稳定性分析104.1.2样本的自相
2、关函数图104.1.3偏相关函数图114.2模型定阶114.3未来预测124.4误差分析13第五章、结论和展望135.1结论135.2展望13 随机过程课程设计任务书姓名杨振亚学号2009026219指导教师蔡吉花设计题目利用平稳时间序列的ARMA(p,q)模型的预报理论要点利用样本数据的自相关函数和偏相关函数给模型定类型与阶数,利用样本数据求模型的参数。在模型求出之后利用模型对未来进行预报。设计目标能找到合适模型,能对未来进行预测并能求出预测误差范围,能给出置信区间。研究方法步骤利用所给数据判断模型类型并求出参对未来进行预测。预期结果能找到合适模型,能对未来进行预测并能求出预测误差范围,能给
3、出置信区间。计划与进步的安排课程安排1周,分 4 次完成:第一次(1-2天):分析题目,查找资料。第二次 ( 3天)把出程序外的论文写出。第三次( 4天):借助计算机程序计算题目得出结果。第四次( 5天): 综合起来生成论文。参考资料张波,张景肖:应用随机过程,清华大学出版社2004版。刘次华:随机过程。王燕:应用时间序列分析(第二版),中国人民大学出版社2008年版。峁诗松,濮晓龙:概率论与数理统计。填写时间2011-12-22 摘 要本文中题目给出了201组数据,首先求出了时序图,该序列的时序图显示出该序列始终在一个常数值84附近随机波动,而且波动的范围有界、无明显趋势,这样根据平稳序列的
4、性质便可以知道,该序列具有稳定性。然后求出自相关图,从自相关系数的值可以看出,该序列当中的值只具有短期相关性,随着延迟期数的增加,该序列的自相关系数快地衰减向零,则认为没有相关系性,所以说这个序列是平稳的。从相关图具有很好的截尾性,在延期2阶后截尾;初步判断为MA(q)模型,而后又求出偏自相关图,它具有很好的拖尾性。凭经验定出阶数q=1。然后利用自相关函数进一步判断,得出其为MA(1)模型。利用MA(1)模型对未来进行预报得到20个数据,并进行误差分析。关键词:ARMA 模型,平稳时间序列,预测,MA(1) 第1章、 绪论传统的应用范围较广的时间序列分析方法是由Box和Jenkins于1970
5、年提出的ARIMA(自回归求和移动平均)方法。对于季节性的时间序列,为了从原始序列中分离出趋势(Trend)-也就是剔除季节因素,所采用的主要是美国普查局(U.S. Census Bureau)所提出的X-12方法及其变种,也有采用德国联邦统计局(Federal Statistical Office)提出的BV 4方法。 时间序列分析方法是经济领域研究的主要工具之一它用合适的模型描述历史数据随时间变化的规律,并预测经济变量值而ARMA模型是适用于任何序列的发展形态的一种高级预测方法,它描述时间序列的动态性和发展变化规律时间序列分析就是根据有序随机变量或者观测得到的有序数据之间相互依赖所包含的信
6、息,用概率统计方法定量得建立一个合适的数学模型,并根据这个模型对相应序列所反映的过程或系统作出预报或控制。时间序列预测方法的基本思想是:预测一个现象的未来变化时,用该现象的过去行为来预测未来即通过时间序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来作出预测ARMA模型是一类常用的随机时间序列模型,是一种精度较高的时间序列短期预测方法,其基本思想是:某些时间序列是依赖于时间的一族随机变量,构成该时间序列的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型近似描述。 通过对该数学模型的分析研究,能够更本质地认识时间序列的结构与特征,达
7、到最小方差意义下的最优预测.所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。在ARIMA模型的识别过程中,我们主要用到两个工具:自相关函数(简称ACF),偏自相关函数(简称PACF)以及它们各自的相关图(即ACF、PACF相对于滞后长度描图)。对于一个序列来说,它的第j阶自相关系数定义为它的j阶自协方差除以它的方差,它是关于j的函数,因此我们也称之为自相关
8、函数,通常记ACF(j)。偏自相关函数PACF(j)度量了消除中间滞后项影响后两滞后变量之间的相关关系。时间序列分析近年来发展非常迅速,在经济,管理,水文,气象,地震,生物,电力和机械等领域都有广泛的应用。第 2章、基本原理2.1模型判断原理(1) AR(p)模型:。(2) MA(q)模型: (3) ARMA(p,q)模型: MA(q)序列的自相关函数序列的前q项是非零的,q+1项以后的各项全为零,即它是截尾的。MA(q)偏自相关函数拖尾。AR(p)自相关函数拖尾, 偏自相关函数p阶截尾。 ARMA(p,q) 自相关函数,偏自相关函数都拖尾。即自相关函数偏自相关函数AR(p)拖尾p阶截尾MA(
9、q)q阶截尾拖尾ARMA(p,q)拖尾拖尾由此判断模型形式。自相关函数自相关函数。,k=0,1,-N-1。实际数据处理中用代替。偏自相关函数用记阶自回归表达式中的第个系数,就是最后一个系数则满足下面方程,得到方程,记为或者,求出的即为偏自相关数。其中得到的为真实值无偏估计记为以便与真实值区分。同样记为在实际应用中主要是通过求出自相关函数和偏自相关函数来进行函数模型以及阶数的判断。2.2模型定阶原理基于自相关函数和偏相关函数的定阶方法对于ARMA(p,q)模型,可以利用其样本的自相关函数和样本偏自相关函数的截尾性判定模型的阶数。2.具体方法如下:i、对于每一个q,计算 ,(M取为或者),考察其中
10、满足或者的个数是否占M个的68.3%或者95.5%。如果,都明显地异于零,而,均近似于零,并且满足上述不等式之一的的个数达到其相应的比例,则可以近似的判定是步截尾,平稳时间序列为MA()。ii、类似,我们可通过计算序列(),考察其中满足或者的个数是否占M个的68.3%或者95.5%。即可以近似的判定是步截尾,平稳时间序列为AR().iii、如果对于序列和来说,均不截尾,即不存在上述的和,此时属于情况iii,则可以判定平稳时间序列为ARMA模型。此外常用的方法还有:基于F-检验确定阶数;利用信息准则法定阶(AIC准则和BIC准则)Matlab此法无法实现。2.3模型参数的估计一般模型阶数都较低,
11、因此求出低阶模型参数为特例。2.3.1初估计i、 AR(p)模型参数的Yule-Walker估计特例:对于一阶自回归模型AR(1),对于二阶自回归模型AR(2), 。ii、MA(q)模型参数估计特例:对于一阶移动平均模型MA(1), ,对于二阶移动平均模型MA(2), 。iii、ARMA(p,q)模型的参数估计模型很复杂,一般利用统计分析软件包完成。2.3.2精估计ARMA(p,q)模型参数的精估计,一般采用极大似然估计,由于模型结构的复杂性,无法直接给出参数的极大似然估计,只能通过迭代方法来完成,这时,迭代初值常常利用初估计得到的值。2.3.3ARMA(p,q)序列预报 设平稳时间序列是一个
12、ARMA(p,q)过程,则其最小二乘预测:。i、AR(p)模型预测,ii、ARMA(p,q)模型预测 ,其中。iii、预测误差 预测误差为:。l步线性最小方差预测的方差和预测步长l有关,而与预测的时间原点t无关。预测步长l越大,预测误差的方差也越大,因而预测的准确度就会降低。所以一般不能用ARMA(p,q)作为长期预测模型。iv、预测的置信区间预测的95%置信区间:。第3章 问题分析3.1问题分析此问题数据较多可以用平稳时间序列解决,题中要求对未来20个数据进行预测完全可以用平稳时间序列预报解决但因预测数据较多越往后误差越大精确度降低。数据较多不易处理需要用到数学软件Matlab进行处理。3.
13、2问题提出现有201个连续的生产纪录,这个生产统计序列是从1985年1月份到2001年9月统计的,如下81.9 89.4 79.0 81.4 84.8 85.9 88.0 80.3 82.6 83.5 80.2 85.2 87.2 83.5 84.3 82.9 84.7 82.9 81.5 83.4 87.7 81.8 79.6 85.8 77.9 89.7 85.4 86.3 80.7 83.8 90.5 84.5 82.4 86.7 83.0 81.8 89.3 79.3 82.7 88.0 79.6 87.8 83.6 79.5 83.3 88.4 86.6 84.6 79.7 86.0
14、 84.2 83.0 84.8 83.6 81.8 85.9 88.2 83.5 87.2 83.7 87.3 83.0 90.5 80.7 83.1 86.5 90.0 77.5 84.7 84.6 87.2 80.5 86.1 82.6 85.4 84.7 82.8 81.9 83.6 86.8 84.0 84.2 82.8 83.0 82.0 84.7 84.4 88.9 82.4 83.0 85.0 82.2 81.6 86.2 85.4 82.1 81.4 85.0 85.8 84.2 83.5 86.5 85.0 80.4 85.7 86.7 86.7 82.3 86.4 82.5
15、 82.0 79.5 86.7 80.5 91.7 81.6 83.9 85.6 84.8 78.4 89.9 85.0 86.2 83.0 85.4 84.4 84.5 86.2 85.6 83.2 85.7 83.5 80.1 82.2 88.6 82.0 85.0 85.2 85.3 84.3 82.3 89.7 84.8 83.1 80.6 87.4 86.8 83.5 86.2 84.1 82.3 84.8 86.6 83.5 78.1 88.8 81.9 83.3 80.0 87.2 83.3 86.6 79.5 84.1 82.2 90.8 86.5 79.7 81.0 87.2
16、 81.6 84.4 84.4 82.2 88.9 80.9 85.1 87.1 84.0 76.5 82.7 85.1 83.3 90.4 81.0 80.3 79.8 89.0 83.7 80.9 87.3 81.1 85.6 86.6 80.0 86.6 83.3 83.1 82.3 86.7 80.2 利用平稳时间序列的数据,得出的ARMA(p,q)模型, 编写程序给出预测,对未来的20个数据进行预测,并分析误差。 第 4章、计算结果和程序4.1程序z=81.4 84.8 85.9 88.0 80.3 82.6 83.5 80.2 85.2 87.2 83.5 84.3 82.9 84
17、.7 82.9 81.5 83.4 87.7 81.8 79.6 85.8 77.9 89.7 85.4 86.3 80.7 83.8 90.5 84.5 82.4 86.7 83.0 81.8 89.3 79.3 82.7 88.0 79.6 87.8 83.6 79.5 83.3 88.4 86.6 84.6 79.7 86.0 84.2 83.0 84.8 83.6 81.8 85.9 88.2 83.5 87.2 83.7 87.3 83.0 90.5 80.7 83.1 86.5 90.0 77.5 84.7 84.6 87.2 80.5 86.1 82.6 85.4 84.7 82
18、.8 81.9 83.6 86.8 84.0 84.2 82.8 83.0 82.0 84.7 84.4 88.9 82.4 83.0 85.0 82.2 81.6 86.2 85.4 82.1 81.4 85.0 85.8 84.2 83.5 86.5 85.0 80.4 85.7 86.7 86.7 82.3 86.4 82.5 82.0 79.5 86.7 80.5 91.7 81.6 83.9 85.6 84.8 78.4 89.9 85.0 86.2 83.0 85.4 84.4 84.5 86.2 85.6 83.2 85.7 83.5 80.1 82.2 88.6 82.0 85
19、.0 85.2 85.3 84.3 82.3 89.7 84.8 83.1 80.6 87.4 86.8 83.5 86.2 84.1 82.3 84.8 86.6 83.5 78.1 88.8 81.9 83.3 80.0 87.2 83.3 86.6 79.5 84.1 82.2 90.8 86.5 79.7 81.0 87.2 81.6 84.4 84.4 82.2 88.9 80.9 85.1 87.1 84.0 76.5 82.7 85.1 83.3 90.4 81.0 80.3 79.8 89.0 83.7 80.9 87.3 81.1 85.6 86.6 80.0 86.6 83
20、.3 83.1 82.3 86.7 80.2;m=mean(z)m = 84.1194 var(z)ans = 8.277441.1稳定性分析plot(z)该序列的时序图显示出该序列始终在一个常数值84附近随机波动,而且波动的范围有界、无明显趋势,这样根据平稳序列的性质便可以知道,该序列具有稳定性。下面划出其自相关函数图进一步判断。4.1.2样本的自相关函数图autocorr(z,30)图像为从自相关系数的值可以看出,该序列当中的值只具有短期相关性,随着延迟期数的增加,该序列的自相关系数快地衰减向零,则认为没有相关系性,所以说这个序列是平稳的。这些自相关系数成现出类似于周期性的余弦衰减截尾。可
21、以为MA(q)模型。4.1.3偏相关函数图从相关图具有很好的截尾性,在延期2阶后截尾;偏自相关图具有很好的托尾性。同时可以凭经验定出阶数q=1。以下计算验证。4.2模型定阶由定阶方法对于对于q=1,计算 ,(M取为14近似),考察其中满足的个数为10个14个的71.42%68.3%,由此近似的判定是1步截尾,平稳时间序列为MA(1)。3.参数估计: 由并且由于MA(1)的可逆条件1,=0.3可得=1/3即模型为+84.1194;现在计算的方差由+84.1194)得=7.4497因此模型为+84.1194,=7.44974.3未来预测 再此用+84.1194预测。用到最后两组数据86.7 80.
22、2预测设为、=80.2-84.1194-0.3333(86.7-84.1194)+84.1194=81.1398=81.1398-0.3333(80.2-84.1194)=82.4463=83.439583.9972以后的预报与84.1194相差不到0.07因此就用84.1194代替综上20组数据预报为81.139882446383.439583.997284.223884.264584.229784.181384.146584.125884.11944.4误差分析由于均值为84.1194方差为8.2774由切比雪夫不等式得95%置信区间为81.1694,87.0694第5章、结论和展望5.1
23、结论此序列由后一项与前一项相关性强。但总体都在均值附近摆动。因此用MA(1)模型。MA(1)模型为均值加上随机扰动项,因此用切比雪夫不等式计算置信区间。5.2展望时间序列分析生不过数十载,但其应用非常广阔,时间序列分析近年来发展非常迅速,在经济,管理,水文,气象,地震,生物,电力和机械等领域都有广泛的应用。近年来时间序列应用的最新动态主要表现在以下几个方面:对传统方法的改进;谱密度分析、小波分析等方法越来越受重视;结合本国的实际选用合适的分析研究方法。时间序列的应用研究始终是经济学和统计学中的一个热点,近几年来,中国的研究人员在该领域的应用也逐渐增多,但无论在方法地选用还是分析的成果上,都处于一个比较低的层面上,因此时间序列分析还有广阔的发展前景。 评 阅 书课程设计报告评语:(评阅意见主要对设计任务的合理性、规范性和正确性以及设计报告书的完整性、规范性和通顺性等方面作出评价) 设计报告成绩:教师签名: 年 月 日答辩记录与评语: 答辩成绩:教师签名: 年 月 日总成绩:15