欢迎来到沃文网! | 帮助中心 分享知识,传播智慧!
沃文网
全部分类
  • 教学课件>
  • 医学资料>
  • 技术资料>
  • 学术论文>
  • 资格考试>
  • 建筑施工>
  • 实用文档>
  • 其他资料>
  • ImageVerifierCode 换一换
    首页 沃文网 > 资源分类 > DOC文档下载
    分享到微信 分享到微博 分享到QQ空间

    基于时间序列分析及Clementine软件的宝钢股价研究.doc

    • 资源ID:1129255       资源大小:3.15MB        全文页数:48页
    • 资源格式: DOC        下载积分:20积分
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录 微博登录
    二维码
    微信扫一扫登录
    下载资源需要20积分
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,下载更划算!
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基于时间序列分析及Clementine软件的宝钢股价研究.doc

    1、摘 要时间序列是按照时间顺序取得的一系列观测值,现实中的很多数据都是以时间序列的形式出现的:一个工厂每月生产的一系列货物数量,每周道路事故的一系列数据,每小时观察的药品生产产量。时间序列的例子在一些领域中是极丰富的,诸如经济,商业,工程等。时间序列分析典型的一个本质特征就是相邻观测值之间的依赖性。时间序列观测值之间的这种依赖特征具有重要的现实意义。时间序列分析所论及的就是对这种依赖性进行分析的技巧。要求对时间序列数据生成随机动态模型,并将这种模型用于重要的应用领域。本文的主要内容是借助SPSS Clementine 软件研究宝山钢铁股票价格随时间的变化规律,并用时间序列分析的有关知识对其进行建

    2、模预测。本文分两部分:第一部分介绍时间序列分析的一些基本概念,如平稳过程、自相关函数、偏相关函数、白噪声等,然后对几种时间序列模型进行描述;另一部分借助SPSS Clementine 软件对宝山钢铁股价这一具体事例分别用专家建模、指数平滑建模和ARIMA建模并对股价进行短期预测,最后通过模型参数比较及预测值误差对比,找出最佳模型。在给案例建模的同时,将给出使用SPSS Clementine软件研究的具体过程。关键词:时间序列;SPSS Clementine软件;宝钢股价;模型比较AbstractThe time series is a sequence of observations take

    3、n sequentially in time. Many sets of data appear as time series in reality: a monthly sequence of the quantity of goods shipped from a factory, a weekly series of the number of traffic accidents, hourly observations made on the yield of a chemical process, and so on. Examples of time series abound i

    4、n such fields as economics, business, engineering and so on. The nature of this dependenced among observations of a time series is of considerable practical interest. Time series analysis is concerned with techniques for the analysis of this dependence. This requires the development of stochastic an

    5、d dynamic models for time series data and the use of such models in important areas of application.The main task of this dissertation is to have a research on the law of the varying number of the stock price of the Baoshan iron and steel company. In this study, we will make the use of the software S

    6、PSS Clementine and create the models of the stock price by using the time series analysis. To begin with, this dissertation briefly introduces some basic concepts such as stationery process, autocorrelation function partial correlation functions and white noise about the time series analysis. In add

    7、ition, this dissertation begins to talk in detail about several fundamental time series models and the properties of the ACF and PACF belonging to the four fundamental models. Then, with the help of the software SPSS Clementine, we will establish models by three measures on the times series of the s

    8、tock price and forecast short-term price. Finally, the model parameters and predictive value of the price should be compared to identify the best model. In the case, the dissertation offers the process of the software modeling in detail.Key words: the time series analysis; SPSS Clementine software;

    9、Baoshan iron and steel company stock price; model comparison 目 录第1章 绪论11.1 时间序列的概念11.2 时间序列的应用11.3 本文的主要内容及安排2第2章 基本概念32.1 随机过程32.2 自协方差和自相关系数42.3 偏自相关函数52.4 白噪声过程72.5 均值、自协方差和自相关的估计82.5.1 样本均值82.5.2 样本自协方差函数92.5.3 样本自相关函数112.5.4 样本偏自相关函数122.6 本章小结13第3章 时间序列模型及Clementine软件介绍143.1 指数平滑模型143.1.1 基本公式1

    10、43.1.2 指数平滑标准143.2 ARIMA模型153.2.1 自回归过程153.2.2 移动平均过程173.2.3 AR(p)过程和MA(q)过程的对偶关系173.2.4自回归求和平稳模型193.2.5 自回归、滑动平均、ARIMA模型性质比较203.3 模型识别与选择213.3.1 模型识别的步骤213.3.2 矩方法223.3.3 极大似然方法233.3.4 模型选择准则243.3.5 模型简易选择253.4 对Clementine软件的概述263.4.1 Clementine的窗口263.4.2 数据流的基本管理和执行283.5 本章小结29第4章 基于Clementine软件的对

    11、宝钢股价建模分析304.1 对宝钢历年股价进行预处理304.2 对宝钢最近2年股价进行建模分析314.2.1 模型建立314.2.2 模型分析及比较36结论42参 考 文 献43致 谢44基于时间序列分析及clementine软件的宝钢股价研究基于时间序列分析及Clementine软件的宝钢股价研究第1章 绪论1.1 时间序列的概念时间序列 (Time series) 从字面意思上看它是与时间相关的一组序列,针对某一种现象,在一个确定的统计指标下可以获得不同时间上的各个数据,将这些数据按照时间先后的顺序排列成一组序列,便构成了一组时间序列。时间也并非是唯一的观测度量,有时可以根据其他度量来观测

    12、,如空间。时间序列法作为一种定量的数据预测方法,经过数十年的不断发展与完善,已被广泛应用于统计学研究中。时间序列分析 (Time series analysis) 是建立在随机过程与数理统计学理论基础上的一种统计方法,该方法适用于动态数据处理,以解决生产、经济中的实际问题为目的1。1.2 时间序列的应用时间序列现象广泛存在于各个领域中:在农业领域,我们关注农产品的年产量及其价格等;在经济和商业领域,我们关注股票的日收盘价格、周利息率、月价格指数、季销售额和年利率等;在工程领域,我们观测声音、电流和电压等;在地球物理领域,我们记录湍流,一个地区的海浪和地球噪声等;在医学研究领域,我们测量脑电图和

    13、心电图追踪等;在气象学领域,我们观测每小时风速、每日温度和年度降雨量等;在质量控制领域,我们根据某目标值监测一个过程;在社会学领域,我们研究年度出生率、死亡率、事故发生率和各种犯罪率等。此外,时间序列被用于观测和研究的领域还有很多。对时间序列的研究基于各种各样不同的目的,它们包括对数据生成机制的理解和描述,对未来值的预报,以及实现系统的最优化控制。时间序列其本质主要表现为:一组观察值之间是相互依赖或相关的;观测值是有序的。因此,以独立性假设为基础的统计方法和技术将不再适用,需要建立有别于传统的新的统计方法。我们把用于时间序列统计的方法学称为时间序列分析2。1.3 本文的主要内容及安排本文的主要

    14、目的是介绍时间序列分析相关的各种方法概念与模型,利用SPSS Clementine 软件研究宝山钢铁股票价格随时间的变化规律,并用时间序列的有关知识进行建模分析。本文的主要安排:第一章:绪论,对本文的内容进行简要概述。 第二章:介绍时间序列的一些基本概念,如随机过程、平稳过程、自相关函数和偏相关函数、白噪声过程等。第三章: 介绍了案例中需要用到的几种模型,并进行简要对比;对SPSS Clementine 软件进行简单介绍。第四章:通过宝山钢铁股价这一案例具体介绍使用Clementine软件建立时间序列模型的步骤与方法,并对模型参数进行分析比较,确定最佳模型。对本文进行总结。第2章 基本概念2.

    15、1 随机过程随机过程是以时间为标号的一组随机变量,其中属于某个样本空间,t属于某个标号集。对于固定的t, 是一个随机变量。对于给定的, 是t的函数,我们把它称作样本函数或实现。所有可能实现的全体称为随机过程和时间序列分析。因此,一个时间序列就是来自某个随机过程的样本函数或实现。为了对时间序列分析有一个正确的认识,我们在本节引入了随机过程的一些基本概念。假设指标集是所有整数的集合。考虑一个来自随机过程的有限随机变量集,其n维分布函数可定义为 (2.1)其中,是任意实数。如果其一维分布函数是时不变的,及对任意整数,k和有,这个过程称为依次分布一阶平稳。依分布二阶平稳是指对于任意整数,和有成立;从而

    16、,依分布n阶平稳是指 (2.2)对于任意n元组 和整数k成立。若对任意整数n,公式 (2.2) 成立,则该过程被称为严平稳过程。对于实值过程,定义该过程的均值函数为 (2.3)该过程的方差函数为 (2.4)和间的协方差函数为 (2.5)和间的相关函数为 (2.6)对于一个严平稳过程,分布函数对于所有的t都是一样的,若,则均值函数,是一个常数。若,则对所有的t,有,也是一个常数,再进一步,由对,和k取任意值时都成立,我们有 (2.7)以及 (2.8)令,可以得到(2.9)以及(2.10)因此,对于前两阶矩有限的严平稳过程,和之间的协方差和相关仅依赖于时间差k 3。2.2 自协方差和自相关系数时间

    17、序列相邻值之间是有依赖性的,对于一个平稳过程 ,如果其时间间隔为k,那么对于任意时间t,和之间的协方差都是相同的,我们将其称为滞后k的自协方差,表达式如下 (2.11)和之间的相关为 (2.12)其中,,作为k的函数,称为自协方差函数,称为自相关函数(autocorrelation function简称ACF),因为它们描述同一过程中相距k个时滞的和之间的协方差和相关性。平稳时间序列的自协方差函数列与自相关函数列具有以下的性质:(1) 对称性:,;(2) 非负定性:系列与都是非负定序列,即对任意正整数m,, 为非负定对称阵;(3) 。2.3 偏自相关函数除了和之间的自相关外,我们考察除去和共同

    18、依赖的干预变量的影响后的相关。这种条件相关通常被称之为偏自相关4。这里有两种方法推导:第一种方法:记为和之间的偏自相关,它等于和之间的普通自相关 (2.13)然后再计算各个分量。第二种方法:考虑回归模型,其中因变量来自于0均值的平稳过程,它关于之后k个变量进行回归 (2.14)其中代表第i个回归系数,是0均值的误差项,并且与不相关。在 (2.14) 式回归方程的两边同乘,并取期望得到对于,我们有如下的方程组对k=1,2,依次运用Cramer法则,有 (2.15) 作为k的函数,通常称为偏自相关函数(partial autocorrelation function简称PACF)5。2.4 白噪声

    19、过程若是一个不相关的随机变量序列,具有常值均值(通常假设为0)和常值方差的确定分布,且对任意,那么这个过程称为白噪声过程。显然,白噪声过程是平稳的,并且其自协方差函数为 (2.16)自相关函数为 (2.17)偏自相关函数为 (2.18)根据定义,对任何过程都有,所以我们提到的自相关和偏相关,仅涉及时的和。在白噪声过程中的基本现象就是其ACF与PACF均等于零。尽管白噪声过程在实际中很难发生,但它作为时间序列模型中的基本构建,扮演着一般向量和函数分析中正交集的角色。2.5 均值、自协方差和自相关的估计一个平稳时间序列可以被均值、方差、自相关和偏自相关所描述。如果知道了所有可能实现的全体或者得到了

    20、多次独立实现,则能够计算出这些参数的精确值。然而,在大多数情况下,得到多次实现非常困难。大多数可利用的时间序列只由单个实现构成,不可能计算总体平均。不过,对于平稳过程,可以将总体平均由时间平均来代替。接下来,本节在优良的统计特性检测条件下,使用时间平均来估计均值、自协方差和自相关。2.5.1 样本均值对于单个实现的平稳过程,其均值的一个自然估计是简单均值 (2.19)它是n个观测值的时间平均。问题变为上面的估计是否是一个有效的估计。显然 (2.20)这意味着是的无偏估计。同时也容易得到 (2.21) 其中令。因此,如果是有限的,则当时,从而是的一致估计。即在均方意义下有 (2.22)如果存在式

    21、 (2.22) 中的结果,则这个过程就是均值遍历的。该结果成立的一个充分条件是当时,。这是因为这个条件暗含着对于任意,我们都可以找到一个正整数N,使得对于所有的,都有。因此,对于,有 (2.23)在此选取足够大的n使得前式第三行第一项小于。因此,当时,我们有,这意味着在 (2.23) 式中有 (2.24)这些结论简单地说就是:当和相隔足够远时,它们几乎不相关,一些新的有用的信息增加进来,使得时间平均接近总体平均6。2.5.2 样本自协方差函数对于单个实现,我们可以使用时间平均来估计自协方差函数(2.25)或 (2.26)有 (2.27)其中,用来近似和。因此 (2.28) (2.29)显然,这

    22、两个估计都是有偏的。不考虑估计的效率后,变成无偏的,而仍然是有偏的。一般地,比的估计偏差大,尤其是在k相对于n很大的情况下。因此,在时间序列分析中,对于给定的n,常建议至多计算到n/4时的估计。若时,则该过程是均值遍历的,并且如 (2.24) 中显示的,那么,估计和都是接近无偏的。在某些情况下,因为和都是有偏的,比较它们的均方误差更合适。对于某些类型的过程,和有更小的均方误差。另外,像一样,总是半正定的,而却不一定。因此,可以采用式 (2.25) 中的作为样本自相关函数去估计的值7。当过程是高斯过程时,Bartlett得到了下面的近似结果 (2.30)以及 (2.31)类似地,有 (2.32)

    23、和 (2.33)因此,比的方差大。事实上,从式 (2.33) 可以看出,对于较大的k,的方差会不稳定的估计。接着,我们想知道什么时候过程是自协方差函数遍历的,即依均方有 (2.34)对于任意给定的k,由于样本自协方差是的渐近无偏估计,因此为均方一致以及该过程是自协方差遍历的一个充分条件是自协方差是绝对可和的,即,并且有。2.5.3 样本自相关函数对给定的一组观测到的时间序列,样本ACF定义为 (2.35)其中是序列的样本均值。我们称关于k的图像为样本相关图。对于平稳的高斯过程,Bartlett得到,对于k0和k+j0,有 (2.36)对于较大的n,的分布近似于正态分布,其均值为,方差为 (2.

    24、37)当km时,则Bartlett的 (2.37) 式近似为 (2.38)在实际中,当未知时,可以用它们的样本估计来代替,并且有的大滞后标准差为 (2.39)为检验白噪声过程,我们使用 (2.40)2.5.4 样本偏自相关函数介绍计算样本偏自相关函数的一个递推算法:以为起始,根据 (2.41)以及, (2.42)这个方法也可用于计算样本的理论偏自相关函数。在原过程是白噪声序列的假设条件下,的方差可以近似表示为 (2.43)因此,可以作为检验白噪声过程假设的关于的临界限度。2.6 本章小结 本章引入了一些为便于理解本文中讨论的时间序列模型所必须的基本概念。首先简单介绍随机过程、自协方差和自相关函

    25、数、偏相关函数、白噪声过程的概念与计算公式。接着讨论样本均值、自协方差、自相关和偏相关函数的估计。这样,便于阐释第3章中所介绍模型的采样现象,并提高对模型识别的评价。同时,这些概念对于理解在时间序列分析中使用的潜在逻辑简化线性过程是非常有用的。第3章 时间序列模型及Clementine软件介绍3.1 指数平滑模型在实际的生产预测中,指数平滑法作为一种常用的手段,也用于对经济发展趋势进行中短期的预测。在所有的预测方法中,指数平滑法是使用最频繁的一种。简单的全期平均法是对一组时间序列的全部过去数据加以利用,并对每个数据赋予相同的权值;移动平均法则不考虑时间间隔相距较远的数据,并在加权移动平均法的基

    26、础上赋予较新数据更大的权重;而指数平滑法兼顾了全期平均法和移动平均法,不舍弃以往的数据,仅仅给历史数据以逐渐减小的权重赋值,即随着数据的不断远离,赋予其逐渐收敛为零的权数8。3.1.1 基本公式指数平滑法的基本公式是 (3.1)其中,是时间t的平滑值;是时间t的实际值;是时间t-1的平滑值;a是平滑常数,其取值范围为0, 1。3.1.2 指数平滑标准(1) 简单:此模型适合于其中没有趋势或季节性的序列。其唯一的相关平滑参数是水平。简单的指数平滑模型非常类似于自回归阶数为0、差分阶数为1、移动平均阶数为1且没有常量的 ARIMA 模型。(2) Holts 线性趋势:此模型适合于其中有线性趋势但没

    27、有季节性的序列。其相关的平滑参数是水平和趋势,并且在此模型中,这些参数的值不会彼此限制。Holts 模型比 Browns 模型更加常用,但在计算大型序列的估计值时会花费更多的时间。Holts 指数平滑模型非常类似于自回归阶数为0、差分阶数为2且移动平均阶数为2的 ARIMA 模型。(3) Browns 线性趋势:此模型适合于其中有线性趋势但没有季节性的序列。其相关的平滑参数是水平和趋势,但在此模型中,这些参数的值假设相等。因此,Browns 模型是 Holts 模型的特例。Browns 指数平滑模型非常类似于自回归阶数为0、差分阶数为2且移动平均阶数为2的 ARIMA 模型,其第二阶移动平均的

    28、系数等于第一阶系数的平方的一半。(4) 阻尼趋势:此模型适合于具有逐渐消失的线性趋势但没有季节性的序列。其相关的平滑参数是水平、趋势和阻尼趋势。阻尼指数平滑模型非常类似于自回归阶数为1、差分阶数为1且移动平均阶数为2的 ARIMA 模型。(5) 简单季节:此模型适合于其中没有趋势且季节效应不随时间变化的序列。其相关的平滑参数是水平和季节。季节指数平滑模型非常类似于自回归阶数为0、差分阶数为1、季节差分阶数为1且移动平均阶数为1、p 和 p+1 的 ARIMA 模型,其中 p 是一个季节区间中的周期数。对于以月为时间单位的数据,p = 12。(6) Winters 加法:此模型适合于具有线性趋势

    29、且季节效应不随时间变化的序列。其相关的平滑参数是水平、趋势和季节。Winters 加法指数平滑模型非常类似于自回归阶数为0、差分阶数为1、季节差分阶数为1且移动平均阶数为 p+1 的 ARIMA 模型,其中 p 是一个季节区间中的周期数。对于以月为时间单位的数据,p = 12。(7) Winters 乘法:此模型适合于具有线性趋势且季节效应随序列的大小变化的序列。其相关的平滑参数是水平、趋势和季节。Winters 乘法指数平滑模型与任何 ARIMA 模型都不相似9。3.2 ARIMA模型ARIMA模型全称为差分自回归移动平均模型(Autoregressive Integrated Moving

    30、 Average Model,简记ARIMA),是一种著名时间序列预测方法。其中ARIMA(p, d, q) 称为差分自回归移动平均模型,AR是自回归, p为自回归项,MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。 或者说,所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,分为自回归过程 (AR) 、移动平均过程 (MA) 、自回归移动平均过程 (ARMA) 以及ARIMA过程。3.2.1 自回归过程把p阶自回归过程或模型记作

    31、AR(p) ,表示为 (3.2)或 (3.3)其中。因为,所以上述过程总是可逆的。为了满足平稳性,多项式的根必须在单位圆之外。一般的p阶自回归AR(p) 过程为 (3.4)或 (3.5)一般的AR(p) 过程的ACF同样用前面的方法得到下面的自相关递推关系: (3.6)从式 (3.6) 可以看到,ACF, 由差分方程所确定。现在将特征多项式写成其中,是的重根。我们可以得到对平稳过程,即。因此,ACF, 的拖尾是指数衰减或阻尼正弦波动的混合形式,这依赖于的根,若某些根是负根则呈现阻尼正弦波动。一般AR(p) 过程的PACF由上式易知,当kp时,式 (2.18) 分子中的矩阵的最后一列可写为该矩阵

    32、前面各列的线性组合。因此,PACF将在滞后p期截尾。3.2.2 移动平均过程q阶移动平均过程MA(q) 表示如下 (3.7)或 (3.8)其中因为,所以有限阶移动平均过程总是平稳的。若的根在单位圆之外,则移动平均过程是可逆的。对于一般的q阶移动平均过程MA(q) ,其表达式为 (3.9)对于该一般MA(q) 过程,方差为, . (3.10)自协方差为 (3.11)自相关函数为 (3.12)MA(q) 过程的自相关函数在滞后q期后截尾。从对MA(1) 和MA(2) 过程的讨论中,易知一般MA(q) 过程的偏自相关函数是拖尾的,为指数衰减和(或)阻尼正弦波动的组合。具体取决于=0的根的特征。如果存

    33、在某些复根,则PACF将包含阻尼正弦波动。3.2.3 AR(p)过程和MA(q)过程的对偶关系对于一个给定的平稳AR(p) 过程,其中也可以写为这里,并且有 (3.13)例如,可以将AR(2) 过程写成这意味着。因此,得到的权数如下: 实际上,对于j2有其中,。在的特殊情形下,有。因此 这意味着一个有限阶的平稳AR过程等价于一个无穷阶的MA过程。给定一个一般的可逆MA(q) 过程其中,也可以将其写成这里,例如,可以将MA(2) 过程写成其中,因此,通过令系数相等可以得到权。具体如下: 一般地,我们有当,过程变为MA(1) 过程时,我们有 (3.14)和 (3.15)因此,根据AR表达式,一个有

    34、限阶的可逆MA过程等价于一个无限阶的AR过程。综上所述,一个有限阶的平稳AR(p) 过程对应于一个无穷阶的MA过程,而一个有限阶的可逆MA(q) 过程对应于一个无穷阶的AR过程。它们之间的对偶关系也存在于ACF和PACF函数中。AR(p) 过程具有ACF函数拖尾和PACF函数截尾的性质,MA(q) 过程具有ACF函数截尾和PACF函数拖尾的性质。3.2.4自回归求和平稳模型考虑一般ARIMA模型 (3.16)其中,平稳AR算子和可逆MA算子没有公因子。参数对d=0和d0分别起着不同的作用。当d=0时,原过程是平稳的,与过程的均值有关,即;然而,当时,被称作确定性趋势项,除非需要,否则在模型中常

    35、可以忽略不计。我们将式 (3.16) 中得到的齐次非平稳模型称之为 (p, d, q) 阶自回归求和移动平均模型,简记为ARIMA(p, d, q) 模型。3.2.5 自回归、滑动平均、ARIMA模型性质比较 自回归、滑动平均、ARIMA模型性质比较如表3.1所示。表3.1 自回归、滑动平均、混合ARIMA模型的性质自回归模型滑动平均模型混合ARMA模型模型的表示形式模型的表示形式权数有限序列无限序列无限序列权数无限序列有限序列无限序列平稳条件的根在单位圆外总是平稳的根在单位圆外可逆条件总是可逆的根在单位圆外的根在单位圆外自相关函数无限项(指数衰减或正弦振荡衰减)拖尾有限项截尾无限项(指数衰减

    36、或q-p步后正弦振荡)拖尾偏相关函数有限项截尾无限项(指数衰减或正弦振荡)拖尾无限项(指数衰减或p-q步后正弦振荡)拖尾3.3 模型识别与选择3.3.1 模型识别的步骤为了说明模型识别,我们考虑一般的ARIMA(p, d, q) 模型 (3.17)模型识别关系到确定必要的变换,如方差稳定变换和差分变换。当d时判定所包含的确定性参数的确定,以及确定模p、q的适当阶数。给定一个时间序列,我们用下述有用的步骤来识别一个试探性模型。步骤1 画出时间序列图并选择适当的变换。在任何时间序列分析中,第一步都是画出数据图。通过仔细地考察散点图,往往可以得到好的思路,如时间序列是否存在趋势、季节性、异常值、异方

    37、差,以及其他非正态非平稳现象。这种认识往往为实施必要的数据变换奠定了基础。在时间序列分析中,运用最广泛的变换是方差稳定的变换和差分。方差稳定的变换、如幂变换等,需要非负值,而差分过程可能产生一些负值,因而我们进行方差稳定变换总是在取差分之前。具有非常数方差的序列往往需要进行对数变换。更一般地,为了使方差平稳化,我们可以采用Box-Cox幂变换。如有必要,方差稳定变换总是在我们作任何更深入的分析之前,因而我们在后面的讨论中,如不加特别说明,总是把变换后的序列称为序列。步骤2 计算并考察原序列的样本ACF和样本PACF,以便进一步确认必要的差分阶数,使得差分后的序列是平稳的。一般准则如下: 若样本

    38、ACF衰减缓慢(个别样本ACF可能不大),且样本PACF在1步延迟后截尾,表明差分是必须的。可进行一阶差分,也可以用Dickey和Fuller(1979) 给出的单位根检验。在临界情形,一般推荐用差分(Dickey, Bell and Miller, 1985)10。 更一般地,为了消除非平稳性有时需要考虑高阶差分,其中d1。在绝大多数情形,d为0,1或2。注意到如果是平稳的,那么 (i=1,2) 也是平稳的。步骤 3 计算并考察经适当变换和差分后序列的样本ACF和样本PACF,并由此识别p和q的阶数。我们知道p是在自回归多项式的最高阶,而q是移动平均多项式的最高阶。通常,p和q所需的阶数小于

    39、或等于3。步骤 4 当d0时确定趋势项。对于非平稳模型参数经常被忽略掉,以便它能够表示局部水平,斜率或趋势有随机变化的时间序列。如果有理由相信差分后的时间序列含有确定性趋势,那么,我们可以通过比较差分序列的样本均值和近似标准差来确认这个结论。为了推导出的表达式,有。由此得到 (3.18)其中, 是定义的自协方差生成函数, 是它在B=1时的值。因此,的方差和标准差是依赖于模型的。尽管如此,在模型识别阶段,由于基本模型是未知的,大多数现有软件都是用下面的近似公式 (3.19)其中是样本方差,是序列的前k个显著的样本ACF值。在原假设时,方程 (3. 19) 退化为 (3.20)另外,我们可以一开始

    40、包括,如果初步估计结果不显著,再从最终的模型估计中将它去掉。3.3.2 矩方法矩方法是用样本矩代替相应的理论值,并求解相应方程得到参数的估计。如对于AR(p) 过程 (3.21)均值用估计。为了估计,我们先利用,得到下面的Yule-Walker方程组 然后,用代替,通过前面的线性方程组我们就得到矩估计,即 (3.22)该估计量通常称为Yule-Walker估计。在得到后,利用下面的结果 (3.23)得到的矩估计为 (3.24)3.3.3 极大似然方法对于一般的平稳ARMA(p, q)模型: (3.25)其中, 是独立同分布服从的白噪声,联合概率密度由下式给出 (3.26)然后将 (3.25)

    41、改写为 (3.27)我们可以写出参数的似然函数。令,并假设初始条件和是已知的。条件对数似然函数为 (3.28)其中 (3.29)是条件平方和函数。其中称为条件极大似然估计11。3.3.4 模型选择准则(1) Akanke 的AIC和BIC准则假设用M个参数的统计模型对数据进行拟合。为了检验模型拟合的质量,Akaike(1973, 1974) 引入了信息准则。该准则在文献中被称为AIC(Akaikes information criterion) ,其定义为AIC(M)=-2lnmaximum likelihood+2M (3.30)其中,M是在模型中的参数个数。我们要选择M使AIC(M) 极小化。Shibata(1976) 证明了AIC准则趋向于高估自回归的阶数。Akaike(1978, 1979) 发展了贝叶斯的极小AIC方法,被称为贝叶斯信息准则 (Bayesian information criterion, BIC) ,其具体形式如下:BIC(M)=


    注意事项

    本文(基于时间序列分析及Clementine软件的宝钢股价研究.doc)为本站会员(精***)主动上传,沃文网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知沃文网(点击联系客服),我们立即给予删除!




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给沃文网发消息,QQ:2622162128 - 联系我们

    版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如有侵权请立即联系:2622162128@qq.com ,我们立即下架或删除。

    Copyright© 2022-2024 www.wodocx.com ,All Rights Reserved |陕ICP备19002583号-1

    陕公网安备 61072602000132号     违法和不良信息举报:0916-4228922