[毕业设计论文]财政收入预测与分析MATLAB.doc
《[毕业设计论文]财政收入预测与分析MATLAB.doc》由会员分享,可在线阅读,更多相关《[毕业设计论文]财政收入预测与分析MATLAB.doc(26页珍藏版)》请在沃文网上搜索。
1、一、根据美国人口从1790年到1990年间的人口数据(如下表),确定人口指数增长模型和Logistic模型中的待定参数,估计出美国2010年的人口,同时画出拟合效果的图形。表1 美国人口统计数据年 份1790180018101820183018401850人口(106)3.95.37.29.612.917.123.2年 份1860187018801890190019101920人口(106)31.438.650.262.976.092.0106.5年 份193019401950196019701980人口(106)123.2131.7150.7179.3204.0226.5提示:指数增长模型:
2、解:设为第t年美国人口数,记时刻(t=0)的人口为。假设人口增长率为常数r,则有令,有关于的微分方程 ,故可解出得到热口指数增长模型:,(1)将(1)式去对数,可得用MATLAB软件计算可得r=0.214/10年,=-36.6198,预测估计美国2010年的人口数为x(2010)= 598.4,拟合图用MATLAB解题具体步骤如下:程序:t=1790:10:1980;y=3.9 5.3 7.2 9.6 12.9 17.1 23.2 31.4 38.6 50.2 62.9 76 92 106.5 123.2 131.7 150.7 179.3 204 226.5v=log(y);p=polyfi
3、t(t,v,1) %得到指数模型参数值r和a结果:y = Columns 1 through 9 3.9000 5.3000 7.2000 9.6000 12.9000 17.1000 23.2000 31.4000 38.6000 Columns 10 through 18 50.2000 62.9000 76.0000 92.0000 106.5000 123.2000 131.7000 150.7000 179.3000 Columns 19 through 20 204.0000 226.5000p = 0.0214 -36.6198程序:ti=1790:2:1980;vi=polyv
4、al(p,ti);yi=exp(vi)plot(t,y,*,ti,yi,r)legend(数据点(x,y),拟合曲线y=f(x) x(2010)=exp(0.0214*2010-36.6198) %估计2010年美国人口Logistic模型:首先我们可用微积分将连续的微分方程离散化,不妨设x(t)表示第t次所得人口数,r为人口固有增长率,根据logistic模型,为人口容量,以下用k代替,可得: 这里可以假设,则现在我们可以用线性拟合,借助matlab来进行运算得到r,ky=3.9,5.3,7.2,9.6,12.9,17.1,23.2,31.4,38.6,50.2,62.9,76.0,92.0
5、,106.5,123.2,131.7,150.7,179.3,204.0,226.5;t=1:20;for k=1:19 x(k)=(y(k+1)-y(k)/y(k);endA=polyfit(y(1:19),x,1) %求出参数r与sA = -0.0014 0.3368这里求出r=0.3368,k=0.3368/0.0014=240.57143(下面的b0就是这里求出)function y=lin(b,t);f(x)=b(1)./1+(b(1)./3.9-1).*exp(-b(2).*t);t=1:20;y=3.9,5.3,7.2,9.6,12.9,17.1,23.2,31.4,38.6,5
6、0.2,62.9,76.0,92.0,106.5,123.2,131.7,150.7,179.3,204.0,226.5;b0=240.57143,0.3368;b=nlinfit(t,y,lin,b0)b0 = 240.5714 0.3368b = 312.6056 0.2615这里就求出了函数的值r=0.2615,=312.6065,=3.9(最初的值,1790年的)则可求出t=1790:10:1980;y=3.9,5.3,7.2,9.6,12.9,17.1,23.2,31.4,38.6,50.2,62.9,76.0,92.0,106.5,123.2,131.7,150.7,179.3,2
7、04.0,226.5;x1=1:20;F=312.6056./1+80.155282.*exp(-0.2615.*x1);plot(t,y,r*);hold onplot(x1,F,b-);hold off,legend(数据点(xi,yi),拟合曲线y=f(x)xlabel(t),ylabel(x(t)下面是图形预测2010年,当t=23时,求出美国2010年的人口为261.4142结论:从以上两个图形可以看出,logistic拟合的更好,误差更少,预测用logistic模型更加准确。二、f(x)的定义如下:1、写一个函数文件f(x)实现该函数,要求参数x可以是向量;程序:function
8、f=f(x)if x0&x=-4 f=x.2+x-6;elseif x=0&x=2&x=3 f=x.2-5*x+6;else f=x.2-x-1end2、作出该函数的图形;程序:x=-10:0.1:0;y1=x.2+x-6;i=find(x=-4);y1(i)=NaN;plot(x,y1,r)hold onx=0:0.1:10;y2=x.2-5*x+6;i=find(x=2&x=3);y2(i)=NaN;plot(x,y2,g)hold onx=10:0.1:20;y3=x.2-x-1;plot(x,y3,b);legend(y1=x.2+x-6,y2=x.2-5*x+6,y3=x.2-x-1
9、)3、求出f(x)的零点与最值。程序:x=fminbnd(f,-10,20)结果:x = -0.5000即f(x)的零点x=-0.5,最小值为f(x)=-6.25,最大值为无穷。三、财政收入预测问题:财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关。下表列出了1952-1981年的原始数据。1、编程将数据读入MATLAB,对数据进行探索性分析; 2、请你分析表中是否存在不合理数据,如果存在,找出不合理数据; 3.、构造预测模型;4、将以上分析组织成一篇数学建模论文。 表3 1952-1981数据年份国民收入(亿元)工业总产值(亿元)农业总产值(亿元)总人口(
10、万人)就业人口(万人)固定资产投资(亿元)财政收入(亿元)1952598349461574822072944184195358645547558796213648921619547075204916026621832972481955737558529614652232898254195682571555662828230181502681957837798575646532371113928619581028123559865994266002563571959111416815096720726173338444196010791870444662072588038050619617571
11、156434658592559013827119626779644616729525110662301963779104651469172266408526619649431250584704992773612932319651152158163272538286701753931966132219116877454229805212466196712491647697763683081415635219681187156568078534319151273031969137221016888067133225207447197016382747767829923443231256419711
12、780315679085229356203556381972183333657898717735854354658197319783684855892113665237469119741993369689190859373693936551975212142549329242138168462692197620524309955937173883444365719772189492597194974393774547231978247555901058962593985655092219792702606511509754240581564890198027916592119498705418
13、96568826198129276862127310007273280496810财政收入分析与预测问题【摘要】国家的财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关。首先,我们根据所给数据,对数据进行描述性分析。之后,我们对数据进行了回归分析,构造了多元线性回归模型,并获得了模型的回归系数估计值及其置信区间。然后,考虑到每个回归系数置信区间包含零点与否的情况和变量之间存在多重共线性,我们用逐步回归法剔除了工业总产值、就业人口因素变量对模型进行了改进。又考虑到数据的时间序列属性,我们对模型进行了自相关性诊断,作出残差散点图,初步判定其大部分点落在1,3象限,
14、随机误差表现出正自相关趋势。但在之后的D-W检验中,我们计算出了DW值,自相关系数估计值,依照样本容量和回归变量数目,查阅了D-W分布表,得到检验的临界值dL和dU。在分析DW所在区间时,我们发现模型的自相关状态不能确定。但我们将1952年-1980年的各项经济指标数据代入模型,得出的预测值与实际值相当吻合。模型拟合效果非常好最后,利用该模型对1990年和2000年的财政收入作出预测,并对结果进行了分析。关键词:MATLAB 多元线性回归模型 回归分析 逐步回归法一、问题重述国家的财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关,根据题目所给数据,对数据进行
15、分析,剔除不合理数据,构造多元线性回归模型,并利用该模型对1990年和2000年的财政收入作出预测。二、问题假设1、 题目所给的数据准确无误;2、 财政收入为研究指标Y,国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资分别自变量;3、 Y与各自变量呈线性函数关系;4、 Y是随机变量,服从均值为零是正态分布,即 三、符号说明:财政收入:国民收入:工业总产值:农业总产值:总人口:就业人口:固定资产投资:与想对应的回归系数, 四、问题分析与模型建立1、问题分析 首先将数据作初步分析。分别将数据导入MATLAB软件中并作出财政收入与6个因素的回归拟合图,并且求出各自拟合优度,F值,p值
16、。如下图(1)到图(7)所示注:MATLAB软件中F(1,29)的临界值为0.004,F(3,25)=0.11582图(1)通过MATLAB软件计算得出=0.9512 F=0.4455 p=0.000表示财政收入有95.12%被国民收入所解释,且P小于0.0001则方程回归效果好,国民收入与财政收入有显著的线性相关。图(2) 通过MATLAB软件计算得出=0.9231 F=0.336 p=0.000表示财政收入有92.31%被国民收入所解释,且P小于0.0001则方程回归效果好,工业总产值与财政收入有显著的线性相关。图(3)通过MATLAB软件计算得出=0.8370 F=0.1438 p=0.
17、000表示财政收入有83.7%被国民收入所解释,且P小于0.0001则方程回归效果好,农业总产值与财政收入有显著的线性相关。图(4)通过MATLAB软件计算得出=0.8756 F=0.1971 p=0.000表示财政收入有87.56%被国民收入所解释,且P小于0.0001则方程回归效果好,总人口与财政收入有显著的线性相关。图(5) 由图(5)可知,1981年就业人口数据存在不合理性,因此将1981年就业人口数据和1981年其他相应的数据剔除,再将剩余的数据作出就业人口与财政收入的拟合图,如图(5-1) 图(5-1) 通过MATLAB软件计算得出=0.8160 F=0.0045 p=0.000表
18、示财政收入有81.6%被国民收入所解释,且P小于0.0001则方程回归效果好,国民收入与财政收入有显著的线性相关。图(6)从上所有拟合图可知,财政收入分别与国民收入、工业总产值等6要素存在着高度线性相关关系,因此,可建立线性回归模型。2.多元线性回归模型基本概念(1)多元线性模型变量Y与其他有关变量的关系称为“回归模型”,其中为均值为0的随机变量。模型中的变量Y称为因变量,通常建立回归模型的目的是要说明因变量的变化规律,并对其进行预测;模型中的称为自变量或“解释变量”,用来说明或解释因变量。当f为线性函数时,回归模型:称为线性回归模型,特别的,当k=1时称为一元线性回归模型。是线性回归的一般形
19、式,其中是未知的参数;是不可观测的随机变量,称为误差项,假定。如果有n次独立的观测数据 ,则线性回归模型可表示成如下形成: 式中,相互独立且服从N(0,)分布。简写成矩阵形式:式中,(2)多元线性回归模型的基本假定假设1:回归模型是正确设定的;假设2:解释变量是非随机的,且各之间不存在严格线性相关性(无完全多重共线性);假设3:各解释变量再所抽取的样本中具有变异性,且随着样本点容量的无限增加,各解释变量的样本方差趋于一个非零常数,即时假设4:随机误差限具有条件零均值、同方差及不序列相关性;假设5:解释变量与随机项不相关;假设6:随机项满足正态分布。(3)参数与的估计 记的估计为,那么我们就可以
20、得到一个k元线性方程,对每一个样本点,可求出相应的值,则为预测值,要使一切的与之间的偏差达到最小,根据最小二乘法的原理,即要求所以只要使达到极小的。由于Q是的一个非负二次型,故其极小值必存在,根据微积分的理论知道,只要Q对的一阶偏导数为0:经整理即得关于的一个线性方程组: (1)其解称为的最小二乘估计。若记(1)的系数矩阵为A,常数项矩阵为B,则A恰为,B恰为: 因而(1)用矩阵形式即为:,在回归分析中存在,这是最小二乘估计,当我们求得了的最小二乘估计后,就可以建立回归方程,从而可以利用它对指标进行预报和控制。为求的估计,引入几个名词。称实测值与回归值的差-为残差,预测值与实测值的关系是:式中
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计论文 毕业设计 论文 财政收入 预测 分析 MATLAB