1、多元统计分析课程设计题目 我国城镇居民消费支出的因子分析 姓名 陈雨薇 黄丽 学号 11001020104 11001020110 教师评语: 成 绩 指导教师 我国城镇居民消费支出的因子分析摘要:近几年来,我国城镇居民的消费重点正从追求数量转变为讲求良好的质量问题,这也是一个国家消费观念的改变。有了量得供不应求,才能有心去追求质的高低,可以看出一个国家的经济的突飞猛进。从基本生活消费品向新型消费领域转变,这种消费结构的改变对社会的经济发展起着至关重要的作用。本文主要以2004年2009年这六年的居民消费支出结构类别情况进行分析,并对影响消费支出的因素提出改善的对策。关键字:城镇居民消费结构
2、因子分析 影响因素引言 随着新中国的逐渐壮大,我们已经不是需要勒紧裤腰带的时代了,已步入小康社会的我们,正向着发达国家慢慢逼近。人们的收入水平、消费水平不断提高,消费观念、消费模式和消费环境的不断改善,对物质的追求已更多的变为在精神上的追求,享受质量的发展而不仅仅局限数量的多少。所以居民消费作为影响社会经济活动的重要因素,体现着国家经济状况的强大程度。优化消费结构对扩大居民消费需求,拉动我国经济持续稳定增长具有深远的意义。正文一、 居民消费支出 居民消费支出是指城乡居民个人和家庭用于生活消费以及集体用于个人消费的全部支出。包括购买商品支出以及享受文化服务和生活服务等非商品支出。不包括各种非消费
3、性的支出。 居民消费支出指常住居民在核算期内对于货物和服务的全部最终消费。它包括四方面内容:(1)居民用货币直接购买的用于生活消费的各种货物,包括本期不能全部消费完的耐用消费品,如家具、家用电器等,也按购买全价计入本期消费中。(2)居民用货币直接购买的用于生活消费的各种服务的支出,如房租、交通、洗理、教育、医疗保健、文化、日用品修理,家庭保姆等项支出。(3)居民以实物工资形式获得的用于生活消费的各种货物和服务,包括免费或以低于市场价格获得的货物和服务。(4)居民自产自用的计入核算期产出内的货物和自有房屋的虚拟房屋等。居民消费不包括作为生产投入和投资建房方面的支出。 二、因子分析模型因子分析是主
4、成分分析的推广和发展,它也是将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。基本思想:因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量相关性较低。设X=(X1,Xp)是客观测的随机向量,E(X)=,D(X)=,且设F=(F1,,Fm)(np)是不可观测的随机向量,E(F
5、)=0,D(F)=Im(即F的各分量方差为1,且互不相关)。又设=(1, P)与F互不相关,且E()=0,D()=diag(12,,p2) D(对角矩阵)。假定随机向量X满足以下的模型; 则模型此为正交因子模型。用矩阵表示为且满足: 即和是不相关的; 即不相关且方差皆为1。, 即不相关,且方差不同。 其中F=(F1,,Fm),F1,,Fm称为X的公共因子,=(1, P),1, p称为X的特因子;公共因子F1,,Fm一般对X的每一个分量Xi都有作用,而i只对Xi起作用,而且各特殊因子之间以及特殊因子与所有公共因子之间都是互不相关的。称为因子载荷是第个变量在第个公共因子上的负荷。矩阵称为因子载荷矩
6、阵。因子分析的内容十分丰富,这里本文主要应用因子分析中常用一种类型:R型因子分析(对变量做因子分析)。R型因子分析的模型为: =三、2004年2009年城镇居民消费支出的结构 改革开放以来,中国经济高涨,人们收入的增加就直接影响到居民消费水平的提高,消费支出的增加。城镇居民的消费支出结构也发生了很大的变化,其中对城镇居民消费支出影响最大的当属交通通信,住房、医疗保健和教育文化的支出。在这些类别中,被称为“三高”的教育、医疗、住房支出占居民总消费支出的比重不断扩大,必定导致居民用于其他方面的消费受到一定抑制。 当今随着人们生活水平的日渐提高以及各项交通通信技术的进步,城镇居民的消费重点已从基本生
7、活消费品从而转向了以住、行为代表的新型消费领域,其中交通通信费用的增长速度尤为突出。并且在科技的不断进步下,随着居民收入水平的提高及电子通讯、家用汽车价格的下调,移动电话及家用汽车己成为我国近几年形成的新消费热点之一。为了研究我国城镇居民消费支出的结构和其影响个消费类别变化的因素,我们收集近六年的数据得到表一:表1 我国城镇居民消费支出的结构城镇居民消费支出本表按当年价格计算单位:亿元指标2005年2006年2007年2008年2009年 食品类支出16615.918277.221239.425568.627152.2 衣着类支出4400.45092.96100.16998.17785.8 居
8、住类支出7765.38812.612306.114565.316165.7 家庭设备、用品及服务类支出2471.42834.93523.14152.44770.8 医疗保健类支出4788.25233.56156.57580.98867.4 交通和通信类支出5456.16470.47946.68505.910335.6 文教娱乐用品及服务类支出6058.46850.97781.28152.99046.9 银行中介服务消费支出1744.12016.31711.22132.91995.8 保险服务消费支出1214.71484.81344.51528.81582 其它支出1474.81932.1337
9、93913.94594 从表1中可以看出,把城镇居民的消费支出大致分为了十个类别,在十大类消费支出中,城乡居民用于食品、住房、医疗、交通通信和教育等项目的支出增长幅度较大,而用于衣着、家庭设备和中介服务消费等的支出呈缓慢增长,甚至银行中介服务的消费近年又下降趋势。其主要原因就是因为现今人们的生活水平不断提高,对生活质量也有了更高层次的追求。如有医疗保健支出的增加也是节节攀升,从此可以看出现在的人们更为注重身体的健康,只有自己身体健康了,才能追求精神生活,由物质的追求转变为精神的享受。因此用于食品、住房、医疗、交通通信和教育等费用支出迅速增加,乃至过高,而挤占了居民对其他方面的消费支出。四、 城
10、镇居民消费支出的因子分析 以上述的数据,首先通过SPSS用因子分析的方法减少变量个数,之后再进行比较和综合评价。(1)首先考察收集到的原有变量是否适合进行因子分析得: 令食品类支出为x1,衣着类支出为x2,居住类支出为x3,家庭设备、用品类支出为x4,医疗保健类支出为x5,交通和通讯类支出为x6,文教娱乐用品及服务类支出为x7,银行中介服务消费支出为x8,保险服务消费支出为x9,其它支出为x10.表2 原变量的相关系数矩阵Correlation Matrixax1x2x3x4x5x6x7x8x9x10Correlationx11.000.992.994.995.991.973.976.723.
11、847.983x2.9921.000.993.994.986.992.994.719.875.986x3.994.9931.000.995.984.982.985.661.818.997x4.995.994.9951.000.995.988.987.678.835.990x5.991.986.984.9951.000.980.973.698.840.972x6.973.992.982.988.9801.000.997.668.862.980x7.976.994.985.987.973.9971.000.682.870.985x8.723.719.661.678.698.668.6821.000
12、.926.612x9.847.875.818.835.840.862.870.9261.000.791x10.983.986.997.990.972.980.985.612.7911.000a. This matrix is not positive definite. 表2是原有变量相关系数矩阵。可以看到,大部分的相关系数都是较高的,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。(2) 提取因子表3 因子分析的初始解(一) CommunalitiesInitialExtractionx11.000.983x21.000.996x31.000.973x41.000.983x5
13、1.000.973x61.000.975x71.000.980x81.000.574x91.000.806x101.000.953Extraction Method: Principal Component Analysis.表3是因子分析的初始解,咸湿佬所有表量的共同度数据。第一列是因子分析初始解下的变量共同度,它表明,对原有10个变量如果采用主成分分析法提取所有特征根,那么原有变量的所有方差都可被解释,变量共同度都为1。事实上因子个数小于原有变量的个数才是因子分析的目标,所以不可以提取全部的特征根;第二列是在按指定提取条件提取的特征根时的共同度。从表3可以看到,大部分变量的共同度均很高,各
14、个变量的信息丢失较少。但是仅有x8信息严重丢失(40%)。因此因此提取的总体效果并不理想。所以重新指定提取特征根的标准,指定提取两个因子,分析结果如下。表4 因子分析的初始解(二)CommunalitiesInitialExtractionx11.000.987x21.000.999x31.000.994x41.000.997x51.000.981x61.000.986x71.000.988x81.000.987x91.000.975x101.000.994Extraction Method: Principal Component Analysis. 从表4中可以看出,制定提取两个特征根是因
15、子分析的初始解。有第二列可知,此时所有变量的共同度均较高,各个变量的信息丢失较少。因此班次提取的总体效果较理想。Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsRotation Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %Total% of VarianceCumulative %19.19791.97291.9729.19791.97291.97
16、26.96169.60769.6072.6916.90898.880.6916.90898.8802.92729.27398.8803.083.83199.7114.027.26799.9785.002.022100.00062.412E-162.412E-15100.00071.590E-161.590E-15100.00085.340E-175.340E-16100.0009-2.634E-16-2.634E-15100.00010-3.504E-16-3.504E-15100.000Extraction Method: Principal Component Analysis.表5 因子
17、解释原有变量总方差的情况 在表5中,第一列是因子编号,以后三列组成一组,每一组中数据项的含义依次是特征根值、方差贡献率和累计方差贡献率。第一组数据项描述了初始因子解的情况。可以看到,第一个因子的特征根值为9.197,解释原油10个变量总方差的91.972%,累计方差贡献率为91.972%。其余变量一次类推。因此10变量的总方差均被解释。第二组数据项描述了因子解的情况。可以看到,由于指定提取两个因子,两个因子共同解释了原有变量总方差的98.880%。总体上,原油变量的信息丢失较少,因子分析效果较理想。第三组数据项表数量最终因子解的情况。可见旋转后,累计方差比没有改变,没有影响原有变量的共同度,但
18、重新分配了各个因子解释原有变量的方差,该变量各因子的方差贡献,使得因子更易于解释。图1 因子的碎石图 也可以从图1中看到,横坐标为因子数目,纵坐标为特征根。第一个因子的特征根值很高,对解释原有变量的贡献最大,第三个以后的因子特征根值都较小,对解释原有变量的贡献很小,因此提取两个因子合适。表6 因子载荷矩阵Component MatrixaComponent12x1.992-.064x2.998-.056x3.987-.145x4.991-.120x5.987-.086x6.988-.104x7.990-.088x8.758.643x9.898.410x10.976-.202表6显示因子在和举证
19、是因子分析的核心内容。根据该表可以写出因子分析模型为: 由表5可知,在10个变量中第一个因子的载荷都高,意味着它们与第一个因子的先关程度高,第一个因子很重要。第二个因子与原有变量的相关性均很小,它对原有变量的解释作用不显著。另外还可以看出这两个因子的实际含义比较模糊。(3) 因子的命名解释 采用方差最大法对因子载荷矩阵实施正交旋转以使因子具有命名解释性。表7 旋转后的因子载荷矩阵Rotated Component MatrixaComponent12x1.884.453x2.885.464x3.921.381x4.913.405x5.891.432x6.901.417x7.895.432x8.
20、321.940x9.561.812x10.920.392从表7可以看出,变量x1、x2、x3、x4、x5、x6、x7、x10在第一个因子上有较高的载荷,第一个因子主要解释这几个变量,可解释为生活必需支出。变量x8、x9在第二个因子上有较高的载荷,第二个因子主要解释这两个变量,可解释为服务消费支出。与旋转前相比,因子含义较为清晰。表8 因子旋转中的正交矩阵Component Transformation MatrixComponent121.859.5132-.513.859Extraction Method: Principal Component Analysis. Rotation Met
21、hod: Varimax with Kaiser Normalization. 表9 因子协方差矩阵 Component Score Covariance MatrixComponent1211.000.0002.0001.000Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores. 从表9中可以看出两个因子没有线性相关性,实现了因子分析的设计目标。图2 旋转后的因子载荷图 从图2中看出,x3、x8比较靠近两个坐标
22、轴,表明如果分别用第一个因子刻画x3,用第二个因子刻画x8,信息丢失较少,效果较好。但如果用一个因子分别刻画其它变量,则效果不是很理想。(4) 计算因子得分表10 因子得分系数矩阵 Component Score Coefficient MatrixComponent12x1.140-.024x2.135-.014x3.200-.125x4.182-.094x5.156-.052x6.170-.075x7.158-.055x8-.406.841x9-.220.560x10.198-.113根据表10可写出因子得分函数:F1=0.140x1+0.135x2+0.200x3+0.182x4+0.1
23、56x5+0.170x6+0.158x7-0.406x8-0.220x9+0.241x10F2=0.024x1-0.014x2-0.125x3-0.094x4-0.052x5-0.075x6-0.055x7+0.841x8+0.560x9-0.197x10 可见计算两个因子的分辨率的变量值时,x3、x8的权重较高,但方向恰好相反,这与因子的实际含义是相吻合的。另外,因子得分的均值为0,标准差为1。正值表示高于平均水平,负值表示低于平均水平。(5)2006年2009年的综合评可利用因子得分变量对这五年来进行对比研究。随着年份是增长,我国的经济发展的速度加快,人们的生活水平不断提高,各项支出都不断
24、攀升这里,仅从单纯的数量上考虑,两个因子的方差贡献了为权数。于是,综合评价计算公式为:F=0.69607F1+0.29273F2。随着经济的发展,人们的收入增加,各项支出增加,其生活水平提高,因为对生活质量的高要求在其教育,住房,医疗支出的增加速度尤为迅速。有综合得分的公式算得可将五年分为三类。表11 因子得分年份FAC1_1FAC2_12004-0.65675-1.355892005-0.8296-0.258012006-1.074721.2396620070.66091-0.7880520080.458510.9429220091.441660.21937 由表11得到综合得分为:2004
25、年:-0.8540536522;2005年:-0.6529869393;2006年:-0.3851946786;2007年:0.2293537472;2008年:0.59517602732009年:1.0677124563 所以三类别分别为第一类:2004年、2005年2006年;第二类:2007年、2008年;第三类:2009年。例如2004年,两个因子对指出的影响都较小,说明人们当时的收入水平偏低,没有更多的钱来用于支出。因为两个因子的影响相对一样,但人们对生活必需的支出和服务消费的支出处于同等的概念,消费支出的分配均匀。在2007年,第二个因子对其消费的支出有着较大的影响,第一个因子影响
26、较弱,说明在那个时段的人们主要偏向于将收入大部分存入银行和投资到保险业,使得自己的钱能够得到积累,而以后以备不时之需。人们有这样的想法也体现了收入水平不高,人们只能通过日积月累获得一定得财力。这一类有消费支出偏向。而到了2009年,我国经济全面的发展,人们的收入大大的的到来提高,人们消费观念也发生了改变,从图三中可以看出,两个因子对变量都有较高的影响,说明人们能够有较多的钱用于生活必需品,而也有较多的钱用于存蓄和投资,使得在享受生活的同时,也不乏将剩余的钱挣得更多的钱。这一类支出分配均匀,而且财力较大。五、 总结 由于社会的发展,人们的观念也随之发生着改变,对此我们队这些影响消费支出因素进行了
27、分析 : 首先,高速增长的教育消费。主要表现在居民教育支出猛增,教育占消费支出的比重迅速扩大;各种择校费、赞助费早已司空见惯;不合理收费屡禁不止,“高价教育”越来越高;教育费用与居民承受能力矛盾突出。 其次,高价住房。城镇居民在住房消费方面的支出也在不断增大,居住质量、居住条件改善在居民提高生活消费水平的目标中始终占有重要的地位。目前住房正逐步向楼层更高和面积更大的防线发展,少数富裕户的住房已向别墅式发展。由于预期房地产价格将会继续大幅上升,许多家庭抑制其他消费,以积攒首付款和支付月供款。过高的首付款和月供支出明显挤出了工薪阶层的消费需求,绝大多数购房者纷纷削减了其他消费。因此,住房价格居高不
28、下,已成为挤占我国城镇居民其他消费的重要原因。 再次,高价的医疗费用。这个主要表现按在医疗乱收费问题屡禁不止;药价仍居高不下;医疗收费超过多数市民的承受能力;不少城镇居民无医疗保障。因而,高医疗也是对居民其他消费的一种挤出效应。 最后,交通通信费用的急速增长。在交通通讯消费支出中,包括固定电话费、移动电话费和上网费在内的通讯费用开支比例迅速上升。随着交通通讯设施的快速发展和交通、通讯工具的大幅降价,我国城镇居民交通、通讯费用支出呈现增加态势。这表明交通、通讯消费快速增长已成为今年居民生活消费的热点,它的增长使人们与外界的交流更加密切、方便、及时。六、参考文献【1】;【2】SPSS统计分析方法及应用(第二版) 薛薇;【3】应用多元统计分析 高惠璇;