多元统计分析关于各地区住宿业企业基本情况和经营情况的统计分析论文.doc
《多元统计分析关于各地区住宿业企业基本情况和经营情况的统计分析论文.doc》由会员分享,可在线阅读,更多相关《多元统计分析关于各地区住宿业企业基本情况和经营情况的统计分析论文.doc(15页珍藏版)》请在沃文网上搜索。
1、关于各地区住宿业企业基本情况和经营情况的统计分析摘要:关键词:住宿业 营业额 频数分析 因子分析 聚类分析 判别分析正文:序言:正文:第一步、录入数据:图-1图-2第二步、进行频数分析:表-1统计量法人企业(个) 年末从业人数(人)营业额(亿元)客房收入餐费收入N有效3131313131缺失00000均值506.8768005.7790.25342.25036.899中值423.0056088.0054.66925.67624.175标准差370.25159799.09293.359543.500537.8579方差137086.1163.576E98715.9881892.2951433.2
2、19偏度1.2962.2721.8921.8951.886偏度的标准误.421.421.421.421.421峰度1.6247.0403.4053.2193.578峰度的标准误.821.821.821.821.821百分位数25234.0026098.0030.93015.17812.91650423.0056088.0054.66925.67624.17575654.0087962.0098.73147.75844.373表-1为统计量表,从上表中可以看出各个变量的均值、中值、标准差、方差、偏度、峰度、以及它们的标准误差,法人企业的营业额基本上是由客房收入和餐费收入平摊,但相对来说还是客房收
3、入占得比例较大些。图-3图-3为带有正态曲线的直方图,描述的是法人企业个数的方面的问题,从图中可以看到各个城市的平均法人个数为506.87,标准误差为370.251,总共有31个城市,而且在这些城市中,法人企业个数在250个的城市居多,大约占到九个。根据标准正态曲线,可以看出该变量的变化情况可大致认为服从正态分布,但在后面的部分也还是存在一定的偏差。图-4图-5图-6图-7图-4、图-5、图-6、图-7分别表示的是年末从业人数、营业额、客房收入和餐费收入的频数直方图,分析方法和图-3相似,就不一一分析了,从上面几个图中可以看出,这几个变量都大致服从正态分布,但我国住宿业方面的发展还是很不平衡,
4、无论是从这五个方面的哪一方面来看,都是数值小的占的比例较大。说明只有少数地区的住宿业可以达到发达水平,还有大部分地区需要加大力度来提高自己的收入水平。第三步、对数据进行因子分析:表-2相关矩阵法人企业(个) 年末从业人数(人)营业额(亿元)客房收入餐费收入相关法人企业(个) 1.000.964.932.891.945年末从业人数(人).9641.000.956.919.968营业额(亿元).932.9561.000.988.968客房收入.891.919.9881.000.923餐费收入.945.968.968.9231.000表-2为五个变量的相关矩阵,从表中的数据可以看出,各个变量同其他变
5、量之间的相关性都很强。表-3解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %14.78295.64895.6484.78295.64895.6482.1402.79598.4433.049.98299.4264.027.55099.9755.001.025100.000提取方法:主成份分析。表-3为解释的总方差,可以看到只要第一个成分就可以解释95.648%的信息,而且在合计列中只有第一个因子的特征值大于1,所以我提取了第一个变量因子并对它做因子分析。图-8图-8为因子分析的碎石图,从图中可以明显的看到第一段的斜率很大,而后面就变得平缓了,也说明只要一个因子
6、就能很好地解释所有的变量,说明我们只提取一个因子的做法是合理的。但由于只有一个因子,所以无法得到因子载荷矩阵和旋转的因子载荷矩阵,但可以有成分得分系数矩阵,由此可以算出因子得分。表-4成份得分系数矩阵成份1法人企业(个) .202年末从业人数(人).206营业额(亿元).207客房收入.202餐费收入.205提取方法 :主成分分析法。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。表-4即为成分得分系数矩阵,从中可以得到因子在各变量上的系数,可以得到计算因子得分的函数:。图-9图-9为最后的因子得分,由于在保存子对话框中点了保存为新变量,所以在原数据中多了一列,即为根据表-4得
7、到的因子得分。第四步、对数据进行聚类分析(K-均值聚类,只选取了前三个变量):表-5初始聚类中心聚类123法人企业(个) 161840922年末从业人数(人)302021420294364营业额(亿元)398.03.998.7表-6迭代历史记录a迭代聚类中心内的更改1231.00019558.7239865.7872.0005424.8936723.8623.0006141.92811952.2144.0003137.2007758.3295.000.000.000a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 5。初始中心间的最小距离为
8、90166.364。表-7最终聚类中心聚类123法人企业(个) 1618307850年末从业人数(人)30202138464110936营业额(亿元)398.041.6169.5表-5、表-6、表-7分别为初始聚类中心、历史迭代记录和最终聚类中心。根据表-6可以看出第一类的聚类中心基本上没有什么改变。当初始聚类中心经过迭代,迭代到第五步的时候都已经变成了0.000,此时已经可以结束迭代,得到最终聚类中心,可以看出第一类的法人企业为1618个,年末从业人数为302021人,营业额为398.0亿元,第二类和第三类可以依次看出。图-10由于在保存子对话框中点了保存为新变量,所以在原数据中多了两列,分
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 关于 各地区 住宿 企业 基本情况 经营 情况 论文