《多元统计分析》实验三.doc
《《多元统计分析》实验三.doc》由会员分享,可在线阅读,更多相关《《多元统计分析》实验三.doc(10页珍藏版)》请在沃文网上搜索。
1、实验三 我国各地区城镇居民消费性支出的主成分分析和聚类分析(王学民 编写)一、实验目的1.掌握如何使用SAS软件来进行主成分分析和聚类分析;2.看懂和理解SAS输出的结果,并学会以此来作出分析;3.掌握对实际数据如何来进行主成分分析;4.对同一组数据使用五种系统聚类方法,学会对各种聚类效果的比较,获取重要经验;5.掌握使用主成分进行聚类二、实验内容数据集sasuser.examp633中含有1999年全国31个省、直辖市和自治区的城镇居民家庭平均每人全年消费性支出的八个主要变量数据。对这些数据进行主成分分析,可将这31个地区的前两个主成分得分标示于平面坐标系内,对各地区作直观的比较分析。对同样
2、的数据使用五种系统聚类方法聚类,并对聚类效果作比较。最后,对主成分的图形聚类和正规聚类的效果进行比较。实验1进行主成分分析,根据前两个主成分得分所作的散点图对31个地区进行比较分析。实验2分别使用最长距离法、中间距离法、两种类平均法和离差平方和法进行聚类分析,并比较其聚类效果。实验3主成分聚类,并与上述正规的聚类方法进行比较三、实验要求1.用SAS软件的交互式数据分析菜单系统完成主成分分析;2.完成五种系统聚类方法,比较其聚类效果;3.根据前两个主成分得分的散点图作直观的聚类,并与上述正规的聚类方法进行比较。四、实验指导1.进行主成分分析在inshigt中打开数据集sasuser.examp6
3、33,见图1。选菜单过程如下:在图1中选分析多元(Y X)在变量框中选 x1,x2,x3,x4,x5,x6,x7,x8 (见图2)Y选输出选主分量分析,主分量选项(见图3)在图4中作图中的选择(主成分个数缺省时为“自动”选项,此时只输出特征值大于1的主成分)确定确定确定图1图2图3图4得到如图5、图6所示的结果:图5图6从图5可以看出,前两个和前三个主成分的累计贡献率分别达到80.6和87.8,第一主成分在所有变量(除在上的载荷稍偏小外)上都有近似相等的正载荷,反映了综合消费性支出的水平,因此第一主成分可称为综合消费性支出成分。第二主成分在变量上有很高的正载荷,在变量上有中等的正载荷,而在其余
4、变量上有负载荷或很小的正载荷。可以认为这个主成分度量了受地区气候影响的消费性支出(主要是衣着,其次是医疗保健可从表1计算出医疗保健在消费性总支出中占的比率,然后进行由大到小的排序,各地区的顺序依次为:宁夏、黑龙江、青海、河北、辽宁、北京、浙江、陕西、甘肃、山西、吉林、河南、新疆、内蒙古、天津、云南、山东、广东、湖北、四川、重庆、湖南、海南、江苏、上海、西藏、贵州、广西、安徽、江西和福建,大致由寒冷的北方地区排到温暖的南方地区。这是由于气候的寒冷易导致医疗保健费用的增加,因此,可以认为除衣着外医疗保健也是受地区气候影响的变量。)在所有消费性支出中占的比重(也可理解为一种消费倾向),第二主成分可称
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元统计分析 多元 统计分析 实验
