《多元统计分析》实验四.doc
《《多元统计分析》实验四.doc》由会员分享,可在线阅读,更多相关《《多元统计分析》实验四.doc(13页珍藏版)》请在沃文网上搜索。
1、实验四 上市公司财务报表数据的因子分析(王学民 编写)一、实验目的1.掌握如何使用SAS软件来进行因子分析;2.看懂和理解SAS输出的结果,并学会以此来作出分析;3.掌握对实际数据如何来进行因子分析;4.了解异常值对数据分析的影响二、实验内容数据集sasuser.case4中含有2001年沪市611家上市公司年财务报表的十个主要财务指标。对这些数据进行因子分析,可将这十个指标成功地归结于三个公共因子,达到较好的降维目的,并给出符合实际背景和意义的解释。在作因子分析之前需先进行预分析,找出影响因子分析的不合理数据和异常数据。通过因子分析,对各因子的得分大小进行排序分析,同时结合各上市公司的三个因
2、子得分用SAS软件建立旋转图,通过三维图形的旋转进行分析和描述。由于图中有600多个散点,故需巧妙地运用SAS软件不断地对图形作出调节使之能更清楚地用来进行观测。实验1剔除不合理数据和异常数据。实验2进行因子分析。实验3 利用SAS软件观测和调节含600多个散点的旋转图。三、实验要求1.用SAS软件完成因子分析的计算;2.根据SAS输出结果完成因子分析;3.学会利用软件观测含有众多散点的旋转图。四、实验指导1.剔除不合理数据和异常数据(1)注意到,如每股净资产()值接近于零或为负,通常将使净资产收益率()没有意义或数值特大。为发现这些值,在inshigt环境下打开数据集sasuser.case
3、4,见图1。选菜单过程如下:在图1中,选x6在数据区域点击右键,出现上托菜单选排序图1随即得到图1中按每股净资产值从小到大的排序。每股净资产最小的三只股票:“PT郑百”(元),“ST同达”(元)和“PT红光”(元)必须被删去。其原因有两个:(i)这三只股票的每股净资产为负或非常接近于零,它们的净资产收益率没有意义。(ii) “PT红光”和“ST同达”的净资产收益率()分别是621.15和82.34,在数值上比排名第三的40.20要大许多,特别是前者为一个非常大的异常值,会对因子分析的结果产生明显的不良影响。删除这三只股票的菜单操作如下:在图1中,选中观测1、2、3在菜单栏中选编辑删除得到图2中
4、的含608个观测的数据集。图2(2)在图2中,选菜单如下:分析散点图(Y X)选x1,x2,x3,x4,x5,x6,x7,x8,x9,x10(见图3)Y;选x1,x2,x3,x4,x5,x6,x7,x8,x9,x10X;选name标签变量确定得到如图4所示的散点图矩阵图3图4“中国石化”点被选亮,明显是个异常点,将该点删除。散点图矩阵变为图5,该图中“宝钢股份”、“华能国际”和“浦发银行”点都被选亮,都是异常点,将它们删除。散点图矩阵变为图6,从该图中还可进一步将一些点作为异常点删除,但这些点的异常程度明显不如上述四个点,对数据分析的影响也不是很大。图5图6我们删除的四只股票是样本中规模最大的
5、四只,其中“中国石化”为一个规模特大的股票,会明显影响所作因子分析的结果。表1是根据608家数据计算出的上述十个财务指标的样本相关矩阵,表2是删除四只异常股票后根据604家数据计算出的样本相关矩阵。对照表1和表2可以看出,表1中的许多样本相关系数值严重地受到了四个异常值的影响。表1 由608家上市公司数据计算的样本相关矩阵1.0000.9931.0000.9700.9831.0000.9560.9720.9971.0000.0240.0440.1080.1331.000-0.018-0.0080.0170.0270.5851.0000.0320.0410.0880.1090.7760.2181
6、.0000.0160.0360.0930.1180.8460.2910.8311.0000.9050.8990.9170.9110.041-0.0130.0400.0091.0000.9890.9900.9750.9640.001-0.0510.0240.0160.9111.000表2 由604家上市公司数据计算的样本相关矩阵1.0000.7231.0000.4270.7431.0000.4070.6970.9821.0000.1710.3250.5390.5591.0000.1490.2280.2840.2740.5851.0000.0960.1770.3620.4020.7760.2181
7、.0000.0660.2040.4550.5000.8490.2900.8331.0000.7480.7680.5740.5670.1250.1380.0670.0581.0000.6220.6190.4850.5000.002-0.0660.0330.0510.8611.0002.进行因子分析 编制如下的SAS程序:proc factor data=sasuser.examp842 n=3 rotate=varimax out=out842; var x1-x10;run;程序说明:“proc factor”是一个因子分析过程;“data=sasuser.examp842”规定过程分析的是s
8、asuser逻辑库中的examp842数据集;“n=3” 规定了选用三个因子;选项“rotate=varimax”规定了使用最大方差旋转法旋转因子。“out=out842”的作用是将所有观测的三个因子得分及原数据集中的所有数据保存在数据集work.out842中。程序中未指明用何参数估计方法,缺省时参数估计是用主成分法。运行后屏幕输出为:从上述输出可见,三个因子的累计贡献率为83.82%。未旋转之前的因子载荷估计很难给出公共因子的解释,于是采用了最大方差旋转法旋转因子,从旋转后的因子载荷估计可见,在因子上都具有大的正载荷,而,在上的载荷都很小,因而该因子可称为股票的规模因子。在因子上, ,都有
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元统计分析 多元 统计分析 实验