因子分析论文.doc
《因子分析论文.doc》由会员分享,可在线阅读,更多相关《因子分析论文.doc(14页珍藏版)》请在沃文网上搜索。
1、关于2000年美国各州犯罪数量的因子分析【摘要】本文采用因子分析方法对美国各州的犯罪情况州际差异及结构差异进行了探讨,研究表明人口与犯罪数量有密切相关,其主要为因贪图财色而进行犯罪,人口越多,犯罪数量越多,尤其是因财物而引起的抢劫、入室行窃、盗窃、自盗数量越多,而大部分的攻击性犯罪发生在美国南部,可能是由于历史原因。 【关键字】美国 各州 犯罪数量 因子提取 正交旋转 因子分析 因子得分【正文】一、 因子分析原理因子分析是一种将多变量化简的多元统计方法,它可以看作是主成份分析的推广。因子分析的目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的变量归为一类,不同类间的变量的相关性则较低。
2、每类变量代表了一个“共同因子”,即一种内在结构(联系)。因子分析就是寻找这种内在结构(联系)的方法。从全部计算过程来看作R型因子分析与作Q型因子分析都是一样的,只不过出发点不同,R型从相关系数矩阵出发,Q型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析。(一)模型主要模型形式:(2)矩阵型式(二)相关概念解释1、因子载荷aij称为因子载荷(实际上是权数)。因子载荷的统计意义:就是第i个变量与第j个公共因子的相关系数,即表示变量xi依赖于Fj的份量(比重),心理学家将它称为载荷。2、变量共同度二、 主要计算方法及步骤(一)方法说明1、因子载荷矩阵估计方法因子
3、载荷的求解方法主要有主成分法,主轴因子旋转法和极大似然法。主成分法指在进行因子分析之前先对数据进行主成分分析,把前几个主成分作为未旋转的公因子,但是此种方法得到的特殊因子间并不相互独立,当变量的共同度较大时,特殊因子所起的作用较小,它们之间的相关性可以忽略。主轴因子法与主成分分析方法类似,都是都分析矩阵的结构入手,主轴因子法的不同之处在于,其假定m个公因子只能解释原始变量的部分方差,利用变量共同度来代替相关矩阵中对角元素1,并以新矩阵为出发点求解特征值和特征向量。极大似然估计法假定公因子与特殊因子服从正态分布,通过构造似然函数求因子载荷和特殊因子方差的极大似然估计。2、因子旋转因子分析的目的不
4、仅是找出主因子,更重要的是知道每个主因子的意义。主因子的意义是根据主因子与可观测变量Xi的关系来确定的。因此希望主因子Fj对Xi(i=1,2,p)的载荷平方,有的值很大,有的值很小,(向0,1两极分化),因子载荷矩阵的这种特征称“因子简单结构”。 但是用上述方法所求出的主因子解,初始因子载荷矩阵并不满足“简单结构准则”,各因子的典型代表变量不很突出,因而容易使因子的意义含糊不清,不便于对因子进行解释。为此须对因子载荷矩阵施行旋转,因子轴方差最大正交旋转的目的即使因子载荷矩阵成为“简单结构”的因子载荷矩阵。使得因子载荷的平方按列向0和1两极转化,较大的载荷值只集中在少数X变量上,达到其结构简化的
5、目的。易于因子命名。经过旋转后,主因子对Xi的方差贡献(变量共同度)并不改变,但各主因子的方差贡献可能有较大的改变,即不再与原来相同,因此,可以通过适当的旋转求得令人满意的主因子。为了对公因子F能够更好的解释,可通过因子旋转的方法得到一个好解释的公因子。所谓对公因子更好解释,就是使每个变量仅在一个公因子上有较大的载荷,而在其余的公因子上的载荷比较小。这种变换因子载荷的方法称为因子轴的旋转。因子旋转的方法很多,常用的为方差最大正交旋转。3、因子得分在分析中,人们往往更愿意用公共因子反映原始变量,这样更有利于描述研究对象的特征。因而往往将公共因子表示为变量(或样品)的线性组合,即:称上式为因子得分
6、函数,用它可计算每个样品的公因子得分。估计因子得分的方法很多。(一)、背景介绍犯罪是危害他人、社会或者国家的行爲,订立法律在于保护人民所享有的法律权益,凡是违反法律,破坏他人受到法律所保障的权益行为,都是犯罪行为。本文将以美国2000年各类犯罪数据为样本,研究美国各州各类犯罪的差异性和相似性,收集到2000年美国50个州7类犯罪(谋杀、强奸、抢劫、攻击、入室行窃、盗窃、自盗)的犯罪数量数据(数据来源:美国司法统计局Bureau of Justice Statistics,BJS)。由于涉及变量较多,直接进行地区间的比较分析较为繁琐,因此首先考虑因子分析方法减少变量个数,之后在进行比较和综合分析
7、。(二)、分析过程详解1、 数据标准化2、 考察原有变量是否适合进行因子分析利用SPSS软件,correlate功能计算相关系数矩阵,计算皮尔森相关系数并进行卡方双尾检验,可以看出变量间存在这很大的相关性。表2-1相关性谋杀强奸抢劫攻击入室行窃盗窃自盗谋杀Pearson 相关性1.520*.294*.813*.167.072.110显著性(双侧).000.038.000.245.618.448N50505050505050强奸Pearson 相关性.520*1.478*.696*.679*.585*.441*显著性(双侧).000.000.000.000.000.001N50505050505
8、050 抢劫Pearson 相关性.294*.478*1.545*.549*.398*.572*显著性(双侧).038.000.000.000.004.000N50505050505050攻击Pearson 相关性.813*.696*.545*1.468*.318*.330*显著性(双侧).000.000.000.001.024.019N50505050505050入室行窃Pearson 相关性.167.679*.549*.468*1.748*.678*显著性(双侧).245.000.000.001.000.000N50505050505050盗窃Pearson 相关性.072.585*.39
9、8*.318*.748*1.529*显著性(双侧).618.000.004.024.000.000N50505050505050自盗Pearson 相关性.110.441*.572*.330*.678*.529*1显著性(双侧).448.001.000.019.000.000N50505050505050*. 在 .01 水平(双侧)上显著相关。*. 在 0.05 水平(双侧)上显著相关。表2-1是原有变量的相关系数矩阵。可以看到:大部分的相关系数都较高,除了少数变量间的相关性较低外,其他变量的相关性都大于0.3,各变量呈交较强的线性关系,能够从中提取公因子,适合进行分析。表2-2 KMO 和
10、 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.780Bartlett 的球形度检验近似卡方218.365df21Sig.000KMO值:0.9以上非常好;0.8以上好;0.7一般;0.6差;0.5很差;0.5以下不能接受。通过观察上面的计算结果,可以知道,巴特利球体检验的统计量的观测值为218.365,相应的概率P接近0,则应拒绝零假设,认为相关系数阵与单位阵有显著的差异。同时KOM值为0.780,接近比较好的范围内,根据Kaiser给出的KOM度量标准可知原有变量适合进行因子分析。3、提取因子表3-1公因子方差初始提取Zscore(谋杀)1.000.9
11、10Zscore(强奸)1.000.748Zscore(抢劫)1.000.548Zscore(攻击)1.000.919Zscore(入室行窃)1.000.850Zscore(盗窃)1.000.719Zscore(自盗)1.000.680提取方法:主成份分析。表3-1是因子分析的初始解,显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,它表明:对原有10个变量如果采用主成分分析法提取所有特征根,那么原有变量的所有方差都可被解释,变量的共同度都为1(原有变量标准化后的方差为1)。事实上,因子个数小于原有变量个数才是因子分析的目标,所以不可以提取全部特征根,第二列是在指定提取条件(特
12、征根大于1)提取特征根时的共同度。可以看到,谋杀、强奸、攻击、入室行窃、盗窃、自盗等变量的绝大部分信息可被因子解释,因子提取的总体效果较好。表3-2解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %13.91455.90955.9093.91455.90955.9093.04843.54943.54921.45920.83976.7481.45920.83976.7482.32433.19876.7483.6799.70486.4514.3785.40691.8575.2623.74295.5996.1932.76098.3
13、597.1151.641100.000提取方法:主成份分析。提取2个公因子,从方差贡献率可以看出,其中第一个公因子解释了总体方差的43.549%,第二个公因子解释了总体方差的33.198,两个公因子的累计方差贡献率为76.748%,可以较好的解释总体方差。图3-1 通过此图可以明显看出前三个因子可以解释大部分的方差,到第四个因子以后,线逐渐平缓,解释能力不强。但提取三个因子后,因子含义不如提取两因子明晰,因此我们提取两个公因子。表3-3成份矩阵a成份12Zscore(谋杀).539.787Zscore(强奸).853.140Zscore(抢劫).738-.055Zscore(攻击).787.5
14、48Zscore(入室行窃).844-.370Zscore(盗窃).717-.452Zscore(自盗).710-.419提取方法 :主成份。a. 已提取了 2 个成份。通过因子载荷矩阵可以看出因子的意义并不是十分明确,为了对因子进行解释与说明,进行因子旋转,选取方差最大因子旋转方法,并保留因子得分。4、 因子旋转表4-1旋转成份矩阵a成份12Zscore(谋杀)-.033.953Zscore(强奸).604.619Zscore(抢劫).627.394Zscore(攻击).308.908Zscore(入室行窃).899.204Zscore(盗窃).845.062Zscore(自盗).820.0
15、84提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。a. 旋转在 3 次迭代后收敛。通过上表中旋转的结果,我们可以看出第一个公因子在强奸、抢劫、入室行窃、盗窃、自盗上有较大的载荷,主要由于求财及求色,可以将其命名为财色欲望因子;第二个因子在谋杀、强奸、攻击上有较大的载荷,可以理解为攻击欲望因子; 最后,通过上面的因子我们可以通过两个主要的因子来表示七个犯罪变量,分别为财色欲望因子和攻击欲望因子。接下来计算各因子得分。图4-15、 因子得分表5-1成份得分系数矩阵a成份12Zscore(谋杀)-.209.516Zscore(强奸).119.206Zscore(抢劫).17
16、4.082Zscore(攻击)-.061.422Zscore(入室行窃).324-.076Zscore(盗窃).331-.141Zscore(自盗).317-.124提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。a. 系数已被标准化。表5-1中,得出因子得分系数矩阵,根据因子得分系数和原始变量的标准化值,可以观测各犯罪类型的各因子的得分数,旋转后的因子表达式可以写成:F1=-0.209谋杀+0.119强奸+0.174抢劫-0.061攻击+0.324入室行窃+0.331盗窃+0.317自盗F1=0.516谋杀+0.206强奸+0.082抢劫+0.442攻击-
17、0.076入室行窃-0.141盗窃-0.124自盗因子表达式中各变量均为标准化后的变量。表5-2成份得分协方差矩阵成份1211.000.0002.0001.000提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。 构成得分。 表5-2为因子间的相关矩阵,可以看出旋转后F1和F2是完全不相关的,这也是由于正交旋转后因子仍然正交。6、 各州的综合评价表6-1排名财色欲望因子得分攻击欲望因子综合得分人口1加利福尼亚州 北卡罗来纳州 加利福尼亚州 加利福尼亚州 2内华达州 佛罗里达州 密歇根州 纽约州 3密歇根州 路易斯安那州 佛罗里达州 得克萨斯州 4科罗拉多州 南卡罗来纳州
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 论文
