《统计分析软件SPSS应用》教学人大薛微.ppt
《《统计分析软件SPSS应用》教学人大薛微.ppt》由会员分享,可在线阅读,更多相关《《统计分析软件SPSS应用》教学人大薛微.ppt(316页珍藏版)》请在沃文网上搜索。
1、统计分析软件应用统计分析软件应用薛薇中国人民大学统计学院2011.2第一章第一章 SPSS SPSS 概述概述 SPSS概述SPSS:Statistical Package for Social ScienceStatistical Product and Service SolutionsSPSS的发展:l60年代:美国斯坦福大学三位研究生研制l70年代:SPSS总部成立于芝加哥,推出SPSSX中小型机版l80年代:SPSS公司(SPSS/PC+微机版13)l90年代:SPSS公司(SPSS WINDOWS版514)SPSS 主要特点操作简便。绝大多数操作是通过菜单、按钮、对话框完成的。无需
2、计算机编程、需记忆大量命令和参数。分析方法丰富、分析结果清晰、直观。可以直接读取其他软件格式的数据文件,如:dbf、xls、sas等。最新版本采用分布式分析系统,适应互联网,支持动态收集、分析数据和HTML报告与一般的办公软件直接兼容不方便SPSS主要窗口:数据编辑窗口窗口标题:data editor 功能:对SPSS的数据文件数据文件进行录入、修改、管理等基本操作的窗口。组成:窗口主菜单、工具栏、数据编辑区、状态显示区特点:SPSS运行过程中自动打开SPSS中各统计分析功能都是针对该窗口中的数据进行的窗口中的数据文件以.sav存于磁盘上两个视图:数据视图和变量视图SPSS主要窗口:数据输出窗
3、口窗口标题:viewer功能:SPSS统计分析报表及图形的输出的窗口。组成:窗口主菜单、工具栏、结果显示区、状态显示区特点:在进行第一次分析时自动打开,也可手工打开可以手工打开若干个可相互切换若干个可相互切换的viewer窗口;状态栏上的!表示当前输出窗口输出窗口可以关闭,窗口内容以.SPO存于磁盘上两个视图:目录视图和内容视图SPSS主要窗口:数据输出窗口驾驭数据出输出窗口一般操作结果文件的打开和保存加密保存窗口元素的移动和删除标准的拖放式操作在大纲视图中操作最方便结果的导出以纯文本格式导出、以HTML格式导出如何在WORD中引用分析结果统计表格:拷贝或拷贝对象统计图:拷贝对象表格的编辑表格
4、状态的确定单元格内容编辑行列转置Autofit表格样式的变换SPSS基本运行方式完全窗口菜单方式:所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS的初学者.SPSS基本运行方式程序运行方式:手工编写SPSS命令程序一次性提交计算机运行适用于大规模的分析工作和熟练的SPSS程序员.实现方法:(1)打开SYNTAX语句窗口并编写和修改SPSS程序(2)点击语句窗口中的RUN菜单项,选择运行方式运行Syntax语句窗口窗口标题:syntax editer 功能:编写和修改SPSS程序的窗口.特点:打开:FILE-NEW-SYNTAX或FILE-
5、OPEN-.SPS扩展名窗口中的程序以.SPS存于磁盘上菜单项RUN中提供四种程序执行方式:All、Selection、Current、To endSPSS 基本运行方式菜单程序混合运行方式:先通过菜单选择分析过程和参数,不立即提交(OK)执行,而是按动PASTE按钮.计算机自动将用户刚定义的分析过程和参数转换成SPSS的命令,并显示到SYNTAX语句窗口中.用户可对其进行必要的修改后再提交给计算机执行.一般适用于熟练的SPSS程序员.利用SPSS进行数据分析的步骤建立SPSS数据文件定义数据文件结构录入修改和编辑待分析数据数据的统计分析统计分析之前的预处理统计分析数据和分析结果的保存结果的说
6、明和解释思考复习SPSS有哪两个主要窗口?功能是什么?有哪些特点?SPSS有哪些运行方式?特点是什么?第二章 SPSS数据文件的建立和管理一份简单的调查问卷单项选择题提供几个备选择答案,从其中选择一个答案变量类型:分类数据、定序数据数据类型:字符型填空题变量类型:定距数据数据类型:数值型如何利用SPSS组织数据SPSS数据文件是一种有结构的数据文件年级 性别问题1问题n11.4222.文件结构数据个案case变量名变量用字符或数字表示字符型数据SPSS数据文件一般只能通过SPSS软件打开一份简单的调查问卷l多项选择题l提供几个备选择答案,从其中选择多个答案如:在下列品牌中您信任哪些品牌?被诊断
7、为高血要后你采取了以下哪些辅助治疗手段?如:高考时报考学校(1)北京大学(2)清华大学(3)人民大学(4)北京理工大学(5)北京师范大学(6)北京外国语大学l多项选择题不能在SPSS中直接存储,因为SPSS的一个变量只能有一个取值如何利用SPSS组织数据l多项选择题的处理方法l思路:将一个问题定义成几个变量,用这几个变量来描述该问题的几个可能被选择的答案。l编码方式:多选项二分法(multiple dichotomize method)多选项分类法(multiple category method)l多选项二分法 将每个答案作为一个变量,每个变量只有两个取值(0或1)。例如:如何利用SPSS组
8、织数据l多选项分类法:预先估计多选项问题可能被选择的最多答案数.为每个答案建立一个变量,取值为多选项问题的可选答案.例如:如何利用SPSS组织数据频数数据:男女统计1023精算1220如何利用SPSS组织数据设置三个变量:专业方向、性别、人数SPSS数据文件的结构(一)变量名变量名(Variable name):变量名是变量存取的唯一标志。起名规则:不多于8个字符组成不区分大小写允许汉字作为变量名默认变量名为VARn,如:var00001SPSS数据文件的结构(二)变量的类型变量的类型(type)和显示宽度和显示宽度(width)1、数值型:标准数值型(Numeric):默认类型 8.2如:1
9、2345678、12345.67、-1234.56 带逗号的数值型(Comma):从个位开始三位一个逗号8.2如:1,234.56科学计数法(Scientific Notation):表示很大或很小的数据 8.2如:1.2E+05带美元符号(Dollar):表示货币格式很多,如:$12.30SPSS数据文件的结构2、字符型(String):存储字符数据 8位如:beijing 处理时用双引号扩起来3、日期型(Date):存储日期数据 格式很多,如:20-AUG-19994、其他:如:圆点数值型(dot)、用户自定义型(customer)注意:显示宽度不影响数据的存储SPSS数据文件的结构(三)
10、变量名标签变量名标签(Variable label):对变量名的一些解释说明,增强分析结果的可视性。可以省略。(四)变量值标签变量值标签(Value label)对变量所取值的一些解释说明,增强分析结果的可视性。可以省略。一般用于品质数据 如:1-男 2-女、1-高 2-中 3-低SPSS数据文件的结构(五)变量列格式变量列格式(Column Format)对齐方式(Text Alignment)左对齐(Left):字符型默认。右对齐(Right):数值型默认。居中对齐(Center)列宽度(Column Width)默认值为变量的总长度。SPSS数据文件的结构(六)缺失值缺失值(Missin
11、g Values)1、什么是缺失值?漏填数据明显错误的数据2、对缺失值的一般处理事先指定:指定某个特定值为缺失值(用户缺失值)其他处理方法,如:以均值、众数替代等3、SPSS缺失值 用户缺失值 系统缺失值:数值型:点()字符型:空SPSS数据文件的结构(七)变量计量尺度(七)变量计量尺度(Measurement)scale:定距数据,一般为数值型数据。如:收入、人数。ordinal:有固有顺序的顺序水准的数值型或字符型数据。如:职称、年龄段nominal:无固有顺序的名义水准的数值型或字符型数据。如:性别、民族定义SPSS数据文件结构操作方法:利用变量视图如何查看变量定义的情况 菜单选项:Ut
12、ilities-VariablesSPSS数据的录入与保存录入时应注意:黑框确定当前数据单元录入带有变量值标签的数据:手工输入代码,屏幕显示变量值标签冻结第一列数据保存:操作保存格式:(1)*.sav:SPSS数据文件(默认)。(2)*.dbf:dbase数据文件。(3)*.xls:Excel工作表文件。注意:有些信息会丢失SPSS数据的编辑(一)打开数据文件菜单选项:File-Open-.sav(二)数据定位按个案号码定位菜单:Data-Go to case-输入样本号按值定位光标定位到某列变量上光标定位到某列变量上-Edit-Find.SPSS数据的编辑(三)插入和删除一个个案插入:dat
13、a-insert case删除:选定待删行,鼠标右键找到Cut(四)插入和删除一个变量插入:光标定位到某列变量上光标定位到某列变量上-Data-Insert Variable(插到某列前)或鼠标右键删除:选定列,鼠标右键Cut项SPSS数据的编辑(五)数据移动、复制和删除定义源数据块鼠标右键:cut copy clear确定目标单元鼠标右键:paste数据文件的合并目的:将两个SPSS数据文件合并到一个数据文件中文件合并的方式:纵向合并横向合并(一)纵向数据合并(1)含义含义:将磁盘上的一个SPSS数据文件追加追加到当前data editor窗口中的数据文件中。(2)前提前提:两个SPSS数据
14、文件应可以合并的内容可以合并的内容,且最好有相同的相同的变量名和变量类型。(3)菜单选项菜单选项:data-merge file-add cases数据文件的合并数据文件的合并(二)横向数据合并(1)含义含义:将磁盘上的一个SPSS数据文件中的若干个变量增加到当前data editor窗口的数据文件中。(2)前提前提:a.两个数据文件必须必须有一个共同的变量名为关键字段-合并的依据;b.两个数据文件应事先按关键字段升序排序。数据文件的合并(二)横向数据合并(3)菜单选项菜单选项:data-merge file-add variable(4)选项说明选项说明:math cases on key
15、variables in sorted files:以关键字作为合并标志。Both files provide cases:合并后的文件的数据由两个文件共同提供。External file is keyed table:以data editor的数据为基础。Working data file is keyed table:以磁盘文件的数据为基础。与其他软件数据共享共享dbf和xls格式文件菜单选项:Data-Open(1)*.dbf:dbase数据文件。字段名、字段类型自动转成SPSS数据文件中的变量名和类型。一条记录为一个个案。(2)*.xls:Excel文件(Read variable n
16、ame选项)共享数据库文件建立ODBC数据源 第三章 SPSS数据文件的基本加工和处理SPSS数据文件的基本加工和处理数据文件的整理 个案排序、个案选取数据加工 变量计算、计数数据分组 自动分组、手工分组数据文件的其他处理功能 指定加权变量目的:将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列。菜单选项:data-sort cases注意:(1)Ascending:升序、Descending:降序。(2)多重排序,选择变量名的次序很关键。个案排序排序在数据分析中的作用?个案选取目的:从现有数据中挑选出部分数据。菜单选项:data-select cases选取个案的几种不同方
17、式(1)选择符合一定条件的个案(If condition is satisfied)(2)随机选取个案(Random sample of cases)近似选取、精确选取(3)选取某一区域内的个案(Based on time or case range)(4)使用过滤变量(use filter variable)注意:以后的操作和分析都在该个案选取的基础上进行.个案选取在数据分析中的作用?变量计算目的:产生新变量或对原变量进行必要的转换处理(如:预测问题 产生比率数据 偏态数据的正态处理 时间序列的平稳处理等)(1)含义:根据用户给出的SPSS算术表达式,对所有或部分样本数据进行加工。(2)菜单
18、选项:transform-compute if 按钮(3)SPSS算术表达式(Numeric Expression):由算术运算符(+、-、*、/、*)、SPSS函数以及SPSS变量名组成的式子。变量计算算术函数统计函数分布函数逻辑函数字符串函数缺失值函数日期时间函数其他函数(4)SPSS函数l算术函数lAbs():求绝对值lsqrt():求平方根lrnd():四舍五入后取整ltrunc():截取小数部分取整lmod():取余lLn():自然对数lLg10():以10为底的对数(4)SPSS函数变量计算l统计函数:lmean():均值lsd():标准差lsum():求总和lcfvar():求变
19、异系数lmax()min():求最大最小值(4)SPSS函数变量计算l分布函数:lnormal():产生服从标准正态分布的随机数序列luniform():产生均匀分布的随机数序列lrv.():产生指定分布的随机数序列,如:rv.t(10)lcdf.():计算指定分布的累计概率值lidf.():计算指定分布的临界值(4)SPSS函数变量计算l逻辑函数:lrange():判断变量值是否在指定的区间内lany():判断变量值是否为指定的若干值l字符串函数:lindex(S1,S2):判断字符串S2在S1中首次出现的位置llength():求字符串长度llower()upcase():字符串的大小写转
20、换llpad():用指定字符补齐字符串为指定长度lltrim():压缩字符串空格lsubstr():取子串(4)SPSS函数变量计算l缺失值函数lmissing():判断变量是否取系统或用户缺失值lsysmis():判断变量是否取系统缺失值l其他函数:lLag():便于进行差分计算(4)SPSS函数变量计算变量转换(5)SPSS条件表达式条件表达式:条件表达式:由SPSS关系运算符、逻辑运算符、SPSS函数以及SPSS变量名组成的式子。关系运算符:(大于)、=(大于等于)、32、sr32)and(sr=700)(nl=32)|(sr700)not xb=1计数(1)含义:对所有或部分个案,计算
21、若干个变量中有几个变量的值落在指定的区域内,并将结果存入新变量中。(2)菜单选项菜单选项:transform-count-define value产生计数变量(3)指定区域的定义Value:指定一个值system-missing:系统缺失值system-or user missing:系统或用户缺失值range through:指定一个闭区域,给出最大和最小值range:lowest through n:最小值到某个给定值range:n through highest:某个给定值到最大值 数据文件的分类汇总(1)含义:按指定的分类变量的变量值对个案分组;计算每组个案的汇总变量的基本统计量;将计
22、算结果生成到一新文件中,即:在新文件中对应分类变量的每一个分类值产生一个个案。原始数据按性别变量汇总数据 数据文件的分类汇总(2)菜单选项:data-aggregate(3)说明:多重分组时,变量名的选择顺序。生成的新文件名默认为:aggr.sav。可修改。生成的新变量名默认为原变量名后加_1。可修改。可以在新文件中存贮个分组个案数.数据分组目的:了解数据的总体分布状况思路:指定按哪个变量分组,即:指定分组变量定义分组变量的分组区间(不重、不漏)指定一个存放分组结果的标志变量分组方法:自动分组手工分组 数据分组(一)自动分组单变量值分组(1)含义:分组变量值相同的个案分在同一组,同组中的标志变
23、量相同。标志变量依照分组变量值的大小次序给定。(单变量分组,通常只适合于离散变量且变量值较少的情况)(2)菜单选项菜单选项:transform-automatic recode分位值自动分组(1)含义:将定距型变量按分位数要求自动划分成相应类(2)菜单选项:transform-categorize variables 数据分组(二)手工分组(组距分组)(1)含义:人工定义分组区域,对所有个案或符合一定条件的个案进行等距或非等距分组。(2)方法:分组结果存入原变量、分组结果存入新变量数据分组(3)分组结果存入原变量:定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值保
24、持不变。菜单选项:transform-recode-into same variables说明:可以指定对符合一定条件的个案进行分组。数据分组(4)分组结果存入新变量:定义分组区域:定义某一区间的原变量值分组后所对应的新值是什么.未定义的原变量值在新变量中为系统缺失值。菜单选项:transform-recode-into different variables定义原变量分组后产生的相应新变量(CHANGE钮)可以指定对符合一定条件的个案进行分组。单值区间可以实现数据转换(问卷分析中的反向题重新计分)问卷分析中的反向题重新计分举例性格打分(内向、一般、外向)1、与生人交往会“自来熟”(1)从不
25、(2)偶尔 (3)有时 (4)经常 2、与不熟悉的异性交往,会脸红 (1)从不 (2)偶尔 (3)有时 (4)经常3、在公众场合下你会大声发表自己的意见 (1)从不 (2)偶尔 (3)有时 (4)经常极为内向:3分 较为内向:6分 较为外向:9分 极为外向:12分 指定加权变量(1)含义:指定某一变量为加权变量。如:平均蔬菜价格、男足打分(2)菜单选项:data-weight case(3)说明 如果取消加权变量应重新定义:data-weight casedo not weight cases作业根据给定的两个关于学生成绩的SPSS数据文件做如下处理:合并两个数据文件(数据不一定是一一对应的)
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析软件SPSS应用 统计分析 软件 SPSS 应用 教学 人大