第3章 市场调查数据的数理推断分析.ppt
《第3章 市场调查数据的数理推断分析.ppt》由会员分享,可在线阅读,更多相关《第3章 市场调查数据的数理推断分析.ppt(123页珍藏版)》请在沃文网上搜索。
1、第3章 市场调查数据的数理推断分析o参数估计是用样本数据估计总体的数量特征,总体的数量特征通常称为总体参数;。o假设检验是首先对总体参数作出某种假设,然后用样本数据检验其能否成立;o方差分析(ANOVA)是用于两个及两个以上样本均数差别的显著性检验,其目的是通过数据分析找出对该事物有显著影响的因素,各因素之间的交互作用,以及显著影响因素的最佳水平等;o回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。统计推断的内容主要包括参数估计、假设检验、方差分析和回归分析等 3.1 样本的有效获取方法 随机抽样是进行统计推断的前提,随机抽样试
2、验具有广泛的应用,该方法的性质是统计推断最重要的理论基础,同时也是实际操作中容易遇到问题的环节。随机抽样的目的是进行统计推断,决定其效果的好坏的一个重要因素,就是抽样的组织形式。抽样的组织形式有:简单随机抽样、类型抽样、等距抽样、整群抽样、阶段抽样等。本节主要介绍的是简单随机抽样的EXCEL实现,根据所抽样的方式不同,抽样的方法可以分为重复抽样和不重复抽样。【例3.1】中国移动公司上海分公司2010年曾随录取通知书对上海各高校各新生发放附赠诸多优惠项目的移动通信手机号码卡,为了了解新生手机号的使用情况以及分析影响手机开通的影响因素,现欲对得到手机号的新生进行回访,假设有5000个用户资料,现抽
3、取100个样本进行统计分析,从而对总体进行推断。3.1.1 利用EXCEL数据分析功能实现随机抽样 利用EXCEL数据分析功能实现随机抽样,其抽样分析工具以数据源区域为总体,创建一个样本。当总体太大而不能进行处理或绘制时,可以选用具有代表性的样本。如果确认数据源区域中的数据是周期性的,可以对一个周期中的数值进行采样。本案例采用随机抽样,以满足用户保证抽样的代表性的要求。利用利用EXCELEXCEL数据分析工具进行抽样,其操作步骤如下:数据分析工具进行抽样,其操作步骤如下:o第一步:打开“第3章 数据资料”,选择工作表“手机用户资料”,针对“手机号”指标进行抽样;o第二步:选择“工具”“数据分析
4、”“抽样”后,出现对话框,如图依次选择;o第三步:然后单击确定,就得到系统自行随机抽样的结果利用EXCEL“数据分析”提供的抽样功能抽取的样本存在以下问题:依次执行“数据”“筛选”“高级筛选”,如图所示,得不重复结果。(1)由于随机抽样采用的是可放回抽样,因而总体中的每个数据都可以被多次抽取,所以在样本中的数据一般都会有重复现象,解决此问题有待于程序的完善。但可以继续使用“筛选”功能对所得数据进行筛选。利用EXCEL“数据分析”提供的抽样功能抽取的样本存在以下问题:(2)虽然经过筛选,抽样结果避免了重复的现象,但最终所得样本数量可能少于所需数量,因而要根据经验适当调整在数据样本选取时的数量设置
5、,以使样本数量满足要求。(3)尽管高级筛选可以对重复抽样情况进行修补,以满足抽样数目的需要,但这种方法最大的问题是:抽样结果只能抽出所需数目的所抽选项,如本例中的“手机号”,但与手机号配套的相关信息无法得到,因而如果想进一步了解样本的其它信息,还要利用很多辅助手段(如“查找”、“筛选”等功能),给后继统计分析带来很大的困难。3.1.2 随机数生成函数RAND()实现随机抽样 利用EXCEL数据分析功能实现的随机抽样,由于是重复抽样,使得抽出的样本数可能不能满足所需数量,必须凭经验调整原始抽取数目,因而会造成多次抽样才能达到目的的情况。利用随机数生成函数RAND()进行随机抽样,可以实现不重复抽
6、样,避免上述情况的发生。利用利用EXCELEXCEL随机数生成函数随机数生成函数RANDRAND(),其操作步骤如下:(),其操作步骤如下:o第一步:在工作表单元格上增加字段“生成随机数”、“随机数排序”。o第二步:在K3 单元格中输入公式“=RAND()”并回车,得到第一个动态随机数,拖动K3 单元格右下角的填充柄至单元格5002,得到一列动态随机数;o第三步:选取单元格K3:K5002,单击鼠标右键,选择“复制”,“选择性粘贴”,将数值复制到单元格L3:L5002中,得到一列静态随机数;o第四步:选取单元格A2:L5002,选择“数据”菜单项下的排序子菜单,以“随机数排序”为主要关键字进行
7、排序。o第五步:从前到后选择单元格A3:K102,即得到随机样本的全部抽取结果。3.2 总体参数估计 利用Excel数据分析功能“描述统计”只能对数值型数据进行描述以估计总体参数,但利用EXCEL提供的几个函数,如求平均函数AVERAGE、标准差函数STDEV、T 分布函数TINV 等的组合使用可以构造出一个专门用于实现样本推断总体的Excel 工作表。以下数值型数据和品质型数据两方面计算样本的平均数、标准差、总体成数等参数值,然后在一定置信水平上估计总体参数的区间范围。3.2.1 3.2.1 利用利用EXCELEXCEL数据分析功能进行参数估计数据分析功能进行参数估计o第一步:打开“第3章
8、数据资料”,选择“手机使用情况调查样本”工作表,针对“平均消费”一项进行参数估计。【例3.2】以例3-1所抽取样本的“平均消费”一项为例,利用Excel进行总体参数估计并估计置信度为95%的总体平均数的置信区间。利用EXCEL数据分析工具提供的“描述统计”功能对样本数据进行总体参数估计,其操作步骤如下:o第二步:按照“工具”“数据分析”“描述统计”的次序选择,弹出“描述统计”对话框,如图设置参数。o第三步:单击确定,输出如图的分析结果。3.2.2 3.2.2 利用利用EXCELEXCEL函数进行参数估计函数进行参数估计 利用EXCEL函数可以进行参数估计,各样本统计量公式如表3-1所示:利用利
9、用EXCELEXCEL函数进行参数估计,需要注意如下两点:函数进行参数估计,需要注意如下两点:(1)构造以上的工作表仅是为了让读者清楚具体的计算步骤,在实际应用中,可将一些中间步骤整合在一起,仅用一个公式就可以计算出置信区间半径,可在任一空单元格内输入如下公式即可。“=ABS(NORMSINV(0.05/2)*STDEV(样本数值)/SQRT(COUNT(样本数值)”(2)在总体方差已知的情况下,可借助函数CONFIDENCE求置信半径,进行区间估计。“=CONFIDENCE(0.05,STDEV(样本数值),COUNT(样本数值))”3.33.3 总体假设检验总体假设检验 假设检验是统计推断
10、的另一种方式,是抽样推断中的一项重要内容。假设检验是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。常用的假设检验方法有u检验法、t检验法、2检验法、F检验法,秩和检验等。3.3.1 3.3.1 总体参数假设检验总体参数假设检验 假设检验分为一个总体的参数检验和两个总体的参数检验。同时根据对总体分布的已
11、知和未知又分为z-检验和t-检验。1.方差已知的总体参数的假设检验方差已知的总体参数的假设检验 正态总体参数的假设检验可利用函数工具和自己输入公式的方法计算统计量,并进行检验。【例3.3】欲考察上海和外地学生手机月消费费用情况,假设已知所考察的总体中,上海学生手机消费的方差为136,外地学生手机消费的方差为98。利用例3.1的抽样样本,检验上海学生手机消费与外地学生手机消费是否有显著差异(a=0.05)?利用利用EXCELEXCEL数据分析工具进行总体假设检验,其操作步骤如下:数据分析工具进行总体假设检验,其操作步骤如下:o第一步:打开“第3章 数据资料”,选择“手机使用情况调查样本”工作表,
12、针对“手机消费”一项进行假设检验。o第二步:以“籍贯”为主要关键字进行排序,以将上海和外地学生进行分类,得上海学生的样本为59个,外地学生的样本为41个;o第三步:按照“工具”“数据分析”“z-检验:双样本平均检验”的次序选择,弹出“z-检验:双样本平均检验”对话框,如图所示设置参数。o第四步:单击确定,输出如图所示的分析结果 根据上述样本统计结果,可知上海学生手机消费的样本平均值为68.15元,外地学生手机消费的样本平均值为49.51,z检验值为8.60,双侧概率p为0,因此可以断定上海和外地学生的手机消费有显著差异。2、方差未知时总体参数的假设检验方差未知时总体参数的假设检验(1)方差未知
13、时一个总体均值的方差未知时一个总体均值的t检验检验 对于一个总体参数的检验,可利用EXCEL提供的统计功能,也可利用函数工具和自己输入公式的方法计算统计量,并进行检验。【例3.4】根据上海移动公司对以往手机消费情况的统计资料显示,上海居民手机月消费额为平均每月55元。试问根据例3.1的抽样样本,该批大学生平均每人每月手机消费额是否高于普通居民的月平均消费额(a=0.05)?【解】该批大学生平均每人每月手机消费额用Y表示,其总体平均数为,可设定以下假设:H0:=55;H1:55 利用利用EXCEL数据分析工具进行假设检验数据分析工具进行假设检验 EXCEL数据分析工具只提供两个样本数据在方差相同
14、和方差不同时的t检验,对单个总体的t检验还要进行预处理,即事先定义一个变量,再进行总体假设检验,其操作步骤如下:o第一步:打开“第3章 数据资料”,选择“手机使用情况调查样本”工作表,针对“手机消费”一项进行假设检验。o第二步:选取单元格K2,设置字段为“变量2”,然后在单元格K3:K102内全部输入0;o第三步:选择“工具”“数据分析”“t-检验:平均值的成对二样本分析”,弹出对话框,如图所示设置参数。o第四步:单击确定,输出分析结果。根据上述样本统计结果,可知学生手机消费的样本平均值为60.51元,t检验值为3.84,单尾概率p为0.000111.645,样本落在拒绝域,所以拒绝原假设,即
15、认为手机卡的开通率高于40%。(4)双样本的比例检验)双样本的比例检验 在不少情形下,管理层感兴趣的是两个不同群体中具有某种行为特征的人的比例是否有差异。【例3.7】在发放优惠移动通信手机号码卡这一项目设计时,设计者认为外地学生的手机卡开通率应该大于上海学生手机卡的开通率。试以=0.05的检验水平,根据例3.1抽取的样本数据,利用比例检验法进行检验。【解解】o首先根据抽样样本中计算实际频数表,计算外地和上海的学生数n1和n2,开通比例p1和p2;o构造统计量 o对规定的显著性水平s=0.05,求出临界值z1-s o计算统计量的z值,与临界值z1-s进行比较,得出结论 o按如下方式提出原假设和备
16、择假设:利用利用EXCEL进行比例检验可按如下步骤进行:进行比例检验可按如下步骤进行:o第一步:打开“第3章 数据资料”,选择“双样本比例检验法”工作表;o第二步:计算实际频数表。利用“数据”菜单中的“数据透视表”选项制作样本中“籍贯”和“使用情况”的交互频数分布表 o第三步:建立“双样本比例检验表”。o第四步:计算各检验指标值。o第五步:判断 由上图可知,检验统计量z=3.9161.645,或者用其伴随概率p=0.000.05,样本落在拒绝域,所以拒绝原假设,即由此样本显示认为该项目中外地学生手机卡的开通率高于上海学生手机卡的开通率。3.3.2 3.3.2 非参数假设检验非参数假设检验 非参
17、数检验是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,但又希望能从样本数据中获得尽可能的信息,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。1、单样本非参数检验、单样本非参数检验 单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第3章 市场调查数据的数理推断分析 市场调查 数据 数理 推断 分析