应用统计ch1统计数据的采集和整理.ppt
《应用统计ch1统计数据的采集和整理.ppt》由会员分享,可在线阅读,更多相关《应用统计ch1统计数据的采集和整理.ppt(42页珍藏版)》请在沃文网上搜索。
1、应用统计应用统计第一章:统计数据的采集和整理第一章:统计数据的采集和整理统统计计数数据据的的分分类类初级数据与次级数据初级数据与次级数据初级数据:如果数据分析和数据采集置于初级数据:如果数据分析和数据采集置于同一整体方案指导下,从同一整体方案指导下,从原始数据的载体或提原始数据的载体或提供者供者那里采集数据,继而进行分析,就称统计那里采集数据,继而进行分析,就称统计分析使用的是分析使用的是初级数据初级数据。次级数据:如果进行分析时数据来自次级数据:如果进行分析时数据来自本项统本项统计活动之外的数据采集和编辑结果计活动之外的数据采集和编辑结果,就称统计,就称统计分析使用的是分析使用的是次级数据次
2、级数据。如:研究收入与教育、职业、家庭等因素的关如:研究收入与教育、职业、家庭等因素的关系。系。统统计计数数据据的的分分类类截面数据与时间序列数据截面数据与时间序列数据截面数据截面数据(cross-sectional data)在相同或近似相同的时间点上收集的数据在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况描述现象在某一时刻的变化情况比如,比如,2003年我国各地区的国内生产总值数据年我国各地区的国内生产总值数据时间序列数据时间序列数据(time series data)在不同时间上收集到的数据在不同时间上收集到的数据描述现象随时间变化的情况描述现象随时间变化的情况比如,比
3、如,1996年至年至2003年国内生产总值数据年国内生产总值数据统统计计数数据据的的分分类类 质别质别数据和量别数据数据和量别数据标志标志(attribute)表示总体单位属性的名词。表示总体单位属性的名词。数量标志数量标志(quantitative attribute)表现为数量表现为数量上不等的标志。上不等的标志。品质标志品质标志(qualitative attribute)表现为状态表现为状态上差异的标志。上差异的标志。质别数据量别数据标志数量标志质量标志数据质别数据量别数据非数值型数值型离散型数值型离散型连续型中国统计年中国统计年中国统计年中国统计年鉴鉴鉴鉴20012001中中中中国国
4、国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社统统计计数数据据的的采采集集政府、行业或者个人已经公布或出版政府、行业或者个人已经公布或出版的各种数据的各种数据1.统统计计部部门门和和政政府府部部门门公公布布的的有有关关资资料料,如如各各类类统统计计年鉴年鉴2.各各类类经经济济信信息息中中心心、信信息息咨咨询询机机构构、专专业业调调查查机机构构等提供的数据等提供的数据3.
5、各类专业期刊、报纸、书籍所提供的资料各类专业期刊、报纸、书籍所提供的资料4.各各种种会会议议,如如博博览览会会、展展销销会会、交交易易会会及及专专业业性性、学术性研讨会上交流的有关资料学术性研讨会上交流的有关资料5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料6.专专门门的的数数据据公公司司,如如A.C.尼尼尔尔森森(A.C.Nielsen)公公司、信息资源司、信息资源(Information Resources Inc.)公司。公司。InternetInternethttp/http/WWW.WWW.统统计计数数据据的的采采集集统计调查统计调查统计调查分为普查和抽查统计调
6、查分为普查和抽查普查(全面调查),是对总体无一遗漏地进普查(全面调查),是对总体无一遗漏地进行调查。行调查。抽查(抽样调查),从总体中抽取部分样本抽查(抽样调查),从总体中抽取部分样本进行调查。按抽样方式不同分为随机调查和进行调查。按抽样方式不同分为随机调查和非随机调查。非随机调查。统计调查的工具统计调查的工具问卷问卷调查卷调查卷总体总体总体总体随机样本随机样本随机样本随机样本 统统计计数数据据的的采采集集实验实验通过实验方法得到的数据通过实验方法得到的数据通常是对自然现象而言通常是对自然现象而言 也被广泛运用到社会科学中也被广泛运用到社会科学中如心理学、教育学、社会学、经济学、管理学等如心理
7、学、教育学、社会学、经济学、管理学等试验设计试验设计对照原则对照原则齐同原则齐同原则随机原则随机原则观察研究观察研究统统计计数数据据的的整整理理和和表表述述质别数据的整理和表述质别数据的整理和表述质别数据分组是按品质标志将总体划分为若干个质别数据分组是按品质标志将总体划分为若干个组,然后将每一个体按其标志表现归入一组组,然后将每一个体按其标志表现归入一组.频数分布表频数分布表(frequency distribution table)(组别组别栏、频数栏,相对频数栏栏、频数栏,相对频数栏)例:根据例:根据饮料文摘饮料文摘,“古典可乐古典可乐”(Coke Classic)、健怡)、健怡可乐(可乐
8、(Diet Coke)、)、彭伯碳酸饮彭伯碳酸饮料(料(Dr.Pepper)、)、百事可乐(百事可乐(Pepsi-Cola)、)、以以及雪碧(及雪碧(Sprite)是销售量居前五位的软饮料是销售量居前五位的软饮料(华尔街日报华尔街日报,1998),下表是所选择的购),下表是所选择的购买买50次的软饮料的样本次的软饮料的样本绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品统统计计数数据据的的整整理理和和表表述述统统计计数数据据的的整整理理和和表表述述品质标志频数相对频数质别数据频数分布表质别数据频数分布表统统计计数数据据的的整整理理和和表表述述质别数据的图形表示质别数据的图形表示19981998
9、年京津沪三直辖市的进出口值年京津沪三直辖市的进出口值直辖市直辖市进出口值进出口值出口值出口值进口值进口值北京市北京市305.17305.17105.23105.23199.94199.94天津市天津市106.14106.1454.9954.9951.1551.15上海市上海市313.44313.44159.56159.56153.88153.88其他的图形表示其他的图形表示统统计计数数据据的的整整理理和和表表述述 量别数据的整理量别数据的整理-频数分组频数分组单项式分组单项式分组单项式分组是作为分组的数量标志的每一个具单项式分组是作为分组的数量标志的每一个具体标志都列为一个组的分组办法体标志都
10、列为一个组的分组办法单项式分组的适用条件单项式分组的适用条件分组的标志值个数少分组的标志值个数少只能对离散型变量进行分组只能对离散型变量进行分组组距式分组组距式分组总体按数量标志分组以后,每个组用两个标志总体按数量标志分组以后,每个组用两个标志值所决定的区间来表示值所决定的区间来表示组距式分组的几个问题组距式分组的几个问题统统计计数数据据的的整整理理和和表表述述统统计计数数据据的的整整理理和和表表述述1.组数(通常组数(通常515组组,原则上组内频数原则上组内频数不少于不少于5个个,两端除外两端除外)通常通常515组组,原则上组内频数不少于原则上组内频数不少于5个个,两端除外两端除外两个参考公
11、式两个参考公式:例例:N=62,K=7.统统计计数数据据的的整整理理和和表表述述统统计计数数据据的的整整理理和和表表述述2.组距组距全距全距=总体中个体最大值总体中个体最大值-个体最小值个体最小值组距组距=例:全距例:全距=135-78=57,组距组距=57/7=8.14,组组距取为距取为10统统计计数数据据的的整整理理和和表表述述3.组限组限a,b).a a,b).a 代表下限,代表下限,b b 代表上限代表上限规定重叠的数值归于后一组的下限规定重叠的数值归于后一组的下限组距组距=上限上限-下限下限缺上限或缺下限称为开口组缺上限或缺下限称为开口组智商分数的组限为智商分数的组限为7070,80
12、)80),80,90)80,90),,130,140),130,140)等距分组和不等距分组等距分组和不等距分组统统计计数数据据的的整整理理和和表表述述4.4.组中值组中值组中值组中值=(上限(上限+下限)下限)/2/2智商分数例的组中值为智商分数例的组中值为(70+80)/2=7570+80)/2=75,8585,9595,105105,115115,125125,135135缺上(下)限开口组组中值缺上(下)限开口组组中值=上(下)限上(下)限 -(+)相邻组组距)相邻组组距/2/2统计数列(统计数列(截面数列截面数列和时序数列)和时序数列)次数分布的概念次数分布的概念在统计分组的基础上,
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 ch1 统计数据 采集 整理