生物统计学课后习题答案统计数据的收集.doc
《生物统计学课后习题答案统计数据的收集.doc》由会员分享,可在线阅读,更多相关《生物统计学课后习题答案统计数据的收集.doc(11页珍藏版)》请在沃文网上搜索。
1、第一章 统计数据的收集与整理1.1 算术平均数是怎样计算的?为什么要计算平均数?答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差?答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同?答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。1.4 完整地描述一
2、组数据需要哪几个特征数?答:平均数、标准差、偏斜度和峭度。1.5 下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。666964656466686562646961616866576669666570645867666667666662666664626265646566726066656161666762656561646264656265686865676862637065646562666263686568576766686364666864636064696566676767
3、656767666864675966656356666363666763706770626472696767666864657161636164646769706664656463706462697068656365666468696563676370656867696665676674646965646565686765656667726567626771696565756269686865636666656261686564676664606168676359656064636962716960635967616869666469656867646466697368606063386267
4、656569656765726667646164666363666666636563676866626361666163686566696466706970636465646767656662616565606365626664答:首先建立一个外部数据文件,名称和路径为:E:dataexer1-5e.dat。所用的SAS程序和计算结果如下:proc format; value hfmt 56-57=56-57 58-59=58-59 60-61=60-61 62-63=62-63 64-65=64-65 66-67=66-67 68-69=68-69 70-71=70-71 72-73=72-
5、73 74-75=74-75;run;data weight; infile E:dataexer1-5e.dat; input bw ;run;proc freq; table bw; format bw hfmt.;run;The SAS SystemCumulative CumulativeBW Frequency Percent Frequency Percent-56-57 3 1.0 3 1.058-59 4 1.3 7 2.360-61 22 7.3 29 9.762-63 46 15.3 75 25.064-65 83 27.7 158 52.766-67 77 25.7 23
6、5 78.368-69 45 15.0 280 93.370-71 13 4.3 293 97.772-73 5 1.7 298 99.374-75 2 0.7 300 100.01.6 将上述我国男青年体重看作一个有限总体,用随机数字表从该总体中随机抽出含量为10的两个样本,分别计算它们的平均数和标准差并进行比较。它们的平均数相等吗?标准差相等吗?能够解释为什么吗?答:用means过程计算,两个样本分别称为和,结果见下表:The SAS SystemVariable N Mean Std Dev-Y1 10 64.5000000 3.5039660Y2 10 63.9000000 3.178
7、0497-随机抽出的两个样本,它们的平均数和标准差都不相等。因为样本平均数和标准差都是统计量,统计量有自己的分布,很难得到平均数和标准差都相等的两个样本。1.7 从一个有限总体中采用非放回式抽样,所得到的样本是简单的随机样本吗?为什么?本课程要求的样本都是随机样本,应当采用哪种抽样方法,才能获得一随机样本?答:不是简单的随机样本。从一个有限总体中以非放回式抽样方法抽样,在前后两次抽样之间不是相互独立的,后一次的抽样结果与前一次抽样的结果有关联,因此不是随机样本。应采用随机抽样的方法抽取样本,具体说应当采用放回式抽样。1.8 证明若用或编码时,前式是否仍然相等?答:(1)令 则 平均数特性之。
8、(2) 令 则 平均数特性之。 用第二种编码方式编码结果,两式不再相等。1.9 有一个样本:,设B为其中任意一个数值。证明只有当最小。这是平均数的一个重要特性,在后面讲到一元线型回归时还会用到该特性。答:令 , 为求使p达最小之B,令则 。 1.10 检测菌肥的功效,在施有菌肥的土壤中种植小麦,成苗后测量苗高,共100株,数据如下1:10.09.37.29.18.58.010.510.69.610.17.06.79.57.810.57.98.19.67.69.410.07.57.25.07.38.77.16.15.26.810.09.97.54.57.67.09.76.28.06.98.38.
9、610.04.84.97.08.38.47.87.56.610.06.59.58.511.09.76.610.05.06.58.08.48.37.47.48.17.77.57.17.87.68.66.07.06.46.76.36.411.010.57.85.08.07.07.45.26.79.08.64.66.93.56.29.76.45.86.49.36.4编制苗高的频数分布表,绘制频数分布图,并计算出该样本的四个特征数。答:首先建立一个外部数据文件,名称和路径为:E:dataexr1-10e.dat。SAS程序及结果如下:options nodate;proc format; value
10、hfmt 3.5-4.4=3.5-4.4 4.5-5.4=4.5-5.4 5.5-6.4=5.5-6.4 6.5-7.4=6.5-7.4 7.5-8.4=7.5-8.4 8.5-9.4=8.5-9.4 9.5-10.4=9.5-10.4 10.5-11.4=10.5-11.4; run; data wheat; infile E:dataexr1-10e.dat; input height ; run; proc freq; table height; format height hfmt.; run;proc capability graphics noprint; var height;
11、histogram/vscale=count; inset mean var skewness kurtosis;run;The SAS SystemThe FREQ ProcedureCumulative Cumulativeheight Frequency Percent Frequency Percent- 3.5-4.4 1 1.00 1 1.004.5-5.4 9 9.00 10 10.005.5-6.4 11 11.00 21 21.006.5-7.4 23 23.00 44 44.007.5-8.4 24 24.00 68 68.008.5-9.4 11 11.00 79 79.
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 课后 习题 答案 统计数据 收集