1、概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散随机变量。2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X只有两个可能取值,且其分布为,则称X服从处参数为p的两点分布。两点分布的概率分布:两点分布的期望:;两点分布的方差:(2)二项分布:若一个随机变量X的概率分布由式 给出,则称X服从参数为n,p的二项分布。记为Xb(n,p)(或B(n,p).两点分布的概率分布:二项分布的期望:;二项分布的方差:(3)泊松分布:若一个随机变量X的概率分布为,则称X服从参数为的泊松分布,记为XP
2、 ()泊松分布的概率分布:泊松分布的期望:;泊松分布的方差:4.连续型随机变量:如果对随机变量X的分布函数F(x),存在非负可积函数,使得对于任意实数,有,则称X为连续型随机变量,称为X的概率密度函数,简称为概率密度函数。5.常用的连续型分布:(1)均匀分布:若连续型随机变量X的概率密度为,则称X在区间(a,b)上服从均匀分布,记为XU(a,b)均匀分布的概率密度:均匀分布的期望:;均匀分布的方差:(2)指数分布:若连续型随机变量X的概率密度为,则称X服从参数为的指数分布,记为Xe ()指数分布的概率密度:指数分布的期望:;指数分布的方差:(3)正态分布:若连续型随机变量X的概率密度为 则称X
3、服从参数为和的正态分布,记为XN(,)正态分布的概率密度:正态分布的期望:;正态分布的方差:(4)标准正态分布:,标准正态分布表的使用:(1)(2)(3)故定理1: 设XN(,),则6.随机变量的分布函数:设X是一个随机变量,称为X的分布函数。分布函数的重要性质:7.求离散型的随机变量函数、连续型随机变量函数的分布(1)由X的概率分布导出Y的概率分布步骤:根据X写出Y的所有可能取值;对Y的每一个可能取值确定相应的概率取值;常用表格的形式把Y的概率分布写出(2)由X的概率密度函数(分布函数)求Y的概率密度函数(分布函数)的步骤:由X的概率密度函数随机变量函数Y=g(X)的分布函数由求导可得Y的概
4、率密度函数(3)对单调函数,计算Y=g(X)的概率密度简单方法:定理1 设随机变量X具有概率密度,又设y=g(x)处处可导且恒有(或恒有),则Y=g(X)是一个连续型随机变量,其概率密度为;其中是y=g(x)的反函数,且练习题:2.4 第7、13、14总习题 第3、6、9、10、11、13、14、17、18、19第三章重要知识点:1.离散型二维随机变量X与Y的联合概率分布表: YX.1(1)要会由X与Y的联合概率分布,求出X与Y各自概率分布或反过来;类似 P63 例2(2)要会在X与Y独立的情况下,根据联合概率分布表的部分数据,求解其余数据;类似 P71 例3(3)要会根据联合概率分布表求形如
5、的概率;(4)要会根据联合概率分布律之类求出相应的期望、方差、协方差、相关系数等。2. 二维连续型随机变量X与Y的联合概率密度:设(X,Y)为二维随机变量,F(x,y)为其分布函数,若存在一个非负可积的二元函数f(x,y),使对任意实数(x,y),有,则称(X,Y)为二维连续型随机变量。(1) 要会画出积分区域使得能正确确定二重积分的上下限;(2) 要会根据联合概率密度求出相应的分布函数F(x,y),以及形如等联合概率值;P64 例3(3) 要会根据联合概率密度求出的边缘密度;类似 P64 例4(4) 要会根据联合概率密度求出相应的期望、方差、协方差、相关系数等。3.联合概率分布以及联合密度函
6、数的一些性质:(1);(2)要会根据这些性质解类似P68 第5,6题。4.常用的连续型二维随机变量分布二维均匀分布:设G是平面上的有界区域,其面积为A。若二维随机变量(X,Y)具有概率密度函数,则称(X,Y)在G上服从均匀分布。5.独立性的判断:定义:设随机变量(X,Y)的联合分布函数为F(x,y),边缘分布函数为,若对任意实数x,y,有(1)离散型随机变量的独立性:由独立性的定义进行判断;所有可能取值,有,则X与Y相互独立。(2)连续型随机变量的独立性:由独立性的定义进行判断;联合概率密度 ,边缘密度,有几乎处处成立, 则X 与Y相互独立。(3)注意与第四章知识的结合X与Y相互独立 因此 X
7、与Y不独立。6相互独立的两个重要定理定理1 随机变量X与Y相互独立的充要条件是X所生成的任何事件与Y生成的任何事件独立,即,对任意实数集A,B,有定理2 如果随机变量X与Y独立,则对任意函数,相互独立。(1)要求会使用这两个定理解决计算问题练习题:习题2-3 第3、4题 习题2-4 第2题习题3.2 第5,7,8题总习题三 第4,9(1)-(4), 12,13第四、五章知识点设总体密度函数如下,是样本,试求未知参数的矩估计值,最大似然估计值。(1),由此可推出,从而参数,的矩估计值为(2)似然函数为:其对数似然函数为:由上式可以看出,是的单调增函数,要使其最大,的取值应该尽可能的大,由于限制,
8、这给出的最大似然估计值为将关于求导并令其为0得到关于的似然方程,解得第四章重要知识点:1.随机变量X数学期望的求法:(1)离散型 ;(2)连续型 2.随机变量函数g(X) 数学期望的求法:(1)离散型 ;(2)连续型 3.二维随机向量期望的求法:(1)离散型 ;(2)连续型 4.随机变量X方差的求法:(1)简明公式 (2)离散型 (3)连续型 5. 随机变量X协方差与相关系数的求法:(1)简明公式 (2)离散型 (3)连续型 (4)6.数学期望、方差、协方差重要的性质:(1) (2) 设X与Y相互独立,则 (3) 若X与Y相互独立,则(4) (5) (6)若X与Y相互独立,则(7) 若(X,Y
9、)服从二维正态分布,则X与Y相互独立,当且仅当7. n维正态分布的几个重要性质:(1)n维正态变量()的每个分量()都是正态变量,反之,若都是正态变量,且相互独立,则()是n维正态变量。(2)n维随机向量()服从n维正态分布的充分必要条件是的任意线性组合均服从一维正态分布均服从一维正态分布(其中不全为零)。(3)若()服从n维正态分布,设是的线性函数,则()服从k维正态分布。(4)设()服从n维正态分布,则“相互独立”等价于“两两不相关”练习题:1. 设(X,Y)的联合密度函数为,求及解:同理又因从而2. 习题4.3第10题8.中心极限定理(1)定理4(棣莫佛拉普拉斯定理)设随机变量相互独立,
10、并且都服从参数为的两点分布,则对任意实数,有(2)定理3(独立同分布的中心极限定理)设随机变量相互独立,服从同一分布,且则练习题:习题4-4 11题 12题 总习题四 24,25,26题第五章重要知识点确定或求证统计量所服从的分布1.三大分布(1)分布:设是取自总体N(0,1)的样本,称统计量服从自由度为n的分布。(2)t分布:设XN(0,1), ,且X与Y相互独立,则称服从自由度为n的t分布。(3)F分布:设,且X与Y相互独立,则称服从自由度为(m,n)的F分布。2.三大抽样分布(1)设总体是取自X的一个样本,为该样本的样本均值,则有,(2)定理2设总体,是取自X的一个样本,与为该样本的样本
11、均值与样本方差,则有,与相互独立(3)定理3 设总体,是取自X的一个样本,与为该样本的样本均值与样本方差,则有,练习题:1.设是来自正态总体的样本,求统计量的分布。解:因为,故由样本的独立性及分布的定义,有再由样本的独立性以及t分布的定义,有2 总习题五 14题3.求样本函数相关的概率问题练习题:习题5-3 2 总习题五 16、17第六章重要知识点:1.矩估计的求法:设总体X的分布函数中含有k个未知参数的函数,则(1)求总体X的k阶矩它们一般都是是这k个未知参数的函数,记为(2)从(1)中解得(3)再用的估计量分别代替上式中的,即可得的估计量:注:求,类似于上述步骤,最后用,代替,求出矩估计2
12、.最大似然估计的求法:求最大似然估计的一般方法:(1) 写出似然函数(2) 令或,求出驻点(3)判断并求出最大值点,在最大值点的表达式中,用样本值代入就得参数的最大似然估计值。比如P154 例46。3. 估计量的优良性准则(1)无偏性定义1 设是未知参数的估计量,若,则称为的无偏估计量。(2)有效性定义2 设和都是参数的无偏估计量,若,则称较有效。4 置信区间(1)双侧置信区间:设为总体分布的未知参数,是取自总体X的一个样本,对给定的数,若存在统计量,使得,则称随机区间为的双侧置信区间,称为置信度,又分别称与为的双侧置信下限与双侧置信上限。(2)单侧置信区间:设为总体分布的未知参数,是取自总体
13、X的一个样本,对给定的数,若存在统计量,满足 ,则称为的置信度为的单侧置信区间,称为的单侧置信下限;若存在统计量,满足则称为的置信度为的单侧置信区间,称为的单侧置信上限。5.寻求置信区间的方法:一般步骤:(1) 选取未知参数的某个较优估计量(2)围绕构造一个依赖于样本与参数的函数(3)对给定的置信水平,确定与,使通常可选取满足与的与,在常用分布情况下,这可由分位数表查得。(4)对不等式作恒等变形后化为则就是的置信度为的双侧置信区间。6.置信区间的公式:(1)0-1分布参数的置信区间:(2)设总体,其中已知,而为未知参数,是取自总体X的一个样本。均值的置信区间为:(,)(3)设总体,其中,未知,
14、 是取自总体X的一个样本。均值的置信区间为:(,)(4)设总体,其中,未知, 是取自总体X的一个样本。方差的置信区间为: 的置信区间为: 练习题:习题6-2 第1,2,5,6题习题6-3 第3,4,5,6题习题6-4 第4题总习题六 第7,8,9,10,16,17,18,20,21题第1章 随机事件及其概率(1)排列组合公式 从m个人中挑出n个人进行排列的可能数。 从m个人中挑出n个人进行组合的可能数。(2)加法和乘法原理加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。乘法原理(两个步骤
15、分别不能完成这件事):mn某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由mn 种方法来完成。(3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题(4)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验的可能结果称为随机事件。(5)基本事件、样本空间和事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:每进行一次试验,必须发生且只能发生这一组中的一个事件;任何事件,都是由这一组中的部分
16、事件组成的。这样一组事件中的每一个事件称为基本事件,用来表示。基本事件的全体,称为试验的样本空间,用表示。一个事件就是由中的部分点(基本事件)组成的集合。通常用大写字母A,B,C,表示事件,它们是的子集。为必然事件,为不可能事件。不可能事件()的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件()的概率为1,而概率为1的事件也不一定是必然事件。(6)事件的关系与运算关系:如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):如果同时有,则称事件A与事件B等价,或称A等于B:A=B。A、B中至少有一个发生的事件:AB,或者A+B。属于A而不属于B的部分所构成的事件,称为
17、A与B的差,记为A-B,也可表示为A-AB或者,它表示A发生而B不发生的事件。A、B同时发生:AB,或者AB。AB=,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。-A称为事件A的逆事件,或称A的对立事件,记为。它表示A不发生的事件。互斥未必对立。运算: 结合率:A(BC)=(AB)C A(BC)=(AB)C 分配率:(AB)C=(AC)(BC) (AB)C=(AC)(BC) 德摩根率: ,(7)概率的公理化定义设为样本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件:1 0P(A)1, 2 P() =13 对于两两互不相容的事件,有常称
18、为可列(完全)可加性。则称P(A)为事件的概率。(8)古典概型1 ,2 。设任一事件,它是由组成的,则有P(A)= =(9)几何概型若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A,。其中L为几何度量(长度、面积、体积)。(10)加法公式P(A+B)=P(A)+P(B)-P(AB)当P(AB)0时,P(A+B)=P(A)+P(B)(11)减法公式P(A-B)=P(A)-P(AB)当BA时,P(A-B)=P(A)-P(B)当A=时,P()=1- P(B)(12)条件概率定义 设A、B是两个事
19、件,且P(A)0,则称为事件A发生条件下,事件B发生的条件概率,记为。条件概率是概率的一种,所有概率的性质都适合于条件概率。例如P(/B)=1P(/A)=1-P(B/A)(13)乘法公式乘法公式:更一般地,对事件A1,A2,An,若P(A1A2An-1)0,则有。(14)独立性两个事件的独立性设事件、满足,则称事件、是相互独立的。若事件、相互独立,且,则有若事件、相互独立,则可得到与、与、与也都相互独立。必然事件和不可能事件与任何事件都相互独立。与任何事件都互斥。多个事件的独立性设ABC是三个事件,如果满足两两独立的条件,P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=
20、P(C)P(A)并且同时满足P(ABC)=P(A)P(B)P(C)那么A、B、C相互独立。对于n个事件类似。(15)全概公式设事件满足1两两互不相容,2,则有。(16)贝叶斯公式设事件,及满足1 ,两两互不相容,0,1,2,2 ,则,i=1,2,n。此公式即为贝叶斯公式。,(,),通常叫先验概率。,(,),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。(17)伯努利概型我们作了次试验,且满足u 每次试验只有两种可能结果,发生或不发生;u 次试验是重复进行的,即发生的概率每次均一样;u 每次试验是独立的,即每次试验发生与否与其他次试验发生与否是互不影响的。这种
21、试验称为伯努利概型,或称为重伯努利试验。用表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现次的概率,。第二章 随机变量及其分布(1)离散型随机变量的分布律设离散型随机变量的可能取值为Xk(k=1,2,)且取各个值的概率,即事件(X=Xk)的概率为P(X=xk)=pk,k=1,2,,则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:。显然分布律应满足下列条件:(1), (2)。(2)连续型随机变量的分布密度设是随机变量的分布函数,若存在非负函数,对任意实数,有, 则称为连续型随机变量。称为的概率密度函数或密度函数,简称概率密度。密度函数具有下面4个性质:1 。
22、2 。(3)离散与连续型随机变量的关系积分元在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似。(4)分布函数设为随机变量,是任意实数,则函数称为随机变量X的分布函数,本质上是一个累积函数。 可以得到X落入区间的概率。分布函数表示随机变量落入区间( ,x内的概率。分布函数具有如下性质:1 ;2 是单调不减的函数,即时,有 ;3 , ;4 ,即是右连续的;5 。对于离散型随机变量,;对于连续型随机变量, 。(5)八大分布0-1分布P(X=1)=p, P(X=0)=q二项分布在重贝努里试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为。, 其中,则称随机
23、变量服从参数为,的二项分布。记为。当时,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。泊松分布设随机变量的分布律为,则称随机变量服从参数为的泊松分布,记为或者P()。泊松分布为二项分布的极限分布(np=,n)。超几何分布随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。几何分布,其中p0,q=1-p。随机变量X服从参数为p的几何分布,记为G(p)。均匀分布设随机变量的值只落在a,b内,其密度函数在a,b上为常数,即axb 其他,则称随机变量在a,b上服从均匀分布,记为XU(a,b)。分布函数为 axb 0, xb。当ax1x2b时,X落在区间()内的概率为。指数分布
24、 ,0, ,其中,则称随机变量X服从参数为的指数分布。X的分布函数为 , x0。 记住积分公式:正态分布设随机变量的密度函数为, ,其中、为常数,则称随机变量服从参数为、的正态分布或高斯(Gauss)分布,记为。具有如下性质:1 的图形是关于对称的;2 当时,为最大值;若,则的分布函数为。参数、时的正态分布称为标准正态分布,记为,其密度函数记为,分布函数为。是不可求积函数,其函数值,已编制成表可供查用。(-x)1-(x)且(0)。如果,则。 (6)分位数下分位表:;上分位表:。(7)函数分布离散型已知的分布列为,的分布列(互不相等)如下:,若有某些相等,则应将对应的相加作为的概率。连续型先利用
25、X的概率密度fX(x)写出Y的分布函数FY(y)P(g(X)y),再利用变上下限积分的求导公式求出fY(y)。第三章 二维随机变量及其分布(1)联合分布离散型如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。设=(X,Y)的所有可能取值为,且事件=的概率为pij,称为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示: YXy1y2yjx1p11p12p1jx2p21p22p2jxipi1这里pij具有下面两个性质:(1)pij0(i,j=1,2,);(2)连续型对于二维随机向量,如果存在非负函数,使对任意一个其邻边分别
26、平行于坐标轴的矩形区域D,即D=(X,Y)|axb,cyx1时,有F(x2,y)F(x1,y);当y2y1时,有F(x,y2) F(x,y1);(3)F(x,y)分别对x和y是右连续的,即(4)(5)对于.(4)离散型与连续型的关系(5)边缘分布离散型X的边缘分布为;Y的边缘分布为。连续型X的边缘分布密度为Y的边缘分布密度为(6)条件分布离散型在已知X=xi的条件下,Y取值的条件分布为在已知Y=yj的条件下,X取值的条件分布为连续型在已知Y=y的条件下,X的条件分布密度为;在已知X=x的条件下,Y的条件分布密度为(7)独立性一般型F(X,Y)=FX(x)FY(y)离散型有零不独立连续型f(x,
27、y)=fX(x)fY(y)直接判断,充要条件:可分离变量正概率密度区间为矩形二维正态分布0随机变量的函数若X1,X2,Xm,Xm+1,Xn相互独立, h,g为连续函数,则:h(X1,X2,Xm)和g(Xm+1,Xn)相互独立。特例:若X与Y独立,则:h(X)和g(Y)独立。例如:若X与Y独立,则:3X+1和5Y-2独立。(8)二维均匀分布设随机向量(X,Y)的分布密度函数为其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)U(D)。例如图3.1、图3.2和图3.3。y1 D1O 1 x图3.1yD211 O 2 x图3.2yD3dcO a b x图3.3(9)二维正态分布
28、设随机向量(X,Y)的分布密度函数为其中是5个参数,则称(X,Y)服从二维正态分布,记为(X,Y)N(由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,即XN(但是若XN(,(X,Y)未必是二维正态分布。(10)函数分布Z=X+Y根据定义计算:对于连续型,fZ(z)两个独立的正态分布的和仍为正态分布()。n个相互独立的正态分布的线性组合,仍服从正态分布。, Z=max,min(X1,X2,Xn)若相互独立,其分布函数分别为,则Z=max,min(X1,X2,Xn)的分布函数为:分布设n个随机变量相互独立,且服从标准正态分布,可以证明它们的平方和的分布密度为我们称随机变量W服
29、从自由度为n的分布,记为W,其中所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。分布满足可加性:设则t分布设X,Y是两个相互独立的随机变量,且可以证明函数的概率密度为我们称随机变量T服从自由度为n的t分布,记为Tt(n)。F分布设,且X与Y独立,可以证明的概率密度函数为我们称随机变量F服从第一个自由度为n1,第二个自由度为n2的F分布,记为Ff(n1, n2).第四章 随机变量的数字特征(1)一维随机变量的数字特征离散型连续型期望期望就是平均值设X是离散型随机变量,其分布律为P()pk,k=1,2,n,(要求绝对收敛)设X是连续型随机变量,其概率密度为f(x),(要求绝
30、对收敛)函数的期望Y=g(X) Y=g(X)方差D(X)=EX-E(X)2,标准差, 矩对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即k=E(Xk)= , k=1,2, .对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即=, k=1,2, .对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即k=E(Xk)= k=1,2, .对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即=k=1,2, .切比雪夫不等式设随机变量X具有数学期望E(X)=,方差D(X)=2,则对于任意正数,有下
31、列切比雪夫不等式切比雪夫不等式给出了在未知X的分布的情况下,对概率的一种估计,它在理论上有重要意义。(2)期望的性质(1) E(C)=C(2) E(CX)=CE(X)(3) E(X+Y)=E(X)+E(Y),(4) E(XY)=E(X) E(Y),充分条件:X和Y独立; 充要条件:X和Y不相关。(3)方差的性质(1) D(C)=0;E(C)=C(2) D(aX)=a2D(X); E(aX)=aE(X)(3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b(4) D(X)=E(X2)-E2(X)(5) D(XY)=D(X)+D(Y),充分条件:X和Y独立; 充要条件:X和Y不相
32、关。 D(XY)=D(X)+D(Y) 2E(X-E(X)(Y-E(Y),无条件成立。而E(X+Y)=E(X)+E(Y),无条件成立。(4)常见分布的期望和方差期望方差0-1分布p二项分布np泊松分布几何分布超几何分布均匀分布指数分布正态分布n2nt分布0(n2)(5)二维随机变量的数字特征期望函数的期望方差协方差对于随机变量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即与记号相对应,X与Y的方差D(X)与D(Y)也可分别记为与。相关系数对于随机变量X与Y,如果D(X)0, D(Y)0,则称为X与Y的相关系数,记作(有时可简记为)。|1,当|=1时,称X与Y完全相关:完全相关而
33、当时,称X与Y不相关。以下五个命题是等价的:;cov(X,Y)=0;E(XY)=E(X)E(Y);D(X+Y)=D(X)+D(Y);D(X-Y)=D(X)+D(Y).协方差矩阵混合矩对于随机变量X与Y,如果有存在,则称之为X与Y的k+l阶混合原点矩,记为;k+l阶混合中心矩记为:(6)协方差的性质(i) cov (X, Y)=cov (Y, X);(ii) cov(aX,bY)=ab cov(X,Y);(iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);(iv) cov(X,Y)=E(XY)-E(X)E(Y).(7)独立和不相关(i) 若随机变量X与Y相互独立,则;
34、反之不真。(ii) 若(X,Y)N(),则X与Y相互独立的充要条件是X和Y不相关。第五章 大数定律和中心极限定理(1)大数定律切比雪夫大数定律设随机变量X1,X2,相互独立,均具有有限方差,且被同一常数C所界:D(Xi)C(i=1,2,),则对于任意的正数,有特殊情形:若X1,X2,具有相同的数学期望E(XI)=,则上式成为伯努利大数定律设是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数,有伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即这就以严格的数学形式描述了频率的稳定性。辛钦大数定律设X1,X2,Xn,是相互独立
35、同分布的随机变量序列,且E(Xn)=,则对于任意的正数有(2)中心极限定理列维林德伯格定理设随机变量X1,X2,相互独立,服从同一分布,且具有相同的数学期望和方差:,则随机变量的分布函数Fn(x)对任意的实数x,有此定理也称为独立同分布的中心极限定理。棣莫弗拉普拉斯定理设随机变量为具有参数n, p(0p1)的二项分布,则对于任意实数x,有(3)二项定理若当,则超几何分布的极限分布为二项分布。(4)泊松定理若当,则其中k=0,1,2,n,。二项分布的极限分布为泊松分布。第六章 样本及抽样分布(1)数理统计的基本概念总体在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我
36、们总是把总体看成一个具有分布的随机变量(或随机向量)。个体总体中的每一个单元称为样品(或个体)。样本我们把从总体中抽取的部分样品称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。我们称之为样本的两重性。样本函数和统计量设为总体的一个样本,称()为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称()为一个统计量。常见统计量及其性质样本均值样本方差样本标准差样本k阶原点矩样本k
37、阶中心矩,,其中,为二阶中心矩。(2)正态总体下的四大分布正态分布设为来自正态总体的一个样本,则样本函数t分布设为来自正态总体的一个样本,则样本函数其中t(n-1)表示自由度为n-1的t分布。设为来自正态总体的一个样本,则样本函数其中表示自由度为n-1的分布。F分布设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数其中表示第一自由度为,第二自由度为的F分布。(3)正态总体下分布的性质与独立。第七章 参数估计(1)点估计矩估计设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。又设为总体X的n个样本值,其样本的k阶原点矩为这样,我们按照“当参数
38、等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。若为的矩估计,为连续函数,则为的矩估计。极大似然估计当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体的一个样本,称为样本的似然函数,简记为Ln.当总体X为离型随机变量时,设其分布律为,则称为样本的似然函数。若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。若为的极大似然估计,为单调函数,则为的极大似然估计。(2)估计量的评选标准无偏性设为未知参数的估计量。若E ()=,则称 为的无偏估计量。E()=E(X), E(S
39、2)=D(X)有效性设和是未知参数的两个无偏估计量。若,则称有效。一致性设是的一串估计量,如果对于任意的正数,都有则称为的一致估计量(或相合估计量)。若为的无偏估计,且则为的一致估计。只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。(3)区间估计置信区间和置信度设总体X含有一个待估的未知参数。如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即那么称区间为的置信区间,为该区间的置信度(或置信水平)。单正态总体的期望和方差的区间估计设为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下:(i)选择样本函数;(ii)由置信
40、度,查表找分位数;(iii)导出置信区间。已知方差,估计均值(i)选择样本函数(ii) 查表找分位数(iii)导出置信区间未知方差,估计均值(i)选择样本函数(ii)查表找分位数(iii)导出置信区间方差的区间估计(i)选择样本函数(ii)查表找分位数(iii)导出的置信区间第八章 假设检验基本思想假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容