1、 概率论与数理统计 公式第 1 章 随机事件及其概率如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验的可能结果称为随机事件。在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:每进行一次试验,必须发生且只能发生这一组中的一个事件;任何事件,都是由这一组中的部分事件组成的。基本事件的全体,称为试验的样本空间,用W 表示。w一个事件就是由 中的部分点(基本事件 )组成的集合。通常用大写字母WWA,B,C,表示事件,它们是 的子集。不可能事件()的概率为零,而概率为零的事件不一定是
2、不可能事件;同理,必然事件()的概率为 1,而概率为 1 的事件也不一定是必然事件。关系:如果事件 A 的组成部分也是事件B的组成部分,(A发生必有事件B发生):如果同时有A , B B A ,则称事件A与事件B等价,或称A等于B:A=B。A、B中至少有一个发生的事件:AU B,或者A+B。属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者AB ,它表示A发生而B不发生的事件。IIA、B同时发生:A B,或者AB。A B=,则表示 A 与 B 不可能同时发生,称事件 A 与事件 B 互不相容或者互斥。基本事件是互不相容的。WA-A 称为事件 A 的逆事件,或
3、称 A 的对立事件,记为 。它表示 A 不发生的事件。互斥未必对立。运算:结合率:A(BC)=(AB)C A(BC)=(AB)CiiAW设 为样本空间, 为事件,对每一个事件 都有一个实数 P(A),若满AA3 对于两两互不相容的事件A ,A ,有211 概率论与数理统计 公式U =PAiii=1常称为可列(完全)可加性。i=1,w ,w LwW =112n1(w ) = P(w ) = LP(w ) =。12nnw ,w Lw组成的,则有古典概型12mP(w ) + P(w ) +L + P(w )=(w ) U (w ) ULU (w )P(A)=12m12mm A所包含的基本事件数= =
4、n若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件 A,几何概型。其中 L 为几何度量(长度、面积、体积)。P(A+B)=P(A)+P(B)-P(AB)当B A 时,P(A-B)=P(A)-P(B)当 A=时,P( )=1- P(B)B定义 设 A、B 是两个事件,且 P(A)0,则称为事件 A 发生条件下,事条件概率 件 B 发生的条件概率,记为P(B / A) =。条件概率是概率的一种,所有概率的性质都适合于条件概率。例如 P(/B)=1 P( /A)=1-P(B/A)B12n12n12
5、1312n1。A B,则称事件 、 是相互独立的。P(A) 0 ,则有独立性= P(B)A B A B A B A B若事件 、 相互独立,则可得到 与 、 与 、 与 也都相互独立。1 概率论与数理统计 公式W必然事件 和不可能事件 与任何事件都相互独立。 与任何事件都互斥。多个事件的独立性设 ABC 是三个事件,如果满足两两独立的条件,P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)并且同时满足 P(ABC)=P(A)P(B)P(C)那么 A、B、C 相互独立。设事件12B , B ,L, BP(B ) 0(i = 1,2,L,n)1两两互不相容,1
6、2ninU全概公式Ai2则有,i=1P(A) = P(B )P(A | B ) + P(B )P(A | B ) +L + P(B )P(A | B )1122nB BAn12P(Bi) 0,i=B B,B, 两两互不相容,n1,2, ,1n12nUi2则,i=1iiinjjj=1此公式即为贝叶斯公式。n, , , ),通常叫先验概率。P B A ,( , ,ii),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了n“由果朔因”的推断。n我们作了 次试验,且满足AAu 每次试验只有两种可能结果, 发生或 不发生;nuAAu 每次试验是独立的,即每次试验 发生与否与其他次试验 发生
7、与否是互不影响的。n型pP (k)A表nk(0 k n)n示 重伯努利试验中 出现AP (k) = C k p qk= 0,1,2,L,nk,。nn1 概率论与数理统计 公式第二章 随机变量及其分布X设离散型随机变量 的可能取值为 X (k=1,2,)且取各个值的概率,即事kkP(X=x )=p ,k=1,2,,kk则称上式为离散型随机变量 的概率分布或分布律。有时也用分布列的形X式给出:X|12kP(X = x ) p , p ,L, p ,L。k12k显然分布律应满足下列条件:pp 0 k= 1,2,Lk(1), (2)。kk=1F(x)x,对任意实数 ,有设xF(x) =f (x)dx,
8、X则称 为连续型随机变量。X称为 的概率密度函数或密度函数,简称概率密度。密度函数具有下面 4 个性质:f (x) 01。P(X = x) P(x X x + dx) f (x)dxP(X = x ) = p在连续型随机变量理论中所起的作用与在离kk散型随机变量理论中所起的作用相类似。1 概率论与数理统计 公式(4)分布 设 为随机变量,x 是任意实数,则函数X函数称为随机变量 X 的分布函数,本质上是一个累积函数。P(a X b) = F(b) - F(a) 可以得到 X 落入区间(a,b的概率。分布函数F 表示随机变量落入区间( ,x内的概率。分布函数具有如下性质:10 F(x) 1, -
9、 x +;x xF(x ) F(x )时,有 ;2 F 是单调不减的函数,即1212,x-x+5 P(X = x) = F(x) - F(x - 0)。对于离散型随机变量,F(x) = p;kx xkx对于连续型随机变量,F。-分布二项分布在n 重贝努里试验中,设事件A发生的概率为 p 。事件A发生的次数是随机变量,设为X ,则X 可能取值为0,1,2,L,n。P(X = k) = P (k) = C p q,其 中kkn-knnq = 1- p,0 p 1,k = 0,1,2,L,n ,则称随机变量 X 服从参数为 n , p 的二项分布。记为X B(n, p) 。=1 ( = ) =当n
10、时,P X kk = 0.1,这就是(0-1)分p q1- ,kk布,所以(0-1)分布是二项分布的特例。1 概率论与数理统计 公式泊松分布设随机变量 X 的分布律为kP(X = k) = e ,-k!l p(l)或则称随机变量 X 服从参数为 的泊松分布,记为 Xl者 P( )。泊松分布为二项分布的极限分布(np=,n)。超几何分布k,MCnN随机变量 X 服从参数为 n,N,M 的超几何分布,记为 H(n,N,M)。几何分布均匀分布(),1,2,3,L,其中 p0,q=1-p。k-随机变量 X 服从参数为 p 的几何分布,记为 G(p)。设随机变量 X 的值只落在a,b内,其密度函数1在a
11、,b上为常数,即b - a1,axb则称随机变量 X 在a,b上服从均匀分布,记为 XU(a,b)。分布函数为0,xa,,-1,当 ax x b 时,X 落在区间(21x - xP(x X x ) =21。b- a121 概率论与数理统计 公式指数分布,xx 其中X 的分布函数为,则称随机变量 X 服从参数为 的指数分布。1- e l ,xx0。记住积分公式:+ x e dxn0正态分布X设随机变量 的密度函数为1(x-m)2e ,- x 其中 、 为常数,则称随机变量 服从参数为 、X。2x =m的图形是关于 对称的;1m(m) =2X(t-m)2若1 ,则 的分布函数为-edt2s 2-。
12、= 0=1、 时的正态分布称为标准正态分布,记为参数X N( 0,1)1,其密2度函数记为x-e2,- x +,2-t dt 。e22p-是不可求积函数,其函数值,已编制成表可供查用。2msmm x - x - P(x X x ) = F - F。21ss121 概率论与数理统计 公式(6)分位(X m )a下分位表:P;数x , x ,xX12n,P(X = x ) pY = g(X ) 的分布列(y12ni= g(x )iLiY12n,p , p ,L,若有某些g 相等,则应将对应的p 相加作为 的概率。i12niii连续型先利用 X 的概率密度 f (x)写出 Y 的分布函数 F (y)
13、P(g(X)YXy),再利用变上下限积分的求导公式求出 f (y)。Y第三章 二维随机变量及其分布x如果二维随机向量 (X,Y)的所有可能取值为至多可列分布x个有序对(x,y),则称 为离散型随机量。(x , y )(i, j =1,2,L) ,x设 =(X,Y)的所有可能取值为ijij,ijP(X ,Y) = (x , y ) = p (i, j =1,2,L)ijx为 =(X,Y)的分布律或称为 X 和 Y 的联合分布律。联合分布有时也用下面的概率分布表来表示:YXxppp111121jMMMMpMMMMMij(1)p 0(i,j=1,2,);ijp=1.(2)ijij1 概率论与数理统计
14、 公式连续型对 于 二 维 随 机 向 量 x, 如 果 存 在 非 负 函 数f (x, y)(- x +,- y +) ,使对任意一个其邻边分别平行于坐标轴的矩形区域 D,即 D=(X,Y)|axb,cyd有P(X ,Y) D = f (x, y)dxdy,D则称x 为连续型随机向量;并称 f(x,y)为x =(X,Y)的分布(2)- -x(X = x Y = y = X = x Y = y) x(,F(x, y) = PX x,Y y称为二维随机向量(X,Y)的分布函数,或称为随机变量X 和 Y 的联合分布函数。分 布 函 数 是 一 个 以 全 平 面 为 其 定 义 域 , 以 事
15、件(w ,w ) | - X (w ) x,- x 时,有 F(x ,y)F(x ,y);当 y y 时,有 F(x,y ) F(x,y );1212121(3)F(x,y)分别对 x 和 y 是右连续的,即2F(x, y) = F(x + 0, y), F(x, y) = F(x, y + 0);(4) F(-,-) = F(-, y) = F(x,-) = 0, F(+,+) =1.1212F(x ,y ) - F(x ,y ) - F(x ,y ) + F(x ,y ) 0.22211211(4)离散型 与 连 续型的关系P(X = x,Y = y) P(x X x + dx,y Y y
16、 + dy) f (x,y)dxdy1 概率论与数理统计 公式X 的边缘分布为分布iijY 的边缘分布为ji连续型X 的边缘分布密度为f (x) = f x y dy+ ( , ) ;XY 的边缘分布密度为f (y) = + f (x, y)dx.Y在已知X=x的条件下,Y 取值的条件分布为i分布pP(Y = y | X = x ) = ij;pjii在已知Y=y的条件下,X 取值的条件分布为jpP(X = x |Y = y ) = ij,pij;YXF(X,Y)=F (x)F (y)YX性i jXY直接判断,充要条件:可分离变量正概率密度区间为矩形-m 2 2r( -m )( -m ) -m
17、 2 1xxyy1-12 e2(1-r)ss,11222ps s 1 - r212随机变量的 若X ,X,X ,X ,X 相互独立, h,g 为连续函数,则:12mm+1h(X ,X ,X )和 g(X ,X )相互独立。n函数12mm+1特例:若 X 与 Y 独立,则:h(X)和 g(Y)独立。n例如:若 X 与 Y 独立,则:3X+1 和 5Y-2 独立。1 概率论与数理统计 公式(8)二维 设随机向量(X,Y)的分布密度函数为均匀分布1SD其中S 为区域 D 的面积,则称(X,Y)服从 D 上的均匀分布,记为(X,Y)DU(D)。例如图 3.1、图 3.2 和图 3.3。y1D1O1x图
18、 3.1y1O2 xydc1 概率论与数理统计 公式(9)二维 设随机向量(X,Y)的分布密度函数为正态分布21 -m 2r( -m )( -m ) -m xxyy1 -12 +2e2(1-r ) ss ss,211222ps s 1- r212m , m s 0,s12,12记为(X,Y)N(12,由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,m ,s ), (m s ).即 XN(但是若 XN(10)函数 Z=X+YY N12,m ,s ), (m s )Y N2 ,(X,Y)未必是二维正态分布。12,2(z) = P(Z z) = P(X + Y z)根据定义计算
19、: F分布Z+对于连续型,f (z) f-m m ,s s2 )。+122n 个相互独立的正态分布的线性组合,仍服从正态分布。mms,22iiiiiiZ=max,min(若 X相 互 独 立 , 其 分 布 函 数 分 别 为X ,X ,X )12n12nF x ,则 Z=max,min(X ,X ,X )的分布12nxn函数为:F (x) F (x) F (x)LF (x)=maxxnF (x) = 1-1- F (x)1- F (x)L1- F (x)minx1x2xn1 概率论与数理统计 公式X 相互独立,且服从标准正态分nc2 分布2布,可以证明它们的平方和n2i2 分布,记为 W 2
20、 n 。所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。c2 分布满足可加性:设Y - c 2 (n ),ii则ki12kt 分布设 X,Y 是两个相互独立的随机变量,且可以证明函数X1-aaF 分布设 X22,且 X 与 Y 独 立,可 以证明1212服从第一个自由度为 n ,第二个自由度为 n 的F 分布,记为F2111F(n ,n )1-a12a21第四章 随机变量的数字特征(1)离散型连续型1 概率论与数理统计 公式一 维 期望设 X 是离散型随机变量,其分布 设 X 是连续型随机变量,其概率密度为 f(x),随 机 期望就是平均值律 为 P( Xk+k=1,2
21、,n,E-n(要求绝对收敛)kkk=1函数的期望Y=g(X)+nE(Y) = g(x ) pkkk=1方差+D2(X ) = x - E(X ) f (x)dxD(X)=EX-E(X) ,22kk标准差k(X) = D(X),矩对于正整数 k,称随机变量 X 对于正整数 k,称随机变量 X 的的 k 次幂的数学期望为 X 的 k k 次幂的数学期望为 X 的 k 阶原点k+kkkiki对于正整数 k,称随机变量 X 对于正整数 k,称随机变量 X 与与 E(X)差的 k 次幂的数学期 E(X)差的 k 次幂的数学期望为 Xmm望为X的k阶中心矩,记为 , 的 k 阶中心矩,记为 ,即kk即m(
22、kkm(.kk.f x dx=k=,kiii设随机变量 X 具有数学期望 E(X)=,方差 D(X)= ,则对于2s2P( X - m e) e2切比雪夫不等式给出了在未知 X 的分布的情况下,对概率的一种估计,它在理论上有重要意义。1 概率论与数理统计 公式nnE( C X ) = C E(X )(3) E(X+Y)=E(X)+E(Y),质iiii(4) E(XY)=E(X) E(Y),充分条件:X 和 Y 独立;充要条件:X 和 Y 不相关。质方差pnplnp(1- p)l1p几何分布G( p)pp2nMN均匀分布U(a,b)211正态分布N(m,s 2)m2n02nnt分布(n2)n -
23、 21 概率论与数理统计 公式niiX随 机i=1-变 量+n的 数jY字 特-征函数的期望EG(X ,Y)EG(X ,Y)+ijijij方差+D(X ) = x - E(X )f (x)dx2Xiii2+j( )f y dyY2j协方差对于随机变量 X 与 Y,称它们的二阶混合中心矩m 为 X 与 Y 的协方11XYsm= E(X - E X Y - E(Y).=XY11与记号s 相对应,X 与 Y 的方差 D( X)与 D(Y)也可分别记为sXY与s。YY1 概率论与数理统计 公式相关系数对于随机变量 X 与 Y,如果 D(X)0, D(Y)0,则称r为 X 与 Y 的相关系数,记作r (
24、有时可简记为 )。XYr(= aY + b) =1正相关,当r = 1时(0),a完全相关负相关,当r = -1时(a 0),而当r 时,称 X 与 Y 不相关。以下五个命题是等价的: r=XYcov(X,Y)=0;(X Y )对于随机变量 X 与 Y,如果有E存在,则称之为 X 与 Y 的klk+l阶混合原点矩,记为n ;k+l阶混合中心矩记为:klkl差 的 (iii) cov(X +X , Y)=cov(X ,Y)+cov(X ,Y);1122(7)0=XYm , m ,s ,s , r2 ),(ii) 若(X,Y)N(122则 X 与 Y 相互独立的充要条件是X 和 Y 不相关。第五章
25、 大数定律和中心极限定理1 概率论与数理统计 公式(1)大数定律X m切比雪 设随机变量 X ,X ,相互独立,均具有有限方差,且被同一21夫大数 常数 C 所界:D(X )C(i=1,2,),则对于任意的正数,有i定律1nnnniini=1i=1特殊情形:若 X ,X ,具有相同的数学期望 E(X )=,I12则上式成为nX -m e =1.nini=1伯努利设是 n 次独立试验中事件 A 发生的次数,p 是事件 A 在大数定 每次试验中发生的概率,则对于任意的正数,有律mlim P - p e =1. nn伯努利大数定律说明,当试验次数 n 很大时,事件 A 发生的频率与概率有较大判别的可
26、能性很小,即mlim P - p e = 0. nn这就以严格的数学形式描述了频率的稳定性。辛钦大 设 X ,X ,X ,是相互独立同分布的随机变量序列,且E12n数定律 (X )=,则对于任意的正数有nnX -m e =1.nini=1(2)中心极限定 列维设随机变量 X ,X ,相互独立,服从同一分布,且具有21数理同的学期望和方差:( ) = m, ( ) = s 0( =1,2, )s2E XD Xk2X N(m, )kknnXkY =k=1nsn的分布函数 F (x)对任意的实数 x,有nn21k=1k-t dt.ex2ns2pnnn此定理也称为独立同分布的中心极限定理。1 概率论与
27、数理统计 公式棣莫弗拉普设随机变量X 为具有参数 n, p(0p1)的二项分布,则对于n拉斯定 任意实数 x,有理1 X2p(3)泊松定理若当nkkkk!n其中 k=0,1,2,n,。二项分布的极限分布为泊松分布。第六章 样本及抽样分布在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。我们把从总体中抽取的部分样品x称为样本。样本12n中所含的样品数称为样本容量,一般用 n 表示。在一般情况下,总是把样本看成是 n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,x表
28、示 n 个随机变量(样本);在具体的一次12n, x ,L, x抽取之后,x表示 n 个具体的数值(样本值)。我们12n称之为样本的两重性。设x12nj jL= (x , x , , x )12nj为样本函数,其中 为一个连续函数。如果 中不包含任何未, x ,L, x知参数,则称j (x)为一个统计量。12n1 概率论与数理统计 公式常见统计量1nx =及其性质样本均值样本方差ni=11nS = (x - x) .22n - 1ii=11n=样本标准差S2ii=1样本 k 阶原点矩nM =kkii=1样本 k 阶中心矩1 nnMxx kkii=1,nE(S 2 ) = s 2 , E(S *
29、2nn(X - X )2 ,为二阶中心矩。ii=1N(m,s )2 的一个样本,则样设 x12n本函数mx -defunt 分布N(m,s )2 的一个样本,则样设 x12n本函数deft其中 t(n-1)表示自由度为 n-1 的 t 分布。1 概率论与数理统计 公式x 为来自正态总体 Nn(m,s )2 的一个样本,则样2分布c2本函数2c ( 1),2s2表示自由度为 n-1 的 c 2 分布。N(m,s )2 的一个样本,而设 x为来自正态总体12n1y , y ,y 为来自正态总体 Nn(m,s )2 的一个样本,则样本122函数/s/sFn12其中nn=1S =2(y - y) ;S
30、22n -1n-1iii=1i=112F(n -1,n -1) 表示第一自由度为 n -1 ,第二自由度为121(3)正 态总 体 下 分布的性质1 概率论与数理统计 公式第七章 参数估计q ,q ,L,q设总体 X 的分布中包含有未知数,则其分布函数可以表成估计12mF(x;m 中也它的 k 阶原点矩vk12mkq ,q ,L,q(q ,q ,L,q )。又设,即 v12mkk12mx 为总体 X 的 n 个样本值,其样本的 k 阶原点矩为n121nknii=1这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有1 nnv (q ,q ,L,q )x,112mi
31、i=1nv (x212mnii=1LLLLLLLLLnv (q ,q ,L,q )m=m12mii=1由上面的 m 个方程中,解出的 m 个未知参数即为参数12mq ,q ,L,q()的矩估计量。12mg(x) 为连续函数,则 g(q ) g( )若q 为q 的矩估计,为 q 的矩估计。1 概率论与数理统计 公式当 总 体 X 为 连 续 型 随 机 变 量 时 , 设 其 分 布 密 度 为f (x;q ,q ,L,q, 其 中为 未 知 参 数 。 又 设1m1m22x , x , x 为总体的一个样本,称1n2nL(q ,q ,L,q )=( ;q ,q ,L,q )f x1mi1m22
32、i=1为样本的似然函数,简记为L.n当 总 体 X 为 离 型 随 机 变 量 时 , 设 其 分 布 律 为PX = x= p(x;1m2nL(x , x ,L, x ;=( ;q ,q ,L,q )p x1n1mi1m222i=1为样本的似然函数。(x , x ,L, x ;q ,q ,L,q ) q ,q ,L,q处取若似然函数 L在12m1n1m22q ,q ,L,qq ,q ,L,q到最大值,则称的最大似然估计值,12m1m2imnqq =qiiig(x) 为单调函数,则g(q ) g( )若q 为q 的极大似然估计,为 q 的极大似然估计。q q q为未知参数 的估计量。若 E (
33、 )= ,则称设x12nq 为q 的无偏估计量。E( )=E(X), E(S2)=D(X)X有效性q q ( , , ,L, ) q q ( , , ,L, )x x x xq=x=x设和是未知参数有效。112212n12n(q ) D(q )q 比 q的两个无偏估计量。若D,则称12121 概率论与数理统计 公式一致性设是 的一串估计量,如果对于任意的正数e ,都有nn则称 为 的一致估计量(或相合估计量)。nq则q 为 的一致估计。若q 为q 的无偏估计,且只要总体的 E(X)和 D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。q设总体 X 含有一个待估的未知参数 。如
34、果我们从样本 x x, , ,L,x 出12nq q ( , , ,L, )x x=x发 , 找 出 两 个 统 计 量与1112nq q ( , , ,L, ) (q q )x xq ,q 以=x, 使 得 区 间2212n12121-a(0 a 1)q q q 1 a,12为 的置信区间,1-a 为该区间的置信度(或置那么称区间12信水平)。X N(m,s 2 ) 的一个样本,在置信度为1-a设 x为总体12nq ,q 。具体步骤如下:下,我们来确定12计q ,q 。12(i)选择样本函数m N( 0,1).n0m= 1-a.s /n0(iii)导出置信区间ssl00n n1 概率论与数理统计 公式未知方差,估计均值(i)选择样本函数(ii)查表找分位数ml 1 a