1、工程质量监理徐慧智第二章 数理统计基础及应用第一节 数理统计基本知识一、总体、个体和样本在一个统计问题中,称研究对象的全体为总体(有限总体和无限总体)。构成总体的每个成员或每个研究对象称为个体(样本、样本容量、样品)。有限总体(母体)工序是无限总体样本1样本2样本3样本1容量为17样本2容量为18样本2容量为17个体(样品)说明:样本容量越大,结果越能反映总体的特性,但是耗费的代价越大,成本越高,当样本容量和总体中个体含量相同时,是一种极限情况二、数据质量质量数据是反映某种质量特性指标的原始数据。狭义的质量数据主要是产品质量相关的数据,如不良品数、合格率、直通率、返修率等。广义的质量数据指能反
2、映各项工作质量的数据,如一批沥青的针入度、含蜡量、延度等。工程质量监理工作依据应为“一切以数据说话”。1、质量数据的分类1)计量值数据计量值数据是可以连续取值的数据,属于连续型变量。它通常由测量得到,如重量、强度、几何尺寸、标高、位移等。2)计数值数据计数值数据是只能按0,1,2,数列取值计数的数据,属于离散型变量。它一般由计数得到。计数值数据又可分为计件值数据和计点值数据。2、质量数据的特性1)波动性,即在相同的生产技术条件下生产出来的一批产品,其质量特性数据由于受到操作者、设备、材料、方法、环境等多种因素的影响而总存在着一定的差异;2)规律性,即当生产过程处于正常状态时,其质量数据的波动是
3、有一定规律的。1、数据的来源材料检验工序检验竣工检验中间检验2、数据的来源产品质量说明文件监理中心实验室工地实验室流动实验室承办人提供监理工程师抽查预测和控制工程质量3、数据的修约数据获得之后,对规定精确度之外的数据,如何取舍的问题,在统计学中的修约规则如下:1)拟舍去的数字中,其最左边的第一位数据小于5时,则舍去,留下的数字不变2)拟舍去的数字中,其最左边的第一位数据大于5时,则进1,即留下的数字末位加13)拟舍去的数字中,其最左边的第一位数据等于5时,后面的数据并非全部为0时,所留数字的末位加14)拟舍去的数字中,其最左边的第一位数据等于5时,后面无数据或者全部为0时,所留数字的末位数字为
4、奇数(1、3、5、7、9)则进1,所留数字的末位数字为偶数(2、4、6、8)则舍去18.2432-18.2例子:26.4843-26.51.0501-1.10.05-0.00.15-0.20.25-0.2上述数值修约规则(奇升偶降法)与以往惯用的四舍五入法相比较,四舍五入方法取得的数据偏大,而奇升偶降法对于数据的取舍具有平衡性,大量数据进行这种修约之后,修约值变大还是变小的可能性几乎是一样的。三、数据的统计特征量用来表示统计数据分布及其某些特性的特征量分为两类:一类表示数据的集中位置,例如算术平均值、中位数等;一类表示数据的离散程度,主要有极差、标准离差、变异系数等。1算术平均值算术平均值是表
5、示一组数据集中位置最有用的统计特征量,经常用样本的算术平均值来代表总体的平均水平。总体的算术平均值用户表示,样本的算术平均值则用x表示。2中位数在一组数据x1、x2、xn中,按其大小次序排序,以排在正中间的一个数表示总体的平均水平,称之为中位数,或称中值,用x-表示。n为奇数时,正中间的数只有一个;n为偶数时,正中间的数有两个,则取这两个数的平均值作为中位数。3.极差在一组数据中最大值与最小值之差,称为极差,极差没有充分利用数据的信息,但计算十分简单,仅适用于样本容量较小(n10)的情况。4.标准偏差标准偏差有时也称标准离差、标准差或称均方差,它是衡量样本数据波动性(离散程度)的指标占在质量检
6、验中,总体的标准偏差一般不易求得。5变异系数标准偏差是反映样本数据的绝对波动状况,当测量较大的量值时,绝对误差一般较大;而测量较小的量值时,绝对误差一般较小,因此,用相对波动的大小,即变异系数更能反映样本数据的波动性。各各类类代代表表性性的的数数量量特特征征值值代表值是多少代表值是多少代表性有多大代表性有多大代表性可靠吗代表性可靠吗集中趋势的度量集中趋势的度量离散趋势的度量离散趋势的度量分布特征的度量分布特征的度量平均指标平均指标变异指标变异指标偏度峰度指标偏度峰度指标基本基本公式公式简单简单式式加权加权式式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公
7、式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式公式算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数中位数中位数众数众数极差极差平均差平均差标准差标准差变异系数变异系数原点矩原点矩中心距中心距N N阶矩阶矩1算术平均值2中位数3、极差4、样本标准偏差5、变异系数例子:某段沥青混凝土面层抗磨性能检测(摩擦系数)58566053485450615755正常干燥沥青路面的摩擦系数为0.6,雨天路面摩擦系数降为0.4,雪天则为0.28,结冰路
8、面就更低,只有0.18 P36页例题四、数据的分布特征质量数据具有一定的规律性,这种规律采用概率分布描述。公路工程质量控制和评价中,经常采用正态分布和t 分布。1、正态分布概率密度函数当一定时,曲线随着U的变化而沿x轴平移;当一定时,曲线的形状由确定,越小,曲线越“瘦高”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散。随机变量平均值标准偏差正态分布曲线具有如下特点:1)正态分布曲线对成语x=u,及以平均值为中心;2)当x=u,曲线处于最高点,当x向左和向右移动时,曲线不断降低,整个曲线呈现中间高、两边底的形状;3)曲线与横坐标轴围成的面积等于1,即当=0,=1时,正态分布乘
9、坐标准正态分布,概率密度为:对于正态分布N(,),它的测量值落入区间(a,b)的概率,用P(ax3=0.27%i=1,2,n,也就是说400次观测数据才有1次出现可疑数据。表达公式为:此外,当观测值与平均值之间的误差大于2倍标准差时,该测量数据应该保留,但需存疑。该准则可以重复应用,直至所保留数据中已不含粗大误差为止。该准则比较保守,因为在测量次数有限时,出现在靠近3界限处的数据较少,除非有较大的粗大误差,否则依据准则而导致数据被剔除的可能性很小。当样本数量小于10时,该准则不能剔除任何异常值。也就是说,测量次数少于10次时,不能用该准则。使用条件为检测次数大于50。2、肖维纳特(Chaven
10、et)法肖维纳特准则也是以正态分布为前提的。在观测次数较少时,肖维纳特准则犯“弃真”错误的概率是较大的,例如,n=5时,犯“弃真”错误的概率可达20。在n185时,肖维纳特准则比3准则严格;当n185时,肖维纳特准则比3准则宽松;当n时,肖维纳特准则就无法应用了。可疑数据的舍弃准则为:3、格拉布斯法格拉布斯法准则是在确认测得值,也就是随机误差服从正态分布的前提下,利用格拉布斯法统计量来判别异常值是否为可疑值的准则。设对某一固定量作等精度的多次独立测量,得到一测量列:x1,x2,xn。当测得值xi(i1,2,n)服从正态分布时,求得把测量列按大小顺序重新排列成顺序统计量为x(1)x()x(n)。
11、其中左右两端边缘测得值最可能含有粗大误差。根据顺序统计原理,格罗贝斯给出了统计量取舍的条件:显著性水平格拉布斯法利用格罗贝斯准则每次只能剔除一个可疑值,需重复进行判别,直到无粗大误差的测得值为止。格罗贝斯准则克服了3准则的缺陷,在概率意义上给出了较为严谨的结果,被认为是比较好的判断准则。例子:实验室进行同配比的混凝土测试实验,其检测结果为(n=10):23.0、24.5、26.0、25.0、24.8、27.0、25.5、31.0、25.4、25.8(MPa),分别采用拉依达法、肖维纳特(Chavenet)法、格拉布斯法判别取舍:解:10个测量数据,1、拉依达法观测数据均不能舍去。2、肖维纳特(
12、Chavenet)法最大值应该舍去,最小值保留。该种方法和拉依达法对数据的取舍结果有所不同。GB/T50081-2002,制作边长为150mm的立方体在标准养护(温度202、相对湿度在95%以上)条件下,养护至28d龄期,用标准试验方法测得的极限抗压强度,称为混凝土标准立方体抗压强度。按照GB50010-2010混凝土结构设混凝土结构设计规范计规范规定,普通混凝土划分为十四个等级,即:C15,C20,C25,C30,C35,C40,C45,C50,C55,C60,C65,C70,C75,C80。例如,强度等级为C30的混凝土是指30MPafcu,k1.67过高21.67 CP 1.33充分31
13、.33 CP 1.00理想41.00CP0.67不足5 0.67CP非常不足3)判断质量分布状态中部有一顶峰,左右两边低,近似对称。这时可判断工序运行正常处于稳定状态。是由于直方图分组过多或是测量数据不准等原因造成。这是由于测量工具有误差或是原材料一时的变化刀具严重磨损短时间内不熟练工人替岗、操作疏忽、混入规范不同的产品等造成。直方图出现两个顶峰这是由于数据来自不同的总体。比如把来自两个工人或两批原材料或两种设备生产的产品混在一起造成。偏向型又分左偏型和右偏型。一些有形位公差要求的特性值分布,往住呈偏向型孔加工习惯,造成的特性值分布,常呈左偏型。而轴加工习惯造成的特性值分布常呈右偏型。绝壁型常
14、常由于操作人员的主观因素造成的,一般多是因为数据收集不正常,或是在工序检测过程中出现了人为干扰。4)判断施工能力B表示实际质量特性值分布范围T表示质量标准要求的界限二、控制图法控制图又叫管理图,它是一种带控制界限的质量管理图表。运用控制图的目的之一就是,通过观察控制图上产品质量特性值的分布状况,分析和判断生产过程是否发生了异常,一旦发现异常就要及时采取必要的措施加以消除,使生产过程恢复稳定状态。也可以应用控制图来使生产过程达到统计控制的状态。产品质量特性值的分布是一种统计分布因此,绘制控制图需要应用概率论的相关理论和知识。是由美国贝尔实验室的休哈特博士于1924年提出来的。1、控制图的基本原理
15、1)质量的波动性在施工过程中,工程质量的波动不可避免。它是由人、设备、材料、工艺方法、环境等几个因素综合作用的结果。波动分为正常波动和异常波动两种。正常波动是偶然因素造成的,其出现带有随机性质的特点,如原材料成分和性能发生微小变化,工人操作的微小变化,周围环境的微小变化等,这类的质量波动是不可避免的,不需要采取措施进行控制。一般情况下,质量波动服从正态分布。异常波动是系统原因造成的,对质量的影响很大。如原材料质量的变化,工人不遵守操作规程,机械设备的调整不当,检验仪器的使用不合理,周围环境发生变化等等。此类的质量波动是可以避免的,质量的异常波动在生产中是不容许出现的,需要采取措施进行控制。2)
16、控制图的原理设所考察的产品的质量特征,在生产过程处于控制状态时,服从正态分布N(,2),则样本大小为n的样本平均数服从N(,2/n)。因此对塣控制图,若以数学期望为中线值,以为上、下控制界限,则适当选择k值,可以保证当过程处于控制状态时,样本平均数以很高的概率位于上下控制界限之间,而且应呈随机排列。例如当k=3时,此概率为99.7%。如果某个样本点落到控制界限之外,就认为生产过程失去控制;这种情况虽然在生产过程处于控制状态时也有可能发生,但其概率只有0.3%,可能性很小。分布概率图-3+3中心线CL控制上限UCL控制下限LCLUCL=+3SCL=LCL=-3S三个界限的计算公式:3)控制图预防
17、原则的贯彻一是对过程不断监控;二是落实“查出异因,采取措施、保证消除、不在出现、纳入标准”等二十字方针;4)控制图的种类及控制界限的计算图名称步骤中心线计算公式备注图(1)计算各样本平均值(2)计算各样本极差Rixij第I样本中的第j个数据i1,2k;j=1,2n;max(xij)第i样本中最大值;min(xij)第i样本中最大值。图(1)找出或计算出各样本的中位数(2)计算各样本极差Rin为奇数时,第i样本中按大小顺序排列起的数据列中间位置的数据n为偶数时,第I样本中按大小顺序排列起的数据列中中间位置的两个数据的平均值LS图(1)找出各组最大值Li和最小值Si(2)计算最大值平均值和最小值平
18、均值(3)计算平均极差(4)计算范围中值MXRs图计算移动极差RsiPn图计算平均不合格品率(pn)i第i样本的不合格品数(各样本样本容量皆为n)P 图计算各组不合格品率pini第i样本的样本容量(各样本样本容量可以不等)C图计算各样本的平均缺陷数ci第i样本的缺陷数(各样本样本容量相等)U图计算各样本的单位缺陷数ui各样本样本容量不等控制图名称控制图名称样样 本本 数数 k样样 本本 容容 量量 n备备 注注 图图 图图LS图图一般一般k=2025一般一般36 图的样本容量常取图的样本容量常取3或或5 XRs图图K=20301pn图图、p 图图一般一般k20251/p5/pC图、图、U图图尽
19、可能使样本中缺陷尽可能使样本中缺陷数数C15样本大小样本大小R 图图 用用X 图图 用用LS图用图用A2D3D4M3A2E2A921.880-2.2671.8802.6602.69531.023-2.5751.1871.7721.82640.729-2.2820.7961.4571.52250.577-2.1150.6911.2901.36360.483-2.0040.5491.1841.26370.4190.0761.9240.5091.1091.91480.3730.1361.8640.4321.0541.14390.3370.1841.8160.4121.0101.104100.3080
20、.2231.7770.3630.9751.072控制图系数表控制图系数表例子:绘制基层厚度检测结果的控制图。日期组号实测偏差平均值极差x1x2x3x4x55/312-0.5-1-0.50.80.80.163.06/3201.7-11-10.70.142.77/33-111-0.511.50.302.08/341-1000002.09/35110.51.5-13.00.602.510/3612-10.524.50.903.011/3720.52105.51.102.012/3822.50.51171.42.013/392-11.511.551.003.014/31000.5001.510.202
21、.0合计295.824.2基层厚度检测结果与计算表格(1)各组的平均值、极差分别为:(2)计算控制界限:样本号CL2.42CL0.58UCL1.98LCL-0.82UCL5.11R图0 2 4 6 8 10 x图基层厚度检测质量控制图3、控制图的应用发生异常的几种情况:1个点落在控制线以外;连续9个点落在中心线同一侧;连续6个点递增或者递减连续14个点中临近两个点交替上下;3个点中有2个点落在中心线一侧偏大范围内连续5个点中有4个落在中心线偏大范围内;连续15个点位于中心线一侧靠近偏小范围连续8个点落在中心线两侧且均在偏大范围内三、相关图法相关图法又叫散布图法、简易相关分析法。它是通过运用相关
22、图研究两个质量特性之间的相关关系,来控制影响产品质量中相关因素的一种有效的常用方法。相关图是把两个变量之间的相关关系,用直角坐标系表示的图表,它根据影响质量特性因素的各对数据,用小点表示填列在直角坐标图上,并观察它们之间的关系。不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线
23、性相关完全正线性相关 三、相关图法回归分析:研究一个随机变量Y对另一个(X)或一组(X1,X2,Xk)变量的相依关系的统计分析方法。例子:不同灰水比(C/W)的混凝土28d强度(R28)的实验结果,确定灰水比和混凝土28d强度之间的回归方程及其相关系数。一个自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归C/WR281.2514.31.5018.01.7522.82.0026.72.2530.32.5034.1第三节 抽样检测基础一、抽样检测的内容抽样检验又称抽样检查,是从一批产品中随机抽取少量产
24、品(样本)进行检验,据以判断该批产品是否合格的统计方法和理论。它与全面检验不同之处,在于后者需对整批产品逐个进行检验,把其中的不合格品拣出来,而抽样检验则根据样本中的产品的检验结果来推断整批产品的质量。如果推断结果认为该批产品符合预先规定的合格标准,就予以接收;否则就拒收。所以,经过抽样检验认为合格的一批产品中,还可能含有一些不合格品。二、随机抽样的方法简单随机抽样:简单随机抽样时必须注意不能有意识抽好的或差的,也不能为了方便只抽表面摆放的或容易抽到的。系统抽样:是指每隔一定时间或一定编号进行,而每一次又是从一定时间间隔内生产出的产品或一段编号产品中任意抽取一个或几个样本的方法。分层抽样:从交
25、验的每批产品中随机抽取预定样本容量的产品项目,对照标准逐个检验样本的性能。如果样本中所含不合格品数不大于抽样方案中规定的数目,则判定该批产品合格,即为合格批,予以接收;反之,则判定为不合格,拒绝接收。检验检验全数检验全数检验抽样检验抽样检验非随机抽样非随机抽样随机抽样随机抽样单纯随机抽样单纯随机抽样系统抽样系统抽样分层抽样分层抽样化整为零化整为零间隔定时间隔定时间隔定量间隔定量三、路基路面现场随机取样方法1、测定区间或者断面确定方法三、路基路面现场随机取样方法2、观测位置的确定方法第四节 抽样检验的评定方法序号1234567891011弯沉值3029312827263332303031序号1213141516171819202122弯沉值2927263231333130292828对于路基路面的压实度、弯沉值、路面结构厚度层、半刚性材料强度、水泥混凝土抗压和抗折强度等检查项目,应采用数理统计的方法进行评定计分。弯沉值检测结果(0.01mm)沉弯代表值为沉弯检测值的上波动界限,即:因为路面设计沉弯值为40(0.01mm),所以该路段的沉弯是满足要求的。本本 节节 课课 结结 束束