高教社杯全国大学生数学建模竞赛A题论文最新-葡萄酒的评价.doc
《高教社杯全国大学生数学建模竞赛A题论文最新-葡萄酒的评价.doc》由会员分享,可在线阅读,更多相关《高教社杯全国大学生数学建模竞赛A题论文最新-葡萄酒的评价.doc(23页珍藏版)》请在沃文网上搜索。
1、葡萄酒的评价摘要本文要解决的是葡萄酒的评价问题,我们利用数理统计的知识,包括显著性差异检验、主成分分析、聚类分析、典型相关分析、逐步线性回归分析等建立数学模型,分别求解。问题一,由题意知,要分析两组评酒员的评价结果有无显著性差异,需应用概率统计中的假设检验知识以及spss软件中关于两个总体均值的假设检验。检验结果表明,对于红葡萄酒,由于的值为,故拒绝原假设,认为两个红葡萄酒样本总体的均值不相等,同理,对白葡萄酒,的值为,认为两个白葡萄酒样本总体的均值不相等。因此,两组评酒员的评价结果有显著性差异。而至于哪一组结果更可信,我们先计算出第一组10位评酒员对每一个葡萄酒样品(红、白葡萄酒样品数总共5
2、5)品尝评分的标准差,再将得到的55个标准差数值求和作为第一组的总标准差;同样我们将第二组10位评酒员对每一葡萄酒样品品尝评分的标准差,并且也将得到的55个标准差数值求和作为第二组的总标准差。我们最后计算出第一组的总标准差为385.49,第二组的总标准差为261.82,小于第一组的总标准差,所以第二组结果更可信。问题二,查阅相关资料可知,糖、酸、单宁、芳香物质和色素五大指标是葡萄的主要构成物质,我们对附件2中的指标进行了简化和处理,统一选取了地位相同且具有代表性的一级指标作为分析指标;对附件3中的芳香物质,使用matlab软件,进行主成分分析,各浓缩成一个指标,其贡献率大于85%,具有统计意义
3、。然后,对以上得到的所有指标类1,加上问题一所求的一组更可信的平均值指标,我们对这些指标进行Q型聚类分析,把酿酒葡萄分成了四个等级。问题三,在分析酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响时,我们运用了spss软件,对红白葡萄和红白葡萄酒的理化指标类1分别进行R型聚类分析,并挑选出具有代表性的8组数据进行典型相关分析,计算出典型相关系数。使用Bartlett检验统计量,对典型相关系数作显著性检验,最后选出具有密切联系的代表性因素。问题四,我们将酿酒葡萄和葡萄酒的一级理化指标作为自变量,而葡萄酒质量作为因变量,使用逐步线性回归方法来分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响 。运用SPS
4、S软件建立回归模型,根据多元回归模型:求得白葡萄酒质量的预报方程:,再对回归方程进行显著性检验,并得到显著性水平为0.0001。 同理可求得红葡萄酒质量的预报方程:,对回归方程进行显著性检验,并得到显著性水平为0.001。最后,我们进行了回代检验,得到样本的平均相对误差分别为1.99%和2.55%,从而论证了能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:显著性差异检验 主成分分析 聚类分析 典型相关分析 逐步线性回归分析一、 问题重述葡萄酒质量是其外观、香气、口感等的综合表现。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后
5、求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。题中给出了某一年份一些葡萄酒的评价结果和该年份这些葡萄酒的和酿酒葡萄的成分数据。本文要建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析附件中的数据处理说明:1) 在附
6、件1第一组红葡萄酒品尝评分中,品酒员4号对样品20的色调评分数据出现了缺失,所以剔除这一列的数据。2) 在附件2第一组白葡萄酒品尝评分中,品酒员7号对样品3号的持久性评分数据出现了异常,所以剔除这一列的数据。3) 对于附件2和3中的没有数据的单元格,我们认为其值为0,所以将其全部赋值为0。1. 第一题的问题分析要分析两组评酒员的评价结果有无显著性差异,根据概率统计中两个总体均值的假设检验知识,若的值小于0.05,即拒绝原假设,认为两样本总体的均值不相等,若的值大于0.05,则接受原假设,认为两个样本总体的均值相等,由此即可判断,两组评酒员的评价机构是否显著性差异。要判断哪一组的结果更加可信,我
7、们需要通过分析其总的标准差来断定结果。所以,我们必须先求出每一组中55个样品所对应的标准差,然后将其标准差相加,得到我们最后要的总标准差。最后结果中总标准差较小的,即是稳定性较好,更加具有可靠性。2. 第二题的问题分析水和糖是葡萄的最主要成分,是发酵成葡萄酒的物质基础;葡萄中酸的含量,对葡萄酒的影响也很大;而单宁、色素和芳香物质在整个葡萄的物质构成中尽管所占比例非常小,但它们对葡萄的特色和风味有着非常显著的贡献;可以说葡萄中的糖、酸、单宁、芳香物质和色素是判断酿酒葡萄品质的指标性物质。因此,我们选取附件2中的一级理化指标,加上芳香物质,两者一起作为相对应的葡萄的理化指标,接着运用主成分分析和Q
8、型聚类分析的方法将葡萄酒的样品分成四个等级。 3. 第三题问题分析由于影响葡萄酒的主要理化指标包括:酒精度,总糖,浸出物,挥发性酸,单宁,总酚,色度,色调,PH值,并且这些成分主要蕴藏于葡萄的梗,皮,果肉,及籽中,因此,葡萄酒的理化指标中我们将用到的指标是附件2中葡萄酒的一级指标以及附件3中经过整合的芳香物质指标。想要分析酿酒葡萄与葡萄酒的理化指标之间的关系,我们得分别求红葡萄与红葡萄酒的理化指标之间的联系和白葡萄与白葡萄酒的理化指标之间的联系;因此,我们得通过R型聚类分析处理,对红白葡萄和红白葡萄酒分别选取代表性指标,通过对这些代表性指标的典型相关分析,反映酿酒葡萄和葡萄酒的理化指标之间的联
9、系,最后使用Bartlett检验统计量,对典型相关系数作显著性检验。4. 第四题问题分析要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,我们将酿酒葡萄与葡萄酒的理化指标合在一起作为新指标来分析此新指标对葡萄酒质量的影响。我们借助逐步线性回归方法,从方程中剔除无统计学作用的自变量,从而简化了计算,得到回归方程,最后进行回代检验。三、模型假设1) 我们是通过聘请一批评酒员进行品评,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分来确定葡萄酒的质量。2) 假设每个评酒员品酒后对其分类指标打分是相互独立的,评酒员之间并未相互讨论。3) 假设给评酒员品评的葡萄酒是生产出来不久的,葡
10、萄酒并未超过保质期,不影响评酒员的品评。4) 假设葡萄酒的质量不受酿酒技术以及其他外在因素的影响,只考虑本题中所给因素的影响。5) 假设影响葡萄和葡萄酒的性质主要是附件中提到的一级指标,二级指标的影响几乎忽略不计。6) 假设葡萄的芳香物质和葡萄酒的芳香物质分别作为一级指标,各包含在葡萄和葡萄酒的理化指标中,论文中做出这种限定。四、 符号说明 :显著性检验中的概率值; :检验中的值; :预报方程的因变量; :预报方程的第个自变量; :预报方程项的系数;五、模型的建立与求解问题一附件1中两组评酒员评价结果的求解: 第一组中10位品酒员分别对每一份红葡萄酒样品品尝,评分的平均值作为这一红葡萄酒样品的
11、得分,第二组中10位品酒员分别对每一份红葡萄酒样品品尝,评分的平均值作为这一红葡萄酒样品的得分,得到每个样品最后得分对照表(表1)如下,其中我们让样品按序号升序排列。第一组红酒样品1酒样品2酒样品3酒样品4酒样品5酒样品6酒样品7酒样品8酒样品962.780.380.468.673.372.271.572.381.5第二组红酒样品1酒样品2酒样品3酒样品4酒样品5酒样品6酒样品7酒样品8酒样品968.17474.671.272.166.365.36678.2第一组红酒样品10酒样品11酒样品12酒样品13酒样品14酒样品15酒样品16酒样品17酒样品1874.270.153.974.67358
12、.774.979.359.9第二组红酒样品10酒样品11酒样品12酒样品13酒样品14酒样品15酒样品16酒样品17酒样品1868.861.668.368.872.665.769.974.565.4第一组红酒样品19酒样品20酒样品21酒样品22酒样品23酒样品24酒样品25酒样品26酒样品2778.679.777877.177.285.67869.273.873第二组红酒样品19酒样品20酒样品21酒样品22酒样品23酒样品24酒样品25酒样品26酒样品2772.675.872.271.677.171.568.27271.5表1同上,两组品酒员对白葡萄酒27个样品评分,得到每个样品最后得分对
13、照表(表2)如下,其中我们也让样品按序号升序排列。第一组白酒样品1酒样品2酒样品3酒样品4酒样品5酒样品6酒样品7酒样品8酒样品9酒样品108274.279.666779.47168.477.571.472.974.3第二组白酒样品1酒样品2酒样品3酒样品4酒样品5酒样品6酒样品7酒样品8酒样品9酒样品1077.975.875.676.981.575.574.272.380.479.8第一组白酒样品11酒样品12酒样品13酒样品14酒样品15酒样品16酒样品17酒样品18酒样品1972.363.365.97272.47478.873.172.2第二组白酒样品11酒样品12酒样品13酒样品14酒
14、样品15酒样品16酒样品17酒样品18酒样品1971.472.473.977.178.467.380.376.776.4第一组白酒样品20酒样品21酒样品22酒样品23酒样品24酒样品25酒样品26酒样品27酒样品2877.876.47175.973.377.181.364.881.3第二组白酒样品20酒样品21酒样品22酒样品23酒样品24酒样品25酒样品26酒样品27酒样品2876.679.279.477.476.179.574.37779.6表2基于表1和表2中的相关数字可以得到:图1由图1,可知和,即拒绝原假设,接受备择假设,即两组的均值不相等,所以两组品酒员的评价结果存在显著性差异。
15、通过excel中的数据处理,我们计算出两组品酒员对红白葡萄酒评分的总标准差如下表所示:红白总标准差第一组157.39228.10385.49第二组114.46147.36261.82表3由表3可知,第二组的总标准差小于第一组的总标准差,即第二组品酒员对葡萄酒样品的评分比较集中,而第一组的评分相对分散,所以,第二组品酒员的评价结果更可信。问题二首先 ,依据附件2和附件3的数据运用主成分分析和Q型聚类分析的方法来对酿酒葡萄的理化指标分别进行处理。用到的软件: Matlab软件。1. 红葡萄的理化指标处理:1) 主成分分析:红葡萄的芳香物质经主成分分析后,得到1个主成分,贡献率为 91.05%(如图
16、a),具有统计学上的意义;即主成分指标基本可以代表所有测定指标的成分指标,成为一个一级指标,同时也表明这些指标对红葡萄的(感官)质量有着重要的影响。2) 聚类分析:红葡萄的一级理化指标加上红葡萄的芳香物质,作为指标类1。然后根据对象的指标类1,性质相近的个体归为一类,使得同一类中个体具有高度的同质性,不同类之间的个体具有高度的异质性。结果如图下:图2由图2可知,我们将红葡萄样品分成了四类,如下:i. 5,24,17,20,26,4,27,25,13,19,10ii. 6,18,15,7,12,22iii. 11iv. 1,8,14,2,23,9,3,16,212. 白葡萄的理化指标处理:1)
17、主成分分析:白葡萄的芳香物质经主成分分析后,得到1个主成分,贡献率为93.03% (如图b),具有统计学上的意义;即主成分指标基本可以代表所有测定指标的成分指标,成为一个一级指标,同时也表明这些指标对白葡萄的(感官)质量有着重要的影响。2) 聚类分析:对样品进行聚类分类,结果如图下:图3基于图3,将白葡萄的样品分成了四类,分别为:i. 6,18,7,15,1,13ii. 8,11,16,17,22iii. 2,12,19,25,3,4,14,21,5,20,9,28,23,26,10,24,iv. 27 图a 图b问题三首先,对附件3中的数据进行处理,使空格处全部赋值为0 ,接着对红白葡萄和红
18、白葡萄酒的理化指标进行R型聚类,最后运用典型相关分析分析酿酒葡萄和葡萄酒的理化指标之间的联系。1. 红葡萄与红葡萄酒理化指标之间的联系:将红葡萄与红葡萄酒的理化指标分别进行R型聚类,通过SPSS软件得到如下结果:1) 红葡萄的理化指标处理,如图4,红线将红葡萄的理化指标进行R型聚类分成8个类,并挑选每个类中具有代表性的指标的数据来进行分析。图4基于图4,将红葡萄的样品分成了8类,分别为:i. 29,32,30,14,28,ii. 3iii. 16,18,22,17,1,20iv. 19,21,31v. 5,7vi. 11,13,10,4,12,2,33,26,vii. 15,25,8,9,6v
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高教 全国大学生 数学 建模 竞赛 论文 最新 葡萄酒 评价
