葡萄酒评价的优秀论文.doc
《葡萄酒评价的优秀论文.doc》由会员分享,可在线阅读,更多相关《葡萄酒评价的优秀论文.doc(20页珍藏版)》请在沃文网上搜索。
1、葡萄酒的评价模型摘要:本文主要针对葡萄酒的评价问题建立了相关数学模型。在对两组评酒员的评价是否存在显著性差异的问题中,首先验证了两组评酒员的评价结果服从正态分布,并通过方差分析法对两组评酒员的评价结果进行了分析,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,由于第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。在对酿酒葡萄进行分级的问题中,首先以相关系数衡量葡萄理化指标与葡萄酒质量的相似性程度,然后筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,利用筛选出的评价指标对酿酒葡萄进行聚类分析,将红葡萄和白葡萄均分成了四类。最后以
2、每类中对应葡萄酒质量评分的均值作为该类葡萄的分数,从而定出四类的级别,以对应国家葡萄酒的四级分类标准。在分析酿酒葡萄与葡萄酒的理化指标间的联系问题中,本文采用偏最小二乘回归分析法对指标间的联系进行了分析计算,发现葡萄酒中的某些理化指标与葡萄的某些理化指标存在较强的相关性,比如白葡萄中的总糖和还原糖对白葡萄酒中顺式白藜芦醇苷和顺式白藜芦醇以及反式白藜芦醇的影响较大。在判断葡萄与葡萄酒的理化指标与葡萄酒的质量间关系的问题中,首先对葡萄和葡萄酒的理化指标与葡萄酒的质量进行了相关性分析,发现某些理化指标与葡萄酒的质量相关性很大。然后筛选出这些相关性较大的指标,用偏最小二乘回归分析法进一步定量分析了这些
3、指标与葡萄酒质量的关系,建立了葡萄酒质量的评价模型,经过检验,利用建立的评价模型对葡萄酒评价结果与专家组的评价结果误差普遍小于5%,这同时论证了用葡萄和葡萄酒的理化指标对葡萄酒进行评价是基本可行的。关键字:显著性检验;聚类分析 ;偏最小二乘回归分析法1 问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。建立数学模型讨论下列问题:(1)分析两组评酒员的评价结果有无显著性差异,哪
4、一组结果更可信?(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2 问题的分析对于问题(1),两组评酒员分别对27种红葡萄酒和28种白葡萄酒进行了评价,通常情况下,评价结果一般服从正态分布,所以首先应当对评价数据进行拟合检验法1,然后利用方差分析对两组评酒员的评价结果进行显著性分析。一个较好的评价组应是本着客观的原则进行评价,因此评价结果通常较为均匀,据此,可以分别计算出各组评酒员评价结果的方差,方差越大表明组内成员的评
5、价差异越大,可信度就越低。对于问题(2),题目要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,首先就必须从这些指标中找到与酿酒葡萄分级有关的指标。考虑到酿酒葡萄的用途是酿制葡萄酒,因此葡萄酒的质量可以作为衡量酿酒葡萄质量的重要指标。而那些与葡萄酒质量相似性程度较大的酿酒葡萄理化指标也应作为酿酒葡萄的评估价指标。采用计算相关系数的方法计算两者间相似性程度,选定合适的相关系数为界线即得出酿酒葡萄质量评价指标。在酿酒葡萄质量指标确认后,采取聚类分析的方法对酿酒葡萄进行分类。分类后,各类中葡萄酿制葡萄酒的质量得分即作为各类分数,从而分出酿酒葡萄的级别。对于问题(3),要求对葡萄与葡萄酒的理
6、化指标的联系进行分析,葡萄的二级理化指标有50多种,葡萄酒的理化指标有15种左右,并且各个指标间可能存在较大的关联度,研究两组多重相关变量间的关系问题,可以考虑用偏最小二乘回归分析法。对于问题(4),首先利用问题(2)中相关性分析法和聚类分析法,筛选出与葡萄酒质量关联度较大的一些关键指标。经过去除掉对葡萄酒质量影响较小的指标,不仅可以简化计算,而且在实际研究中,工作人员只需测量这些关键指标即可,减少了工作量。然后利用偏最小二乘回归分析法,分析筛选后的指标与葡萄酒质量的函数关系,进而得到对葡萄酒质量的评价模型。为检验所建评价模型的准确性,可以考虑将样本数据分成两部分,一部分数据用于分析计算评价模
7、型,然后利用另一部分数据对模型进行检验。如果说误差较小,则说明所建评价模型较为满意,同时也论证了用理化指标对葡萄酒的质量进行评价的可行性。3 模型的假设(1) 酿酒葡萄的酿造水平与酿造环境相同;(2) 酿制同一种酒使用的葡萄是相同的;4 符号说明:第一组评酒员中第个评酒员对第种红葡萄酒的第个理化指标的评分;:第一组评酒员中第个评酒员对第种红葡萄酒的总评分;:第一组评酒员对第种红葡萄酒评价结果的方差;:第个指标与第个指标间的相关系数。5 模型的建立与求解5.1 两组评酒员评价结果的差异分析5.1.1 数据的处理与准备根据题意,共有两组评酒员,每组有十个成员,每个评酒员在评价任意一种酒时,均考虑了
8、四项一级指标和十项二级指标,每种酒的评价满分为100分,其中各个指标所占分值如表1所示。为方便计,将各个二级指标按照表1中从左至右的顺序依次编为110号。表1 各指标所占分值一级指标外观分析香气分析口感分析整体二级指标澄清度色调纯正度浓度质量纯正度浓度持久性质量整体分 值51068166882211记,分别表示第一组评酒员中第个评酒员,对第种红葡萄酒第个二级指标的评分和对第种红葡萄酒的总评分, ,分别表示第二组评酒员中第个评酒员,对第种红葡萄酒第个二级指标的评分和对第种红葡萄酒的总评分,则有假设把每一组所有评酒员对第种红葡萄酒的平均评分,作为该组对该种红葡萄酒的最终评分,分别用,表示第一组和第
9、二组对第种红葡萄酒的最终评分, 则 同样,记,分别表示第一组评酒员中第个评酒员,对第种白葡萄酒第个二级项指标的评分和第种白葡萄酒的总评分,分别表示第二组评酒员中第个评酒员,对第种白葡萄酒第个二级指标的评分和第种白葡萄酒的总评分,。则分别用,表示第一组和第二组对第种白葡萄酒的最终评分,。则 现以第1号红葡萄酒为例,分析两组评酒员评价结果的分布情况。20个评酒员对第1号酒的评分依次为70,79,91,68,97,82,69,80,81,76,68,71,80 ,52 ,53 ,76,71,73,70,67。以10分为间距,统计落入各个区间数据的个数,结果见表2.表2 评分结果分布统计区间50596
10、0697079808990100个数24842可以看出,20个评酒员对1号红葡萄酒的评分结果呈现出两头少中间多的分布。下面利用拟合检验法1检验评价结果是否服从正态分布(取显著性水平)。原假设:样本服从正态分布。计算参数及的极大似然估计值分别是,.计算出落入5个区间的频率依次为0.1,0.2,0.4,0.2,0.1.经过查卡方分布表,而,所以接受原假设,即20个评酒员对1号红葡萄酒样品的评分可视为服从正态分布。类似地,其他54种酒的评价结果经检验均服从正态分布。5.1.2 两组评价结果分析计算出两组评酒员对各种酒的评分情况,见图1.图1 两组最终评分均值通过图1总结出,两组评酒员对于55种酒的评
11、分走势大致相同,但对于红葡萄酒的评价,第一组的评分普遍高于第二组;对于白葡萄酒的评价,第一组的评分普遍低于第二组。针对第种酒,两组评酒员的评分标准可能不同,主观性较大。为检验两组评酒员的评价结果是否存在显著性差异,可进一步对两组评价结果进行检验1。以红葡萄酒为例,第一组的十个评酒员对第种红葡萄酒的评分构成样本,第二组的十个评酒员对第种酒的评分作为构成,。两个样本的容量为10,自由度为9。两样本的均值分别记作,标准差分别记作,则 两样本总自由度为18,合并的标准差, 进一步计算相应的,提出假设:两个样本差异不显著。备择假设:两个样本差异显著。通常显著水平,即置信概率为95%。经过查分布表知,自由
12、度为18时,。故当时,接受原假设,表明两组评酒员对第种红葡萄酒的评价结果差异不显著;故当时,拒绝原假设,表明两组评酒员对第种红葡萄酒的评价结果差异显著。经过上述计算,两组评酒员对27中红葡酒和28种白葡萄酒的评价差异结果如表3所示(其中,1表示两组评价结果不显著差异,0表示显著差异)。表3 各种酒的评价差异性红葡萄酒白葡萄酒酒类显著性酒类显著性酒类显著性酒类评分1015011150211602016031171311704018040180511905019160200602007021170210802208022091231902311002411002401102511112511212
13、60121260130270130271140140280两组评酒员对于55种酒的评价,总计有37种存在显著性差异,占总数的67.3%。其中红葡萄酒17种,占红葡萄酒总数的63.0%,白葡萄酒20种,占白葡萄酒总数的71.4%,差异性略高于红葡萄酒。因此,两组评酒员对于这些酒的评价普遍存在显著性差异,为了得到更为准确客观的评价结果,必须分别对各组评酒员的评价结果进一步分析,比较两组评价的可靠性。一个好的评价组在评价某种酒时,每一个成员应当本着客观性的评价原则对酒的各项指标进行评分,尽量避免主观影响。因此好的评价组对于同一种酒的评价结果通常更为均衡,不会出现高分和低分居多,而中等分数偏少的现象。
14、所以,组员评价结果的均衡度在很大程度上表征了该评价组评价结果的可信度,而表现均衡度大小的数据就是评价样本的方差,方差越大,均衡度越小,评价组的可信度越低,反之亦然。对于第种红葡萄酒,第一组的十个评酒员对第种红葡萄酒的评分构成样本,第二组的十个评酒员对第种酒的评分作为构成,。记两样本的方差为,则根据上式依次分别计算出,两组评酒员对27种红葡萄酒和28种白葡萄酒评价结果的方差,结果见图2.图2 两组组评酒员评价结果方差通过图2,可以看出,第一组评酒员对于各种酒评价结果的方差绝大部分大于第二组,这说明第一组评酒员在评价同一种酒时,组内成员的标准或认识差异较大,评价结果过于离散,均衡度较差,可信度也就
15、较低,因此可以断定,第二组评酒员的评价结果更可信。5.2酿酒葡萄分级模型欲对酿酒葡萄进行分级,首先应当确定适当的分级指标。然而对于题目要求的酿酒葡萄的理化指标和葡萄酒的质量这些指标中既可能存在指标间存在较强的相关性的情况,又可能存在一些指标与酿酒葡萄的分级关系微小。因此,有必要对所给指标进行分析。题目提供的酿酒葡萄的理化指标中的部分指标具有二级指标,为了更为细致准确的分析各指标与葡萄酒质量的关系,对于有二级指标的一级指标,只考虑其二级指标,将该一级指标去除。然后按照剩下指标的原始顺序进行顺序编号,共有55个葡萄理化指标,记作。将葡萄酒质量编号为56,即对于个指标,第种葡萄样品的值为5.2.1
16、由相关系数确定评估葡萄质量指标因为酿酒葡萄是用来酿葡萄酒的,因此,酿成葡萄酒的质量也就成为了判别酿酒葡萄的最重要指标。题目提供了酿酒葡萄的50多种指标,然而对于这些指标未必每项都对酿制的酒有影响,或者说产生的影响是可以忽略的。所以有必要对酿酒葡萄的理化指标与酿酒质量进行相似性度量,从而找出与酿酒质量相关程度较大的指标。下面通过计算相关系数衡量这些指标间的相似程度。指标与的样本相关系数为其中为酿酒葡萄的样品数目。计算得红葡萄理化指标与红葡萄酒质量相关系数见图3。图3 相关系数散点图从图中可以看出,只有部分指标与葡萄酒的质量的相关系数超过0.5,与葡萄酒质量具有较大的相似性。其中,还有些指标是与葡
17、萄酒的质量具有较大的负相关系数,也就是会抑制葡萄酒质量的提高,因此这样的指标也必须被作为评估酿酒葡萄的指标。下面对红葡萄以正负0.5、正负0.4为界,对白葡萄以正负0.4、正负0.3为界筛选指标,筛选情况见表4.表4 指标选取情况红葡萄白葡萄界线选取指标界线选取指标正指标:18,26,27,29,42负指标:55正指标:2,38,41,53负指标:46正指标:18,26,27,29,33,42负指标:55正指标:2,3,10,21,38,41,43,45,51,53,55负指标:46 经过筛选后的指标不仅与葡萄酒的质量有了较大的相关性,同时也大幅度降低了指标的数量,因而无需再对筛选后的指标间的
18、相似程度进行计算以去掉相似程度过高指标。如果指标数量较多,可以采用R型聚类分析对指标进行聚类从而去掉可归为一类的指标。5.2.2基于聚类分析法的酿酒葡萄分级模型聚类分析主要包括样本相似性度量,类与类间相似性度量两个步骤。(1)样本的相似性度量在对样本进行聚类分析时,首先要确定样本的相似性度量,常用的样本相似性度量有马氏距离、车比雪夫距离、欧式距离等,下面介绍最常用的欧式距离法。记是样本点集,距离是的一个函数,满足条件:这一距离的定义满足正定性、对称性和三角不等式。在聚类分析中,对于定量变量,最常用的是闵氏距离,即 当时则得到欧式距离。(2)类与类间的相似性度量如果有两个样本类和,则可以用最短距
19、离法、最长距离法、重心法、类平均法等方法度量它们之间的距离。下面介绍本文应用的类平均法。它等于中两样本点距离的平均,分别为中的样本点个数。下面根据由5.2.1节中筛选出的指标对酿酒葡萄样品进行聚类分析。首先对每个指标的数据进行标准化处理得到 其中,分别表示样品的数量和指标的数量。样本间相似性采用欧式距离度量,类间距离的计算选用类平均法。此外国际上和国内都是将葡萄酒按质量分为四个等级,其中,我国葡萄酒质量划分为优质特级葡萄酒、产区优质葡萄酒、产区优良葡萄酒以及佐餐酒四个级别8。故将酿酒葡萄分为对应的四个等级能够便于对酿酒葡萄的收购以及应用。得到葡萄样品分类结果为表5 分类结果图红葡萄白葡萄界线界
20、线界线界线第一类2,3,99第一类1528第二类2323第二类7,8,11,12,13,18,191,7,8,11,12,13,15,18第三类1,4,5,6,7,8,10,12,13,14,15,16,17,18,19,20,21,22,24,25,26, 271,2,3,4,5,6,7,8,10,12,13,14,15,16,17,18,19,20,21,22,24,25,26, 27第三类1,2,3,4,5,6,9,10,14,17,20,21,22,23,24, 25,26,27,282,4,5,6,9,10,14,17,20,21,23,24,25,26, 27, 28第四类1111
21、第四类1616界线降低并没有对分类结果产生较大的影响,但为了保证分类结果与酿酒质量的相关性,这里采用界线取得较高的两组分类结果。上面根据酿酒葡萄的理化指标和葡萄酒的质量对葡萄样品进行了划分,考虑到酿酒葡萄的用途是酿酒,因此葡萄酒的质量应作为衡量葡萄样品好坏的最重要指标。故以每类样品中各样品的评酒员得分平均值作为该类葡萄样品的分级指标。白葡萄分级方法同酿红葡萄酒分级方法,分级结果见表6。表6 酿酒葡萄分级结果红葡萄白葡萄级别样品评分级别样品评分第一级别2377.1第一级别1578.4第二级别2,3,975.6第二级别1,2,3,4,5,6,9,10,14,17,20,21,22,23,24, 2
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 葡萄酒 评价 优秀论文