竞赛论文评审的公平分配.doc
《竞赛论文评审的公平分配.doc》由会员分享,可在线阅读,更多相关《竞赛论文评审的公平分配.doc(20页珍藏版)》请在沃文网上搜索。
1、竞赛论文评审的公平分配摘要全国大学生数学建模竞赛是目前国内最有影响的一项大学生课外科技活动。公正的评奖必然要在公正的评审下实现。本文针对江苏赛区的评审方法,在尽量保证评审的合理性和公平性,并尽可能减少评审工作量的条件下,提出了评审人员的分配方案和批阅论文的数量分配方案。针对问题一,将论文按题型分为ABCD四组,假设每位评审人只评审一类论文,按比例来计算各类论文的评审人数,再由批阅各类论文的评审人数之和得到评审总人数为37人。根据题目中相关的约束条件,以平均每位评审人的批阅量的方差和为目标函数,用LINGO11.0计算得到各校评审人名额的分配方案为:分配人数012学校编号1012,2123,30
2、42,51,52,556059,1320,2429,4350,535414针对问题二,由题意可以推测每位评审人每天的评阅量服从正态分布。由此计算置信度为95%的各类论文评审人数,此时得到评审总人数为39人。同问题一相同的方法,用LINGO11.0计算得到各校评审人名额的分配方案为:分配人数012学校编号12,16,2123,2942,44,45,556068,10,11,1315,1720,2428,43,465415,9针对问题三、四,根据已有的条件和问题二已得到的结果,用计算机模拟求解,通过VC+6.0编程,得到部分结果如下:评审编号学校组别最大批卷数总批卷数评审编号学校组别最大批卷数总批
3、卷数11A78782118A696921B77772219B838332A75752320A858542B79792421B797953C85852522C767663D77772623D7575针对问题五,考虑到不同评审人批阅论文的宽严程度的不同,为保证论文分类方案的公平性,用熵权法来计算不同评审人对论文评阅分数的权重,得到每篇论文的综合评价值,以此来作为论文按照优劣等级排序的依据,将排序后的论文编号,按照4%,7%,9%,11%,13%,56%的比例按照排名顺序进行分类。最后,对模型进行改进,用更公平的相对尾数法对评审名额进行分配,用比熵权法更为好的客观赋权法CRITIC法对论文优劣进行分
4、类。关键词:正态分布 熵权法 相对尾数法 CRITIC法1. 问题重述与分析全国大学生数学建模竞赛是目前国内最有影响的一项大学生课外科技活动。2005年有大约26000名学生参与该项竞赛。竞赛采取全国范围内同时分赛区进行。各赛区负责本赛区的竞赛组织工作。竞赛论文是评奖的主要依据。评审分初评、赛区评审、全国统一评审3个阶段。赛区评审的工作量非常大,各赛区都采取了一些积极的措施,以保证评审的公正,并尽可能减少评审工作量。题目中以江苏省赛区的评审方法为例,假设总共有M篇论文,每篇论文至少需要经K名评审人评阅,每个评审人每天可以评阅J篇论文,并且评审工作必须在两天内完成。围绕评审分配方案提出了五个问题
5、,规定近年才参赛的学校不邀请评审人,只做C、D两题的高职高专学校的评审人数不能低于30%,少数历年竞赛成绩优秀的学校可以适当的增加评审人数,但总人数不能超过2个。在上述条件下,对五个问题进行分析。问题一要求确定总评审人数,并给出一个参赛校的评审人数分配方案。根据题目要求和限定条件,将论文按ABCD分为四组,可以按比例来公平地分配每组论文评阅的人数,由此得到总评审人数。设定平均每位评审人的批阅量的方差和为目标函数,考虑到每所学校最多不超过两个人,并且少数历年成绩优秀的学校可以适当增加人数,而高职高专类学校的评审人数不能低于总人数的30%,根据这些约束条件,可用LINGO计算出每个学校的评审人数分
6、配名额。问题二在问题一的基础上,对每位评阅人每天的评阅论文数做了区间限定,这是一个概率事件。根据题目意思,大部分评审人每天批阅的论文数在40篇左右,离40篇越远,概率越小,呈现“中间大,两头小”的现象,与正态分布相似,因此假设每位评阅人每天的批阅论文篇数服从正态分布,由正态分布的原理可以计算得到该正态分布的标准差。根据问题一的的已知条件和约束条件来对评审人员的名额进行分配。问题三要求本校的评审人不得评审本校的论文,用VC+6.0编程,在编程时将问题的对象分为两类:试卷(940)与评审人员(39),分别将试卷编号1940,再将评审人员编号139。考虑他们之间的分配问题,在分配时综合考虑评审人员的
7、工作量、阅卷类型、学校等相关的限制条件,满足评审人员不得评审本校论文的要求。通过编程求解得出最后的分组方案。问题四在问题三的基础上要求评审人的评审任务尽可能少,由于在前面确定总人数的时候已经考虑到每位评审人员的平均评审任务量,也就是说不同组的评审人员平均每人分配到的任务量是相近的。所以分配是在同一组中进行,也就是说只有是在相同组的评审人员任务量才可以调整,不同组的不能进行相互调整。我们将任务量相对较多的评审人员的任务分配少许给那些任务量少的评审人员,从而使得同一组中的每一位评审人员任务量尽可能接近,也就是方差最小。问题五要求给出一个合理的处理方案,将论文按4%,7%,9%,11%,13%,56
8、%的比例从好到差分类。考虑到不同评审人对论文的评分宽严程度的不同,会造成成绩的误差,不能真实反映论文的优劣好坏。假设所有的评卷老师所分配到的试卷的质量是相同的,即每位评卷老师所评试卷都与整个母体(即所有试卷)服从相同的分布,也就是说每位老师所评试卷中都有一定量的好试卷和一定量的差试卷。则每位评卷老师所评试卷的均值和方差都不相同。均值的差异体现两位教师的评卷习惯(或倾向),方差的差异体现两位教师的评卷离散度。单独考察一个评卷老师,他所给出的所有试卷的分数,只能代表每份试卷在他心目中的地位,或者说是他所改的试卷在他心中的一个排序,体现在分数上只表示两份试卷的差异性。那么不同的老师给出同样的分,对标
9、准总分的贡献度是不相同的。单独考察一份试卷,分别由不同的老师给分,如果把某个或某些改卷老师换成善于给高分(即均值较大)的老师来改,那么他的绝对分数就会升高,相反,如果换成善于给低份的老师来改,那么他的绝对分数就会下降。对于直接去掉最高分和最低分的做法,虽然最高分和最低分不排除有一定的个人感情色彩,但是同时也包含着阅卷人对试卷的一些态度。最高分,说明阅卷人看到了该试卷的一些值得肯定的方面;最低分说明阅卷人看到了该试卷的一些不可忽视的弱点。当然,也许这些因素可能并不是主要的方面,但是如果直接去掉这些因素,在一定程度上也是不科学的。要体现方案的合理性和公平性,需要考虑两个方面:第一,尽力去掉或减少评
10、卷老师不同带来的成绩的差异和干扰;第二,尽力去掉或减少同一份试卷高分和低分的个人情绪干扰。因此采取熵权法可以解决上面的两个问题。2. 符号说明表2.1 评审分配名额的基本符号说明符号描述参赛的总论文数(篇),也即参赛的总队伍数每篇论文经过评阅的评阅人数(人)学校总数(个)每个评阅人每天能够评阅的论文数(篇)评审人总数(人)评阅论文的总天数(天)每个学校的编号,且第个学校的参赛队数(队)第个学校分配到的评审人数第个评审人每天的评阅量,A组论文的数量(篇)B组论文的数量(篇)C组论文的数量(篇)D组论文的数量(篇)评审A组论文的评审人数(人)评审B组论文的评审人数(人)评审C组论文的评审人数(人)
11、评审D组论文的评审人数(人)0-1变量,表示第个评审人只能批阅第类论文,表示ABCD四类论文第个学校的第个评审人批阅第类论文的数量第篇论文的第个评审人的评阅分数第个评审人的评阅分数的信息熵第个评审人的评阅分数的客观权重第篇论文的评阅分数的综合评价值3. 基本假设1) 假设参赛学校的成绩具有代表性,能够作为今年评审人分配的依据;2) 假设每个评审人只评阅ABCD中的一类论文;3) 每个评审人之间相互独立,互不影响;4) 存在一个客观标准,可以根据它衡量任意两份论文的优劣。可以用一个绝对名次或分数来描述在此标准衡量下的论文质量。这是任何一种排序算法的基础;5) 每个评审人的都有一定的评阅能力,且对
12、同一篇论文的评分基本上保持一致;6) 评审人在评阅论文时,不受个人的喜好影响,做到公平公正,保证论文成绩的真实性和合理性;7) 假设少数优秀学校的评审人名额可以有两个,普通学校最多为一个,而今年刚参加比赛的学校不提供名额;8) 本校的老师不能评阅本校参赛队的论文;9) 假设所有的评卷老师所分配到的试卷的质量是相同的,即每位评卷老师所评试卷都与整个母体(即所有试卷)服从相同的分布,也就是说每位老师所评试卷中都有一定量的好试卷和一定量的差试卷。4. 模型建立4.1 问题一根据所给数据,并结合实际情况,考虑到影响公平性的因素有参赛学校的成绩和参赛队伍的规模,则以A题为例所需要的评审人数为(4.1.1
13、)同理,可以得到相应的B、C、D题的评审人数。因此,参加评审的总人数为(4.1.2)根据题目中的约束条件:每个学校至多2位评审人;近年才参赛的学校不邀请评审人;少数历年竞赛优秀的学校可以适当增加评审人数;已知 ,则有(4.1.3)解得;得到相应的目标函数及其约束条件如下:(4.1.4)(4.1.5)4.2 问题二根据上面的问题分析,假设每位评审人的评阅量服从正态分布,根据概率统计中的原理,即若特征值X服从正态分布,那么在范围内包含了99.73%的特征值,可以得到的值。又根据实际情况和正态分布的对称性,可以得到的值。由此得到每位评审人的评阅量所服从的正态分布。以A组论文为例,计算A组论文的评审人
14、数量。根据概率统计相关知识,若相互独立,是常数,则,即相互独立的服从正态分布的随机变量的线性组合仍服从正态分布。由于每篇论文至少要经过K位评审人评阅,且要在D天内改完所有的论文,已知A组论文数为篇,则一天批阅A论文的篇数至少为篇,即:(4.1.6)由于,且它们互相独立,则 。将其化为标准正态分布,得到(4.1.7)取适当的分位点,并且令(4.1.8)有上式可以解得的下限值。再令(4.1.9)可以得到的上限值。由此可以得出A类论文在置信度为95%时的评审人数的置信区间为。4.3 问题三、四对于问题三在安排时考虑采用计算机模拟来得到一种分配方案,在编程时将问题的对象分为两类:试卷(940)与评审人
15、员(39),分别将试卷编号1940,再将评审人员编号139。考虑他们之间的分配问题,在分配时综合考虑评审人员的工作量、阅卷类型、学校等相关的限制条件,满足评审人员不得评审本校论文的要求。对于问题四,由于计算机模拟是随机的,因此有的专家评审的任务量非常少,有的却非常大。为了满足各评审人员的任务尽可能少这一要求,需要进行适当的试卷分配调整。由于在前面确定总人数的时候已经考虑到每位评审人员的平均评审任务量,也就是说不同组的评审人员平均每人分配到的任务量是相近的。所以分配是在同一组中进行,也就是说只有是在相同组的评审人员任务量才可以调整,不同组的不能进行相互调整。我们将任务量相对较多的评审人员的任务分
16、配少许给那些任务量少的评审人员,从而使得同一组中的每一位评审人员任务量尽可能接近,也就是方差最小。调整的时候也是满足第三问中的要求:评审人员不得评审本校论文。在实际编程时考虑如下的流程:YNN对每份试卷进行遍历对于940份中的第i份对每位老师进行遍历对于39位中的第j位此老师所在学校与试卷冲突此老师已达到最大阅卷量此老师已分配阅卷组别此老师安排批阅该类试卷此老师工作量加一NY两者组别相同遍历下一份试卷39位老师遍历完毕遍历下一位老师此老师工作量加一分配该老师批阅该试卷分配该老师批阅该试卷Y4.4 问题四根据假设,每位评审人只批阅一类论文,则有=0或1。由已知条件和问题二的结论得到第类论文总批阅
17、量为(4.1.10)其中,(4.1.11)根据已知条件和问题二求得的结果,得到批阅第类论文的平均每个评审人批阅论文的数量为(4.1.12)要使得评审人的任务尽量少,则应满足:(4.1.13)在上述目标函数和约束条件下,通过LINGO11.0运算得到的值。根据已得到的分配结果,在满足本校评审人不能批阅本校的论文的条件下,对评审人进行再次分配,并得出每位评审人的批阅论文数量。4.5 问题五通过上面问题分析中对问题五的分析,要实现方案的合理性和公平性,考虑两个原则:第一,消除或减少评卷老师不同所带来的论文成绩的差异和干扰;第二,消除或减少同一份试卷高分和低分的个人情绪干扰。为将论文按4%,7%,9%
18、,11%,13%,56%的比例从好到差公平合理地分类,对A、B、C、D四类论文分别按论文的优劣来排序。为合理地将论文排序,采用熵权法来计算评价论文优劣指标的权重。首先对第篇论文的第个评审人的评阅分数进行标准化:(4.1.14)其中。越大,说明评阅分数越高。设第个评审人的评阅分数的信息熵为,根据熵权法的相关原理得到该信息熵的计算公式为(4.1.15)其中,(4.1.16)如果,定义(4.1.17)利用熵来计算出第个评审人的评阅分数的客观权重为:(4.1.18)利用公式(4.1.15)和(4.1.18)可以得出第篇论文的评阅分数的综合评价值:(4.1.19)根据综合评价值来对论文按照优劣等级排序,
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 竞赛 论文 评审 公平 分配
