竞赛论文评审的公平分配.doc

上传人：精***

文档编号：1162213

上传时间：2024-12-30

格式：DOC

页数：20

大小：724KB

《竞赛论文评审的公平分配.doc》由会员分享，可在线阅读，更多相关《竞赛论文评审的公平分配.doc（20页珍藏版）》请在沃文网上搜索。

1、竞赛论文评审的公平分配摘要全国大学生数学建模竞赛是目前国内最有影响的一项大学生课外科技活动。公正的评奖必然要在公正的评审下实现。本文针对江苏赛区的评审方法，在尽量保证评审的合理性和公平性，并尽可能减少评审工作量的条件下，提出了评审人员的分配方案和批阅论文的数量分配方案。针对问题一，将论文按题型分为ABCD四组，假设每位评审人只评审一类论文，按比例来计算各类论文的评审人数，再由批阅各类论文的评审人数之和得到评审总人数为37人。根据题目中相关的约束条件，以平均每位评审人的批阅量的方差和为目标函数，用LINGO11.0计算得到各校评审人名额的分配方案为：分配人数012学校编号1012,2123,30

2、42,51,52,556059,1320,2429,4350,535414针对问题二，由题意可以推测每位评审人每天的评阅量服从正态分布。由此计算置信度为95%的各类论文评审人数，此时得到评审总人数为39人。同问题一相同的方法，用LINGO11.0计算得到各校评审人名额的分配方案为：分配人数012学校编号12,16,2123,2942,44,45,556068,10,11,1315,1720,2428,43,465415,9针对问题三、四，根据已有的条件和问题二已得到的结果，用计算机模拟求解，通过VC+6.0编程，得到部分结果如下：评审编号学校组别最大批卷数总批卷数评审编号学校组别最大批卷数总批

3、卷数11A78782118A696921B77772219B838332A75752320A858542B79792421B797953C85852522C767663D77772623D7575针对问题五，考虑到不同评审人批阅论文的宽严程度的不同，为保证论文分类方案的公平性，用熵权法来计算不同评审人对论文评阅分数的权重，得到每篇论文的综合评价值，以此来作为论文按照优劣等级排序的依据，将排序后的论文编号，按照4%，7%，9%，11%，13%，56%的比例按照排名顺序进行分类。最后，对模型进行改进，用更公平的相对尾数法对评审名额进行分配，用比熵权法更为好的客观赋权法CRITIC法对论文优劣进行分

4、类。关键词：正态分布熵权法相对尾数法 CRITIC法1. 问题重述与分析全国大学生数学建模竞赛是目前国内最有影响的一项大学生课外科技活动。2005年有大约26000名学生参与该项竞赛。竞赛采取全国范围内同时分赛区进行。各赛区负责本赛区的竞赛组织工作。竞赛论文是评奖的主要依据。评审分初评、赛区评审、全国统一评审3个阶段。赛区评审的工作量非常大，各赛区都采取了一些积极的措施，以保证评审的公正，并尽可能减少评审工作量。题目中以江苏省赛区的评审方法为例，假设总共有M篇论文，每篇论文至少需要经K名评审人评阅，每个评审人每天可以评阅J篇论文，并且评审工作必须在两天内完成。围绕评审分配方案提出了五个问题

5、，规定近年才参赛的学校不邀请评审人，只做C、D两题的高职高专学校的评审人数不能低于30%，少数历年竞赛成绩优秀的学校可以适当的增加评审人数，但总人数不能超过2个。在上述条件下，对五个问题进行分析。问题一要求确定总评审人数，并给出一个参赛校的评审人数分配方案。根据题目要求和限定条件，将论文按ABCD分为四组，可以按比例来公平地分配每组论文评阅的人数，由此得到总评审人数。设定平均每位评审人的批阅量的方差和为目标函数，考虑到每所学校最多不超过两个人，并且少数历年成绩优秀的学校可以适当增加人数，而高职高专类学校的评审人数不能低于总人数的30%，根据这些约束条件，可用LINGO计算出每个学校的评审人数分

6、配名额。问题二在问题一的基础上，对每位评阅人每天的评阅论文数做了区间限定，这是一个概率事件。根据题目意思，大部分评审人每天批阅的论文数在40篇左右，离40篇越远，概率越小，呈现“中间大，两头小”的现象，与正态分布相似，因此假设每位评阅人每天的批阅论文篇数服从正态分布，由正态分布的原理可以计算得到该正态分布的标准差。根据问题一的的已知条件和约束条件来对评审人员的名额进行分配。问题三要求本校的评审人不得评审本校的论文，用VC+6.0编程，在编程时将问题的对象分为两类：试卷（940）与评审人员（39），分别将试卷编号1940，再将评审人员编号139。考虑他们之间的分配问题，在分配时综合考虑评审人员的

7、工作量、阅卷类型、学校等相关的限制条件，满足评审人员不得评审本校论文的要求。通过编程求解得出最后的分组方案。问题四在问题三的基础上要求评审人的评审任务尽可能少，由于在前面确定总人数的时候已经考虑到每位评审人员的平均评审任务量，也就是说不同组的评审人员平均每人分配到的任务量是相近的。所以分配是在同一组中进行，也就是说只有是在相同组的评审人员任务量才可以调整，不同组的不能进行相互调整。我们将任务量相对较多的评审人员的任务分配少许给那些任务量少的评审人员，从而使得同一组中的每一位评审人员任务量尽可能接近，也就是方差最小。问题五要求给出一个合理的处理方案，将论文按4%，7%，9%，11%，13%，56

8、%的比例从好到差分类。考虑到不同评审人对论文的评分宽严程度的不同，会造成成绩的误差，不能真实反映论文的优劣好坏。假设所有的评卷老师所分配到的试卷的质量是相同的，即每位评卷老师所评试卷都与整个母体（即所有试卷）服从相同的分布，也就是说每位老师所评试卷中都有一定量的好试卷和一定量的差试卷。则每位评卷老师所评试卷的均值和方差都不相同。均值的差异体现两位教师的评卷习惯（或倾向），方差的差异体现两位教师的评卷离散度。单独考察一个评卷老师，他所给出的所有试卷的分数，只能代表每份试卷在他心目中的地位，或者说是他所改的试卷在他心中的一个排序，体现在分数上只表示两份试卷的差异性。那么不同的老师给出同样的分，对标

9、准总分的贡献度是不相同的。单独考察一份试卷，分别由不同的老师给分，如果把某个或某些改卷老师换成善于给高分（即均值较大）的老师来改，那么他的绝对分数就会升高，相反，如果换成善于给低份的老师来改，那么他的绝对分数就会下降。对于直接去掉最高分和最低分的做法，虽然最高分和最低分不排除有一定的个人感情色彩，但是同时也包含着阅卷人对试卷的一些态度。最高分，说明阅卷人看到了该试卷的一些值得肯定的方面；最低分说明阅卷人看到了该试卷的一些不可忽视的弱点。当然，也许这些因素可能并不是主要的方面，但是如果直接去掉这些因素，在一定程度上也是不科学的。要体现方案的合理性和公平性，需要考虑两个方面：第一，尽力去掉或减少评

10、卷老师不同带来的成绩的差异和干扰；第二，尽力去掉或减少同一份试卷高分和低分的个人情绪干扰。因此采取熵权法可以解决上面的两个问题。2. 符号说明表2.1 评审分配名额的基本符号说明符号描述参赛的总论文数（篇），也即参赛的总队伍数每篇论文经过评阅的评阅人数（人）学校总数（个）每个评阅人每天能够评阅的论文数（篇）评审人总数（人）评阅论文的总天数（天）每个学校的编号，且第个学校的参赛队数（队）第个学校分配到的评审人数第个评审人每天的评阅量，A组论文的数量（篇）B组论文的数量（篇）C组论文的数量（篇）D组论文的数量（篇）评审A组论文的评审人数（人）评审B组论文的评审人数（人）评审C组论文的评审人数（人）

11、评审D组论文的评审人数（人）0-1变量，表示第个评审人只能批阅第类论文，表示ABCD四类论文第个学校的第个评审人批阅第类论文的数量第篇论文的第个评审人的评阅分数第个评审人的评阅分数的信息熵第个评审人的评阅分数的客观权重第篇论文的评阅分数的综合评价值3. 基本假设1) 假设参赛学校的成绩具有代表性，能够作为今年评审人分配的依据；2) 假设每个评审人只评阅ABCD中的一类论文；3) 每个评审人之间相互独立，互不影响；4) 存在一个客观标准，可以根据它衡量任意两份论文的优劣。可以用一个绝对名次或分数来描述在此标准衡量下的论文质量。这是任何一种排序算法的基础；5) 每个评审人的都有一定的评阅能力，且对

12、同一篇论文的评分基本上保持一致；6) 评审人在评阅论文时，不受个人的喜好影响，做到公平公正，保证论文成绩的真实性和合理性；7) 假设少数优秀学校的评审人名额可以有两个，普通学校最多为一个，而今年刚参加比赛的学校不提供名额；8) 本校的老师不能评阅本校参赛队的论文；9) 假设所有的评卷老师所分配到的试卷的质量是相同的，即每位评卷老师所评试卷都与整个母体（即所有试卷）服从相同的分布，也就是说每位老师所评试卷中都有一定量的好试卷和一定量的差试卷。4. 模型建立4.1 问题一根据所给数据，并结合实际情况，考虑到影响公平性的因素有参赛学校的成绩和参赛队伍的规模，则以A题为例所需要的评审人数为（4.1.1

13、）同理，可以得到相应的B、C、D题的评审人数。因此，参加评审的总人数为（4.1.2）根据题目中的约束条件：每个学校至多2位评审人；近年才参赛的学校不邀请评审人；少数历年竞赛优秀的学校可以适当增加评审人数；已知 ,则有（4.1.3）解得；得到相应的目标函数及其约束条件如下：（4.1.4）（4.1.5）4.2 问题二根据上面的问题分析，假设每位评审人的评阅量服从正态分布，根据概率统计中的原理，即若特征值X服从正态分布，那么在范围内包含了99.73%的特征值，可以得到的值。又根据实际情况和正态分布的对称性，可以得到的值。由此得到每位评审人的评阅量所服从的正态分布。以A组论文为例，计算A组论文的评审人

14、数量。根据概率统计相关知识，若相互独立，是常数，则，即相互独立的服从正态分布的随机变量的线性组合仍服从正态分布。由于每篇论文至少要经过K位评审人评阅，且要在D天内改完所有的论文，已知A组论文数为篇，则一天批阅A论文的篇数至少为篇，即:（4.1.6）由于，且它们互相独立，则。将其化为标准正态分布，得到（4.1.7）取适当的分位点，并且令（4.1.8）有上式可以解得的下限值。再令（4.1.9）可以得到的上限值。由此可以得出A类论文在置信度为95%时的评审人数的置信区间为。4.3 问题三、四对于问题三在安排时考虑采用计算机模拟来得到一种分配方案，在编程时将问题的对象分为两类：试卷（940）与评审人

15、员（39），分别将试卷编号1940，再将评审人员编号139。考虑他们之间的分配问题，在分配时综合考虑评审人员的工作量、阅卷类型、学校等相关的限制条件，满足评审人员不得评审本校论文的要求。对于问题四，由于计算机模拟是随机的，因此有的专家评审的任务量非常少，有的却非常大。为了满足各评审人员的任务尽可能少这一要求，需要进行适当的试卷分配调整。由于在前面确定总人数的时候已经考虑到每位评审人员的平均评审任务量，也就是说不同组的评审人员平均每人分配到的任务量是相近的。所以分配是在同一组中进行，也就是说只有是在相同组的评审人员任务量才可以调整，不同组的不能进行相互调整。我们将任务量相对较多的评审人员的任务分

16、配少许给那些任务量少的评审人员，从而使得同一组中的每一位评审人员任务量尽可能接近，也就是方差最小。调整的时候也是满足第三问中的要求：评审人员不得评审本校论文。在实际编程时考虑如下的流程：YNN对每份试卷进行遍历对于940份中的第i份对每位老师进行遍历对于39位中的第j位此老师所在学校与试卷冲突此老师已达到最大阅卷量此老师已分配阅卷组别此老师安排批阅该类试卷此老师工作量加一NY两者组别相同遍历下一份试卷39位老师遍历完毕遍历下一位老师此老师工作量加一分配该老师批阅该试卷分配该老师批阅该试卷Y4.4 问题四根据假设，每位评审人只批阅一类论文，则有=0或1。由已知条件和问题二的结论得到第类论文总批阅

17、量为（4.1.10）其中，（4.1.11）根据已知条件和问题二求得的结果，得到批阅第类论文的平均每个评审人批阅论文的数量为（4.1.12）要使得评审人的任务尽量少，则应满足：（4.1.13）在上述目标函数和约束条件下，通过LINGO11.0运算得到的值。根据已得到的分配结果，在满足本校评审人不能批阅本校的论文的条件下，对评审人进行再次分配，并得出每位评审人的批阅论文数量。4.5 问题五通过上面问题分析中对问题五的分析，要实现方案的合理性和公平性，考虑两个原则：第一，消除或减少评卷老师不同所带来的论文成绩的差异和干扰；第二，消除或减少同一份试卷高分和低分的个人情绪干扰。为将论文按4%，7%，9%

18、，11%，13%，56%的比例从好到差公平合理地分类，对A、B、C、D四类论文分别按论文的优劣来排序。为合理地将论文排序，采用熵权法来计算评价论文优劣指标的权重。首先对第篇论文的第个评审人的评阅分数进行标准化：（4.1.14）其中。越大，说明评阅分数越高。设第个评审人的评阅分数的信息熵为，根据熵权法的相关原理得到该信息熵的计算公式为（4.1.15）其中，（4.1.16）如果，定义（4.1.17）利用熵来计算出第个评审人的评阅分数的客观权重为：（4.1.18）利用公式（4.1.15）和（4.1.18）可以得出第篇论文的评阅分数的综合评价值：（4.1.19）根据综合评价值来对论文按照优劣等级排序，

19、越大，排名越靠前。将排序后的论文编号，按照4%，7%，9%，11%，13%，56%的比例按照排名顺序进行分类。5. 模型求解5.1 问题一5.1.1 求解总评审人数首先对训练1.xls中的数据进行初步处理，得到表4.1如下：表5.1 江苏赛区各院校竞赛情况总结表论文类型篇数学校类型各类学校数量A341本科类中历年竞赛成绩优秀6B319本科类中历年竞赛成绩良好34C143高职高专类20D138近年刚参赛6参赛论文总数940参赛学校总数60参赛队伍总数 940个根据表中数据和已知条件：，得到各类论文的评审人数如表5.2所示：表5.2 各类论文的评审人数论文类型论文数量（篇）评审人数（人）A3411

20、3B31912C1436D1386因此，参加评审的总人数为（人）。5.1.2 公平合理分配方案的提出根据高职高专类学校评审人员数不低于30%的要求进行名额分配，本科类学校25人，高职高专类学校12人。又根据已列出的目标函数和约束条件，经过LINGO11.0的运算，将所得结果整理得到表4.3：表5.3 时各大院校分配到的评审人名额学校编号参赛队数分配人数学校编号参赛队数分配人数110923112026123216034023316043323416052813511062213617071813716081813815092413915010150401401114041120121304212

21、01319143101149144101151014510116171461011710147101181014812119101491312010150121211505111022150521102315053101249154912591556026915660271015760288158802910159803011060505.2 问题二5.2.1 求解评审总人数由于大多数人的评阅速度为每天40篇左右，且，根据正态分布的对称性，可以得到，又根据概率统计中的原理，得到，即。所以每位评审人的评阅量服从正态分布。取上侧分位点，代入式（4.1.8）和（4.1.9）得到各类论文在置信度为95

22、%时的评审人数的置信区间如表5.4表5.4 各类论文在置信度为95%时的评审人数的置信区间论文类型每天共需评阅数第一题中的结果置信区间A511.512.7912.22，13.39B478.511.9611.41，12.54C2135.334.96，5.72D2075.184.82，5.56根据上表数据，可以发现第一中的结果都包含在置信区间内，这是必然的结果。由于在题目中未指出需要的最少评审人员数，所以取置信区间的上限，得到总的评审人员数为（人）。5.2.2 公平合理分配方案的提出根据高职高专类学校评审人员数不低于30%的要求进行名额分配，本科类学校27人，高职高专类12人。又根据问题一中已列出

23、的目标函数和约束条件，经过LINGO11.0的运算，将所得结果整理得到表5.5：表5.5 时各大院校分配到的评审人名额学校编号参赛队数分配人数学校编号参赛队数分配人数1109231120261232160340233160433234160528235110622136170718137160818138150924239150101514014011141411201213042120131914310114914410015101451001617046101171014710118101481211910149131201015012121150511112215052111231505

24、3101249154912591556026915660271015760288158802910059803011060505.3 问题三、四通过LINGO11.0运算得到结果整理如表5.6：表5.6 每位评审人的批阅量、批阅题型及所属学校评审编号学校组别最大批卷数总批卷数评审编号学校组别最大批卷数总批卷数11A78782118A696921B77772219B838332A75752320A858542B79792421B797953C85852522C767663D77772623D757574C69692732A747485D92922833A767696A79792934B86861

25、07B82823036A7878118A83833137B8686129B84843238C82821310A79793346D77771411B79793447A84841512A79793548B69701613C77773649A11801714D72723750D21741815B82823851无0771916A73733952C31862017B7171通过VC+6.0编程，得到部分结果整理如表5.7：表5.7 评审人信息（部分）试卷编号学校组别评审人员1评审人员2评审人员31501A3132351921B41424931011C57251021091D68261101442A11

26、5271451702B214241711773A115271783A128271791903A115281912003B214242012043C716252052103D817262112234A115282242434B218292442535A115282542575A315282582595A319282602715A218292722776A3 19282892856B218296. 模型评价与改进6.1 模型评价1、该模型在一定程度上既保证了评审的公正，又减少了评审工作量，提高了评审工作的效率。但是此方法不能满足公平性的两个理想原则，达不到最大公平限度。2、能借助一些简单的软件较快

27、地得到评审人数分配方案，但是由于数据输入量大，造成计算不简便。3、利用熵权法来确定三位评委所打分数的权重，可以很大程度上去掉或减少评卷老师不同带来的成绩差异和干扰以及同一份试卷高分和低分的个人情绪的干扰，能较好地体现评分的公正性和合理性。6.2 模型改进6.2.1 对评审人分配方案公平性的改进对于分配方案的公平性，除了比例惯例法，Q值法，新Q值法等常用方法，还有最大概率法，最大熵法，0-1规划法，遗传算法等等。根据公平性的理想化原则，提出相对尾数法5，可以很好地满足公平性分配的两个理想化原则。设有个部门, 每个部门的人数分别为, , 总人数, 待分配的席位为m , 理想化的席位分配结果, 满足

28、，记，（6.2.1）显然, 若全为整数时, 应有，当不全为整数时, 需要确定同时满足下列公理的公平分配方案：公理1.，即取或, 其中,，表示x 的整数部分。公理2. , 即总席位增加时,各个部门的席位数不会减少。定义: 设总人数为，总席位数为, 第个部门的人数为, 令，（6.2.2）称其为对第个部门的绝对不公平值. 令, （6.2.3）称其为对第个部门的相对不公平值, 或称为相对尾数。由于人口数是整数, 为使分配公平, 需所有的越小越好, 所以公平的分配方案应该是最大的达到最小, 亦即所有的达到最小。为方便起见, 首先考虑只有两个部门的情况, 并且, 和不全是整数(实际上, 它们同为整数或小数

29、)。记, 即为的小数部分。若将总席位数增加为时, 对应的记为, 记为。定理满足公理1、2 的分配方案为:若, 且，则取 (即“比例加惯例的方法)。若, 则取若, 则取, 一般地, 对个部门, 设不全为零, 且, 则当时, 将剩余的个席位分配给第一至第个部门；当时, 个席位分配给第一至第个部门及较大的一个部门。该模型在评审人数分配、分组、阅卷方案及最后的评分处理上都保证了公平性原则，且有效地减少了评审工作量，不仅适用于数学建模竞赛的评审，还适用于其它各种竞赛以及考试的阅卷评审工作。6.2.2 对论文分类方案的公平性的改进解决具有多个指标的有限决策方案的排序问题，除了熵权法，还有CRITIC法。其

30、基本思路是确定指标的客观权数以两个基本概念为基础。一是对比强度，它表示了同一个指标各个评价方案之间取值差距的大小，以标准差的形式来表现，即标准化差的大小表明了在同一个指标内各方案取值差距的大小，标准差越大各方案之间取值差距越大。二是评价指标之间的冲突性，指标之间具有较强的正相关，说明两个指标冲突性较低。第个指标与其他指标的冲突性的量化指标为，其中评价指标就是以对比强度和冲突性来综合衡量的。设表示第个指标所包含的信息量，则可表示为（6.2.4）越大，第个指标所包含的信息量越大，该指标的性对重要性也就越大，所以第个指标的客观权重应为;（6.2.5）通过题目中所提供的数据可求出评价指标之间的相关系数

31、，从而得到相关系数矩阵R。最后计算综合性评价值为（6.2.6）根据综合评价值来对论文按照优劣等级排序，越大，排名越靠前。将排序后的论文编号，按照4%，7%，9%，11%，13%，56%的比例按照排名顺序进行分类。由于CRITIC法不仅考虑了指标变异大小对权重的影响，还考虑了各种指标之间的冲突性，因此可以说，CRITIC法是一种比熵权法更为好的客观赋权法。7. 参考文献1 赵洋,阮小军多指标席位分配模型的研究科技广场，2008：15-17.2 杨国武席位的公平分配数学模型, 武汉交通科技大学学报,1999.23(3):318-321.3 徐春艳公正合理的评分方式, 长春师范学院学报(自然

32、科学版),2005.24(5):145-147.4 王昆, 宋海洲三种客观权重赋权法的比较分析, 技术经济与管理研究,2003.6:48-49.5 王秀莲席位分配问题的相对尾数法数学的实践与认识,2007.37(9):81-848. 附录8.1 评审总人数为37人时的分配方案的LINGO11.0运行结果Local optimal solution found. Objective value: 0.2100000E+62 Objective bound: 0.1000000E+31 Infeasibilities: 0.000000 Extended solver steps: 34 T

33、otal solver iterations: 4107Variable Value Reduced CostX1 2.000000 -1643.098X2 2.000000 -187.5331X3 2.000000 87.02691X4 2.000000 129.5473X5 1.000000 -204.3223X6 1.000000 103.4587X7 1.000000 228.6485X8 1.000000 228.6485X9 1.000000 16.86375X10 0.000000 -0.4499993E+21X11 0.000000 -0.3919993E+21X12 0.00

34、0000 -0.3379994E+21X13 1.000000 203.3510X14 1.000000 276.3247X15 1.000000 287.0274X16 1.000000 249.9459X17 1.000000 287.0274X18 1.000000 287.0274X19 1.000000 287.0274X20 1.000000 287.0274X21 0.000000 -0.4499993E+21X22 0.000000 -0.4499993E+21X23 0.000000 -0.4499993E+21X24 1.000000 276.3247X25 1.00000

35、0 276.3247X26 1.000000 276.3247X27 1.000000 287.0274X28 1.000000 261.6220X29 1.000000 287.0274X30 0.000000 -0.2419995E+21X31 0.000000 -0.2879994E+21X32 0.000000 -0.5119992E+21X33 0.000000 -0.5119992E+21X34 0.000000 -0.5119992E+21X35 0.000000 -0.2419995E+21X36 0.000000 -0.5779992E+21X37 0.000000 -0.5

36、119992E+21X38 0.000000 -0.4499993E+21X39 0.000000 -0.4499993E+21X40 0.000000 -0.3919993E+21X41 0.000000 -0.2879994E+21X42 0.000000 -0.2879994E+21X43 1.000000 287.0274X44 1.000000 287.0274X45 1.000000 287.0274X46 1.000000 287.0274X47 1.000000 287.0274X48 1.000000 296.4327X49 1.000000 295.1354X50 1.000000 296.4327X51 0.000000 -0.2419995E+21X52 0.000000 -0.2419995E+21X53 1.000000 287.0274X54 1.000000 276.32478.2评审总人数为39人时的分配方案的LINGO11.0运行结果Local optimal solution found. Objective value: 0.2100000E+62 Objective bound:

下载提示：本站仅提供存储空间/不修改/不编辑