生活中的统计

您当前的位置: 首页 > 生活中的统计

不留情面的“两刀”——消除极端值的影响

时间:2015-09-18

  

 

  体操、跳水等体育比赛和戏剧、歌曲等文艺评比中,当一个选手动作完成或表演完毕后,先由受聘评委逐个亮分。然后采用“去掉一个最高分,去掉一个最低分”,再计算每个选手的平均得分。这种做法已为国内外很多赛事广泛采用。基于各自的观赏点,遇此情景观众中不免有唏嘘声。有的为砍掉最高分惋惜,有的为砍掉最低分庆幸。那么要问,这种评分方法依据何在?是否科学?

 

  我们来分析一下。假定一次比赛有9个评委,9个评委给每个参赛选手所打分数,表现为一组数据。现在,我们就用9个评委给每个参赛选手所打分数的平均值作为这组数据的代表,来评价选手的成绩。这样做有时会出现什么问题呢?

 

  如果9个评委给甲选手的打分是:

 

  897879777675817974

 

  计算得平均分为:78.67

 

  给乙选手的打分是:

 

  908081797876848250

 

  计算得平均分为77.78

 

  从平均分数上看,甲选手得分高于乙选手。进一步分析这两个选手的得分会发现,除评委9为甲打的分数高于乙以外,其余评委为甲打的分数都比乙低,显然这样的比赛结果难以令人信服。什么会出现这种情况呢?因为平均值的大小与一组数据里的每个数据都有关系,其中任何数据的变动都会引起平均值的变动。如果数据中出现一两个极端数据,那么平均值对于这组数据所起的代表作用就会削弱。这里评委9给选手乙的打分远远低于其他评委,影响了平均值的代表性。评委9给选手乙所打的50分,远离其他人的打分,我们称这个数据值为异常值或离群值。为了防止评委因为个人偏见而给出过高或者过低分数,人们想出了上述“去掉一个最高分,去掉一个最低分”的评分方法。这样可以避免异常值造成的影响。这种将少数异常值去掉后计算的均值也叫截尾均值。如果去掉最高分和最低分,我们来算一算,甲、乙两位选手的平均得分分别是多少?容易计算得:甲选手的平均分是77.86,乙选手的平均分是80。这样比赛结果就是乙选手成绩优于甲选手。显然这个结果比较公正。

 

  截尾均值由于去掉了数据中影响数据稳定性的异常值,从而具有较好的稳健性。如果没有出现反常情况,去掉最高、最低分对平均分的影响是不大的。综合上述分析,我们知道:赛事组织者不讲情面的做法,是为了减少异常值对评分的影响,从而获得较为公正地反映选手水平的平均指标。