深度原创|深度原创 | 一文讲清楚成绩分析指标

成绩分析指标及其系统应用 摘要 考试是对学生学习状况进行检验的有效手段。对考试成绩进行统计分析,可以帮助教师找出教学及命题中的不足,更好地改进教学。总结常用的成绩分析指标,利用这些指标构建一个在线成绩分析系统,并给出系统应用的一个具体实例。实验结果表明,这些指标能够较好地对考试效果进行评价。
关键词 成绩分析;指标;在线成绩分析系统
考试是考查学生知识和能力的重要手段。为了充分发挥考试的功能,使考试真正为提高教育质量服务,如何对考试进行评价甚为关键。统计分析是对统计资料采用科学的定量和定性的分析或评价,作出科学的结论,达到对事物本质和规律的认识。将学生成绩的评价体系建立在统计分析理论基础上,运用统计分析指标对考试结果予以评价和监控,能有效地找出教学及考试中的不足,并及时进行改进。
结语 运用统计分析对学生成绩进行科学、严谨的评价,可以得到丰富的教学信息,同时为从总体上把握考试质量提供了理论依据。成绩分析系统的应用,改进了命题水平,大大提高了教学质量。
成绩分析指标 1.难度(P) 难度是反应试题或考试难易程度的重要指标。
难度反应了考生对试题核查考试是否适应。试题太难或太易都无法反映考生的实际水平。试题太难,所有考生都做不出来;试题太容易,所有考生得分都差不多。
比如:中考、高考的难度以适中为宜。中考试题难度以0.30~0.80为佳,整卷难度以0.6~0.70为佳。高考试题难度以0.30~0.70为佳,整卷难度以0.5~0.60为佳。
难度:题目的难易程度。
它反映了考生对试题和考试是否适应,试题太难或太易都无法反映考生的实际水平。难度值在0至1之间。P>0.8试题太易;P<0.2时,试题太难。一份试卷应该由不同难度按一定比例组成。一般地说,P>0.8 、P<0.2的试题各占10%;P=0.2~0.4,和P=0.6~0.8的试题各占20%;P>0.4、P<0.6的中等难度试题应占60%。整套试卷平均难度在0.4~0.6之间。
①预估难度:命题者对试题的预测难度。
②实际难度:考试后,根据实测数据,运用相关公式算出来的难度。
实际难度计算公式为:P=X/M

X:为试题平均得分 M:为试题满分
难度的计算
  • 客观题一般以答对某题的人数(R)与总人数(N)之比,P = R/N或者P = X/M
  • 主观题以某题考生所得分数的平均数(X)与该题满分(M)之比,P = X/M
一般认为P<0.4O为难题,0.4<=P<=0.7较为合适,P>0.7为容易题
序号 难度系数 备注
1 P<0.4 难题
2 0.4<=P<=0.7 较为合适
3 P>0.7 容易题
2.区分度(D) 区分度是指试卷对学生实际水平的区分程度或鉴别能力。区分度高的试卷能对不同知识水平和能力的学生加以区分,使能力高的学生得高分,能力低的学生得低分;区分度低的试卷则不能对学生的能力进行很好的鉴别,使水平高和水平低的学生得分相差不大或没有规律可循。区分度可用极端分组法计算,首先把考生试卷总分由高到低排序,取前27%的学生作为高分组,取后27%的学生作为低分组,分别计算高分组学生的平均分和低分组学生的平均分,设试卷满分为W,则试卷区分度,D值在0~1之间。一般认为,D≥0.4的试题区分度为“优秀”;0.3≤D<0.4的试题区分度为“良好”;0.2≤D<0.3的试题区分度为“可以”;D<0.2的试题区分度为“较差”。
序号 区分度(D) 试题评价
1 0.4以上 非常优良
2 0.30—0.39 良好,如能改进更好
3 0.20—0.29 尚可,用时需做改进
4 0.19以下 劣,必须淘汰或改进以提高区分度
区分度的大小与试题的难度大小有关,一般情况下,难度适中的试题,会具有比较良好的区分度。
比如:中考、高考一般要求试题的区分度在0.30以上,这表示高分组考生比低分组考生能多得30%的分数。
区分度越高,越能把不同水平的受测者区分开来,该道题目被采用的价值也就越大。因而当题目的难度为中等时,区分度最高。
试题难度系数在一定的范围内,而且有相对高的区分度时,试题就被认为是质量好的试题,试题的质量是由该试题的难度和区分度共同构成的。
难度系数范围 区分度范围 评价
0.6-0.9 >0.40 理想试题
0.4-0.6 >0.40 较理想考题
>0.9 0.20-0.40 容易试题,仍有区分性试题
<0.4 >0.40 较难试题,但仍有区分性试题
0.4-0.9 <0.20 有问题试题,需要修改
<0.4 <0.20 应淘汰试题
区分度是试题对考生实际水平的区分程度,它是作为评价试卷质量,筛选试题的主要指标与依据。
通常用D表示,取值在-1.00和1.00之间,D值越大,试题的区分能力越强。
当D为正值时,说明试题是积极区分,即高分组通过率高,低分组通过率低.
D为负值时,说明试题是消极区分,高分组通过率低,低分组通过率高。
D为0时,试题无区分作用
区分度的计算
  • 客观试题区分度的计算:按考试成绩由高到低排序,成绩最高的前27%的考生为高分组,最低的后27%为低分组。PH、PL分别为试题高分组和低分组考生的难度值,D= PH-PL或者区分度D=(27%高分组的平均分-27%低分组的平均分)/满分值
  • 主观题题区分度的计算:按考试成绩由高到低排序,成绩最高的前27%的考生为高分组,最低的后27%为低分组。XH表示接受测验的高分段学生的总得分数,XL表示接受测验的低分段学生的总得分数,N为考生总人数的25%,H表示该题的最高得分,L表示该题的最低得分。D=(XH-XL)/(N(H-L)),注:H-L可能存在相减存在0的情况,导致除数为0*;
-- eg: SELECT ROUND((2040-0)/(738*(6-0)),2) AS D FROM DUAL-- 0.46 SELECT ROUND((2040-0)/(2952*(6-0)),2) AS D FROM DUAL-- 0.12

  • 整个试卷的区分度,是所有试题区分度的平均值。
3.信度(α) 考试信度分析:一个高质量的试卷必须保证测验的结果可靠,即测试的信度。它是反映测验分数稳定性和可靠性的指标,表明一个测试反映受试者稳定水平的程度。
信度是反应考试一致性或可靠性的指标。
信度高,表示考试成绩较为准确,误差较小;信度低,表明误差大。
信度低的考试无法正确评价考生的知识水平与智能素质。
比如:中考、高考一般要求客观题的信度在0.9以上,主观题的信度在0.7以上,全卷的信度在0.8以上。
信度:即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。信度高,表示测量较为准确,测量误差较小;信度低,表明测量误差较大。信度低的考试无法正确评价考生的知识水平与智能素质。中考一般要求全卷的信度在0.8以上。
从另一方面来说,信度是反应考试(或测量)可靠性或准确性的指标,试题中题目的区分度,各题满分值差异,题目间异质性都会影响信度。
序号 α信度系数 解释
1 ≥0.90 信度很好,达到了最好的标准化考试的水平
2 0.80-0.90 对学校测试而言,已经是非常好了
3 0.7-0.80 对学校测试而言,大部分试题都很好;可能又少数试题需要改进
4 0.60-0.70 信度偏低,需要补充其他考试以确定分数或等弟。部分试题可能需要改进
5 0.50-0.60 信度低。建议对试题进行修改,除非试卷的试题量很少(10题或少于10题)
6 <0.50 信度有问题。考试基本无效,需要修改
计算公式:

深度原创|深度原创 | 一文讲清楚成绩分析指标
文章图片
信度计算公式
/** eg: 测量题目数 29 题目分数的方差求和 65.23 测验总分的方有效期 457.26 */ SELECT ROUND((29 /( 29 -1 ))* (1 - 65.23 /457.26),2) 信度 FROM DUAL

举例而言,对于“图书馆利用情况及满意度调查问卷”的第一部分第1题,若对同一个人相隔3天,问同一个问题,若第一次回答,被调查者选择A、第二次回答选择C、第三次回答选择D,则说明对于该问题调查结果的信度低,因为调查结果的差异较大。若三次都选择相同的答案或者差异较小的答案,则在排除系统误差的条件下,说明调查结果的信度较高。
4.粗心度(C) 计算公式:
CARELESS = 1 - ROUND(SUM(CASE WHEN ((SCORE/FULL_SCORE) - DIFFICULTY) > 0 THEN 1 ELSE 0 END)/QUESTION_CNT,2)
  • Careless 粗心度
  • Score 每小题得分
  • FullScore 每小题满分
  • Difficulty 每小题难度
  • QuestionCnt 科目试题总数
【深度原创|深度原创 | 一文讲清楚成绩分析指标】解释:按科目分组计算,应该做对的题,你既然做错了,分值越大代表越粗心;
5.S-P表诊断 深度原创|深度原创 | 一文讲清楚成绩分析指标
文章图片
S-P表诊断 深度原创|深度原创 | 一文讲清楚成绩分析指标
文章图片
sp S-P表诊断是一种教学过程精细化管理与评价的工具,它将测试、练习的试题得分数据排成一览表,并对学生和问题的特性以视觉化的图表进行结构分析。其目的在于获得学生的学习诊断信息,并用图形化的分析结果将对学生S和问题P的特性(即学习反应信息)反映出来。S-P表分析与诊断模块除了对团体试题应答倾向的分析之外,还能对每个学生的试题应答倾向作出分析与诊断。S-P表的评价功能包括:
  • 衡量学生总体的学习倾向,评价学生群体学习的总水平,判断学习有无两极分化,了解学生的优势部分和劣势部分等;
  • 评价学生个体的学习情况,如学生中的漏洞及异常,学生在集体中所处的位置等;
  • 评价所出题目的难度、区分度,试卷的稳定性及信度和效度;
  • 从曲线的总体分析,可对教学过程中存在的问题加深认识,有利于改进教学工作。
利用S线、P线的位置与形状等参数,可从不同的侧面对学生学习及试题设计的状况进行分析。
6 四分位分析,箱线图的分析与绘制(Box-plot) 盒图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的。它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。也可以往盒图里面加入平均值(mean)。如下图。下四分位数、中位数、上四分位数组成一个“带有隔间的盒子”。上四分位数到最大值之间建立一条延伸线,这个延伸线成为“胡须(whisker)”。

深度原创|深度原创 | 一文讲清楚成绩分析指标
文章图片
Boxplot
由于现实数据中总是存在各式各样地“脏数据”,也成为“离群点”,于是为了不因这些少数的离群数据导致整体特征的偏移,将这些离群点单独汇出,而盒图中的胡须的两级修改成最小观测值与最大观测值。这里有个经验,就是最大(最小)观测值设置为与四分位数值间距离为1.5个IQR(中间四分位数极差)。
箱形图的价值
通过盒图,在分析数据的时候,盒图能够有效地帮助我们识别数据的特征:
  • 直观地识别数据集中的异常值(查看离群点)。
  • 判断数据集的数据离散程度和偏向(观察盒子的长度,上下隔间的形状,以及胡须的长度)。
箱线图一般被用作显示数据分散情况。具体是计算一组数据的中位数、25%分位数、75%分位数、上边界、下边界,来将数据从大到小排列,直观展示数据整体的分布情况。

深度原创|深度原创 | 一文讲清楚成绩分析指标
文章图片
箱线图 Box-plot
大部分正常数据在箱体中,上下边界之外的就是异常数据了。
上下边界的计算公式是:
UpperLimit=Q3+1.5IQR=75%分位数+(75%分位数-25%分位数)*1.5 LowerLimit=Q1-1.5IQR=25%分位数-(75%分位数-25%分位数)*1.5

参数说明:
  • 1.Q1表示下四分位数,即25%分位数;Q3为上四分位数,即75%分位数;IQR表示上下四分位差,系数1.5是一种经过大量分析和经验积累起来的标准,一般情况下不做调整。
  • 2.分位数的参数可根据具体预警结果调整:25%和75%,是比较灵敏的条件,在这种条件下,多达25%的数据可以变得任意远而不会很大地扰动四分位。具体业务中可结合拟合结果自行调整为其他分位。
计算过程:
-- 箱线图 /*850, 740, 900, 1070, 930, 850, 950, 980, 980, 880, 1000, 980, 930, 650, 760, 810, 1000, 1000, 960, 960 880, 880, 880, 860, 720, 720, 620, 860, 970, 950, 880, 910, 850, 870, 840, 840, 850, 840, 840, 840 系数1.5是一种经过大量分析和经验积累起来的标准,一般情况下不做调整 */ SELECT L.* ,Q3+1.5*(Q3-Q1) AS UPPER_LIMIT-- 上边界 ,Q1-1.5*(Q3-Q1) AS LOWER_LIMIT-- 下边界 ,Q3-Q1 AS IQR-- IQR表示上下四分位差 FROM ( SELECT /*SUM(CASE WHEN UP_NUMBER = ROUND(CNT*1/4,0) THEN T.SCORE ELSE 0 END) OVER()Q1-- 第一四分位数 ,SUM(CASE WHEN UP_NUMBER = ROUND(CNT*3/4,0) THEN T.SCORE ELSE 0 END) OVER()Q3-- 第三四分位数*/ MEDIAN(SCORE) OVER() MEDIAN-- 中位数 ,PERCENTILE_CONT(0.25) WITHIN GROUP(ORDER BY SCORE ASC) OVER() Q1 -- 第一四分位数 ,PERCENTILE_CONT(0.75) WITHIN GROUP(ORDER BY SCORE ASC) OVER() Q3 -- 第三四分位数 ,MAX(T.SCORE) OVER() MAX_SCORE ,MIN(T.SCORE) OVER() MIN_SCORE /*,SUM(CASE WHEN UP_NUMBER = ROUND(CNT*3/4,0) THEN T.SCORE ELSE 0 END) OVER() - SUM(CASE WHEN UP_NUMBER = ROUND(CNT*1/4,0) THEN T.SCORE ELSE 0 END) OVER() IQR-- 四分位距*/ FROM (SELECT M.SCORE ,ROW_NUMBER() OVER(ORDER BY M.SCORE ASC) UP_NUMBER ,COUNT(1) OVER() CNT FROM ( SELECT 880 AS SCORE FROM DUAL UNION ALL SELECT 880FROM DUAL UNION ALL SELECT 880FROM DUAL UNION ALL SELECT 860FROM DUAL UNION ALL SELECT 720FROM DUAL UNION ALL SELECT 720FROM DUAL UNION ALL SELECT 620FROM DUAL UNION ALL SELECT 860 FROM DUAL UNION ALL SELECT 970FROM DUAL UNION ALL SELECT 950FROM DUAL UNION ALL SELECT 880FROM DUAL UNION ALL SELECT 910FROM DUAL UNION ALL SELECT 850FROM DUAL UNION ALL SELECT 870FROM DUAL UNION ALL SELECT 840FROM DUAL UNION ALL SELECT 840FROM DUAL UNION ALL SELECT 850FROM DUAL UNION ALL SELECT 840FROM DUAL UNION ALL SELECT 840FROM DUAL UNION ALL SELECT 840FROM DUAL ) M ) T ) L/*SELECT * FROM ( SELECT 880 AS SCORE FROM DUAL UNION ALL SELECT 880FROM DUAL UNION ALL SELECT 880FROM DUAL UNION ALL SELECT 860FROM DUAL UNION ALL SELECT 720FROM DUAL UNION ALL SELECT 720FROM DUAL UNION ALL SELECT 620FROM DUAL UNION ALL SELECT 860 FROM DUAL UNION ALL SELECT 970FROM DUAL UNION ALL SELECT 950FROM DUAL UNION ALL SELECT 880FROM DUAL UNION ALL SELECT 910FROM DUAL UNION ALL SELECT 850FROM DUAL UNION ALL SELECT 870FROM DUAL UNION ALL SELECT 840FROM DUAL UNION ALL SELECT 840FROM DUAL UNION ALL SELECT 850FROM DUAL UNION ALL SELECT 840FROM DUAL UNION ALL SELECT 840FROM DUAL UNION ALL SELECT 840FROM DUAL ) M WHEREM.SCORE < 780 OR M.SCORE > 940*/

7 上线率统计
针对总分,也是针对某个组织机构;
设置类型,默认为2 ,1 实际分数 2 百分比,建议统一设置为2百分比;
涉及到的统计数据项有实考人数、试卷总分、上线的百分比(如上线1百分比、上线2百分比、上线3百分比)、上线人数(如上线1人数、上线2人数、上线3人数);
按教育局、学校、班级进行分类统计;
8 分数段统计
分数段统计分为单科分数段统计和总分分数段统计,采用分值描述;
分为默认分数段,如单科10分/段,总分100分/段,以及自定义分数段;一般采用>=起分数,<止分数;0分段单独列出;
统计项一般统计人数和人数占比;
9 试卷分析
试卷按科目进行分析
试卷概况分析,数据项有:试卷满分、平均分、考试人数、难度、难度系数、区分度、信度、最高分、最低分;
主客观题分析,数据项有:题目类型、本题满分、满分人数、零分人数、平均分、得分率、难度、难度系数、区分度、信度;
题目知识点分析:题目名称、知识点、分值、平均分、得分率;
10 临界生管理
一般默认的临界点分数为:总分*60%=临界点分数,也可以自己输入临界点分数;上下浮动的范围默认为10;
列出的数据项包括:学籍号、姓名、班级、总分、百分等级;

    推荐阅读