教学测量与评价.ppt

上传人:牧羊曲112 文档编号:5269222 上传时间:2023-06-20 格式:PPT 页数:66 大小:477.50KB
返回 下载 相关 举报
教学测量与评价.ppt_第1页
第1页 / 共66页
教学测量与评价.ppt_第2页
第2页 / 共66页
教学测量与评价.ppt_第3页
第3页 / 共66页
教学测量与评价.ppt_第4页
第4页 / 共66页
教学测量与评价.ppt_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《教学测量与评价.ppt》由会员分享,可在线阅读,更多相关《教学测量与评价.ppt(66页珍藏版)》请在三一办公上搜索。

1、教学测量与评价,第一讲教学测量与评价的含义与作用,一、什么是教学测量二、什么是教学评价三、教学测量与评价与关系四、教学测量与评价的作用,一、教学测量,1.含义教学测量(instructional measurement)是考核教学成效的一种方法。这是借助于一定的手段与方式,对学生的学习成绩(简称学绩)进行探察,并以一定的数量来表示的考核办法。,2.在教学测量中应注意什么(1)教学测量的目的在于考核教学成效,也就是考察教学目标的完成情况。因此,教学测量的目标应以教学目标为依据,测量目标应与教学目标一致,而不能偏离教学目标。,教学目标的例子:掌握水势概念、根系吸水的动力和叶片散失水分的原理;了解水

2、分在生命活动中的作用(植物生理学,水分生理)。本章要求学生掌握食用菌菌丝体和子实体的形态结构;掌握食用菌的生活史(食用菌栽培,食用菌的形态与生活史)。,三维目标,1.知识与技能:即每门学科的基本知识和基本技能。2.过程与方法:即让学生了解学科知识形成的过程、“亲历”探究知识的过程;学会发现问题、思考问题、解决问题的方法,学会学习,形成创新精神和实践能力等。3.情感、态度和价值观:即让学生形成积极的学习态度、健康向上的人生态度,具有科学精神和正确的世界观、人生观、价值观,成为有社会责任感和使命感的社会公民等。(人体生命活动的调节,第四节 激素调节),1识记:这是最低等级的认知目标,它指对具体事物

3、和普遍原理的回忆,对方法和过程的回忆,或者对一种模式、结构或框架的回忆。比如对专业术语,对日期、事件、人物、地点,对处理具体事物的方式方法,对各种理论等等的记忆。2理解:这是低层次的理解,以一种语言或一种交流形式被译述或转化成另一种语言或另一种交流形式时的严谨性和准确性为依据,对材料进行初步的重新整理与排列,指出材料包含的意义和趋势。因此理解包括三个心理过程:转译、解释和推断。,3运用:指在某些特定的和具体的情景里使用抽象概念只是对所学知识的初步运用,而非综合的、创造性的运用。这些抽象概念可能是以一般的观念、程序的规则或概括化的方法等形式表现出来的,也可能是那些必须记住的和能够运用的专门性的原

4、理、观念和理论。4分析:指将材料分解成各种组成要素或组成成分,弄清各种观念的有关层次,或者明确所表达的各种观念之间的关系,阐明材料各要素的组织原理即对材料内容组合起来的组织、系统和结构的分析。,5综合:指对各种要素或组成成分加工,形成新的结构整体或新的模式;制定出合理的工作计划或操作步骤;确定一套抽象关系,用以对特定的资料或现象进行分类或解释;或者从一套基本命题或符号表达式中演绎出各种命题关系。6评价:这是认知领域教育目标的最高层次,是指为了特定目的对材料和方法的价值及符合准则的程度作出定量的和定性的判断。准则既可以是内在证据,如逻辑上准确性、一致性等,也可以是外部准则,如相应领域的最高标准等

5、。评价是认知能力的最高水平,是认知行为和情感行为的主要结合点和过渡桥梁。,识 记,理 解,运 用,分 析,综 合,评 价,二、教学评价,1.含义教学评价(instructional evaluation)就是依据教学目标,对学绩测验所得测量结果进行分析及解释。它主要包含以下两个方面的工作。(1)教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。,评价(估)的功能为家长提供信息为选拔提供信息为学生提供信息为教师提供信息为学校(间)提供信息,评价必须要注意的:公平,公正,标准一致,标准清晰如何评价(估)形

6、成性评估和终极性评估常模参照评估与标准参照评估,三、教学测量与评价的关系,区别:教学测量是对学绩测验所得结果的客观描述(将结果予以数量化),并不考虑结果的实际意义,而教学评价则是对学绩测验所得结果的主观判断(对结果进行分析解释),以了解结果的实际意义。联系:(1)教学评价是一种主观判断,但是这种主观判断必须以教学测量所得的客观描述为依据(2)教学测量也不能脱离教学评价。教学测量只是对学绩测验结果的客观描述,只有通过教学评价,才能判断这种客观描述的实际意义,四、教学测量与评价的功能,1.反馈调节功能对教师对学生2.激励动机功能 对学生对教师,第二节 中学生物学测量的命题,一、设计双向细目表,教师

7、可以根据测验目的及教学目标的需求,以教学目标为横轴,而以教材内容为纵轴,画出一个二维度的分类表,且平均分配好试题比重或题数于表中的每个细目里,并尽量使试题的取材能够充分涵盖所要评价的教学目标和教材内容的范围,以作为编拟成就测验试题的设计蓝图,这样的一个二维度分类表便叫做双向细目表(two-way specification table)。典型的双向细目表,如所示。,高中生物上学期成就测验的双向细目表,教师在设计双向细目表时必须注意:第一,命题的范围在教学过的教材内容范围之内 第二,双向细目表边缘小格中的数字,不可以为零,也就是说,双向细目表中列出的教材内容或教学目标不能没有适当的试题。第三,教

8、师可以针对自己的命题及评分的习惯,选定双向细目表中所陈述的测验题型,变化或增减所预拟的试题题数或分值。,二、选定测验的题型,试题的类型可以分成两大类:选择型试题(客观题)可分为:选择题;是非题;配合题;填空题;解释性习题等。填充型试题(主观题)可分为:简答题;限制反应题;论述题等。,1在下列情况下,以使用主观型试题来评价为宜,(1)拟评价学生的创意、组织和综合科学知识或语文表达等比较复杂的成就;(2)拟评测学生对某些科学知识的意见或态度;(3)拟评测学生分析、应用或评价整体科学概念的能力;(4)受试人数不多而且试题拟只使用一次或有充足时间阅卷而无足够时间命题:(5)教师个人在评阅答案时,能明确

9、制订统一的评分标准。,2在下列情况下,以使用客观型试题来评价为宜,(1)试题拟重复使用而且受试者人数众多;(2)要求测验结果具有较高信度;(3)评价结果必须尽可能公平、公正;(4)有充足时间命题,而缺乏足够时间阅卷;(5)教师个人在评阅答案时,无法把握明确而统一的标准。,3下列情况则两类试题均可达到预期目标,(1)评价学生的各方面学习成就;(2)考验学生是否了解并能运用科学原理、学说、定律;(3)考验学生应用科学知识以解决问题的能力;(4)考验学生的批判性思维能力:(5)考验学生记忆和运用科学知识的能力;(6)考验学生分析和综合科学知识的能力。,二、编拟测验试题,(一)编拟试题的一般原则 1试

10、题取材均匀,并具有教材内容的代表性。2试题的叙述应力求简明扼要,题意明确。3各个试题宜彼此独立,互不牵涉,并避免含有暗示答案的线索。4试题宜有公认的正确答案或相对较佳的答案。5试题中某些错误,虽不影响答案的选择,也应当避免。6凡具有争议性的试题,应该注明命题参考资料的来源。,7若要测量学生的高层次认知能力,则试题不一定要有固定答案。8试题的叙述应重新组织,避免直接抄课文或原来教材。9试题应重视重要概念或原理原则的了解与应用,要避免偏难琐碎及零碎知识的记忆。10避免使用与测验无关的叙述,增加作答困难。11命题不要超过单元教学的评价目标。12提早命题,以预留时间进行试题审查或修正。13命题数量尽量

11、多一些,作为备用试题。,第三节试卷分析指标及其解读,一、考试与试卷分析二、试卷分析方法三、定量分析的主要指标四、定量分析结果的解读五、综合分析规范,一 考试与试卷分析,(1)常模参照性考试:考试的目的主要是在于考查被试者的个体差异,一般用于衡量被试者的相对水平。只有将被试者的得分放到考试所在的团体中,从而直接或间接地以被试者在该团体中的相对等级或相对位置来评估被试者的能力水平。,1.1考试的分类,(2)目标参照性考试:也叫标准参照考试,强调的是被试者对考试目标和内容的掌握程度。因而能反映出被试者的绝对水平及在知识掌握上的强点和弱点,并能对被试者在参照标准上的表现做出解释。,1.2 课程考试,课

12、程考试是评估学生学习成绩,检验教师教学和学生学习效果的主要形式,是教学过程中不可或缺的环节。课程考试目的:对学生学习状况和相关知识掌握程度,教师教学计划的完成程度及效果进行检查;对学生的学业水平、能力做出判断、区分和解释。,1.3 试卷分析,试卷分析:是指对学生考试成绩、试卷信度、效度,试题的难度、区分度,考试命题、试卷编制、阅卷评分等内容进行定量和定性分析,以评价考试质量、反思教与学效果的活动。试卷分析是教师教学活动的重要环节,也是教研室的基本工作之一。,1.4 试卷分析的目的,评价考试质量,检验考试的可靠性、有效性。通过对考试的信度、效度、试题的难度、区分度等方面作分析,可以判断此次考试的

13、质量。只有有效的、可靠的考试,才能作为评价教学质量或衡量学生学习情况的依据。,改进考试工作,提高试题和试卷编制质量。通过对试卷一系列指数的分析,能为我们进一步修改试题、编制试卷提供依据,提高编制试卷的技能、技巧,使测验更趋科学;获取教与学效果的反馈信息。对试卷的深入分析,能反馈大量的信息,及时发现教与学中存在的问题,便于采取有针对性的措施或建议,改进教学。,二 试卷分析方法,2.1 定量分析方法,是指通过对试卷和考试成绩的数理统计分析,得出有关试卷的成绩分布、平均分、标准差、试题难度、试题区分度、考试信度、考试效度等数据特征,用以说明试卷命题质量、教师教学和学生学习效果的分析方法。,综合分析是

14、指在定量分析数据结果的基础上,结合考试的具体情况,进行归纳、分析、综合、概括,从而得出具有普遍意义的结论的分析方法。如结合定量分析数据结果对不同专业考生具体差异,考生在学习中普遍存在的问题,教学中的薄弱环节等进行分析。另外,对试卷命题质量中比如题目表述是否科学、文字表述是否正确以及阅卷情况等直接进行定性分析。,2.2 定性分析(综合分析),2.3 完整的试卷分析应是定量分析和综合分析相结合从教育测量学理论角度看,定量分析的数据是不完全客观的数据,由此产生的定量分析的结果需要通过综合分析来加以判断和解释。综合分析是试卷分析的主体,定量分析只能为综合分析提供辅助的参考依据。脱离定量分析过程的综合分

15、析是片面的,没有综合分析的定量分析是教条的。,三 定量分析的主要指标,(1)成绩频数分布统计表:以5或10分为一个分数段,统计每个分数段包含的学生数,组成成绩的频数分布统计表。,3.1 成绩分布统计,(2)成绩频数分布图:将该统计表各分数段的中值和该组学生数对应点依次制成条形图,形成中间高两边低的成绩频数分布图。,(3)成绩分布曲线图:,(1)正态分布:以平均值为中心,左右两侧频数分布基本对称,靠近均数两侧的频数较多,而距均数两侧较远时,频数逐渐减少。,3.2 成绩分布曲线图分类,高分或低分考生数量较少,中间部分数量较多,且其分档情况在成绩解释上比较合理。说明测试结果与学生的实际情况一致,各种

16、难度的题目比例合理。,(2)正偏态分布:说明试题难度偏高,难度较大的题目比例偏大,或是教与学效果较差。呈这种分布的试题有利于将成绩优秀的学生和中等程度的学生区别开,但不利于将中等程度的学生和成绩较差的学生区别开。,(3)负偏态分布:说明试题难度偏低,难度较低的题目比例偏大,或者教与学的效果较好。呈这种分布的试题有利于将成绩较差的学生和中等程度的学生区别开,但不利于将中等程度的学生和成绩优秀的学生区别开。,一套质量较高的试题,理想的考试成绩分布曲线图应该是呈正态分布。课程考试作为一种目标参照性考试,学生成绩呈正态或近似正态分布,都是正常、合理的。,3.3 标准差和极值,标准差:描述一组分数离散情

17、况的最常用、最可靠的统计量。考试成绩的标准差用来判断考试分数的集中程度。标准差理想控制范围在7-10;,极值:指考试出现的最高分数和最低分数,极值既是数据完整性的体现,又是数据的关键观察点;课程考试不应出现0或满分的成绩,0分属于异常数据,出现多个满分则提示较难考题数量严重不足。,3.4 试题难度(P),试题难度(P)是指能够正确回答试题的人数和参加考试的总人数之比,即指某题的通过率和正答率。试题难度系数与试题实际难易程度正好相反。计算公式:P=平均分满分值 一般认为,难度指数P在0.30.7之间为合适,低于0.3太难,高于0.7太易,0.5左右最好。,关于难度的几个问题:难度水平的确定是为了

18、筛选题目。平时测验难度要利于学生的学习,但一定的难度能增加区分度,这对全面了解、掌握学生学习情况有十分重要的作用。难度水平的确定要考虑及格率,防止损伤学困生的自尊心。难度水平的确定要考虑对分数分布的影响,一般以偏正态分布为前提,有时偏正态分布更能激发学生的学习积极性。,3.5 试题区分度(D),区分度(D)是指试题区分考生能力的程度,它基于一个假设:即高能考生比低能考生更有可能正确回答试题。区分度的取值在-1.01.0之间,D值越大,试题的区分能力越强。D0时,为积极区分;D0时,为消极区分;D=0时,无区分能力。,先将分数排序,P1=27高分组的难度,P2=27低分组的难度,区分度D=(27

19、高分组的平均分27低分组的平均分)满分值。,效度是指试卷的有效性和准确性程度,它反映的是考试测量到的与所要测量的二者之间的符合程度。课程考试主要考虑内容效度。即指选取的具有代表性的样本组成的考试内容是否能够恰当地代表教学内容(教学目标)总体。,3.6 试卷的效度,对课程考试而言,试卷效度是决定考试质量的重要因素。但目前还没有一种切实可行的统计方法可以用来合理地计算试题取样的恰当程度。目前对效度的评价,大多是由专家或经验丰富的教师依据考试大纲与考试命题的双向细目表对每道试题进行比较分析来作出估计。,3.7 试卷的信度,信度是指试卷的稳定性和可靠性程度。将同一份试卷,对同一组参加考试者进行反复测验

20、,所得结果一致,那么这份试卷就具有很高的信度。信度系数的计算方法有多种,如稳定性信度系数、等值性信度系数、内部一致性信度系数。学校试卷分析软件采用的是克伦巴赫(Cronbach)系数法。教育测量学理论认为,对于测验专业理论与能力的试卷,其信度应在0.90以上,信度在0.70以下的试卷不宜采用。,四 定量分析结果的解读,4.1 成绩分布,偏离正态分布有两种情况,一是试题难度普遍较大,考生得分普遍较低,使得低分端出现高峰,呈正偏态分布;二是试题难度普遍较小,考生得分普遍较高,使高分端出现高峰,呈负偏态分布。当考试分数分布呈明显偏态时,可通过改变试题难度的比例加以调整,使之大体上呈正态分布。,4.2

21、 试题难度,非正常影响因素试题质量:超纲,偏题,怪题,有错误,选项迷惑性太差或太强;教学有遗漏,或者对重点强调不够;学生不努力,或者对知识点掌握不够;学生作弊,4.3 试题区分度,研究证明,难度系数P越接近0.5,区分度越好;当难度系数P介于0.40.6或0.30.7之问时,区分度较为理想;而当难度系数p0.7时,区分度较差。要把学生的能力、水平进行最大程度的区分,试题难度值的分布也应以正态为好。试卷中试题难(P0.3):中等(0.3P0.7):易(0.7P)的比例为10:70:20较合适;,4.4 试题区分度低的几种原因试题本身质量差,命题不妥,用词不当,不符合命题技术;(45.5)试题本身

22、很好,教师在教学中存在漏洞,影响学生答题;(20.3)试题本身很好,教师教学方面也没有问题,而是学生自身的原因,如学习不努力,没有掌握好教学内容等原因。(34.2),4.5 考试信度偏低的几种原因,题量偏少,试卷覆盖面小,考试不足以反映学生对知识的掌握情况;试题太难或者太容易,导致优生和差生都不能或者都能正确回答;试题区分度太差,不足以区分不同水平的学生;学生作弊、考试评卷给分尺度不一。,五 试卷综合分析,5.1 命题质量分析,(1)试卷内容是否覆盖教学大纲主要知识点;各试题考核的知识点是否与教学目标相一致;试题考核的内容是否是本学科的重点内容;(2)试卷的题型、题量是否合适,是否有考核学生综

23、合运用知识能力的综合性题目;(3)试卷语言表述是否准确,题意是否明确,有无错误或容易产生误解和争议的内容;(4)试卷设计是否科学、规范。名词术语、计量单位、图表格式是否规范。,5.2 学生掌握情况分析,(1)从学生成绩和定量分析结果看,学生对本课程知识如基本概念、基本原理、基本技能掌握情况以及综合应用所学知识分析、解决问题的能力如何?(2)分析学生失分较多和较少的题目,找出原因;,5.3 总结与建议,(1)根据上述分析总结考试命题、教师教学和学生学习中存在的问题与不足,分析其原因;(2)对今后改进课程教学和考试命题提出改进措施,对学生学习提出建议;,课后作业,对2014-2015学年第二学期的环境生物学试卷进行分析。1、绘出成绩分布图2、计算难度和区分度3、对考试情况进行定性分析每人写一份试卷分析发到,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号