我的教学测量与评价ppt课件.pptx

上传人:牧羊曲112 文档编号:1417364 上传时间:2022-11-21 格式:PPTX 页数:196 大小:2.97MB
返回 下载 相关 举报
我的教学测量与评价ppt课件.pptx_第1页
第1页 / 共196页
我的教学测量与评价ppt课件.pptx_第2页
第2页 / 共196页
我的教学测量与评价ppt课件.pptx_第3页
第3页 / 共196页
我的教学测量与评价ppt课件.pptx_第4页
第4页 / 共196页
我的教学测量与评价ppt课件.pptx_第5页
第5页 / 共196页
点击查看更多>>
资源描述

《我的教学测量与评价ppt课件.pptx》由会员分享,可在线阅读,更多相关《我的教学测量与评价ppt课件.pptx(196页珍藏版)》请在三一办公上搜索。

1、第一讲教学测量与评价的含义与作用,一、什么是教学测量二、什么是教学评价三、教学测量与评价与关系四、教学测量与评价的作用,一、教学测量,1.含义教学测量(instructional measurement)是考核教学成效的一种方法。这是借助于一定的手段与方式,对学生的学习成绩(简称学绩)进行探察,并以一定的数量来表示的考核办法。 2.在教学测量中应注意什么?,2. 在教学测量中应注意什么(1)教学测量的目的在于考核教学成效,也就是考察教学目标的完成情况。因此,教学测量的目标应以教学目标为依据,测量目标应与教学目标一致,而不能偏离教学目标 教学目标,有时也称为行为目标,是指对学生在一段时间教学后应

2、该掌握的技能与概念的陈述。,教学目标的例子:学生能够有3分钟做对100道除法题。学生至少能够说出5个唐代的皇帝。学生能够写一篇文章,对凡高和高更的艺术风格进行比较。识记,理解,运用情感目标,知识目标、,(2)教学测量的对象是学生内在的能力与品德等的形成状况,它不可能像物理测量那样直接进行,只能借助于一定的手段与方式间接进行。,(3)教学成效是通过量化的学绩进行考察的。也就是说,教学成效是以学生的学习成绩为直接考察依据的,而学绩是以一定的数量来表示的,因此命题的合理性与评分的客观性是有效教学测量的一个重要影响因素,二、教学评价,1.含义教学评价(instructional evaluation)

3、就是依据教学目标,对学绩测验所得测量结果进行分析及解释。它主要包含以下两个方面的工作。(1)教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。 (2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。,评价(估)的功能为家长提供信息为选拔提供信息为学生提供信息为教师提供信息为学校(间)提供信息,评价必须要注意的:公平,公正,标准一致,标准清晰如何评价(估)形成性评估和终极性评估常模参照评估与标准参照评估,三、教学测量与评价的关系,区别:教学测量是对学绩测验所得结果的客观描述(将结果予以数量化),并不考虑结果的实际意义,而教学评价则是对学绩测验所得结果的主观

4、判断(对结果进行分析解释),以了解结果的实际意义。 联系:(1)教学评价是一种主观判断,但是这种主观判断必须以教学测量所得的客观描述为依据 (2)教学测量也不能脱离教学评价 。教学测量只是对学绩测验结果的客观描述,只有通过教学评价,才能判断这种客观描述的实际意义,四、教学测量与评价的功能,1. 反馈调节功能对教师对学生2.激励动机功能 对学生对教师,第二讲 有效教学测验的基本要求,一、测验的信度二、测验的效度三、项目的难度与区分度,一、测验的信度,1.定义信度指的是测量结果的稳定性程度2.信度的作用信度是衡量一个量表质量高低的重要指标。信度不高的量表是不能使用的。,3.常见的信度种类(1)重测

5、信度(2)复本信度(3)分半信度(4)同质信度(内部一致性信度)(5)评分者信度,重测信度是指用同一个对同一组被试施测两次所得的结果的一致程度。公采用皮尔逊积差相关。(http:/www.chinadoctor.org/doctor/news/technology/1399.htm)重测信度的使用前提条件:所测量的心理特性心理必须是稳定的遗忘和练习的效果基本是是相互抵消的在前后两次的施测间隔期内,被试在所要测查的心理特质没有获得更多的学习和训练,例一,用一个算术四则的速度测验12个小学生,得分记为X,为了考察测量结果的可靠性,于3个月后再测一次,得分记为Y,问测验结果是否可靠?学生序号 1 2

6、 3 4 5 6 7 8 9 10 11 12X 20 20 21 22 23 23 232425262627Y 20 21 21 20 23 23 252526262729,复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度。其值为同一批被试在两个复本测验上所得分数的积差相关。复本信度的前提是构造出两份或两份以上的真正平行的测验(即A、B卷),分半信度是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的的一致性的程度。(也称内部一致性程度)分半信度的前提是只能施测一次或没有复本的情况下使用。,例三,对初中一年级学生进行地理成绩测验,每答对1题得1分,答错1题得0分,其测验结

7、果如下表,试估计该测验的折半信度?学生序号 题 序 1 2 3 4 5 61 1 0 0 0 0 02 0 0 0 1 0 03 1 0 1 0 0 04 1 1 0 0 1 05 1 0 0 1 0 06 1 1 1 0 1 17 1 1 1 1 0 18 1 1 0 1 1 09 0 1 1 0 0 110 1 1 1 1 1 1,评分者信度是指多个评分者给同一批人的答卷进行评分的一致性的程度。用肯德尔和谐系数进行估计。影响信度的因素被试主试者施测情境测量工具,提高测量信度的常用方法适当增加测验的长度新增的项目必须同质,新增的数量必须适度使用测验中所有试题的难度接近正态分布,并控制在中等水

8、平。主试严格执行操作规程,评分者严格按标准给分。实测场地按测验手册的要求进行布置,减少无关因素干扰,二、测验的效度,1.含义测验的效度指的是测量的正确性和有效性,即它能够测出所要测量的心理特质与行为特征的程度。换言之,效度指测验能在多大程度上达到测量目的。 2.效度的类型,2.效度的类型 内容效度、构想效度、实证效度(1)内容效度内容效度指测验题目对有关内容或行为范围取样的适当性,也就是测验所选的项目是否符合所要测量的东西,其代表性是否适当。(2)内容效度的确定方法(3)内容效度的统计方法,(2)内容效度的确定方法内容效度的确定方法主要是逻辑分析法,其工作思路是请有关专家对测验题目与原定内容的

9、吻合程度。其具体步骤是:明确欲测的内容的范围,包括知识与能力要求两个方面。确定每个题目所测内容,并与双向细目表对照。,制定评定量表,考察题目对所测内容的覆盖率,判断题目难度与能力要求之间的差异,还要考察各种题目数量与分数的比例以及题目形式对内容的适当性,对整个测验的有效性作出总的评价。,(3)内容效度的统计方法从同一个教学内容总体抽取两套独立的平行测验,用这个测验来测同一批被试,求其相关。例1还有一种是再测。这种方法操作过程:在被试学习某种知识之前作一次测验(如学习电学之前考电学知识),在学过该知识后再作赋闲的测验。这时,若后测成绩显著优于前测。例1,例一,在物理某一单元教学之前,对学生进行有

10、关这一单元内容的测验。教学之后,再以复本测验施测,两次测验分数如下,试检定测验的内容效度?(学生序号 1 2 3 4 5 6 7 8 9 10教学前X 34 40 32 30 31 35 44 33 42 36教学后Y 52 64 50 54 58 63 72 62 62 50,结论,然后根据自由度df=N-1=9,查t值表,寻得0.01显著性水平t的双侧临界值为t(9)0.01=4.781,而实际计算出的t=13.974.781=t(9)0.01,于是可以说,教学前后学生在两个复本测验上得分的平均数有极显著性差异,从而可以作出判断,物理中该单元测验的内容具有有效性,或内容效度较高。,内容效度

11、应用,内容效度主要应用于成就测验、学科测验、选拔和分类职业测验。内容效度不适合用于能力倾向和人格测验。,2.构想效度(结构效度)(1)定义构想效度指测验对某种理论的符合程度,其目的在于用相应的理论观点对测验的结果加以解释及探讨。 (2)结构效度的确定步骤提出理论假设,并把这一假设分解成一些细小的纲目依据理论框架,编制出具体题目。用逻辑与实证的方法来验证假设。,(3)结构效度的估计方法测验内部寻找证据:根据某种理论构想所编制的测验如果有内容效度,也就证明了该测验有一定的构想效度。测验之间寻找证据:将测验结果与另一个效度已知的同类测验结果进行相关检验。如果相关高,说明所编制的测验具有一定构想效度考

12、察测验的预测性:如果用来测量某一理论构想的测验可以有效地预测某一行为,那么可以说该测验具有一定的构想效度,3.实证效度 实证效度又称效标关联效度,指一个测验对处于特定情境中的个体行为进行预测的有效程度。也就是说,一个测验是否有效,应该以实践的效果来作为检验的标准。其中被预测的行为是检验效度的标准,简称效标如高考是否有效,与大学学习成绩,效标不仅随测验的种类不同而不同,而且可能随时间而改变,现在是一个好的成功的效标,将来就不一定是。所以,为某个测验选择一个最有效的效标,这是最重要的事情。教育测验的效标,可采用各学科成绩和教师评定的结果;智力测验的效标,可采用学科成绩、教师评判的结果、学生总成绩、

13、受教育年限、年龄以及其他事物;能力倾向测验的效标,可采用特殊课程或特殊训练的成绩;职业兴趣测验的效标,可采用从业人员实际服务成绩或记录;人格测验的效标,可采用编制者的主观标准,或以被试以后行为或临床资料。,效标关联效度的估计方法,(1)相关法由于测验分数和效标分数这两个变量的类型不同,二者相关系数的计算方法也就不同。A、积差相关法:适用于两个变量为连续变量进行显著性检验:自由度df=N-2,检验的是两个变量,都减去2;置信度取0.05,查相关系数界值表,寻找临界值;结论:r临界值,说明显著相关,效度高;r临界值,说明无相关,效度低。,例二,用一套高中数学成就测验对某校高一10个学生施测,其测验

14、分数X如下,并以这些学生的物理学科考试成绩为效标,试估计高中数学成就测验的效标关联效度系数,且检验数学和物理两成绩变量是否相关?效度如何?自由度为10-2=8,直接查0.05或o.o1的置信区间大还是小。学生序号 1 2 3 4 5 6 7 8 9 10数 学 X 88 80 68 60 96 32 32 64 64 75物 理 Y 94 78 56 48 70 38 62 78 70 82,效标关联效度的估计方法,(2)区分法该方法的思路是:被试接受测验后,让他们工作一段时间,再根据工作成绩好坏分成两组,然后再回过头来分析这两组被试原先接受测验的分数差异,若这两种人的测验分数差异显著,则说明

15、该测验有较高的效度。,练习,1、用一套高中生成就测验对某校高二15个学生施测,其测验得分如下,并以这些学生校内生物学科的期末成绩为效标,试估计高中生物成就测验的效标关联效度?学生序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15测验分数X 42 38 50 40 42 48 39 45 41 43 46 36 54 44 42校内成绩Y 72 66 85 70 78 83 69 82 72 75 77 82 90 84 80,(三)提高测量效度的方法,1、影响测量效度的因素测验的构成(要素)测验实施方面(过程)被试主观状态方面估计效度所依循的效标样本方面,三、难度,难

16、度是指试题的难易程度。一道试题,如果大部分被试都能答对,则该题的难度就小;如果大部分被试都不能答对,则该题的难度就大。一个题目的难度大小,除了所测的内容本身的难易程度有关以外,还与测验的编制技术和被试的知识经验有关,由于学得不清楚或者因被试没学过,一个本来容易的题可能变难。这就是说测验的难度具有相对性,正因为此,必须让试题通过实践来对难度作出检验。,难度的计算,(一)基本公式1、客观题难度的计算(当人数较少时)P=R/N R为答对该试题人数,N为参加测验总人数适用范围:客观题,只有答对与答错两种可能。(即二分)例1:在100个学生中,答对第一题的30人,答对第二题的60人,求第一、二道题的难度

17、?比较这两道题谁比谁难?,2.极端分组法当被试人数较多时,则可以先将被试依照测验总分从高到低排列,分成三组,总分最高的27%的为高分组(NH)总分最低的27%为低分组。分别计算出高分组与低分组的通过率,然后求项目的难度。公式为P=(PH+PL)/2PH为高分组答对该题的百分比;PL为低分组答对该题的百分比。,例:某区域1000人参加考试,试卷第一题高分组180人答对,低分组60人答对,求该题难度?,3.非二分法记分的项目的难度如论述题公式P某题平均得分/该题满分,2、主观题难度的计算,例2:某道论述题满分12分,所有考生在这道题上的平均得分为3.6分,求该题的难度?例3:语文测验第五题满分为1

18、2分,这道题考生的平均得分是8.5分,求该题难度?例4:60人参加考试,某题满分为12分,正确得分累积是480分,求该题难度?例5.某区域1000人参加考试,试卷第一题如果题满分为10分,高分组得分总数为2100分,低分组得分总数为830分,求该题难度?,2、难度的分析与控制,(1)难度分析进行难度分析的主要目的是为了筛选题目。A、测验题目难度水平的确定测验题目难度水平的适当与否,取决于测验的目的、性质和题目的形成。当P值接近于0或接近于1时,即被试在该题上全部答对或全部答错,则该题无法提供个体的信息。而只当P值接近于0.50时,题目才能把被试做最大的程度的区分。但在实际工作中,若每一题的难度

19、值均为0.50,那么此测验很可能只能区分出好与差两种极端被试的差异,却不能对各种被试作更精确的区分。因此,一般各题的难度可在0.50+0.2之间。,B、测验难度对分数分布的影响,测验的难度直接依赖于组成测验的题目的难度,通过考察测验分数的分布,可以对测验的难度做出直观检查。由于多数人的心理特性多数呈正态分布,因此当测验目的在于测量个体差异时,若被试样本具有代表性,则其结果应呈正态分布。测验分数背离正态分布有两种情况:其一是题目难度普遍较大,被试得分普遍较低,使得低分端出现高峰,呈正偏态;其二是题目难度普遍较小,被试的得分普遍较高,使得高分端出现高峰,呈负偏态。,2、难度的控制,一般说来,影响题

20、目难度的主要因素有:考察知识点的多少;考察能力的复杂程度或层次的高低;考生对题目的熟悉态度;命题的技巧。难度控制:正确估计考生水平;弄清弄懂各知识点;掌握命题技巧。,四、区分度,(一)区分度的含义指测验题目对考生实际水平的区分程度或鉴别能力。如一道题,学业水平、实际能力都较高的考生都答对了;而学业水平、实际能力都较低的考生都答错了,则可认为该题目有好的区分度。区分度分析主要以效能为依据,考察考生在每个题目上反应与其在效标上的表现之间的相关程度。区分度(D)的取值范围介于- 1.00+1.00之间,值越大,区分度的效果越佳。区分度D0为正区分,D0为负区分,D=0为零区分,(二)区分度的计算,1

21、、极端分组法(1)客观性试题D=PH-PLPh与pl分别为高分组与低分组在该项目上的通过率例6:有道试题,高分组有70%学生通过,低分组有30%的学生通过;而另一道题,高分组有40%学生通过,低分组有70%学生通过,求两题的各自区分度?例7一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5人,这道题的区分度为多少?,(2)主观题,D=(XH-XL)/N(H-L)XH为高分组得分的总分XL为低分组得分的总分H为该道题的最高分L为该道题的最低分N为应试总人数的27%。,例7,高分组 低分组得分X 人次f 得分X 人次f 5 4 5 0 4 3

22、 4 1 3 2 3 1 2 1 2 3 1 0 1 4 0 0 0 4,2、相关法,点二列相关法(针对是否题)例8:15个学生在数学测验中得分记录如下,计算数学测验中第一题的区分度?学生 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15测验总 65 70 31 49 80 50 35 10 81 69 78 55 77 90 42第一题 0 1 0 1 1 0 1 0 0 1 1 0 1 1 0,二列相关,二列相关适用于连续的测量变量。但其中一个变量因为某种原因被人为分成两类。例如,当一个测验的项目分数是连续的,而效标或测验总分数被分为高、低或及格、不及格两个类别时。例

23、9:已知一测验中某选择题的通过率为0.5,答对者的测验总分平均为76分,答错者的测验总分平均为63分,全体被试20人总分的标准差为16,求该题的区分度?,(三)提高区分度的方法,1、使题目的难度适中,使整个考试难度适中题目的难度适中可使区分度达到最大值,因此,使难度适中是提高区分度的重要方法。2、着重考察复杂的学习结果使高能学生得高分或低能学生得低分,使分数尽量分布在整个分数量尺上。3、掌握区分度的评价标准。,第三章教育测验的编制与实施,一、教育测验编制的一般程序(一)确定测验目标1、什么是测验目标测验目标是测验编制者所编制的测验所要达到的某种具体的目的。它明确规定测验所要达到的预期结果或标准

24、。确定测验目标是编制测验的首要前提。,2、测验目标与教育目标分类,测验目标的确定是以教育目标分类理论为基础的。(1)布鲁姆的认知目标领域知识:这是最低等级的认知目标。主要指记忆知识。对学过的知识和有关材料的识别和再现。理解:这是最低层次的理解。主要是对知识的掌握,其特点是脱离了“死记硬背”。应用:指的是将学过的材料(知识)应用到新的具体情景中去。分析:指能将知识进行分解,找出组成要素,并分析其相互关系及组成原理。综合:与分析相反,指把各个元素或部分组成新的整体。评价:指根据一定的标准对事物给予价值判断。,布氏上述六类目标是有层次、有顺序的,知识是最低层次,是最基本的要求。其余依次是理解、应用、

25、分析、综合、评价。评价为认知领域的最高层次,是前面五种目标的综合并增加了价值标准。这六类目标,由简单到复杂,由低级到高级依次排列,组成层次结构。,(2)我国认知目标的分类,A、五分法知识理解应用分析综合创造B、四分法识记理解简单运用综合运用,(二)确定测验内容,测验内容的确定,实际上也就是内容抽样的决定和测验目标的确立相结合而成。这一结合过程必须通过命题双向细目表来确定。命题双向细目表由3个要素构成:测验目标测验内容测验目标和测验内容的比例,比例确定标准,每一内容范围的比例应与该内容项目在整个教学领域里的相对重要性相符合,这种相对重要性可由该内容项目的教学课时的多少来体现;每一目标层次所要求的

26、比例应当与测验编制者认为这个目标对所受测学生的水平所具有的重要性相符。测验双向细目表,是编制测验的蓝图,它详细说明了测验的内容、测验目标,对试题数量、考试时间安排、测验分数分配等,都起着重要作用,因此,它是编制测验必不可少的一环。,测验材料的收集必须遵循的原则:,1、测验材料要适合测验目的2、测验材料要能够代表该教材的全部内容3、测验材料要有普遍性4、测验材料要适合学生程度并能鉴别学生的学习水平5、测验材料要能激发学生的进取心,(三)测验设计,1、测验形式的确定2、测验题目形式的确定3、测验具体题型的确定与题目编制4、测验题目量的确定5、测验时间的确定6、测验题目的编制先按试题的形式及内容分类

27、从易到难排列,二、测验题目编制技术,1、客观性测验题目的编制(约占60%左右)试题应反映教学内容的重点或教学过程中要求学生掌握的有意义的内容和知识点;务必使每道试题自成一体,不可互相牵扯;试题文字力求浅显易懂,题意明确;试题的答案应该是明确且唯一的;试题应按教育目标的要求,内容不能超过受测者的知识和能力。,2、主观性测验题目的编制(大约占40%左右),试题应考查教育内容中的重要问题;把问题和实际情景结合起来,强调知识的应用;要给被试发挥自己创造力的余地;要使答案的复杂程度与被试的成熟程度相符。,三、教育测量分数的整理和分析,编制频数分布表求组中值求全矩求组数求组限画频数分布曲线图,分析频数曲线

28、图,1、常(正)态分布即成绩中等的多,优秀和差的少,俗称“中间大,两头小”。学生的学业成绩呈常态分布,表明能正确、客观地反映学生真实的知识程度和能力水平。这是因为学生智力及其差异,一般是呈常态分配的;另外,教学大纲的制定、教材的编写、考试命题都是从大多数中等程度学生的实际出发,为大多数中等水平的学生经过努力能接受的。2、正偏态分布即低分人数很多,高分人数很少。学生的学业成绩呈正偏态分布,表明测试难度过大,考试要求过高,超越大纲和教材的要求;或者学生的基础差,应调整试题的难度或教学进度。3、负偏态分布即高分人数很多,低分人数很少。学生的学业成绩呈负偏态分布,表明测试较易,考试要求低于大纲或教材要

29、求;或学生的基础好,应加大试题的难度和教学的进度。,4、驼峰型分布即低分高分人数很多,中分人数很少。学生的学业成绩呈驼峰型分布,表明试题难度过大和过小的题较多,中等难度的太少;或表明学生基础相差悬殊,好的和差的学生多,中等程度的学生较少。5、平波型分布即中低高分人数差不多。学生的学业成绩呈平波型分布,表明大中小几种难度的试题比较接近,或学生的基础相差不大,试题区分度低,需要提高区分度。6、陡峭型分布即中分人数很多,低高分人数极少。学生的学业成绩呈陡峭型分布,表明难度中等的试题比例过大,缺乏区分度或学生的基础相差不大,要提高试题的区分度。,学生的成绩分布曲线的形态多种多样,是教学过程中多种现象的

30、反映,这些现象都是通过原因与结果的连续和交织形成的。造成这种现象的原因是复杂的,往往与教师的教学态度、教学水平、教学经验有关,与学生的学习态度、学习基础、学习方法、学习习惯有关,与学校的思想政治工作和行政管理工作质量有关,与社会因素和家庭教育有关。,逐题分析法,就是对试卷中每一道题的得分和失分情况进行分析,将每题的高分率(指该题高于应得分数的90%的人数的百分比)、及格率、不及格率和零分率统计出来,以便分析学生对每道试题的掌握情况和存在问题。,第四章 教育评价的方法,教育评价方法是指收集、整理、优化信息资料的手段和技术。它是为达到评价目标,根据评价的原则选定的有利于各种评价力量协同工作的一整套

31、活动方式。补充评价类型,教育评价类型,一、按评价的主体划分 1、自我评价 2、他人评价 二、按评价的功能划分1、诊断性评价 2、形成性评价是通过诊断教育方案或计划、教育过程与活动中存在的问题,为正在进行的教育活动提供反馈信息,以提高实践中正在进行的教育活动质量的评价。一般地说,形成性评价不以区分评价对象的优良程度为目的,不重视对被评对象进行分等鉴定。3、总结性评价它是在教育活动发生后关于教育效果的判断,三、按评价中是否采用数量化方法划分1、数量化评价 2、非数量化评价 数量结合、客观判断与主观描述并重的分析与判断。,二、评价方法定性分析与定量分析(一)定性分析方法是用语言描述形式以及哲学思辨、

32、逻辑分析揭示被评价对象特征的信息收集分析、处理的方法。如:观察法、逻辑分析法、访谈法、归纳法等,定性分析法在教育评价中的作用,为定量分析活动提供基础为定量分析结果提供说明为被评人员改进工作提供指南,1、观察法,是一种简单易行的方法。它是评价者根据评价对象和指标内涵的要求,有目的有计划地直接进行自然状态或控制条件下观察并获取信息资料的过程。观察法适用于各种评价,主要是以“听”和“看”为基本手段。运用观察法的要求:有针对性有很强的洞察力,能“眼观六路,耳听八方”,透过现象看本质作好即时现场记录,以教师课堂教学评价的观察为例,根据评价目的和质量要求,设计好听课记录表格;根据调查活动的时间安排和参与评

33、价人员的业务素质确定听课人员,听课人员一般应由懂得此门学科的人员或专业人员参加;听课人员进入课堂听课,并根据授课人的教态、学生的反应等情况,及时作好记录,或填写好听课记录表;将听课记录表收集起来进行统计处理,对授课人的水平作出综合分析结论。,2、逻辑分析法,逻辑分析的方法是教育评价中运用最多,也是最重要的手段之一。这不仅是因为搜集的评价资料中存在着大量的非数量化的材料,难于进行统计分析,而且即使进行统计分析,其结论的解释、说明等也需要借助逻辑分析的方法作更深层的分析研究。逻辑分析的方法是运用辩正唯物主义的哲学观,透过事物的现象认识并揭示其本质,从事物的外部联系深入到内部联系,从偶然事件中发现必

34、然规律,并从整体把握事实真相的方法。其具体的方法有:分析与综合、抽象与概括、分类与比较、归纳与演绎、具体化与系统化等。,(二)定量分析 是指用数值形式以及数学、统计方法反映被评价对象特征的信息分析、处理的方法。如:算术平均值法、矩阵法、权数分配法、推断统计法。定量分析法在教育评价中的作用数量分析是获得评价结论的重要依据定量分析是表述评价结论最简洁的方法,定量分析的具体方法,1、算术平均值法2、加权平均值法3、矩阵法4、权数分配法5、推断统计法,三、定性分析与定量分析相结合例:郭福昌:我国幼儿学前教育的定性和定量分析,三、设计教育评价指标体系的方法,(一)目标与指标1、目标目标即目的,泛指人们从

35、事活动所达到的目的。2、指标指综合反映某种社会现象状况的一些数字,把这些数字与反映对象某一方面的因素结合起来,就构成了指标。简单地说,指标就是目标一个方面的规定,它是具体的、可测量的、行为化和操作化的目标。,3、指标体系,任何一指标都不反映全部的目标,它只反映目标的一个方面。或者说,它只反映目标的一个局部,只有系统化的,具有紧密联系的一群指标,才反映全部的目标,称之为指标体系。目标与指标有和联系与区别?,联系:(1)目标是指标的根据和基础;(2)指标是目标的具体化和操作化,是操作化了的目标;(3)指标反映目标,并通过实践活动积极影响目标的变化。区别:(1)目标反映对象的全貌,指标反映对象的局部

36、特征;(2)目标内涵较宽,比较抽象,比较笼统;指标内涵较窄,比较具体,比较清晰;(3)目标相对于指标来说比较稳定,一经确定变动较少,指标对于目标来说比较灵活,可根据一个时期的侧重点进行调整。,(二)指标体系的结构,1、直线式结构 二级指标11一级指标1 二级指标12 二级指标21一级指标2 二级指标22 二级指标31一级指标3 二级指标32,例1:小学生最优发展的整体评价指标体系,思想品德 思想素质 科学素质 性格 情趣爱好小 审美素质 美的感受和鉴赏学 美的表达和创造生 学业成绩最 知识素质 知识结构优 百科知识面发 自学能力展 能力素质 自理生活能力 人际交往和组织能力 体态和机能 身体素

37、质 运动能力 卫生保健,2、树状式结构,一级指标,一级指标,一级指标,总目标,二级指标,例2:学生主体性的基本结构,主体性,自主性,主动性,创造性,自尊自信,自我调控,独立判断决断,自觉自理,成就动机,竞争意识,兴趣和求知欲,主动参与,社会适应性,创新意识,创造性思维能力,动手实践能力,(三)教育评价指标体系建立的步骤和方法,1、步骤:(1)分解目标,提出初拟指标(2)归类合并,进行筛选(3)理论论证(4)专家评判(5)预试修订,(1)分解目标,提出初拟指标,一般较为注意指标的科学性、完备性,唯恐挂一漏了或包罗不尽。这些指标不仅是较为粗疏的,数量也可能是比较多的。,(2)归类合并,进行筛选,在

38、初拟指标中,有的能反映评价对象的本质,有的则未必;有的算得上主要因素,有的可能只是次要因素。各因素之间出现交叉、重复、包含、矛盾、因果等关系,也难以避免,必须对初拟指标进行归类合并和筛选,以达到“少而精”的要求。,(3)理论论证,经过以上方法筛选所得的指标,是否符合评价要求,还必须从有关学科的科学意义上进行理论论证,论证的主要依据是教育科学、心理学和系统科学。论证时,在明确指标内涵的基础上,针对教育目标、评价目标、和被评价对象的实际情况逐一进行论证,以求高质量的指标体系。从整体上讲,指标体系要求层次清楚而不零乱,结构严谨而不松散,对每一条指标,要求内涵明确而不含糊,表述简洁而不累赘。,指标表述

39、的标准,能被理解的:用不含糊、清楚的语言表述。行为导向的:说明预期的行为。可以度量的:可以直接测量的。能被运用的:用可操作的语言下定义的。意义深远的:能引发高级行为效果。实际的:在现有的资源、时间、才能和可用技术下能完成的。重要的:说明重要的和相关的效果。发展的:随时间演进,在不同角度继续成长。综合的:包括一切重要效果。均衡的:制定多种目标的优先顺序。正确的:表示出组织者的真正意图。扼要的:用以表达的文字越少越好。这些标准,供我们表述指标时参考。,(4)专家评判,这是指标设计从设计者手中走向管理实践的重要步骤。专家通常包括评价理论研究者、上级领导、富有经验的教育行政干部、教师等。专家评判可采用

40、个别访问、座谈、问卷征询、现场调查等方式,应根据不同情况选择。,(5)预试修订,指标体系经过筛选、修订,初步确定以后,可以同评定标准相匹配,选点在小范围试验,看是否可行,试验后对指标体系再作修改,然后投入使用。,2、方法,(1)头脑风暴法是利用头脑积极思维,进行智力碰撞,激发智慧的灵感,从而提出评价指标的一种常用方法。(2)因素分解法是一种将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法。应当注意:分解出来的因素,从高到低逐层缩小内涵,越往下层次指标越明确、越具体、范围越小,越可以观测。(3)理论推演法是根据有关学科的理论推演出评价指标的方法。(4)典型

41、研究法是通过少数典型事例进行研究而设计评价指标的方法。,3、筛选指标的方法,(1)经验法是凭设计者的学识修养和工作经验进行筛选的一种简便实用的方法。一般遵循以下几个要点:A、理由是否充分或必要判断每项指标是否是必要的,缺了它有什么不好,保留它有什么理由,被保留的要有充分的依据,在指标体系中,属于非要不可的因素。B、取主舍次区分每项指标反映评价对象本质的程度,保留能反映本质的主要因素,舍弃不能充分反映本质的次要因素。C、从各指标之间的关系上进行比较内涵相同或近似的合并,内涵交叉的保留其一;有因果关系的,保留“因”而去掉“果”;相互矛盾的保留既符合方针、政策规定又切合当地实际的指标。D、去难存易,

42、删繁就简确实难测的指标可以舍弃;指标内涵复杂的,尽量求其单一。,(2)调查统计法,是在调查获取资料的基础上进行统计的方法。其具体的做法是:把初拟指标制成问卷,发给有关专家和有经验的教育工作者,请他们对初拟指标每一项作出判断。一般分为五档,即很重要、重要、一般、可要可不要、不要。答卷者在每项指标后记上自己判断该项指标相比之下的重要程度(只能定一个档次),然后,收回问卷,统计“很重要”、“重要”两档的人数比例,按评为“很重要”、“重要”人数比例由高到低顺序排列,把低于某数值(一般低于三分之二或四分之三处作为划界)的指标删除,就得到筛选的指标。,例3:学校领导班子评价指标体系的建立,1、首先分4个层

43、次提出了16项指标(1)政治素质(政治理论和政策水平、思想品德修养、事业心和责任感)(2)业务素质(文化专业达标、教育理论修养、管理实践经验)(3)工作效能(职务与能力相称、分工明确和各尽其责、团结协作、指挥灵便、工作效率高)(4)工作作风(深入实际、发扬民主、决策果断、以身作则、开拓精神),2、把以上16项指标,分为五档(很重要、重要、一般、可要可不要、不要),分别征询意见,获得以下结果:政治素质(事业心和责任感1、政治理论和政策水平3、思想品德修养11)业务素质(教育理论修养2、管理实践经验10)工作效能(团结协作5、分工明确和各尽其责8、工作效率高9)工作作风(决策果断4、以身作则6、开

44、拓精神7、发扬民主12),第五章 教育评价心理及其调控,一、评价心理的概念所谓评价心理,是指参评者对评价现实的体验或反映。参评者:不仅包括主评者或主评团体,还包括被评者或被评团体。评价现实:是指评价过程的实践活动和评价过程的各种关系交往等现实活动。,提问:评价心理=心理评价?,心理评价:是指评价者对心理现象的价值判断。1、二者研究对象所在的范畴不同评价心理旨在研究有关评价活动中主评者或主评团体、被评者或被评团体以及评价过程中的各种心理的变化的影响。它的研究对象归根到底是心理学上的问题。心理评价旨在对人的各种心理活动进行价值认识和价值判断。它的研究对象归根结底不是心理问题,而是价值论问题。,2、

45、二者的实际功用不同,评价心理的研究是为了能够控制评价活动中参评人员的态度、情感和意志等心理因素的影响,调节人的主观心态,从而保证评价尽可能地公正、客观。心理评价是为了区分各种心理品质的优劣,以引导人们克服自卑、妒忌和偏见等不良心理品质,培养健康的、积极向上的心理品质。,提问:为什么人的主观状态、心理因素会影响评价的客观性?为什么不能“铁面无私”、“秉公执法”呢?,评价是依据一定目标对评价对象进行的价值判断的活动。这一价值判断是建立在个人对客体的感性认识基础之上的价值判断,主要取决于主体的情感和意志,决定于主体对它们的态度。 这朵花是白的这是一个事实判断。如2个命题 这朵花是美的这是一个价值判断

46、。可见,评价活动是一种主体性很强的活动,评价中必然有主体的态度、情感、意志等心理因素的参与,所以,那种绝对意义上、理想的“铁面无私”、“秉公执法”、“绝对客观”不可能产生。,二、评价心理的调控,评价心理调控:是指用一定的手段和方法,对评价者和被评价者可能出现的心理行为进行调节、控制和利用,使评价工作顺利开展。(一)调控评价心理的意义1、通过心理调控,可以使教育评价的准备更加合理充分2、通过心理调控,可以保证教育评价活动的实施得以顺利进行,更好地完成各环节的任务3、通过心理调控,可以使评价的功能得以全面发挥,圆满实现评价的目的,(二)评价者心理与调控,1、评价者的心理现象(1)准备过程的心理现象

47、(角色心理、心理定势、新奇感和期望效应)(2)施评过程的心理现象(自尊心理、首因效应、近因效应、晕轮效应、参照效应、理想效应、时序效应、成见效应、宽大效应和附和权威心理)(3)结果处理过程的心理现象(类群效应、从众心理、逆反心理、本位心理和模式效应),2、评价者心理的调控,(1)评价者素质能力的调控把好选拔关评价技能培训思想品德教育(2)管理上的调控(3)通过心理“换位”使评价者自觉进行调控(4)通过完善规章制度加以调控,三、被评价者心理与调控,1、被评价者的心理现象(1)被评价者自我评价心理现象(自我认可疑惧心理和被审心理)(2)受评过程心理现象(应付心理、迎合心理和自卫心理)(3)结果反馈

48、心理现象(敏感心理、护短心理、嫉妒心理和对评价进行评价心理),2、自我评价的心理机制,自我评价不但是评价过程的必要环节,而且自我评价对评价结果有着相当大的影响,需要了解被评价者自我评价形成的心理机制。(1)根据别人对自己的评价来评价自己(2)通过与他人的对比来评价自己(3)通过自我分析来实现自我评价,3、被评价者心理的调控,(1)提高对评价的认识搞好评价动员征求群众对评价方案的意见,采纳合理的建议,打破评价的神秘感讲明评价的计划和日程安排,使被评价者心中有数建立和健全评价制度被评价单位的领导和骨干要为群众作出榜样,以正确的态度积极投入评价工作(2)采用多种评价形态,控制评价效应(如:转移法、暗

49、示法、深呼吸法等)(3)保持评价者和被评价者良好的心理交往状态(4)适当进行自我评价正确对待别人对自己的评价把握自己与别人类比的可比性对自己的评价要全面学会把别人的评价、与别人的类比、自我评价统一起来(5)结果反馈方式要灵活多样,被评价者4种心理状态,1、评价者情绪好与被评价者情绪好相结合2、评价者情绪好,被评价者情绪不好3、评价者情绪不好,被评价者情绪好4、评价者与被评价者情绪不好可见,不论在什么情况下,评价者的情绪和态度是至关重要的。有素养的评价者,应该始终保持良好的情绪,使双方心理交流处于良好状态。这样才有可能采取主动,对被评价者的心理实施调控,使评价工作得以顺利进行。,第六章 学校办学

50、水平的评价,一、学校办学水平评价的作用1、有利于端正办学方向,具有导向作用2、能够测度学校管理水平的高低,具有优化管理的作用3、能反映学校各方面工作的优劣,具有激励、督促的作用4、有利于教育科学理论的研究与提高,起到探索规律、完善理论的作用,二、学校办学水平评价的基本内容和指标体系,(一)学校办学水平的基本内容1、学校办学方向的评价这一方面主要是指对学校工作目标实现程度的评价。其评价的主要指标有:贯彻教育方针政策的情况执行教育法规的情况本校具体教育目标和管理目标的制订情况,2、学校办学条件的评价,(1)学校中人力资源条件主要包括教师队伍和学校领导班子(2)学校中财力资源条件主要为学校的教育经费

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号