《化学教学测量与评价课件.ppt》由会员分享,可在线阅读,更多相关《化学教学测量与评价课件.ppt(141页珍藏版)》请在三一办公上搜索。
1、第一章 化学教学测评概述,第一节 教育测量概述一、什么是测量(一)测量的定义测量是根据法则给事物分派数字。(史蒂文斯)测量这一定义包含了三个要素:1、法则给事物的属性分派数字的依据和准则2、事物属性测量的对象或目标3、数字描述事物属性的符号,是测量结果的表现形式,比如:重量杠杆原理;温度热胀冷缩原理。“法则”不同,测量结果不一样,因此法则有好坏之分。,根据能否直接测量,可以将事物属性分为两类:一是可以直接测量的事物属性,如长度、体积、重量等;二是只能间接测量的事物属性,如温度、心理等,数字具有如下特征:1、数字具有区分性:数字不同,事物的属性也不同。2、数字具有顺序性,如12 33、数字具有等
2、距性,如2-1=1 3-2=14、数字有0,使事物的测量具有参照点但是,在不同的测量中,测量结果所使用的数字可能具有不同的属性。,(二)测量的三个要素 单位、参照点、量表,1、单位。是计量事物的标准量的名称。 理想的测量单位应具备两个条件:(1)要有确定的意义。即对同一单位,所有人的理解都是相同的,不应有异义和多义。(2)单位的距离要等值,即相邻两个单位点之间的差别总是相等的。 但是,在教育测量中运用的单位大多是不等值的。,2、参照点是指在测量工作中,计算的起点。参照点有两种:(1)绝对零点。“0”表示没有,如重量为“0”表示“恰恰没有一点重量”。(2)相对零点(人定参照点)。 “0”并不表示
3、没有,温度(成绩)为“0”并不表示没有温度(一无所知),如以海洋面为测量陆地和山的高度的起点,称为海拔*米,以冰点(00C)作为测量温度的起点等。教育测量中使用的参照点都是相对零点。,3、量表 即测量的工具,是“具有确定单位和测量参照点的连续体”。如尺子、天平、试卷、问卷、图形、符号等。“将欲测量的事物特征与这个连续体相比较,确定它的位置,看它距参照点的远近,就会得到该事物特征的一个测量值。”,(三)、四种测量量表,1、称名量表(类别量表)最低水平的一种量表它只是用数字表明事物的类别或性质不同而已,没有任何数量大小的意义,不能作数量化分析,也不能将之进行加减乘除运算。有人认为运用类别量表进行的
4、测量不能算是真正意义上的测量。它主要用于次数的统计、求百分比、列联相关、X2检验等。,2、等级量表(顺序量表)用来描述各个类别的数字,不仅具有区分性,而且还具有等级性(或顺序性),因此,量表上的数字之间能表示事物大小的位次关系,但不具有等距性和可加性,也不能进行加减乘除运算。它主要用于求中位数、百分数、等级相关系数、肯德尔和谐系数等。,3、等距量表较高水平的量表量表上的数值不仅具有区分性、等级性,还有等距性,等距量表的数字是一个真正的数字,因此可以进行加减运算,但等距量表没有绝对零点,所以不能作乘除运算。主要用于计算平均数、标准差、积差相关系数、T检验、F检验等。,4、比率量表最高水平的量表有
5、相等单位和绝对零点,量表数值可以进行加减乘除运算。大多数物理测量量表是比率量表,但化学教育测量基本没有比率量表。,二、什么是教育测量,(一)教育测量的涵义 教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。 教育测量主要是对学生内在精神属性的测量,如学习成绩、智力水平、品德状况、心理健康状况等。所以教育测量主要是一种间接测量。,(二)教育测量的特点,1、测量结果的间接性:教育测量是通过被试者对测验项目的行为反应来测量他的内在的心理特征。2、度量单位的相对性:单位是测量的基本要求,理想的单位应有确定的意义和相等的价值。但测量人的行为时并不具备这样理想的两个条件,所以要对教育
6、测量的分数进行转换,如T分数,百分等级分数等。,3、测量对象的复杂性:教育测量主要是对学生内在精神属性的测量。内在性不能直接测量;多变性前后测量结果不一致其他因素如疲劳、情绪、心理掩饰也会影响测量结果4、测量目的的针对性测量总有一定的目的,教育测量必须为实现教育目的服务。,三、教育测量的误差问题,凡测量必有误差,但为了尽可能准确测量,必须尽量控制误差,使其最小。误差主要来源于三方面:1、测量的工具(化学测量仪器和设备;教育与心理测量量表)(1)项目取样(代表性)(2)项目题型(猜测率)(3)项目措词和要求(模棱两可,表述不清)如:春天的水怎么样?,2、所测量的事物的一致性程度。测量在短期内不受
7、测验经验、练习效应的影响。3、测量者的因素主测者:熟练掌握测量技术。比如,指导语另外,如何计时、记分,对被试的各种提问如何回答,以及在测验中途发生意外情况(如停电,有人迟到,生病;作弊等应该如何处理)。 受测者: 应试动机、测验焦虑。,指导语会直接影响受测者的作答态度与方法。有人以不同的指导语对几组被试实施同一个能力测验,结果表明,将该测验说成“智力测验”的一组,成绩最高;将之说成“日常测验”的一组,成绩最低。,动机不同会影响其作答态度、注意力、持久性、反应速度等,从而影响测验成绩,四、教育测量的作用,1、有利于提高教育、教学水平如:形成性测验、终结性测验2、有利于提高教育管理水平克服主观经验
8、管理3、有利于发展教育研究方法用数据说话,第二节 教育评价概述,思考:当你看到这个问题时,或者说,当你听到教育评价这个词时,你最先想到的是什么?,实验结果:依人数的多少排列:,师范生:A、测验 B、等级 C、成绩 D、不公平 E、判断任课教师:A、测验 B、测量 C、等级 D、成绩责任制 E、对个人秘密的侵犯,一、什么是评价,顾名思义,评价就是评判价值。 书本定义:评价是指根据某种价值观对事物及其属性进行判断、衡量,亦即对人或物做出好与坏、真与假、善与恶、美与丑、优与劣等等的判断。评价意味着对某一事物的价值给予一般的衡量。价值是指客体满足主体需要的程度。 实际上,一种事物的价值是客观存在的,但
9、是各人的需要不同,所以各人的价值观不一样,作出的价值判断(评价)也不同,可见,评价是主观需要与客观价值的统一。比如集邮。,二、什么是教育评价,教育评价是一门新兴的学科,迄今尚未形成统一的为大家所公认的科学定义。下面是几种具有代表性的界说: (一)早期解释 泰勒在40年代初将教育评价解释为:“确定教育目标在实际上被理解到何种程度的过程。”目标评价模式 后来日本学者进一步把它界定为:“教育评价就是系统地、有步骤地从数量上测量或从性质上描述儿童的学习过程和结果,据此判定是否达到了所期望的教育目标的一种手段。”注重总结性评价,忽视形成性评价,有贯彻之意目标 评价 实施,(二)60年代的界说 克龙巴赫
10、的定义:“评价是为决策提供信息的过程。”后来有人对这一界说做了具体的描述:“教育评价是一种有系统地去寻找并搜集信息资料,以便协助决策者在诸种可行的途径(方案)中择一而行的历程。” 对教育评价的阐释突破了行为目标模式的观点,强调了评价的信息作用(为教师教学、管理者决策等),扩大拓宽了评价的功能、范围。,(三)较深层的定义 斯克里文和豪斯的定义:“评价是一种对优缺点和价值的评估,是一种既有描述又有判断的活动。” 日本心理学家大桥正夫认为:“教育评价就是对照教育目标,对教育行为产生的变化进行价值上的判断。”这种观点强调评价者必须进行价值判断,而非只测量事物或决定目标是否达成。评价活动从反映管理者、决
11、策者的意图转变为反映局外人的意愿或价值。至此,价值问题由 “价值中立”的假设,或者说剥离价值的评价设想,重新得到了反思和审视,价值因素开始“登堂入室”。,(四)我国对教育评价的初步界定和理解(20世纪80年代以后) “教育评价是对教育的社会价值做出判断的过程。” “教育评价是按照一定的价值标准,对受教育者的发展变化及构成其变化的诸种因素进行价值判断的过程。” 本教材的观点:“教育评价是根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地搜集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。”,共同特:(1)评价是一个过程;(2)价值判断是评价的本质特
12、征;(3)以一定的教育价值观为依据;(4)采用一切可行的科学手段。,要理解评价的本质,必须明确几点:1教育评价的对象、范围评什么 教育评价从早期以学生学习结果为对象,逐渐扩大了应用的范围,现代教育评价则以教育的全领域为对象。从宏观到中观、微观,各种教育现象都可以作为评价对象,不仅评价教育结果,教育计划、教育活动和教育过程等都是教育评价的对象。,2教育评价的目的和作用为什么评 这里涉及评价的指导思想和教育观等基本理论问题。 教育评价是为了鉴定、考核,还是为了推动、改进;是为了选拔、淘汰,还是为了教育、发展,这是两种不同的教育观和评价观。 传统的教育评价目的是为了“选拔适合教育的儿童” 。而现代教
13、育评价的目的是为了“创造适合儿童的教育”,即评价是为了诊断评价对象的现状,以便发现问题,使教育、教学工作不断改进、不断完善,不断适合教育对象的需要,为促进儿童个性全面发展和提高教育质量服务的“为了学生的发展”。,3教育评价的依据根据什么来评 价值判断是教育评价的本质特征。根据什么进行价值判断?这就是评价的实质和关键。因此必需有一个衡量和判断的客观依据和标准,即教育的价值目标和标准问题。 这里又涉及什么是价值、教育价值、教育价值观的问题。我们应当根据马克思主义价值观和社会主义现代化建设的需要,根据人才成长发展的规律,确立我们的教育价值观和价值取向,确定教育评价的价值目标和标准。从这个意义上说,教
14、育方针、政策和教育目标就是我们的教育价值观的集中体现,我们应当以教育方针和教育目标为依据确定评价的目标和标准。,4教育评价的手段怎样评 教育评价是运用科学的方法和手段,对教育现象及其效果作出价值判断的活动。教育评价的科学性在很大程度上取决于方法和手段的科学性。没有科学的方法和手段,就没有评价的科学性。,(五)教育评价与教育测量的关系1、联系: 教育测量是教育评价的基础,教育测量是对教育进行量的测定,所获得的结果是教育评价所需信息的主要的、可靠的来源,是对教育的状态和价值进行客观判断的前提。 教育评价=事实判断+价值判断 教育测量所获得的数据只有通过评价判断这个环节才能获得实际意义,否则便成了一
15、堆抽象而枯燥的数字。,2、区别: 两者着眼点不同:教育测量是为了取得数据;教育评价是要分析解释,对教育价值作出判断。 两者特点不同:教育测量是一种纯客观的过程,具有客观性特点;教育评价具有客观性与主体性相结合特点。 两者复杂程度不同:教育测量是对教育数量化的描述,关心量的获得,活动较为单一;教育评价着眼于事物质的判定,含定性与定量分析,活动是多重的。,三、教育评价系统的结构和功能,(一)教育评价系统的结构 系统论认为,所谓系统,是由若干相互联系、相互作用的要素所构成的、具有特定结构和功能的有机整体。比如教学系统由教师、学生、教学组织形式、教学方法、教学手段、教材等要素构成。 任何一个系统都是较
16、高一级系统的一个要素,任何一个要素,通常又是较低一级的系统。凡系统都有一定的结构和功能。构成系统的各要素在系统内组成的方式就是系统的结构,这种结构在运动状态下所发挥的效能就是功能。因此,系统结构与系统功能是相互制约、相互影响的。,(一)教育评价系统的结构,从教育评价系统结构上分析,教育评价一般由以下几个要素构成:1、价值目标和标准 2、组织机构和人员 3、评价方法和技术 4、评价对象与评价人员的心理调控,教育评价必须以目标为导向,以标准为依据,因此必须根据教育目标、培养目标和课程标准,设计好评价目标、指标、标准等。具体说就是实施教育评价所依据的评价标准体系。,是指实施评价的组织机构、领导人员和
17、评价者。一定的评价任务要求设置与之相适应的组织机构和人员,或领导小组和负责评价的人员。目前我国普通教育评价的实施,还没有专门组织机构和负责评价的专业人员,与国外相比显得非常落后。,是指实施教育评价的技术和方法,基本技能和能力。其中包括各种搜集评价信息的方法和技术、统计处理评价信息的方法技术和进行综合分析判断的方法和技术等。,是指参与教育评价的主体(评价者)与客体(被评者)双方在评价过程中所表现的动机、需要和人际关系等心理状态,它直接影响评价过程、评价程序的顺利进行,影响评价任务的完成,因此对评价主体与客体的心理调控就具有重大的意义和作用。必须通过各种调控的途径,取得及时的有针对性的有效控制,才
18、能保证评价的效果,达到评价的目的。,(二)教育评价的功能,1、教育评价的意义(1)教育评价是教育管理的重要组成部分教育管理的各个环节(计划、实施、检查和总结)都需要评价。评价能及时反馈信息,及时发现问题,解决问题,是一种科学的管理。(2)教育评价是深化教育改革的重要措施要进行一项教育改革,首先要进行改革方案的可行性评价;在改革进程中,必须加强形成性评价;在某一改革告一段落时必须进行终结性评价。,(3)教育评价是全面提高教育质量的重要手段。 通过教育评价,可以加强学校各项教育教学工作的有效性。(4)教育评价是教育科学研究的重要内容 现代教育科学研究被划分为三大领域:教育基础理论研究、教育发展研究
19、和教育评价研究。可见,教育评价是教育科学研究的重要内容。,2教育评价的功能,(1)导向功能教育评价是根据教育目标进行的,通过评价目标、指标体系的引导,可以为学校指明办学方向,为教师与学生指明教与学的奋斗目标。(2)监督检查功能社会各界要了解、考察教育的发展状况,教育行政领导部门要对学校工作进行指导与管理;学校要对师生的教学活动进行调节和控制;教师要对学生的学习进行监督和帮助,都需要通过一个具有检查监督功能的形式和手段,即教育评价。,(3)激励功能教育评价能起到激励先进,鞭策后进的作用。正(负)评价,要社会承认的需要得到满足(受到挫折),要得到成功的需要得到满足(受到挫折),自尊感提高(低落),
20、情绪稳定(不稳定),唤起新的要社会承认的需要(扩大或放弃,唤起新的要得到成功的需要(扩大和放弃),(4)筛选择优功能 在教育的实际工作中,经常要对评价对象进行筛选择优。这就需要将众多的对象根据一个标准来衡量和判断,也就是要对他们进行科学的教育评价。(5)诊断改进功能 通过教育评价,可以发现教育、教学过程中存在的问题和不足,然后提出改进的措施,这就是教育评价的诊断与改进功能。,四、教育评价的种类,(一)根据评价的对象和范围1宏观教育评价以教育的全领域及宏观决策方面的教育现象、措施为对象的教育评价,或对一个具有相当规模的地区的教育进行的评价。这类评价属于总体的、全局性的、高层次的评价。2中观教育评
21、价以学校为对象,对学校内部各方面的工作进行的评价。如学校办学质量评价、学校教学工作评价、学校德育工作评价、学校后勤工作评价等等。3微观教育评价以学生为对象的教育评价。如对学生的学业成绩、思想品德、智能发展等的评价。,(二)根据评价的时间和作用1诊断性评价是指在教育、教学活动开始之前,为使计划更有效地实施而进行的预测性、摸底性评价。其目的是为了摸清评价对象的基础和情况,分析存在的问题,为解决问题搜集必要的资料,以找到解决问题的办法。2形成性评价是指在教育、教学活动计划实施的过程中,对计划、方案执行的情况进行的评价。其目的是为了了解动态过程的效果,及时反馈信息,及时调节,使计划、方案不断完善,以便
22、顺利达到预期的目的。3总结性评价是指某一教育、教学活动项目告一段落或完成以后进行的评价。其目的是为了了解这项活动达到预期目标的情况以及它的最终效果或效益。,(三)根据评价的基准不同1相对评价 是指在评价对象团体中确定一个基准,或以某一团体的评价状况为基准,对团体中的个体成员在这个团体中所处的相对位置进行评价。相对评价的特点:一是评价基准是在评价对象团体内部确定的;二是参照的标准是对团体进行测量以后确定的;三是它关心的是团体成员在该团体中所处的相对位置。 A1 A2 A3 M0 An,2绝对评价 是指以预先制订的目标为评价基准,评价每个对象达到目标或基准的程度。也称目标参照评价。绝对评价的特点:
23、一是评价基准是在评价对象团体以外确定的;二是参照标准是在对团体进行测量以前确定的;三是它关心的是评价对象达标的程度。 A1 A2 A3 M0 An,(四)根据评价的性质1需要性评价 是指根据某种需要,对新提出的教育目标、计划方案的必要性作出价值判断。其目的是要判断新提出的教育目标、计划方案或活动是否有必要进行或开展。需要性评价一般是在某种教育改革项目开始前或对教育活动整个过程进行总体反思时进行的。2可行性评价 是指对教育目标、计划、方案实现的条件、可行程度的评价。其目的是了解实施教育目标、计划、方案的物质条件、技术条件和经济效益。3配置性评价 是指对教育目标、计划、方案,所需要的资源条件,人员
24、与业务技术条件的配置进行价值判断。其目的是合理安排和利用人力、物力和财力。,(五)根据评价的主客体不同 1自我评价 是指被评者按照一定的评价目的与要求,对自身的工作、学习、品德等方面的表现进行价值判断。自我评价能充分发挥评价对象在评价中的积极性,激发被评价者的自尊心、自信心,使之自觉地、主动地接受评价。 2他人评价 是指被评者以外的人进行的评价,又叫外部评价。他人评价,一般较严格、慎重,也比较客观,可信度较高,具有一定的权威性,自评只有经过他评才能得到有关方面的认可。,作业:如何评价中国的高考?,第三节教育测评的发展阶段,先测后评一、教育测量的发展阶段一般可将教育测评的发展分为以下三个阶段:(
25、一)教育测评的萌芽阶段(年以前)1、我国古代教育测量思想早在2500多年前,我国古代教育家孔子就曾根据自己的观察评定学生的个别差异,将人的智力分成三个等级:“中上之人”,“中人”,“中下之人” 。并指出:“中人以上可以语上也,中人以下不可以语上也 。”,1、我国古代教育测量思想,孔子之后约150年,大思想家孟子指出了“万物皆可测量”的思想:“权,然后知轻重;度,然后知短长。物皆然,心为甚。”据可考证的史料分析,世界上最早的心理与教育测量出现于中国西周奴隶制时期(公元前1100771年)。 (1)礼记学记记载,在西周的“国学”中已经建立具有相当系统性的教育测量制度:“比年入学,中年考校。一年视离
26、经辨志,三年视敬业乐群,五年视博习亲师,七年视论学取友,谓之小成。九年知类通达,强立而不反,谓之大成。”,(2)现代许多教育测量学家认为,教育测量起源于中国的科举考试(6061905年,1300年)。科举考试始于隋,兴盛完备于唐,废于清末,是我国实行时间最长的一种选士制度,对我国乃至于对世界的考试制度有重要的影响。法国大革命时期,资产阶级启蒙思想家伏尔泰曾赞叹地说:“人类精神,肯定想象不出比这样的政府更好的政府。在这个政府里,重要的衙门彼此统属,任何事情都在那里决定,而其成员,都是经过几场严格的考试的。”科举制是通过分科考试来选取人才,采用口试、贴经、墨义、策问、诗赋等方法测试考生。讨论:中国
27、科举考试的优缺点。,2、西方早期教育测量思想,中国的科举考试自16世纪由利玛窦传入欧洲。1702年,英国的剑桥大学首先以笔试替代口试,开西方学校考试笔试之先河(比中国的科举制晚了近1100年)。1845年,美国初等学校普及,学生数激增,对毕业生一一口试已不可能,于是,波士顿市教育委员会率先在美国相继以笔试取代口试,考察该市所属学校的毕业生(比中国的科举制晚了近1240年) 。,(二)教育测量的蓬勃兴起阶段(年),该阶段以费舍1864年的量表集为标志;1897莱斯的拼字测验引起人们对测验问题的极大关注 ;1879年,冯特在德国莱比锡建立了第一个心理学实验室,其方法论的变革促进了教育测量运动的兴起
28、;1882年,英国高尔顿(Galton)受达尔文影响,在伦敦建立了人类学测验实验室和德国冯特的心理学实验室相对峙。,高尔顿在他的实验室里发明了许多测量仪器,如用来测量长度视觉辨别的“高尔顿棒”、用于测量听力的“高尔顿笛”,并以这些感觉敏锐度为指标来判断人的智力。他通过测量发现白痴对热、冷、痛等感觉的鉴别能力较低。他还是应用等级评定量表、问卷法以及自由联想法的先驱,他创造了粗略计算相关系数的方法,他的学生皮尔逊就是积差相关系数的发明者。,1904年,法国教育部委派许多教育家、医学家组成一个委员会,研究公立学校内低能儿童班级的管理问题,心理学家比奈是其中的成员之一,他主张用一种测验的方法去辨别心理
29、缺陷儿童。经过他与助手西蒙的精心研究,于1905年在心理学年报上发表了题为诊断异常儿童智力的新方法的论文。该文介绍的新方法就是世界上第一个智力量表比纳西蒙智力量表。,20世纪20年代,美国的教育测验运动蓬勃发展起来。美国的教育测验运动的发展可分为三个时期。(1)开拓期(19041915年) 这是方法的探索与初步的发展时期。在美国心理学家卡特尔研究的基础上,1904年桑代克发表了在测验学史上的划时代巨著 精神与社会测验学导论,标志着教育测验运动的开始。桑代克在书中提出了“凡是存在的东西都有数量,凡有数量的东西都可测量”的著名信条。,美国心理学家卡特尔(J.M.Cattell)曾留学德国,师从冯特
30、,在英国剑桥大学任教期间与高尔顿交往甚密。回师从美后,他编制了几十个测验,包括测量肌肉力量、运动速度、痛感受性、视听敏度、重量辨别力、反应时、记忆力以及类似的一些项目。美国学者波林指出:“在测验领域中,19世纪80年代是高尔顿的10年,90年代是卡特尔的10年,20世纪头10年则是比奈的10年”。,2、兴盛期(19151930年)。 这一时期对桑代克提出的信条,不但在技术方面努力求得正确应用,而且不断提高到理论上加以证实。这一时期已发展了三种不同性质的测验,即学力测验、智力测验和人格测验。据统计,到1928年止,便有3000多种测验问世。,3、教育测验的批判期(19301940年)。 随着教育
31、测验运动的不断发展,人们逐渐认识到,教育测验尽管能使考试客观化、标准化,并能把人的能力换算成数字,甚至个别差异的程度也可以量化,但测验毕竟不能测得人的全部,如社会态度、实际技术、创造力、兴趣、鉴赏力等等,因难以数量化,教育测验便不能充分把握,往往被教育者所冷落。然而,这些又都是教育的重要方面。1931年,塞蒙兹(Symonbs,P. M)发表了人格与行动的诊断一书,主张人格测量应用评定法、问卷法、交谈法、轶事记录法等,从而从思想上否定了单纯的人格测量法。从此,教育测量运动逐步过渡到教育评价的时期。,30年代,美国进步主义的一些学者针对教育测量过分追求客观化、标准化、数量化的缺陷,提出了改革措施
32、。教育测量有了新的进展,表现在:第一,开始重视学生智力和思想品德的测量,不能单测量学生的知识。第二,教育测量量表的编制突破了过去单一答案的求同式思维题,发展为包括多种答案的求异式思维题和论文式试题。,第三,教育测量的范围由过去偏重于学生学习成绩的测量,发展到涉及课程设置、教材、教育改革方案等教育工作的各个方面的测量。第四,现代的教育测量由过去单一的常模参照性测验模式发展到常模参照性测验与目标参照性测验相结合的模式。第五,教育测量本身的理论研究与技术开发更加深入与完善。 如关于测验等值、项目反应理论(IRT)、测验信度、评分误差控制的研究等都有了较大的发展。现代化的测量工具(如电脑、光学扫描器等
33、)也在教育测量中得到广泛的使用。,二、教育评价的发展阶段,教育评价作为科学概念,是20世纪30年代,在美国进步主义教育联盟的新教育课程的改革实验“八年研究”中正式诞生的。具体地说,教育评价思想源于中国古代教育的考试,孕育于西方教育测量的批判,形成于“八年研究”的改革实践。(一)教育评价产生的社会背景 20世纪20年代末,30年代初,美国爆发了一场空前的经济危机 。,教育评价自产生至今大致经历了三个发展阶段,在这三个阶段中教育评价方法论各有其不同的特点: 1教育评价的开创时期(19301958年)泰勒在“八年研究”(1933-1940) 的报告史密斯泰勒报告里,系统地总结了教育评价思想体系,第一
34、次提出了教育评价的科学概念“评价过程在本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。 ”,泰勒的“目标中心模式”深深打上了行为主义心理学的烙印 ,其方法论的实证化特点非常明显。 首先,泰勒认为开展评价的依据是把所要评价的内容分成具体可见的、可操作的学生行为目标,以便在评价中能够围绕这些行为目标进行观察和测定,以此来控制教育活动,评价教育成败。如果制定的目标越明确、具体,可操作性越强,则实用性也就越大。他说:“除非对目标所指的那种行为有比较清楚的概念,否则就无法知道期待学生产生哪种行为,以了解这些目标实现程度。”,其次,泰勒在他的评价模式中非常强调对学习和教育结果进行客观地测量、统
35、计。他曾提出过三种评价手段:(1)由评价专家组织测验,通过这些测验测得学生的行为变化情况;(2)把学生置于特定情境之中,对学生的特定行为进行有目的的观察;(3)用提问的形式使学生表达观点,借以引起学生作出能体现其知识和能力的回答。泰勒在运用这些手段时,提出过三个重要准则:客观性、信度和效度。如果任何一种手段违背了这三条准则,都将是无效的手段。,泰勒的目标中心模式,教育目标至关重要。为了帮助教育者更清楚地表达教育目标,美国布卢姆于1948年开始致力于教育目标的分类研究, 1956年布卢姆等研究完成了认知领域的目标分类,1964年克拉斯弗完成了情感领域的目标分类,1965年和1972年辛普森和哈罗
36、分别完成了动作技能领域的目标分类。使评价手段的可操作性向前迈了一步,加强了评价的实证化倾向。此外,泰勒模式还催生了标准化测验,使评价手段的客观化程度进一步加强 。,2大发展时期(19581972年)背景:1957年苏联的人造卫星上天 ,美国朝野轰动。1958年美国国防教育法颁布,一方面给教育投入大量经费,另一方面又要求对教育工作实行科学的评价。1963年美国政府正式提出要对教育的效能和质量进行评价,并拨出大量专款用于教育评价理论与技术、方法的研究和培养专门的教育评价工作人员。,1963年,克龙巴赫发表了通过评价改进教程一文,尖锐地批评了以往的评价工作,他批评以往的评价概念缺乏实用性和合理性,用
37、实验组和控制组的测验分数进行比较,这是偏重于事后评价。他认为,应把评价作为一个收集和报告对课程设计有指导意义的信息过程,只报告测验的平均分数没有报告测验项目及其分析是没有用的。他指出:(1)评价人不仅应关心教育的目标,检验教育目标达到的程度,更应关心教育的决策;(2)评价的重点应放在教育过程之中,而不是在教育过程结束之后;(3)评价不是决定优劣的过程,而是作为一个收集和反馈信息的过程。,1963年,格拉泽发表文章,在指出相对评价的不足时,提出在今后学校教育中应着重进行绝对评价。1966年,斯塔夫宾提出了把背景评价(Context)、输入评价(Input)、过程评价(Process)和结果评价(
38、Product)结合起来而形成的CIPP模式。首次提出了过程评价的思想,他认为,评价不应局限于评判决策者所确定的教育目标预期效果的达到程度,而应该收集有关教育方案实施全过程及其成果的资料,评价是为决策提供信息的过程“评价的最主要目的不是为了证明(prove),而是为了改进(Improve)” 。,1、预期结果的决策,为这类决策提供信息的是背景评价。这种评价实际上是根据社会需要对教育目标本身作出价值判断,以图发现教育计划的目标同计划的实际影响的差异。所以,其实质是诊断性的。2、预期方法的决策,为这类决策提供信息的是输入评价,它是在阐明了决策目标后,对达到目标所需要的条件进行评价,实质上是对教育方
39、案、计划可行性的评价。,3、实际方法的决策,为这类决策提供信息的是过程评价,它为计划方案的制定者提供反馈信息,用于发现其实施过程中的潜在问题。4、实际结果的决策,为这类决策提供信息的是结果评价,它的重点也在于目标到达度。该模式的主要特点:突破了泰勒的框架,在许多地方有了新的发展,其中最主要的是目标的合理性和可行性受到了充分的重视,泰勒模式的缺陷在这里得到了克服。,1967年,斯克里文发表了评价方法论,提出了以下几种概念的区别:(1)形成性评价和终结性评价;(2)专业性评价和业余性评价;(3)比较性评价和非比较性评价;(4)目标达成度的评价和目标是否值得达成的评价。同时,斯克里文还提出了目标游离
40、模式(Goal Free),认为教育活动除了收到预期的效应外,还会产生各种“非预期效应”。这些非预期效应可能是积极的,也可能是消极的,但它对教育活动的社会价值总要产生或多或少的影响,因此,为了降低评价活动中方案、计划制定者主观意图的影响,不能把评价目的告诉评价者,以利于评价者收集教育的全部成果和信息,这种不受预定活动目标影响的评价模式被称之为“目标游离模式”或“无目标模式”。,1969年,艾斯纳对泰勒的目标评价理论进行了抨击。他认为,对教育本质的不同理解,可以造成对目标的不同表述,泰勒的评价方法不一定适用于教育实际。因为它既没有提供评价目标本身的方法,也没有提出判断评价目标与结果之间差异的标准
41、。在这个阶段,出现了40多种评价模式。 其发展演变情况是:从专家学者的研究领域变成政府工作范围;评价的内容和范畴从学生学习,课程与教学效果发展到教育决策和教育规划;评价的理论与方法技术有了迅速发展。教育评价方法论的主要特点是实证化倾向仍占主要地位,人文化倾向已开始萌芽。,3专业时期(1973年至今)背景:第二次世界大战后,随着美国经济的增长,公民权运动开始高涨,特别是60年代的社会动乱和社会变革时期,迫使人们在研究教育问题时,开始考虑人的需要和人与人之间交互作用对教育的影响,在方法论上逐渐向人文主义哲学靠拢。,人文主义哲学思潮:德国的赫尔德认为人类生命与自然世界中的背景相联系,他从人的自然与精
42、神的统一和双重特征出发,认为人性不是一个给定的数据而是一个问题,不是到处都一致的某种东西,它的基本特征可以一劳永逸地被人发现,而是可变的东西,它的特征要求在特殊的事例中进行单独的调查研究。,狄而泰认为:精神科学与自然科学完全不同,自然科学研究的是外在于人的客观或物质现象,而精神科学研究的则是人的精神生活,精神生活的中心或基本内容是价值和意义的体验、表达和理解。 叔本华和尼采的意志哲学,新康德主义者温德尔班德和李凯尔特的文化科学方法论,狄尔泰学派的生命哲学和解释学,以及胡塞尔的现象学和海德格尔、加达默尔的存在主义和哲学解释学。这些哲学思潮和运动,成为现代人文主义思潮的主要来源。,为了顺应人文主义
43、哲学潮流,教育评价出现了一系列新的模式。这些评价模式的共同特点就是在评价中不过分追求客观性,而是试图摒弃数量特征,不只是单纯从评价者的需要出发,而是考虑到所有参与人的需要,强调个体的经验、活动和主观认识的作用,强调必须把人类行为置于特定情境中加以理解,重视在调查研究中,在随机观察中,在与参与者的会谈和讨论中,获得定性的、而非定量的资料,主张以问题中心,把价值和意识问题作为研究的起点,提倡所谓的人文的方法,如个案法、谈话法、临床法、历史法等。,2022/11/26,71,可编辑,1975年,斯塔克创立了一种重视所有评价参与人的观点和看法的评价模式“应答评价模式” 。斯塔克认为“如果教育评价更直接
44、地指向方案的活动而非方案的内容,如果它能满足评价听取人对信息的需求,或者在反映方案得失长短的评价报告中更能反映人们不同的价值观念,那么,这种评价即可称为应答评价。”该模式旨在突出人的需要在评价过程中的作用。,在具体的评价过程中,应答性评价不是象预定式评价那样强调目标的表述和客观的测验,“该方法以牺牲某些测量上的准确性换取评价结果对方案有关人员来说更多的有用性,”它要求评价人要与被评价活动有关的各种人员接触,了解他们的愿望、看法并作实地观察,根据由此获得的信息确定评价范围,设计评价方案、选择收集信息的方法,然后对收集的信息进行分析判断并按需要对回答的问题进行分类,再将分类评价结果写成正式报告分发
45、各有关人员,最后,在分类评价的基础上对教育方案作出全面评价。这是一个广泛征询意见,了解评价需要的过程。,1973年殴文斯提出了对手式评价模式。对手式评价模式是为揭示教育方案和教育活动正反两个方面的长短得失所采用的准法律过程评委会审议形式的评价模式。它十分重视听取教育方案和教育活动的争议意见,尤其是反对的意见,所以又称“反对者”、“反向”或“抗衡”评价模式。对手式评价抓住了决策范围的两端,采用了“斗争”理论,靠相互对立的评价者通过出示更好的、也是更有说服力的证据,或者用能导致优势的法律或辩论技术(或其它技术)去努力获胜。对手通过争论,使各方面的意见得到充分反映,以便决策者全面掌握情况,作出正确的
46、结论。,20世纪80年代,美国出现了自称“第四代教育评价”的理论,由古巴(E.Cuba)和林肯(Y.S.Lincoln)合作创立。古巴和林肯认为:从评价本质上看,评价描述的并不是事物真正的、客观的状态,而是参与评价的人或团体关于评价对象的一种主观性认识,是一种通过“协商”而形成的“心理建构”。是参与评价及与评价有关的人和团体基于对对象的认识而整合成的一种共同的、公认的主观看法。从某种意义上说,评价结果由于受人们的物质心理、社会、文化条件限制,不是绝对意义上的“真理”,连“近似真理”也算不上,常常为人们主观偏好与误差所制约。因此,评价中应充分听取不同方面的意见,协调各种价值标准间的分歧,缩短不同
47、意见间的距离,最后形成公认的一致的看法。,古巴和林肯认为,评估过程可以包括以下环节:其一,确定所有与评估有关的人员,包括决策者、执行者、评估者、调适对象和局外人员;其二,征询各有关人员的评估构想与要求;其三,对不同的构想和要求加以评判说明;其四,针对未达成共识的观点拟定协商议程,收集提供协商所需的信息;其五,各种观点的代表进行协商论辩,通过论辩、协商以求达成共识;其六,通过不断的论辩、协商,解决不断出现的新问题。,本章参考资料:中国发展性评价网http:/,第二章 化学教学测量与评价,化学教学测量与评价,是化学教学系统的重要组成部分,是检查化学教学效果的主要手段,是提高化学教学质量的基本途径。
48、只有通过教学测量与评价,才能掌握学生的知识水平和学习状况,判断学生的学习能力和努力程度;才能研究教师的教学水平,发现教学上的薄弱环节。,第一节 概述一、化学教学测量的作用,1诊断作用 诊断是指对学生的学习能力、水平的现状及发展的判断。利用测量结果,可以诊断出学生对知识的掌握程度、相关能力的发展程度,从中发现学生的长处,亦暴露他们的弱点。2强化作用 测量结果的强化作用,可以激励优秀学生锦上添花,不断向上;可以促进中下学生增强信心,努力攀登,从而最大限度地调动全体学生的学习积极性。3调整作用,二、化学教学测量的方式,(一)书面方式书面方式是最常用、最主要的一种教学测量方式。它普遍适用在正常教学中的
49、水平测量(单元、期中、期末等),以及较大范围内的选拔性测量(中考和高考等)。 分为书面答卷、书面作业、书面报告等。 要使测量结果符合客观要求,必须做到:清楚、明确、简炼地提出问题;客观、公正、合理地评判答案。 (二)口头方式; (三)作业方式做好统计(问什么、向谁问、何时问)进行过程设计(设问引入、诱导引入、评核深入)(四)实验方式(主要是实验操作设计和考试等),三、化学教学测量的程序1确定目标(按课程标准和考试说明确定)2编制试卷(科学,严密,准确,全面和恰当)3现场施测(主要是试卷的保密等工作)4评定成绩(客观,公正,流水作业)5考核总结(基本情况,突出问题,努力方向),四、 化学教学评价
50、,教学质量的评价(一)评价的指标教学目标的设计,教学内容的安排,教学方法的选择,教学技能的运用,以及教学效果的估计等。(二)评价的原则课堂教学质量评价方式有:自评、他评、专评,即自己评、他人评或互相评、专家评。不任哪种形式都要遵循以下原则:1科学性原则 2客观性原则 . 3操作性原则,五、化学教学评价的方法,1.纸笔测验:理解相互关系,解决问题,真实情景,开放性2.学习档案评价:自我评价,表现进步3.活动表现评价:任务驱动,过程和方法,情感态度与价值观等方面的评价,4、网络教学学习评价,(1)网络教学评价的内容学生学习活动、学习效果的评价、教师指导活动的评价、学习资源质量的评价、支撑服务系统的