《心理咨询师考试课件(0727).ppt》由会员分享,可在线阅读,更多相关《心理咨询师考试课件(0727).ppt(202页珍藏版)》请在三一办公上搜索。
1、心理测量学基础理论知识,问题提出,有患者找你,说心情不好,感到生活没有意义,可能有心理问题,请你给他检查。这时你怎样检查?有学员找你,说想知道自己的个性特征,请你给他检查。这时你怎样检查?有家长带孩子找你,说想知道孩子的智力是否有问题,请你给他检查。这时你怎样检查?,进行心理测量,学心理测量,首先要,自己当被试,体验心理测量,你招别人嫉妒的指数有多高,当你已经老了的时候,一个人独自回忆过去,你认为最值得回忆的将是:a.让你刻骨铭心的情人b.一些还没有达成的心愿c.去旅行时的一些经历d.自己风光时的政绩e.与家人相处时的温馨,a.让你刻骨铭心的情人-80%:因为你的才华横溢出众,所以引起别人的嫉
2、妒。b.一些还没有达成的心愿-99%:你会大红大紫,从而引起别人的嫉妒。c.去旅行时的一些经历-55%:小心在自吹自擂时招来别人的嫉妒。d.自己风光时的政绩-40%:喜欢在别人面前吹嘘从而招来嫉妒。e.与家人相处时的温馨-20%:知道退一步海阔天空,故不易有人嫉妒。,心理测试在专业领域称为心理测量网上的心理测试很多是娱乐游戏性质,焦虑自评量表,A:1分 B:2分 C:3分 D:4分,标准分=原始分*1.25,5059分,轻度焦虑 6069分,中度焦虑 70分以上,重度焦虑,第5、9、13、17、19题反向记分A:4分 B:3分 C:2分 D:1分,如何进行心理测量?,(一)编制或选择心理测量工
3、具(二)正确使用心理测量工具进行测验(三)对测量结果进行统计分析 1.试卷得分输入电脑 2.利用SPSS软件进行统计分析 测验工具的质量分析:信度、效度、(区分度)原始项目得分 维度分(总分)标准分 与常模比较(四)对测验结果的解释与报告,1.课程说明,串讲目的参考教材学习要求知识体系,1.1 串讲目的,心理咨询从业资格证:轻松应试 顺利过关心理学双基培养:基础知识 基本技能,在考试中所占比例:(以2010年11月考试为例),三级:基础知识:实占25分(测验基础10题,6单选4多选;测验技能15题,9单选6多选。)技能:3-4个案例,占总分10分左右。基础知识与技能关系,1.2 参考教材,心理
4、学咨询师(基础知识),中国就业培训技术指导中心、中国心理卫生协会组织编写,民族出版社,20011年6月。,新旧教材的变化,新教材修订原则 结构不变 内容微调,新旧教材的变化,心理测量学的变化 两大方面:(目录)A、概念中的说明文字变少 B、删除了一些较难掌握且实用价值不大的公式,1.3 学习要求,基本要求:了解基本概念与原理 学会使用工具,1.3 学习要求,复习方法:心理测量学:熟练掌握习题集中的题目测验技能:做表格总结知识点。通过自己做测验、自己分析来熟悉量表知识点。多做技能训练题,熟悉常见题型。,1.4 知识体系,第一节 概述第二节 测验的常模第三节 测验的信度第四节 测验的效度第五节 项
5、目分析第六节 测验的编制第七节 测验的使用,2.内容串讲,串讲原则:要点讲析 考点点击(以往真题)根据考核要求将知识点分为识记、领会(理解)、应用三个不同的掌握层次。串讲以有效预习为前提,弱化章节结构。高度总结知识点,浓缩形成考点单。讲解并不平均用力,遵循“识记知识点明,领会知识讲清,应用知识联系实际”的原则。,第一节心理测量概述,第一单元 测量与测量量表,测量(定义07.11、要素06.11,08.5,08.11、量表05.11,06.11,08.5,09.5,09.5,09.11),一、什么是测量,测量就是依据一定的法则 用数字 对事物 加以确定。三元素:(1)测量的对象:事物(属性)(2
6、)测量的结果:描写事物属性的数字或符号(3)测量的法则例:对象:性别 结果:1表示男性 2表示女性 法则1:外部生理特征 法则2:性染色体,如何测量一个人的体温?应包含哪几个要素?,(3)测量法则:热胀冷缩原理,(1)测量对象:人的体温,(2)测量结果:37,例题,关于测量,正确的是()A.测量就是心理测量B.测量就是依据一定的法则用数字对事物加以确定C.测量就是用数字来描述事物的法则D.测量就是用一些题目或数字来描述事物的属性,二、测量要素,两个要素:参照点、单位。(一)参照点:要确定事物的量,必须有一个计算的起点,这个起点 叫做参照点。绝对参照点 相对参照点(二)单位:是测量的基本要求,没
7、有单位就无法进行测量。好的单位必须具备两个条件:一是有确定的意义,二是有相同的价值,三、测量量表,测量的本质是根据某一法则在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体成为量表。,测量工具,斯蒂文斯(SSStevens)根据量表的精确程度将测量从低级到高级分成四种水平,即命名量表、顺序量表、等距量表和等比量表,四种测量水平,命名量表,顺序量表,等距量表,等比量表,量表的两要素:参照点和单位,例题:4,5,7心理测量是在()量表上进行?,第二单元 心理测量的基本概念,一、心理测量的定义二、心理测量的性质,心理测量的基本概念,心理测量的定义,心理测量的性质,间接性相对性客观性,一
8、、心理测量的定义,定义:,少数有代表性的行为,相关的心理特征,推论,心理测验的基本要素:1、测量的对象是人的行为(典型行为)焦虑:紧张、胃不舒服、腰酸背痛、失眠抑郁:情绪低落、思维呆滞、夜轻昼重、生活无意义感,如何获得典型行为?,通过开放式调查、访谈、临床记录等,然后进行频次统计;计算区分度,2、心理测量依据的法则 心理学理论 3、心理测量的结果 对象的定量描述 作为现代科学的心理测量学,涉及多门学科。4、心理测量的工具 测验的本质:一个一个精心设计、精心编排,被称为“题目”的行为刺激组成,“测验”内容千差万别,形式林林总总。,心理测量的定义,例题:9.下列说法中正确的是()A.心理测量就是将
9、具有代表性的行为构成的项目集,对代表性人群进行测试,标准化后的数量化系统B.心理测量就是用标准化测验或量表,在标准情境下,对人的外显行为进行观察,并将结果按照数量或类别加以描述的过程C.心理测量就是对心理的某方面品质,采用多种手段进行系统地观察和综合评价D.心理测量就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段,二、心理测量的性质 08.11,二、心理的可测性,1.可测性,心理的可测性(续),2、间接性:外显行为-心理活动 心理属性如何测量?3、相对性:没有绝对的标准与零点 心理属性如何测量?4、
10、客观性:即标准化。标准化贯穿于心理测验的全过程。,第三单元 心理测验的分类,一、按测验的功能分类二、按测验材料的性质分类三、按测验材科的严谨程度分类四、按测验的方式分类五、按测验的要求分类 注意:分类标准(考核要点),一、按测验的功能分类,智力测验:,一、按测验的功能分类,特殊能力测验:音乐、绘画、文书才能测验,一、按测验的功能分类,人格测验:一般有两类,一类是问卷法,一类是投射法。前者如MMPI、16PF、EPQ,后者如罗夏测验、主题统觉测验(TAT),例:人格测验不包含()?A.EPQ B.16PF C.CRT D.MMPI,二、按测验材料的性质分类,(一)文字测验(二)操作测验也称非文字
11、测验,(一)客观测验(二)投射测验,三、按测验材科的严谨程度分类,四、按测验的方式分类,(一)个别测验(二)团体测验,五、按测验的要求分类,(一)最高作为测验最好的回答,主要与认知活动有关,有正确答案,能评定等级、水平。(二)典型行为测验按习惯方式作出反应,无正确答案。,第四单元 纠正错误的测验观,一、错误的测验观,二、正确的测验观,测验万能论 测验无用论 心理测验即智力测验,是心理学研究方法之一,是决策的辅助工具。作为研究方法和测量工具尚不完善,第五单元 心理测验在心理咨询中的应用,心理测验有什么作用?1.心理测验最基本功能:了解个别差异2.衍生出的心理测验功能:诊断、预测和评价:服务于心理
12、咨询与辅导 甄选、分类和安置:服务于人才测评与人力资源 心理和教育科研的辅助手段,第五单元 心理测验在心理咨询中的应用,心理门诊常用的3类心理测验:,智力测验:中国比内量表(吴天敏);韦氏成人智力量表WAIS-RC、韦氏儿童智力量表C-WISC、韦氏幼儿智力量表C-WYCSI(龚耀先)、韦氏儿童智力量表WISC-CR(林传鼎等);瑞文标准型测验SPM(张厚粲)、联合型瑞文测验CRT(李丹),人格测验:艾森克人格问卷EPQ;卡特尔16种人格因素问卷16PF;明尼苏达多项人格调查表(MMPI),心理评定量表:精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表、恐怖量表等。,第六单元 心理测验的发
13、展史,1.高尔顿及其弟子,1893年出版的人类才能及其发展的研究一书中,首先提出“测验”和“心理测量”这两个术语,发展出分析个别差异资料的统计方法,提出相关和回归的概念,(1)高尔顿(Galton):心理测验运动第一人,(2)皮尔逊(Pearson):创立积差相关法,(3)斯皮尔曼(Spearman):创立因素分析,提出智力的二因素理论,2.卡特尔(J.M.Cattell),1890年在心理测验与测量一文中第一次提出“心理测验”;他还提出智力的两个G因素理论,编制16PF问卷,3.智力测验的发展,(2)推孟(Terman)1916年修订比纳智力量表,形成斯坦福-比内智力量表 1960年 引入
14、离差智商概念 进行了心理学史上最长的纵向研究 最早研究婚姻幸福,(1)比内-西蒙(Binet-Simon)1905年,编制了世界上第一个正式的心理测验 1908年,修订比内-西蒙智力量表,提出智龄概念,(3)奥蒂斯(Otis),增加了操作量表提出了离差智商,(4)韦克斯勒(Wechesler),编制了第一个团体测验:陆军甲种和乙种智力测验,4.人格测验的发展,(1)投射测验,罗夏墨迹测验 主题统觉测验,(2)客观测验,明尼苏达多相人格问卷(MMPI):经验法 16种人格因素问卷(16PF):因素分析法 艾森克人格问卷(EPQ):生物学理论,5.我国心理测验的发展,张厚粲先生(1927-),晚清
15、“四大名臣”张之洞之孙女,北京师范大学教授、博导,主编了我国最早的心理与教育统计学教材 率先开设“心理测量”课程 主持了韦氏儿童智力量表、瑞文标准推理测验的修订,1985年,主持的“高考标准化广东区试验”获全国首届教育科学优秀成果一等奖,2000年,当选国际心理联合会副主席,第二节 测验的常模,常模团体(性质、条件:样本大小05.11,06.11,07.5,08.5,08.11、取样方法06.5,07.11,08.11,09.5、常模分数与常模08.5,08.11,09.11)常模的类型(发展顺序量表05.11,08.5,08.11、智力年龄05.11,09.11、百分位常模07.11,05.
16、11,08.5,08.11、标准分常模05.11,06.11,06.5,07.5,08.5,08.11,09.5,09.11)智商(智力年龄、比率智商09.5、离差智商09.5,09.11)常模分数表示法(转换表法06.5,09.5、剖面图法07.11),第一单元 常模团体,群体构成的界定所测群体的代表性样本样本的大小适当标准化样组是时空的产物,常模团体,性质,取样的方法,常模分数与常模,简单随机抽样系统抽样分组抽样分层抽样,条件,一、常模团体的性质,从总体中抽取出来、代表总体的样本。,总体:一个统计问题研究对象的全体,是具有某种(或某些)共同特征的元素的集合。,样本:按一定程序从总体中抽取的
17、一组个体。,二.常模团体的条件,(1)群体的构成必须明确界定 年龄、性别、职业、文化程度等,(2)代表性:代表总体,1936年,文学文摘调查240万人,预测兰登将获选美国总统;而盖洛普调查3万人,却成功预测罗斯福获选美国总统。,1952-1992年期间,盖洛普民意测验公司预测美国总统的调查人数一般为1500人.,(3)适当的样本容量,全国性常模,一般应有20003000人为宜。,常模样本量一般不低于30或100,总体数目小,只有几十个人,需要100%的样本。,三、取样的方法,取样即从目标人群中选择有代表性的样本。,总体单位,调查单位,抽样调查,按随机原则选择调查单位,各单位被选中的机会相同。,
18、(一)简单随机抽样 按照随机表顺序选择被试构成样本,(二)系统抽样(等距抽样),(三)整群抽样,整群抽样是首先将总体中各单位归并成若干个互不交叉、互不重复的集合,我们称之为群;然后以群为抽样单位抽取样本的一种抽样方式。例如:以一个自然班级为抽样单位,(四)分层抽样确定常模时最常用抽样方法,1.原始分数:被试完成一项测验之后,将被试的回答与答案加以比较,得到的被试的测验分数。2.原始分数本身,是没有什么解释意义的。例如:某学生在某次考试中成绩是80分,80分代表什么?3.如何解释心理测验分数?一种是标准参照,一种是常模参照,四、常模分数与常模,4.常模心理测验时用于比较和解释测验结果的参照标准,
19、它是常模团体的测验分数的分布。参照常模团体测验的分数分布,可以知道个体在分布中处于什么位置。,5.常模分数为了便于确定个体的测验得分在标准化样本群体中的地位,原始分数经常会被转换成为某种导出分数。进行这种转换的主要目的有两个:可以清晰地表示个体在标准化样本群体中的相对位置,从而可以在与其他人比较的基础上,对其成绩作出评价;可以对个体在不同测验上的作答表现直接进行横向比较。,经常使用的分数转换方式有两个途径:纵向转换,即把个体得分与不同年龄的发展水平进行比较,并转换成为相应的等级水平(发展常模)横向转换,即把个体得分与同一群体内其他人的分数进行比较,从而确定个体在群体内的等级位置(团体内常模),
20、第二单元 常模的类型(重中之重),常模的类型,发展常模,团体内常模,1.顺序量表2.智力年龄3.年级当量4.比率智商,1.百分位常模2.标准分常模3.离差智商,一、发展常模,发展常模表示个体在正常发展曲线上处于什么样的水平正常超前滞后,(一)发展顺序量表最早的一个范例是葛塞尔发展程序表按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平16周婴儿能使头部保持平衡,皮亚杰最著名的工作就是对守恒概念的研究。通常儿童到5岁时才会理解质量守恒;6岁才会掌握重量守恒;7岁时才有容量守恒概念。,(二)智力年龄20世纪初,比内提出一个测量儿童心理成长的设想据此,编制了比内-西蒙量表,在该量表
21、中使用智龄来度量智力,在比内-西蒙量表中,题目被划分入各个年龄水平,如7岁组,8岁组.如果为每个年龄水平都编制一些适当题目,便可得到一个评价儿童智力发展水平的年龄量表。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫做智力年龄,是年龄量表上度量智力的单位。,智龄=基础年龄与在较高年龄水平的题目上获得的附加月份之和。,基础年龄:全部题目都通过的那组题目所代表的年龄,用年表示附加年龄:儿童在较高年龄水平的题目上获得的附加月份之和。其计算方法是:附加年龄较高年龄水平的题目*2月,例题:(习题集31题)吴天敏修订的比内-西蒙量表中,某儿童通过了4岁组的全部题目,5岁组通过3题
22、,6岁组通过2题,7岁组通过1题,其智龄为()岁?,(三)年级当量测验结果说明被试的心理水平达到哪一年级的水平。有时候我们说某学生的成就为:拼写相当于7年级,阅读相当于8年级,数学相当于5年级水平。常模样本中6年级的算术平均分为35,某儿童在算术测验中也得35分,那么该儿童的算术是()水平(习题集32题),二、百分位常模,百分位常模包括百分等级和百分点、四分位数和十分位数。,(一)百分等级,一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比 是目前应用最广的表示测验分数的方法。55的百分等级表示在常模样本中有55%的人比这个分数低(习题集34题),(二)百分点(百分位数),百分点是
23、计算处于某一百分比例的人对应的测验分数是多少。,百分等级,测验分数(百分位数),(三)四分位数和十分位数,四分位数是将量表分成四等份,相当于百分等级的25%、50%和75%对应的三个点分成的四段。十分位数是用9个点将全部数据分为10等份,与9个分割点上相对应的数据称为十分位数。例题:36,37(理解),“被涨薪”、“被平均”、,甲地区:A:2000元/月;B:20000元/月平均工资:(2000+20000)/2=11000元,乙地区:C:5000元/月;D:10000元/月平均工资:(5000+10000)/2=7500元,推论:甲地区平均工资高于乙地区平均工资,但其贫富差距(基尼系数)也更
24、大,(1)均值()与标准差(SD),三、标准分常模,(2)标准分常模,优点:等距量表,可进行统计分析缺点:计算复杂,不易理解,标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。,因为它的基本单位是标准差,所以叫标准分数。,常见的标准分数有:z分数、T分数、标准九分、离差智商(IQ)等标准分数可以通过线性转换,也可以通过非线性转换得到线性转换:从正态到正态 非线性转换:从偏态到正态(通过百分等级),一般z分数:,正态分布曲线,Z,个体在群体中的相对位置:将原始分数与平均数的距离以标准差为单位来表示。,正态分布曲线,(3)z分数与百分等级的对应关系,查POZ表即可知标准分数与百分等
25、级之间的对应关系,z分数的转换形式:,z分数中经常出现小数点和负数,Z=A+Bz A:去掉负值;B:去掉小数,常见的z分数的转换形式:T分数、标准九分、标准十分、标准二十分、离差智商等,T分数 T=50+10z:M=50 SD=10,T:McCall定义,纪念Terman(推孟)和Thorndike(桑代克),量表:MMPI,EPQ,MMPI MMPI采用T分数,其解释主要考虑各量表的高分特点,如果那个分量表的T分在60分以上,便视为可能有病理性异常表现或某种心理偏离现象。,EPQ人格问卷的T分数曲线,中间型,倾向型,典型型,下面是某求助者的 EPQ 测验结果:粗分 T分 P 7 60 E 1
26、0 50 N 3 30 4 35,该求助者 N 量表得分与常模平均数之间相差()。(A)1.0 个标准差(B)1.5 个标准差(C)2.0 个标准差(D)2.5 个标准差(公式或看图),C,标准九分:M=5,SD=2,离差智商:使用最广、影响最大 量表:韦氏智力量表总分(FIQ、VIQ、PIQ)M=100,SD=15,标准十分:M=5.5,SD=1.5 量表:16PF,标准二十分:T=10+3Z M=10,SD=3 量表:韦氏智力量表的分测验标准分,思考:几种量表计分与结果解释?,韦氏智力量表各分测验标准分 T=10+3Z(标准20分)韦氏智力量表智商(FIQ、VIQ、PIQ)IQ=100+1
27、5Z(离差智商)MMPI、EPQ标准分 T=50+10Z(麦柯尔T分数标准分),一般z分数:,四、智商及其意义,1.智力年龄(心理年龄)若心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄,则智力较一般儿童低。但在使用中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性比内-西蒙量表(1908版),2.比率智商,推孟(1916)对比内-西蒙量表修订而成斯坦福-比纳智力量表比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。(公式5-3)比率智商并不适合于年龄较大的被试,3.离差智商:韦克斯勒(Wechesler),个体智力在所在年龄组中所处的位置,
28、韦氏智力百分等级分布表,1960年推孟在修订斯坦福-比内量表时也使用了离差智商(然而,其使用的是平均数为100,标准差为16的标准分数量表)(比内离差智商),专栏 几种导出分数间的相互关系,某求助者的WAIS-RC的测量结果显示:,该求助者分测验成绩处于常模平均水平的分测验包含()(A)知识(B)词汇(C)填图(D)拼图,根据测验结果,可以判断该求助者高于常模平均数水平的包括()。(A)VIQ(B)PIQ(C)领悟(D)拼图,在该求助者智商指标中,百分等级是84的是()?WAIS-RC的各项分测验采用的标准分常模是()?根据该求助者FIQ结果,其智力等级是()(A)高于平常(B)平常(C)低于
29、平常(D)边界从分测验结果可知,与一般人相比,该求助者弱项包括(),第三单元 常模分数的表示方法,一、转换表法 最简单而且最基本的表示常模的方法,有时也叫常模表。转换表显示出一个特定的标准化样组的原始分数及与其对应的等值分数:百分位数、标准分数、T分数等。,二、剖面图:直观剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。,第三节 测量的信度,信度定义(定义05.11,09.11、影响因素07.5,08.11、公式、指标05.11,06.11)评估方法(重测信度06.11,09.5,09.5、复本信度06.5,09.5、内部一致性信度
30、06.11,07.11,08.5、评分者信度05.11,07.5)信度与测验分数解释(解释05.11,08.5,09.11)影响因素(07.5,06.5,05.11,06.5,07.5,08.11,09.5,09.11),第一单元 信度的概念,信度是指测量结果间的一致性或稳定性程度。,一.信度的定义,导致测量结果间不一致性或不稳定性的因素是什么?,随机误差,误差:测量结果与被测量真值之间的差距。,信度是随机误差的反映。,随机误差:偶然的、变化无规律的误差。,系统误差:恒定的、变化有规律的误差。,什么叫误差?误差包括哪些?,真分数理论,信度分析的原理是真分数理论,真分数理论:实测分数等于真分数和
31、误差分数之和.X=T+EX:实测分数T:真分数(一个测量工具在没有测量误差时,所得到的纯正值。操作定义:经过无数次测量所得到的平均值)E:误差分数补充:真分数又可分解为目标真分数与非目标真分数(系统误差)两部分,根据方差分析原理,SX2=ST2+SE2将上述公式两边都队以SX2,得 ST2/SX2+SE2/SX2=1移项,得:1-SE2/SX2=ST2/SX2=rxx,SX2:实测分数方差(总方差、总变异)ST2:真分数方差(真分数变异)SE2:误差分数方差(误差变异)rxx:信度系数,信度的操作性定义:一组测量分数的真分数方差与总方差的比率。,二、信度的指标,(一)信度系数、信度指数 信度系
32、数是一种相关系数(二)测量标准误(是测量误差的指标)(公式5-13)信度越高,标准误越小;信度越低,标准误越大。,第二单元 信度评估的方法,一、重测信度-再测法(跨时间的一致性)二、复本信度-等价法(内容上的一致性)三、内部一致性信度(题目间一致性)四、评分者信度(多位评分者一致性),1.定义:重测信度是指用同一量表对同一组被试施测两次所得结果的一致性程度。皮尔逊积差相关系数一般是两周到四周较宜,间隔时间最好不超过六个月。2优缺点,一、重测信度:跨时间的一致性,二、复本信度:跨内容形式的一致性,1含义和计算 复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度。皮尔逊积差相关系数2优缺
33、点,三、内部一致性信度:测题间的一致性,含义:不同的测题(至少3题)测的都是同一心理特质信度值:Cronbach 系数我觉得比平常容易紧张和着急。我容易心里烦乱或觉得惊恐。我感觉容易衰弱和疲乏。我因为胃痛和消极不良而苦恼。我容易入睡并一夜睡得很好。我做恶梦。,四、评分者信度,随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。,各种信度系数相应误差变异的来源,评分误差存在的严重性,严重到什么程度?历史教授的答案被评阅为“不及格”高考作文一幅漫画的启示,67
34、位评阅者,6至25分都有,最高分与最低分相差19分1984年,高考作文评分调查,438位老师,4篇作文,。最高得分为41.25,最低分为20.75,标准差为2.98。1985年,对1984年的四篇作文再研究,347位老师(有部分年参加研究的老师),最高得分为42.5,最低分为24.75,标准差为3.3。,注:表中数据来源,Lewis R.Aiken:Psychological testing and assessment(eighth edition),Allyn and Bacon,Inc,1994.,1.信度是评价测验质量的重要指标之一,第三单元 信度与测验分数的解释,确定测验可以接受的信
35、度水平认知测验:0.90以上人格测验:0.80以上团体比较:0.70以上鉴别或预测个人成绩或作为:0.85以上一般原则是:信度低于0.70时,测验不能使用,2.解释总变异中真分数造成的变异的比例,信度系数可以解释为测验总变异中真分数造成的变异占百分之几。(信度的操作性定义)ST2/SX2=rxx,例如,我们已知高考文科试卷的总信度rXX=0.965,文科考生总分的标准差为53.42,那么,文科考试成绩的标准误为:,3.信度可以用来解释个人测验分数的意义测量标准误。,如果某生的考试成绩为495分,在置信度为0.95时,其真分数的置信区间为:,4.信度可以帮助进行不同测验分数的比较。,差异分数的测
36、量标准误可用如下公式求出:,式中,SEdiff是差异分数的测量标准误;rXX和rYY是两个测验各自的信度系数;SD是两测验间使用的相同的标准差,第四单元 影响信度(随机误差)的因素,测验过程涉及的因素有:,1.受测者(样本)2.施测者3.测验情境4.测验工具5.两次施测的时间间隔,一、受测者方面(样本)(一)就单个受测者而言(二)就受测者团体(样本团体而言)1.样本团体异质性的影响:若获得信度的取样团体较为异质的话,往往会高估测验的信度。2.样本团体平均能力水平的影响样本团体平均能力水平太低,受测者由于他们猜测较多,故信度较低。,二、施测者方面 施测者不按指导手册规定施测,或故意制造紧张气氛,
37、或给考生暗示、协助,或施测者没有掌握好评分标准,随心所欲解释,都会降低信度。三、施测情境 实施测试时,考场是否安静,光线是否良好,所需设备是否齐备,桌面是否合乎要求,空间阔窄是否恰当等。,四、施测工具施测工具的难度、长度等会影响信度。第一,测验越长,测验的测题取样或内容取样就越有代表性。第二,测验越长,被试的猜测因素影响就越小。增加测验长度的效果应遵循报酬递减率原则 难度对信度影响仅存在于某些测验中,若测验对某团体太难或太易,则分数范围将缩小,从而使信度降低,为什么增加测验的长度,会提高信度?第一,测验越长,测验的测题取样或内容取样就越有代表性。第二,测验越长,被试的猜测因素影响就越小。增加测
38、验长度的效果遵循报酬递减率原则,五、时间间隔(只影响重测、重测复本信度)以再测法或复本法求信度,两次测验相隔时间越短,记忆练习效应越明显,其信度系数越大六、信度的特殊问题(教材:p382),习题,关于心理测验,下列说法正确的是()。(A)测验越长,测验的测题取样或内容取样越有代表性(B)测验越长,被试者受猜测因素的影响就越小(C)测验越长,遵循报酬递增率原则(D)测验太长,有时会引起被试者的疲劳和反感而降低可靠性,ABD,信度只受(B)的影响A、系统误差 B、随机误差C、恒定效应 D、概化理论,同质性信度主要代表测验内部()间的一致性(A)两半测验(B)题目与分测验(C)所有题目(D)分测验,
39、C,测验实施中的干扰因素包括(ABCD)(A)主试者的影响因素(B)测验情境(C)被试者的影响因素(D)其他干扰因素,一般要求在成对的受过训练的评分者之间平均一致性达到()以上,才认为评分是客观的。(A)0.70(B)0.80(C)0.90(D)1.00,C,以再测法或复本法求信度,两次测验相隔时间越短,其信度系数(A)。(A)越大(B)越低(C)越小(D)不变,使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数,叫(),又称()。(A)复本信度(B)重测信度(C)稳定性系数(D)分半信度,B,C,第四节 测验的效度,效度定义(定义05.11,08.5,08.11
40、、公式07.5、性质07.11,08.5)评估方法(内容效度05.11,07.5,07.11,05.11,06.11,08.11,09.5.,09.11,、构想效度07.11,08.5,08.11、效标效度06.11,08.5,09.5,09.11)效度的功能影响因素(06.5,07.11,05.11),第一单元 效度的概念,效度是指测量结果的有效性或准确性程度。,1.效度的定义,小李飞刀,例无虚发,2.影响效度的因素:,随机误差和系统误差,效度是测量的随机误差和系统误差的综合反映。,SX=SV+SI+SErXY2=效度=SV/SX=1-(SI/SX+SE/SX),SX:实测分数方差(总变异数
41、);SV:与测量目标有关的真变异数;SI:系统误差方差;SE:随机误差方差,实测分数真分数+随机误差分数 目标真分数+系统误差分数+随机误差分数,3.效度的计算公式,4.效度的操作性定义一组测量分数的有效方差与总方差的比率。,(一)效度具有相对性 效度是一个相对概念,是相对于某种测量目的而言的,只能达到某种程度的相对准确,不能百分百的准确 在评鉴测验的效度时,必须考虑测验的目的和功能(二)效度具有连续性,5.效度的性质,6.信度和效度的关系,(1)信度是效度的必要而非充分条件,(2)效度受信度制约 低信度一定低效度,高效度一定高信度,但高信度不一定高效度。高效度意味着随机误差和系统误差都小,因
42、此一定高信度,但高信度只意味着随机误差小,并不一定系统误差也小,因此效度不一定高。,第二单元 效度评估的方法,美国心理学会在1974年所发行的教育与心理测量之标准一书中将效度分为三大类:即内容效度、构想效度和效标效度。,效度评估方法,内容效度,效标效度,对测验本身的分析测验间的相互比较效标效度的研究证明实验法和观察法证实,构想效度,专家判断法统计分析法经验推测法,相关法区分法命中率法,一、内容效度,(一)什么是内容效度内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。即一个测验实际测到的内容与所要测量的内容之间的吻合程度。因此,一个测验要有内
43、容效度必须具备两个条件:(1)要有定义完好的内容范围。(2)测验题目应是所界定的内容范围的代表性取样。,(二)内容效度的评估方法,1.专家判断法最常用的方法 请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。又称“逻辑效度”2统计分析法:用两个测验复本来测同一批被试,若相关高,则内容效度可能高,但若相关低,则说明必有一个测验缺乏内容效度。3经验推测法 实践,(三)内容效度的特性,内容效度与表面效度的区别:表面效度(surface validity):外行人对某个测验从表面上看好像是测某种心理特质的程度。并不是一种真正的效度。最高行为测验要求有较高的表面效度,以激发
44、被试的动机;典型行为测验要求较低的表面效度,以减少掩饰和防御机制。,结构效度:,结构:,自圆其说,用来解释人类行为的理论框架或心理特质,如智力。,测验能测量到理论上的结构或特质的程度。,二、构想效度,结构效度的确定方法结构效度确立的一般步骤:(1)提出理论框架;(2)依据理论框架推演出有关测验成绩的假设;(3)用逻辑或实证的方法来证明假设。,结构效度确定的具体估计方法:(1)测验内部寻找证据法 l 分析测验的内容效度 若内容效度高,说明其结构效度也高 l 计算测验的内部一致性信度 内部一致性信度可以推断测量是单一特质还是测量多种特质,从而为结构效度提供证据 l 被试解答测题时的反应特点,(2)
45、测验之间寻找证据法l相容效度:新老测验之间的相关(两测验测的是同一心理特质)。若相关高,则说明新测验可能有较高的效度。l区分效度:新老测验之间的相关(两测验测的不是同一心理特质),若相关低,则说明新测验可能有较高的效度。l因素分析法:数据得出的因素符合理论的构思,说明效度高。,(3)考察测验的实证效度法例如:一份测验其理论构想为:个体可以分为内向与外向两种类型一组现实中被公认为是性格外向的人在测验中得分较高,另一组被公认为是性格内向的人在测验中得分较低,则说明该测验能区分人的内向与外向特征,进而说明该测验在测量人的性格内外向方面有较高的结构效度。,(4)实验法和观察法证实观察实验前和实验后测验
46、分数的差异也是验证构想效度的方法。,二、实证效度(效标效度),效标:被预测的行为,如成就、幸福感,一个测验对处于特定情境中的个体的行为进行估计的有效性。被估计的行为是检验测验效度的标准,简称效标。,用智力、责任感来预测成就用人格、乐观性、社会支持来预测幸福感,效标与效标测量效标(criterion)是衡量一个测验是否有效的外在标准。常用的效标:学业成就、临床诊断、实际工作表现、特殊训练成绩、不同团体的总体表现、先前有效的测验、等级评定。观念效标:理论定义,如“大学的成功”效标测量:操作定义,如大学成绩,根据效标资料是否与测验分数同时获得,分为 同时效度,幽默感强的人,幸福感水平更高。操作:幽默
47、感问卷、幸福感量表同时施测,预测效度,纵向研究:智力、成就动机、兴趣、责任感预测工作成就,效标效度的评估方法(1)相关法测验分数与效标测量之间的相关系数。例:幽默感与幸福感水平求相关(2)区分法 区分法是检验测验分数能否有效地区分由效标所定义的高分组与低分组团体的一种方法。效标的高分组与低分组,在测验分数上是否具有显著差异。,(3)命中率,总命中率=(A+D)/(A+B+C+D)正命中率=A/(A+C),第三单元 效度的功能,已知某测验的效度系数为0.7,下列说法正确的是:(A)该测验能够对效标作出正确预测的比例为0.49(B)该测验能够对效标作出正确预测的比例为0.70(C)该测验无法对效标
48、作出正确预测的比例为0.51(D)该测验无法对效标作出正确预测的比例为0.30,第四单元 影响效度的因素,影响效度的因素,测验本身的因素,测验实施中的干扰因素,样本团体的性质,效标的性质,主试的影响被试的影响,样本团体的异质性干涉变量,习题,在心理测验中,效度是指一个心理测验的()A、稳定性B、准确性 C、可信度 D、区分性,B,效标效度的主要评估方法有()(A)相关法(B)区分法(C)失误法(D)命中率法,ABD,效度具有相对性,因此在评鉴测验的效度时,必须考虑测验的()(A)信度(B)目的(C)功能(D)长度,BC,内容效度的评估方法包括()(A)专家判断法(B)双向细目表法(C)统计分析
49、法(D)经验推测法,ACD,构想效度的估计方法包括()(A)对测验本身的分析(B)测验间的相互比较(C)效标效度的研究证明(D)实验法和观察法证实,ABCD,在编制测验时,效度是要考虑的重要特性。如果编制最高行为测验,除了内容效度,也要求有()。(A)较高的表面效度(B)较好的专家判断(C)较好的外行判断(D)主观性,A,第五节 项目分析,难度(定义07.5,07.11、计算方法、难度水平确定05.11,09.5)例:93,94,95区分度(定义07.5、计算方法06.5)区分度与难度的关系06.5,06.5,07.5,第一单元 项目的难度,难度,定义,难度水平的确定,二分法记分的项目非二分记
50、分的项目,计算方法,项目的难度测验的难度,一、定义,难度(difficulty),是指项目的难易程度。在非能力测验(如人格测验)中,类似的指标是“通俗性”难度的指标通常以P表示,P值越大,难度越低(公式5-14)例题:在200名学生中,答对某项目的人数为120人,则该项目的难度为?(习题集 93题),二、计算方法,(一)二分法记分的项目(公式5-15)例题:在370名被试者中,选为高分组和低分组的被试者各有100人,其中高分组有70人答对第1题,低分组有40人答对第1题,则第1题的难度为?(习题集 94题),(二)非二分记分的项目(公式5-16)例题:数学测验的第7题满分为15分,该题考生的平