新课件-心理测量学.ppt_三一办公31ppt.com

资源描述

《新课件-心理测量学.ppt》由会员分享，可在线阅读，更多相关《新课件-心理测量学.ppt（261页珍藏版）》请在三一办公上搜索。

1、心理咨询师考试心理测量学知识,张春雨（）西南大学心理学院,主要内容,第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用,第一节概述,第一单元测量与测量量表第二单元心理测验的基本概念第三单元心理测验的分类第四单元纠正错误的测验观第五单元心理测验在心理咨询中的应用第六单元心理测验的发展史,一、什么是测量测量就是依据一定的法则用数字对事物加以确定。三个主要的元素：(1)事物；(2)数字；(3)法则。,第一单元测量与测量量表,所谓“事物”，指的是我们要测量的对象，更准确地说，就是引起我们兴趣的事物的属性或特

2、征。所谓“数字”，是代表某一事物或事物某一属性的量。区分性1与2序列性（等级性）3 2 1等距性 321、211可加性所谓“法则”，代表的是测量所依据的规则和方法,二、测量要素,(一)参照点参照点有两种：绝对零点人定的参照点，即相对零点(二)单位好的单位必须具备两个条件：确定的意义相同的价值,三、测量量表,测量的本质是根据某一法则将事物数量化，即在一个定有单位和参照点的连续体上把事物的属性表现出来，这个连续体称为量表。由于制定量表的单位和参照点不同，量表的种类也不同。,（1）命名量表只是用数字来代表事物或对事物进行分类。量表中的数字没有任何数值意义，不能作量化分析。无大小意义，只表明类别。无参

3、照点和单位。无法比较大小或进行任何数学方法运算。测量水平最低的一种形式，如代号、类别,四类量表,（2）顺序量表表明类别的大小或某种属性的多少。主要用于分等论级和分类。数字仅表示等级并不表示某种属性的真正量或绝对值。无参照点（没有绝对零度）和单位。无法进行数学方法运算。,（3）等距量表存在大小关系。无绝对零度，但存在相对零点。有相等单位，可以进行加减数学运算，但不能做乘除运算。,（4）等比量表是最精确的测量。具有相等单位又有绝对零点。大多是物理量表，可以进行各种数学运算。可以知道事物之间的某种特点上相差多少及它们之间的倍数关系。心理测验本质属于顺序量表！,第二单元心理测量的基本概念,一、心理测

4、量的定义二、心理测量的性质,一、心理测量的定义,所谓心理测量，就是依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。,二、心理测量的性质,(一)间接性(二)相对性(三)客观性,心理测量的间接性,研究者无法直接测量人的心理，只能测量人的外显行为，也就是说，只能通过一个人对测验题目的反应来推论他的心理特质。特质是构成人格的最小单位，是激发与指导个体的各种反应的恒常的心理结构。,心理测量的相对性,在对人的行为做比较时，没有绝对的标准，也就是没有绝对的零点，有的只是一个连续的行为序列。所谓测验就是看每个人处在这

5、个序列的什么位置上。,心理测量的客观性,测验的客观性实际上就是测验的标准化问题。对一切测量的共同要求是测验工具的标准化。测验用的项目或作业、施测说明、施测者的言语态度及施测时的环境等，要求标准化。测验评分记分的原则和手续也要经过标准化，使反应的量化是客观的。最后，分数转换和解释标准化，对结果的推论应该是客观的。,第三单元心理测验的分类,按测验的功能分类按测验材料的性质分类按测验材料的严谨程度分类按测验的方式分类按测验的要求分类,一、按测验的功能分类,(一)智力测验(二)特殊能力测验(三)人格测验EPQ16PFMMPI,二、按测验的性质分类,(一)文字测验(二)操作测验也称非文字测验。,三、按

6、测验材科的严谨程度分类,(一)客观测验(二)投射测验,四、按测验的方式分类,(一)个别测验(二)团体测验,五、按测验的要求分类,(一)最高行为测验（智力测验、成就测验）(二)典型行为测验（人格测验）,第四单元纠正错误的测验观,错误的测验观正确的测验观,一、错误的测验观,(一)测验万能论(二)测验无用论(三)心理测验即智力测验,二、正确的测验观,(一)心理测验是重要的心理学研究方法之一，是决策的辅助工具(二)心理测验作为研究方法和测量工具尚不完善,第五单元心理测验在心理咨询中的应用,智力测验人格测验心理评定量表,这几个方面是我国目前心理门诊中运用较多的,第六单元心理测验的发展史,科学心理测

7、验的产生和发展现代心理测验在我国的发展,一、科学心理测验的产生与发展,高尔顿(FGalton)提出人的不同气质特点和智能是按身体特点的不同而遗传的。为了研究差异的遗传性，便设计了测量差异的方法。为心理测验奠定了统计学基础。他第一个提出了相关的概念,卡特尔,卡特尔是对心理测验发展做出巨大贡献美国心理学家。1890年，卡特尔在心理杂志上发表心理测验与测量一文，这是心理测验第一次出现于心理学文献中。在此文中，卡特尔写到：“心理学若不立足于实验与测量上，决不能够有自然科学之准确性。”又说：“心理测验如果有一个普遍的标准，则其科学的与实用的价值都可以增加。”他当时就极力主张测验手续和考试方法应有统一规定

8、，并要有常模以便比较。所有这些都是测量学上的重要概念。,比内(ABinet)世界上第一个正式的心理测验。,20世纪以后，心理测验主要有以下几个方面的发展：1操作测验的发展2团体智力测验的发展3能力倾向测验的发展4人格测验的发展,二、现代心理测验在我国的发展,近些年来我国的心理学家正在致力于测验本土化.,近代中国的心理测验,1914年，Creighton比较中美儿童智力差异（广州，500人）1916年，樊炳清首先介绍了比西智力量表1918年，Walcott用S-B施测（清华）1918年，俞子夷编制“小学生毛笔书法量表”1920 南京高等师范学校，廖世承、陈鹤琴开设心理测量课,1921年，廖世承

9、、陈鹤琴出版书心理测量法1921年，费培杰将比内智力测验翻成中文1922年，张耀翔在北京将心理测验列为入学考试科目1922年夏，中华教育改进社聘请美国麦柯尔 1924年，陆志韦发表订正比内西蒙智力测验说明书；36年代与吴天敏做修订（80年代吴天敏3修）,1931年6月由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议，组织并成立了中国测验学会。南京1932年，测验创刊1935年，沈有乾用“朋洛德人格问卷”测量中国学生1937年，周先庚使用“塞斯顿情绪稳定性测验”此时智力测验和人格测验约20种，教育测验50种,1943年，林传鼎试用“普莱西X-O测验”丁瓒等于46，4752年分别将TAT（主题统觉测验）与韦克

10、斯勒布勒维测验用于临床。194851年间，刘范使用过RIT（罗夏克墨迹图测验）。至1949年，出版的测验方面的书籍共计20余种,1979年，林传鼎，吴天敏，张厚粲在武汉举办全国测验培训班1979年，龚耀先主持修订“韦克斯勒成人智力量表”1979年，林传鼎、张厚粲编制“少年儿童学习能力测验”1980年，林传鼎、张厚粲主持修订“韦克斯勒儿童智力量表”1980年，北师大开设心理测验课,1980年，张厚粲开始对高考试卷做系统分析1981年，刘绍衣修订“卡特尔16种人格因素问卷”1982年，吴天敏第三次修订中国比内测验1982年，宋维真修订“明尼苏达多相人格调查表”,1983年，龚耀先、陈仲庚修订“艾

11、森克问卷”1984年，中国心理学会成立心理测量专业委员会1984年，我国正式加入“国际教育成就评价协会”1985年，张厚粲主持修订“瑞文标准推理测验”1986年，龚耀先主持修订“韦克斯勒幼儿智力量表”,1987年，张明园修订“生活事件量表”1989年，李丹修订“瑞文测验（联合型）”1990年，中国加入国际测验委员会（ITC）；吴文源修订“症状自评量表（SCL-90）”1992年，戴忠恒修订“一般能力倾向测验”,1992年，宋维真编制“心理健康调查表”1992年，沙毓（yu）英等编制“学生性格量表”1993年，宋维真等编制“中国人个性测量表”（CPAI）1980年代，编制超常、弱智儿童筛查量表、

12、03（6）岁儿童发育、发展量表、CPM领导行为评价量表,真题练习,200705-103、正确的测验观包括（）。（A）心理测验是重要的心理学研究方法之一，是决策的辅助工具（B）做心理测验时态度要正确（C）心理测验作为研究方法和测量工具不完善（D）“一考定终身”说明心理测验非常重要200705-104、人格测验包括（）。（A）EPQ（B）MMPI（C）16PF（D）CRT200711-50、关于测量，正确的说法是（）。（A）测量就是心理测量（B）就是依据一定的法则用数字对事物加以确定（C）就是用数字描述事物的法则（D）就是用一些题目或数字来描述事物的属性,AC,ABC,B,真题练习,200806-

13、105、心理测验具有（）。（A）外显性（B）间接性（C）相对性（D）客观性200806-106按测验的功能，可将测验分为（）。（A）智力测验（B）特殊能力测验（C）人格测验（D）投射测验200806-109错误的测验观包括（）。（A）心理测验即人格测验（B）心理测验尚不完善（C）心理测验即智力测验（D）测验万能论200811-106、按测验的方式分类，可将测验分为()。(A)操作测验(B)文字测(C)个别测验(D)团体测验,BCD,ABC,ACD,CD,真题练习,200811-107、心理测验具有()。(A)外显性(B)间接性(C)相对性(D)客观性200811-108、测量的主要元素包括()

14、。(A)事物(B)数字(C)法则(D)描述200905-91、测量所用数字具有自然数的特点，即具有（A）区分性（B）等级性（C）等距性（D）可加性200905-118、等距量表中的数值可以进行（）运算。（A）加（B）减（C）乘（D）除,BCD,ABC,ABCD,AB,真题练习,200911-34、人格测验不包括()。(A)EPQ(B)16PF(C)CRT(D)MMPI2200911-55、在顺序量表中，变量具有()。(A)相等单位(B)绝对零点(C)等级(D)可以做四则运算 200911-75、编制世界上第一个正式的心理测验的学者是()。(A)高尔登(B)比内(C)卡特尔(D)奥蒂斯20091

15、1-91、按测验的功能，可将测验分为()。(A)智力测验(B)特殊能力测验(C)人格测验(D)投射测验200911-118、按测验材料的性质，可将测验分为()(A)文字测验(B)主题统觉测验(C)智力测验(D)操作测验,C,C,B,ABC,AD,真题练习,201011-107、按测验材料的性质，可将测验分为（）。（A）文字测验（B）智力测验（C）主题统觉测验（D）操作测验201105-53、在顺序量表中，变量具有()。(A)相等单位(B)等级(C)绝对零点(D)可以做四则运算,AD,小结:第一节概述,第一单元测量与测量量表第二单元心理测验的基本概念第三单元心理测验的分类第四单元纠正错

16、误的测验观第五单元心理测验在心理咨询中的应用第六单元心理测验的发展史,心理测量学,第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用,第二节测验的常模,第一单元常模团体第二单元常模的类型第三单元常模分数的表示方法,第一单元常模团体,一、常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。用一个标准的、规范的分数表示出来，以提供比较的基础。任何一个测验都有许多可能的常模团体。,第一单元常模团体,一、常模团体的性质常模的选择主要是基于对测验将要施测的总体的认识，常模团体

17、必须能够代表该总体。常模的选择包括：确定一般总体、确定目标总体、确定样本。使用测验需要特别注意常模团体。,二、常模团体的条件,(一)群体的构成必须明确界定(二)常模团体必须是所测群体的代表性样本(三)样本的大小要适当在实际工作中，应从经济的或实用的可能性和减少误差这两个方面来综合考虑样本的大小。一般最低不小于30或100个。全国性常模，一般应有20003000人为宜。样本大小适当的关键是样本要有代表性。(四)标准化样组是一定时空的产物在选择合适常模时，要注意选择较为新近的常模。,三、取样的方法,取样即从目标人群中选择有代表性的样本。抽样方法有下列几种：,(一)简单随机抽样按照随机表顺序选择被试

18、构成样本,(二)系统抽样系统抽样要求目标总体无序可排，也无等级结构存在。,(三)分组抽样先将群体进行分组，再在组内进行随机取样。,(四)分层抽样先将目标总体按某种变量分成若干层次，再从各层次中随即抽取若干被试，最后把各层的被试组合成常模样本。,四、常模分数与常模,(一)常模分数常模分数就是施测常模样本被试后，将被试者的原始分数按一定规则转换出来的导出分数。由原始分数构成的分布转换而来的分数，叫导出分数导出分数具有一定的参照点和单位，它实际是一个有意义的测验量表，它与原始分数等值。（有意义、等单位、带参照点）,(二)常模,常模分数构成的分布，就是通常所说的常模(norm)，它是解释心理测验分数的

19、基础。常模有一般常模与特殊常模之分。,第二单元常模的类型,发展常模百分位常模标准分常模智商及其意义,一、发展常模,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。(一)发展顺序量表(二)智力年龄(三)年级当量,(一)发展顺序量表,最早的一个范例是格塞尔发展程序表皮亚杰最著名的工作就是对守恒概念的研究。,格塞尔婴幼儿发展量表Gesell Developmental Schedules由美国耶鲁大学的A.格塞尔及其同事制定的婴幼儿发展测量工具。最初发表于1925年，后对它作了几次修订，先后发表于1937、1940、1947和1974年。1974年修订版的测试对象为从出生至5岁、重

20、点是3岁以下的幼儿，测试时间约30分钟。格塞尔早期用电影记录并分析了幼儿的日常行为反应，发现了幼儿发展程序的规律。他认为，幼儿的生长发展是有次序地逐步成熟和由简易分化到精细分化。幼儿的行为在抵达某一阶段时会显示出特殊的飞跃式进展，幼儿的新行为在成熟程序上具有代表性，并反映其在生长发育上已抵达新的阶段。格塞尔称这些年龄阶段为枢纽年龄，并把测定枢纽年龄列为量表的重点检查项目和诊断标准。格塞尔量表确定，1岁内以每4周为一个阶段，而以4周、16周、28周、40周、52周作为枢纽年龄，13岁间则以36月为一个阶段,以18月、24月、36月为枢纽年龄。,格塞尔婴幼儿发展量表Gesell Developme

21、ntal Schedules其检查内容分应人能：测试幼儿对周围人的应答能力和料理自己生活的能力；应物能：测试幼儿看物、摘物和绘画等能力；言语能：测试幼儿听、理解和言语能力；动作能：测试幼儿坐、步行和跳跃的能力。结果以发展商数评价幼儿的发展水平。格塞尔认为，所观察到的发展现象反映了中枢神经系统的成熟程序。这一理论受到各方面的肯定。格塞尔量表具有临床诊断的价值，它不仅适用于测量幼儿的发展水平,而且比其他量表更适用于伤残儿,被认为是婴幼儿智能测试的经典方法。20世纪60年代初,中国开始在临床上试用格塞尔量表。,(一)发展顺序量表,皮亚杰对守恒概念的研究。,儿童不是时期出现不同的守恒概念5岁能理解质量

22、守恒概念6岁掌握重量守恒概念7岁掌握容量守恒概念,(二)智力年龄比内-西蒙量表中首先使用智力年龄的概念。一个儿童在年龄量表上所得的分数，就是最能代表他的智力水平的年龄。这种分数叫做智力年龄，简称智龄。直接的计算年龄常模转换,(三)年级当量年级当量实际上就是年级量表，测验结果说明属哪一年级的水平，在教育成就测验中最常用。,二、百分位常模,百分位常模包括百分等级和百分点、四分位数和十分位数,(一)百分等级,一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。,(二)百分点（百分位数）,在分数量表上，相对于某一百分等级的分数点就叫百分点或百分位数。,(三)四分位数和十分位数,四分位数是将

23、量表分成四等份，相当于百分等级的25%、50%和75%对应的三个点分成的四段。十分位数是将一组数据由小到大（或由大到小）排序后，用9个点将全部数据分为10等份，与9个分割点上相对应的数据称为十分位数。,三、标准分常模,常见的标准分数有：z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。标准分数可以通过线性转换，也可以通过非线性转换得到,(一)线性转换的标准分数,(公式5-2)其中X为任一原始分数，为样本平均数，SD为样本标准差。Z=A+Bz(公式5-3)加上一个常数（A）是为了去掉负值，乘以一个常数（B）是为了使单位变小从而去掉小数点。,(一)线性转换的标准分数,当以50为平均数(即加上

24、一个常数50)，以10为标准差(乘以一个常数10)来表示时，通常叫做T分数，即：T50+10(公式5-4)最早使用T分数者是麦柯尔。,标准九分、十分、二十分,标准九分：量表是个9级的分数量表。它是以5为平均数，以2为标准差的一个分数量表。标准十分：平均数为5，标准差为1.5；标准二十分：平均数为10，标准差为3。使用最广、影响最大的一种常态化标准分数则是离差智商。,(二)非线性转换的标准分数,当原始分数不是常态分布时，也可以使之常态化，这一转换过程就是非线性的。常态化过程主要是将原始分数转化为百分等级，再将百分等级转化为常态分布上相应的离均值，并可以表示为任何平均数和标准差。计算步骤如下：1对

25、每个原始分数值计算累积百分比；2在常态曲线面积表中，求出对应于该百分比的z分数。所得的z分数可将分布分成几部分，称z/分数，以区别由线性转换所求得的z分数。,四、智商及其意义,若心理年龄高于其生理年龄，则智力较一般儿童高，若心理年龄低于其生理年龄，则智力较一般儿童低。但在使用中发现，单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性,(一)比率智商,比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。(公式5-5)由于个体心理年龄与实足年龄并不同步增长，所以比率智商并不适合于年龄较大的被试。,(二)离差智商,是一种以年龄组为样本计算而得的标准分数，它表示的是个体智力在年龄

26、组中所处的位置，因而是表示智力高低的一种理想的指标。韦克斯勒将离差智商的平均数定为100，标准差定为15。(公式5-6),16%,50%,第三单元常模分数的表示方法,一、转换表法二、剖析图将测验分数的转换关系用图形表示出来。,真题练习,200705-50、常模样本量一般不小于（）。A）100或500（B）800或1000（C）20或25（D）30或100200705-51、维克斯勒将离差智商的平均数定位100，标准差定为(A)17（B）15（C）11（D）13200711-51、系统抽样的关键是计算（）。(A)样本量（B）总体（C）随机数（D）组距200711-52、百分等级的55的分数表示

27、在常模样本中有55%的人比这个分数（）。（A）低（B）相等（C）高（D）以上都不正确200711-53、（）可以将测验分数的转换关系用图形表示出来，便于直观的看出被试者在各个分测验上的表现及相对位置。（A）条形图（B）直方图（C）剖面图（D）饼状图,D,B,D,A,C,200806-53、（）是由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本。（A）团体（B）常模团体（C）样本（D）受测人群200806-54、常模分数构成的分布，就是通常所说的（），它是解释心理测验分数的基础。（A）常模分数（B）常模（C）导出分数（D）分数200806-55、，式中SD为（）。（A）样本平均数B

28、）任一原始分数 C）样本标准差D）标准分数200806-56韦克斯勒将离差智商的平均数定为100，标准差定为（）。（A）16（B）15（C）14（D）13200806-57最简单而且最基本的表示常模的方法就是（A）转换表（B）分布表（C）对照表（D）指数表,B,B,C,C,B,A,200811-55、取样是指从()中选择有代表性的样本。(A)总体(B)群体(C)目标人群(D)样本，200811-56、常模分数又叫()。(A)导出分数(B)粗分数(C)原始分数(D)总体分数200811-57、标准二十分的标准差为(）(A)5(B)4(C)3(D)2200811-58、韦克斯勒将离差智商的平均数定

29、为100，标准差定为(A)16(B)15(C)14(D)13200811-105、发展顺序量表可以告诉人们某儿童的发育与其年龄相比(A)超前(B)滞后(C)正常(D)以上都不是200905-34、以50为平均数、以10为标准差表示的标准分数叫（A）标准九分数（B）T分数（C）离差智商（D）Z分数200905-56、随机号码表法是（）。A）简单随机抽样（B）系统抽样（C）分组抽样（D）分层抽样200905-76、比率智商（IQ）是（）与实足年龄之比。A）生理年龄（B）真实年龄（C）心理年龄（D）智力年龄200905-105、标准分数可以通过（）得到。（A）线性转换（B）非线性转换（C）分析（D）

30、变化,C,A,C,B,ABC,B,A,C,AB,200911-56、首先使用智力年龄概念的是()量表(A)比内西蒙(B)韦克斯勒(C)斯坦福比内(D)瑞文200911-105、属于标准分数常模的是()。(A)百分等级(B)T分数(C)比率智商(D)离差智商20105-34发展常模就是（）。A团体的分数 B百分位数 C个人的分数 D年龄量表20105-35在心理测验中，对于非典型群体需要制定（）A普通常模 B特殊常模 C一般常模 D发展常模20105-56具有某种共同特征的人所组成的一个群体或者是该群体的一个样本，叫做（）。A团体 B常模团体 C样本 D受测人人群20105-57以50为平均数，

31、以10为标准差来表示的分数，通常叫AZ分数 B标准九分数 CT分数 D离差智商20105-76解释心理测验分数的比较基础是（）。A常模分数 B常模 C导出分数 D分数,A,BD,B,B,C,B,20105-92抽样的方法一般包括（）。A分层抽样 B系统抽样 C分组抽样 D简单随机抽样20105-121常模的构成要素包括（）。A抽样分数 B原始分数 C导出分数 D对常模团体的具体描述201011-56、常模样本量的大小，一般最低不小于（）。P337（A）100或500（B）800或1000（C）20或25（D）30或100201011-57、“某分数的百分等级为55”表示在常模样本中有55%的人

32、的分数比该分数（A）。P340（A）低（B）相等（C）高（D）全不是201011-58、以50为平均数、以10为标准差来表示的分数通常叫（）。P342（A）Z分数（B）T分数（C）标准九分数（D）离差分数201011-59、（）表示的是个体智力分数在同年龄组分数分布中所处的位置。P343（A）离差智商B）比率智商C）百分等级 D）标准九分数,ABCD,BCD,D,A,B,A,201011-60、（）是将测验分数的转换关系用图形表示出来，从而可以很直观地看出披试者在各个分测验分数分布中的相对位置。P346（A）条形图（B）直方图（C）剖面图（D）散点图201011-106、标准分数可以通过（）得

33、到。P341（A）线性转换（B）非线性转换（C）求积（D）求和201105-54、由具有某种共同特征的人所组成的一个群体，或者是该群体的一个样本，称为()。(A)团体(B)常模团体(C)样本(D)受测人群,C,AB,B,小结：第二节测验的常模,第一单元常模团体第二单元常模的类型第三单元常模分数的表示方法,心理测量学,第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用,第三节测验的信度,第一单元信度的概念第二单元信度评估的方法第三单元信度与测验分数的解释第四单元影响信度的因素,补充内容：,经典测验理

34、论的基本假设,一、误差的含义和种类,（一）含义测量误差指的是在测量过程中与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。（二）种类系统误差随机误差,二、误差的来源,（一）测验本身引起的误差取样缺乏代表性，词语模棱两可（二）施测过程引起的误差1.主试者方面：年龄、性别、外表、动作等 2.环境因素 3.时间安排 4.意外干扰 5.记分,二、误差的来源,（三）受测者本身引起的误差应试动机测验焦虑学习和训练测验经验生理状态反应定势,三、真分数,（一）含义测量没有误差时所得到的真值操作性：无数次测量结果得到的平均值（二）实得分数、真分数与测量误差（三）性质一组测验分数的变异性是由测

35、量目的有关的变异数、稳定的但出自无关来源的变异数和随机误差变异数所决定的,三、真分数,（四）真分数的数学模型（五）三个假设公理若某种心理特质可以用平行测验反复测量足够多次，观察分数就会接近真分数 E（X）T；E（E）0真分数与误差分数之间的相关为零（T，E）0各平行测验上的误差分数之间的相关为零（E1，E2）0,三、真分数,（六）平行测验如果两个题目不同的测验测的是同一种特质，并且题目的形式、数量、难度、区分度以及测查等值团体后所得分数的分布都是一致的，则这两个测验被称为平行测验。,第一单元信度的概念,一、信度的定义信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量，所

36、得结果的一致程度。,信度只受随机误差的影响。,如果我们讨论一组测验分数的特性时，可用方差代表具体分数，得到与公式5-7类似的公式：式中，是测验实得分数的方差，是测验真分数的方差，是测验误差的方差。,在测量理论中，信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率。即：（公式59）由于真实分数的方差是无法统计的，因此公式59还可以转化为：因此，信度也可以看作在总的方差中非测量误差的方差所占的比例。,二、信度的指标,(一)信度系数与信度指数(公式5-11)信度指数的平方就是信度系数。(二)测量标准误（误差的标准差）信度越高，标准误越小；信度越低，标准误越大。,第二单元信度评估

37、的方法,重测信度复本信度内部一致性信度评分者信度,一、重测信度,又称稳定性系数。使用同一测验，在同样条件下对同一组被试者前后施测两次测验，求两次得分间的相关系数。一般是两周到四周较宜，间隔时间最好不超过六个月。,二、复本信度,以两个等值但题目不同的测验(复本)来测量同一群体，然后求得被试者在两个测验上得分的相关系数复本信度反映的是测验在内容上的等值性，故又称等值性系数。,复本测验要求题目内容、数量、形式、难度、区分度、指导语、时限、例题等相同或相似,三、内部一致性信度,(一)分半信度(splithalf reliability)这个相关系数就代表了两半测验内容取样的一致程度(公式5-14)式中

38、为一半分数的相关系数，为测验在原长度时的信度估计值。,How to divide the test?,Random（随机法）odd-even（奇偶法）1st half of items&last half of items（顺序法）,(二)同质性信度(homogeneity reliability)代表测验内部所有题目间的一致性。（1）指所有题目都测的是同一种心理特质。（2）指所有题目得分之间都具有较高的正相关。同质性信度就是一个测验所测内容或特质的相同程度。,克伦巴赫系数,四、评分者信度,随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验卷的两个分数计算相关，即得评分

39、者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上，才认为评分是客观的。,斯皮尔曼等级相关,评分者信度:肯德尔和谐系数,被评者,评定者,公式中 K=3（评定者数）N=6（被评者数）,W0.86,第三单元信度与测验分数的解释,解释真实分数与实得分数的相关确定信度可以接受的水平解释个人分数的意义比较不同测验分数的差异,一、解释真分数与实得分数的相关,信度系数可以解释为测验的总变异中，真分数造成的变异占百分之几。在极端的情况下，如有rxx1.00，则表示完全没有测量误差，所有的变异均来自真实分数；若有rxx0，则所有的变异和差别都反映的是测量误差。,二、确定信度可以接受的水平,一

40、般原则是：当rxx0.70时，测验不能用于对个人做出评价或预测，而且不能作团体比较；当0.70rxx 0.85时，可用于团体比较；当rxx0.85时，才能用来鉴别或预测个人成绩或作为。,三、解释个人分数的意义,两个作用其一是估计真实分数的范围；其二是了解实得分数再测时可能的变化情形。人们一般采用95%的或然率（概率）水平，其置信区间为：(公式5-16),四、比较不同测验分数的差异,测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。差异分数的标准误公式为：（公式517）,第四单元影响信度的因素,一、样本特征二、

41、测验长度三、测验难度四、时间间隔,一、样本特征,信度常用信度系数来表示，信度系数就是相关系数，相关系数受样本是否异质及样本团体平均能力水平的影响。(一)样本团体异质性的影响(二)样本团体平均能力水平的影响,样本团体异质性的影响,任何相关系数都要受到团体中分数分布的范围所影响，而分数范围与样本团体的异质程度有关。若获得信度的取样团体较为异质的话，往往会高估测验的信度，相反则会低估测验的信度。,样本团体平均能力水平的影响,测验的信度还受取样不同团体间平均能力水平的不同而不同。这是因为，对于不同水平的团体，题目具有不同的难度，每个题目在难度上的微小差异累计起来便会影响信度。显而易见，每个信度系数都要

42、求有对建立信度系数的团体的描述。在编制测验时，应把常模团体按年龄、性别、文化程度、职业等分为更同质的亚团体，并分别报告每个亚团体的信度系数，这样测验才能适用于各种团体。,二、测验长度,测验长度，亦即测验的数量，也是影响信度系数的一个因素。一般来说，在一个测验中增加同质的题目，可以使信度提高。第一，测验越长，测验的测题取样或内容取样就越有代表性。第二，测验越长，被试的猜测因素影响就越小。长有时反而会引起被试的疲劳和反感而降低可靠性。,K=rkk(1-rxx)/rxx(1-rkk)K为改变后的长度与原长度之比rxx为原测验的信度rkk为测验长度是原来的k倍时的信度估计,三、测验难度,难度对信度的影

43、响，只存在于某些测验中，如智力测验、成就测验、能力倾向测验等，对于人格测验、兴趣测验、态度量表等不存在难度问题，因为这些测验的题目没有正确或错误答案之分。,三、测验难度,在实际情况下，如果某个测验适用范围很广，其难度水平通常适合于中等能力水平的被试，而对较高水平和较低水平的被试可能较易或较难，使得分数分布范围缩小，信度水平降低。因此一个标准化的测验，应根据不同能力水平报告测验的难度，以作为选择测验的参考。,四、时间间隔,时间间隔只对重测信度和不同时测量时的复本信度（重测复本信度）有影响，对其余的信度来说不存在时间间隔问题。,真题练习,200705-52、一般要求在成对的受过训练的评分者之间平均

44、一致性达到（）以上，才认为评分是客观的。（A）0.70（B）0.80（C）0.90（D）1.00200705-53、以再测法或复本法求信度，两次测验相隔时间越短，其信度系数（）。（A）越大（B）越低（C）越小（D）不变200705-55、信度只受（）的影响。A）系统误差B）随机误差C）恒定效应D）概化作用200711-54、同质性信度主要代表测验内部（）间的一致性。A）两半测验B）题目与分测验（C）所有题目（D）分测验200811-59、信度只受()的影响(A）系统误差(B)随机误差(C)恒定效应(D)概化理论,C,A,B,C,B,200905-35、以再测法或复本法秋信度，两次测验相隔时间越

45、短，其信度系数越（）。（A）大（B）低（C）小（D）不确定200905-77、重测信度即（）。（A）等位性系数B）稳定性系数（C）相关系数D）X系数200905-92、关于心理测验，下列说法正确的是（）。（A）测验越长，测验的测题取样或内容取样越有代表性（B）测验越长，被试者受猜测因素的影响就越小（C）测验越长，月遵循报酬递增率原则（D）测验太长，有时会引起被试者的疲劳和反感而降低可靠性200911-76、在不同时间内用同一测验重复测量同一被试者，所得结果的一致程度称为()。(A)信度(B)效度(C)难度(D)区分度,A,B,ABD,A,20105-77同质性信度主要反映测验内部（）间的一致性

46、。A两半测验 B题目与分测验 C所有题目 D分测验与分测验201011-61、信度只受（）的影响。P348A系统误差B随机误差C恒定效应D实验误差,C,B,小结：第三节测验的信度,第一单元信度的概念第二单元信度评估的方法第三单元信度与测验分数的解释第四单元影响信度的因素,心理测量学,第一节概述第二节测验的常模第三节测验的信度第四节测验的效度第五节项目分析第六节测验编制的一般程序第七节心理测验的使用,第四节测验的效度,第一单元效度的概念第二单元效度评估的方法第三单元效度的功能第四单元影响效度的因素,一、效度的定义,效度是指所测量的与所要测量的心理特点之间符合的程

47、度，或者简单地说是指一个心理测验的准确性。在测验理论中，效度被定义为在一组测量中，与测量目标有关的方差(或称有效方差)与总方差的比率，即：(公式5-21),二、效度的性质,(一)效度具有相对性在评鉴测验的效度时，必须考虑其目的与功能。,二、效度的性质,(二)效度具有连续性测验效度通常用相关系数表示，它只有程度上的不同，而没有“全有”或“全无”的区别。因此，我们评价一个测验时，不应该说“有效”或“无效”，而应该用效度较高或较低来评价。另外，效度是针对测验结果的，即测验效度是“测验结果”的有效性程度。,信度和效度的关系,一、信度是效度的必要而非充分条件二、效度是受信度制约的,第二单元效度评估的方

48、法,美国心理学会在1974年所发行的教育与心理测量之标准一书中将效度分为三大类：即内容效度、构想效度和效标效度。,一、内容效度,(一)什么是内容效度内容效度指的是测验题目对有关内容或行为取样的适用性，从而确定测验是否是所欲测量的行为领域的代表性取样。想要编制一个具有较高内容效度的测验需要对所测心理特征有明确的概念测验题目应是所界定的内容范围的代表性取样,(二)内容效度的评估方法,1专家判断法2统计分析法3经验推测法,1专家判断法,请有关专家对测验题目与原定内容的符合性做出判断，看测验的题目是否代表规定的内容。又称“逻辑效度”(logical validity)。,为了使内容效度的确定过程更为客

49、观，弥补不同专家对同一测验的判断可能不一致，可采用如下几个步骤：、定义好测验内容的总体范围，描述有关的知识与技能及所用材料的来源；、编制双向细目表，确定内容和技能各自所占的比例，并由测验编制者确定各题所测的是何种内容与技能；、制定评定量表来测量测验的整个效度，如测验包括的内容、技能、材料的重要程度、题目对内容的适用性等。,简约式命题细目表,说明:1.全卷满分100分，表中分值即为百分比。2.M为选择题；H为填空题；N为解答题；E为综合题。3.试题难度分为容易题（0.7以上）、适中（0.40.7）、难（0.4以下）三级，三种试题试题的分值比例约为5:4:1。4.考试时间120分钟，其中第I卷50

50、分钟，第II卷70分钟。,全息式命题细目表,2统计分析法,重测信度（学习前后测验）:在学习某一知识前后各做一次测验，进行比较评分者一致性信度复本信度:来自同一范围的复本测同一批被试，看其相关,3经验推测法,即通过实践来检验效度。不同的被试团体在测验上的得分和对每题的反应有较大差异，一般总分和各题通过率随年级上升如儿童发展量表是否有效，经过对不同年龄阶段的儿童进行调查，然后分析其结果。,(三)内容效度的特性,内容效度与所有效度的性质一样，不是普遍适用的，而是根据具体情况分析得来。如果测验分析者和测验使用者定义的内容范围相同，则编制者报告的内容效度对使用者而言是有意义的，否则就没有意义。,内容效度

展开阅读全文