心理测量学基础知识课件.pptx

上传人:牧羊曲112 文档编号:3658449 上传时间:2023-03-14 格式:PPTX 页数:111 大小:2.04MB
返回 下载 相关 举报
心理测量学基础知识课件.pptx_第1页
第1页 / 共111页
心理测量学基础知识课件.pptx_第2页
第2页 / 共111页
心理测量学基础知识课件.pptx_第3页
第3页 / 共111页
心理测量学基础知识课件.pptx_第4页
第4页 / 共111页
心理测量学基础知识课件.pptx_第5页
第5页 / 共111页
点击查看更多>>
资源描述

《心理测量学基础知识课件.pptx》由会员分享,可在线阅读,更多相关《心理测量学基础知识课件.pptx(111页珍藏版)》请在三一办公上搜索。

1、心理测量学基础知识,第一节概述,一、测量的基本概念(一)测量的定义 测量:依据一定的法则,使用量具对事物的特征进行定量描述的过程。,一定的法则事物的特征量具定量描述,(二)测量要素,1、参照点 绝对参照点(绝对零点)相对参照点2、单位 好的单位须符合两个条件:意义明确:同一单位对所有人来说意义相同。等价:第一单位与第二单位之间的距离第二单位与第三单位之间的距离。,(三)测量的量表,量表(scale):使事物的特征数量化的数字的连续体。Stevens:将量表从低到高分为4个等级。1、命名量表(Nominal Scale)2、顺序量表(Order Scale)3、等距量表(Interval Sca

2、le)4、比率量表(Ratio Scale),1、命名量表(Nominal Scale)用数字来代表事物或对事物进行分类。代号类别 如:1代表男性,2代表女性 特点 不能做量化分析,2、顺序量表(Order Scale)给个体赋值,使数值的大小次序与个体在所测量的心理特性上的多少、大小、高低等的次序相符合。顺序量表在心理和教育中十分常见(如竞赛成绩排名等)。特点:不能做加减乘除运算,3、等距量表(Interval Scale)给个体赋值,使数值间的差不仅能够反映出对应个体在所测量心理特性上的排序,而且能够反映出对应个体在该特性上的差异程度。(如温度计,偏爱程度等)但建构间距量表不是容易的事,常

3、常只能做到顺序量表。特点:可做加减运算,不能乘除运算,4、等比量表(Ratio Scale)给个体赋值,使数值间的比率能够反映对应个体在测量心理特性上比率。(如身高、体重、速度等)。特点:数值可做加减乘除运算 心理测量通常都是顺序量表,为方便比较,通常把顺序量表转换为等距量表。,二、心理测量的基本概念,(一)定义心理测量:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。,1、心理测量的对象是人的行为2、行为样本:从总体行为中抽取出来的、能够反映个人特定心理特质的一组行为,作为直接的测量对象。3、测验条

4、件对所有被试必须是相同的。4、原始分数的解释只有与其他人的分数或常模比较才有意义。,(二)心理测量的性质,1 心理测验的间接性 通过测量外显行为来推断内隐的心理特质2 心理测验的相对性没有绝对的标准3 心理测验的客观性测验的客观性实际上就是测验的标准化问题,三、心理测验的种类,(一)按测验的功能分类 1智力测验 2特殊能力测验 3人格测验 兴趣、态度、动机、气质、性格,(二)按测验的方式分类1个别测验 优点:获得的信息多;容易建立融洽的合作关系;特殊被试(幼儿、盲人)缺点:费时、复杂、对主试要求高。2团体测验 优点:缺点:,(三)按测验材料性质分类 1文字测验 2操作测验 文化公平测验(四)按

5、测验材料的严谨程度分类 1客观测验 2投射测验,(五)按测验的要求分类 1最高行为测验 2典型行为测验,四、对心理测验的科学态度,(一)错误观念 1、万能论 2、无用论 3、心理测验就是智力测验(心理测验=智力测验=智商=遗传决定论),(二)对待测验的正确态度 1、心理测验是研究心理学的重要方法之一,是决策的辅助工具;2、心理测验作为研究方法和测量工具尚不完善;3、防止乱编和滥用心理测验。,五、心理测验在心理咨询中的应用,常用三类心理测验:,第二节测验的常模,一、常模团体(一)常模团体的性质 由具有共同特征的人所组成的一组群体,或是该群体的一个样本。任何一个测验,都有许多可能的常模团体。在制定

6、常模时,首先要确定常模团体。在对常模参照分数做解释时,也必须首先考虑常模团体的组成。,(二)常模团体的条件,1、界限明确 对每个常模团体的性质和特征的简短且明确的描述。2、代表性强 克服取样偏差,采用正确的取样方法。,3、大小适当 从统计学原理上说,样本是越大越好,但考虑到经济、实用,样本数量也不能无限扩大。样本大小可以根据以下几方面来确定:a.常模总体的数目。总体数目小,则样本数目也小;总体数目大,样本数目也应大。一般来说,样本最好应有30100人;如果是全国性常模,一般应有20003000人为宜。b.总体性质。总体性质越复杂,样本容量就越大。c.测验结果的精确度。精确度要求越高,样本量就越

7、大。4、选择近时,(三)取样的方法,简单随机抽样系统抽样分组抽样分层抽样,1、简单随机抽样 按随机表顺序抽样。每个人或抽样单位有相同的机会成为常模中的一部分。,2、系统抽样 等距抽样。具体抽样流程为:抽样前,须将母体的每一个单位编号,先计算样本区间(即N/n,N表示母体的数目,n表示样本的大小),然后从1到N/n号中随机抽出一个号码作为第一个样本单位,将第一个样本单位的号码加下样本区间即得第二个样本单位,依此类推,直到样本数抽够为止。,3、分组抽样 先将总体依照一种或几种特征分为几个子总体(类群),每一个子总体称为一层,然后从每一层中随机抽取一个子样本,将它们合在一起,即为总体的样本,称为分层

8、样本 比如某中学有1000名学生,其中男600人,女有400人,欲采用分层抽样从中抽取100人的一个样本,则其中男应有60人,女应有40人,4、分层抽样 是将总体按照某种标准(如:年龄、文化程度)划分为一些子群体。每一个子群为一个抽样单位,用随机的方法从中抽若干子群,将抽出的子群中所有个体合起来作为总体的样本。,(四)常模分数与常模,1、常模分数 对常模样本施测后,将被试的原始分数按一定规则转换出来的导出分数。2、常模即常模分数构成的分布。它是解释个人心理测验分数的参照标准。种类:全国常模;区域常模、特殊常模,二、常模的类型,类型:1、发展常模2、商数3、百分位4、标准分数,(一)发展常模,1

9、.发展顺序量表(ordinal scales)格塞尔发展顺序量表格塞尔认为,婴幼儿的行为系统的建立是一个有次序的过程,反映了神经系统的不断成长和功能的分化,因而可以把每个成熟阶段的行为模式作为智能诊断的依据。,2智力年龄(mental age)(心理年龄)指被试智力发展水平的年龄。单位是年(或岁)和12个等距的月。年龄量表最基本的假设是,随年龄的增长,所测量的特质有系统的改变。因此,不适用于成人。,3年级当量(grade equivalents),即年级常模,用年级代替年龄,指把学生的测验成绩与各年级学生的平均成绩比较,看他相当于几年级的水平。年级常模的单位通常为10个月间隔。如5年级的分布为

10、5-0到5-9。年级当量只适用于一般课程,不适合只学12年的课程。年级当量只适用于解释本学年的水平,不适用于跨学年的。如一个五年级学生的年级当量为8,并不能说他已经掌握了8年级的课程。,(二)商数(quotient),1、比率智商 IQ=100(MA/CA)缺点:实龄等距,而智龄不等距(智力发展不是直线的)计算成人智商时,以多大实龄作为除数?智力生长何时达到顶点?不同年龄组,比率智商分数具有不同的标准差,因而相同的比率智商对于不同年龄具有不同的意义。2、离差智商 IQ100+15Z,(三)百分位常模,1、百分等级(percentile rank)概念 某个分数的百分等级就是得分低于这个分数的人

11、数的百分比。百分等级指示个体在常模团体中的相对位置。百分等级越低,个体所处的地位越低。,2、百分点 相对于某一百分等级的分数点叫百分点或百分位数。3、四分位和十分位 百分点将分数分布分成100个等份。四分位是将分数分成4个等份。十分位是将分数分成10个等份。十分位提供一个10级的等级量表,每一级包括10%的分数。,(四)标准分常模,标准分数的理论依据(来源),标准正态分布,标准分数(standard score),转换方法:线性转换:从正态到正态非线性转换:从偏态到正态(通过百分等级),线性转换1.z分数。X-X z=SD z分数用来表示某一分数与平均数之差是标准差的多少倍。不仅具有可比性,还

12、具有可加性。,Z分数 Z=A+Bz(其中:A B可以是任一常数)除了Z分数外,还可以把Z分数转换成T分数、标准九、离差智商等。,2.T分数 纪念Terman和Thorndike。T=50+10z 平均数为50,标准差为10,3.标准九(stanine)标准化九级分制 标准九=5+2z,即平均数为5,标准差为24.离差智商(deviation IQ)IQ=100+15z 平均数为100,标准差为15,导出分数的相互关系 P368,(五)常模分数的表示方法,(一)转化表法转化表的3个基本要素:原始分、导出分、常模团体的特征描述。1简单转化表 2复杂转化表,(二)剖面图法,第三节测验的信度,测量误差

13、及其来源 一、测量误差的含义:测量值与实际值的差异 二、测量误差的种类 系统误差:测量工具本身引起的误差(稳定);随机误差:由不稳定因素引起的误差(不稳定)。,真分数及其有关的假设,真分数:一个测量工具在没有测量误差时,所得到的纯正值。真分数的操作定义:无数次测量结果的平均值。观察分数:测验分数,真分数的数学模型及其假设 X=T+EX:测验分数T:真分数E:误差测量误差的假设:(X)=T 或(E)=0,一、信度的概念,(一)什么是信度?信度(reliability)是指测量结果的稳定性程度,也叫测量的可靠性。操作定义:一组测量分数的真变异数与总变异数(实得变异数)的比率。rxx=ST2/Sx2

14、,(二)信度的指标rxx:信度系数信度指数标准误 标准误即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,反映的是样本均数之间的变异。信度与标准误互为消长关系。,二、信度估计的方法,(一)重测信度1含义和计算重测信度(test-retest reliability):用同一量表对同一组被试施测两次所得结果的一致性程度。缺点是受练习和记忆的影响,(二)复本信度,1含义和计算 复本信度(Alternate-form reliability)是指两个平行(等值)的测验测量同一批被试所得结果的一致性程度。计算方法与重测法相同。,施测的安排:等值性系数:两个复本测验是同时连续

15、施测的 稳定等值系数(重测复本信度):两个复本测验是相距一段时间分两次施测的。,2使用的前提条件两测验真正平行:项目的内容、形式、数量、难易、时限、指导语等被试要有条件接受两个测验。注意:时间间隔要适当。,3、局限只能减少而不能排除练习和记忆的影响。许多测验建立复本相当困难。,(三)内部一致性信度:分半信度,1含义和计算分半信度(split-half reliability)是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。假设:两半测验等值。分半法经常会低估信度。,常见的分半方法是按测题序号奇偶分半:l 测验题目按某种顺序(如难度)排列;l如果是随机排列的题目,则必须是

16、所有题目是平等的(要么难度相等,要么性质一致,是测同一个心理特质的);l如果测验有多个分量表,应在分量表内部排好顺序,再把各分量表的两半组合起来求相关。,同质性信度(homogeneity reliability),也叫内部一致性系数,是指测验内部所有题目间的一致性程度。可弥补分半法的不足。,(四)内部一致性信度:同质性信度,(五)评分者信度 评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。2人时:相关系数(积差相关).90 多人时:肯德尔和谐系数,(一)解释真分数与实得分数的相关 信度系数从0.0-1.0分布,代表了从缺乏信度到完全可信的所有状况。(二)确定信度可以接受的水平

17、p374表5-3(三)解释个人测验分数的意义 真分数的置信区间(95%)=X1.96SE(四)不同测验分数的比较,三、信度与测验分数的解释,四、影响测量信度的主要因素,(一)样本特征样本团体同质性越高(个体差异越小),所得相关系数(信度)就越低。样本团体异质性越高(个体差异越大),所得相关系数(信度)就越高。样本团体平均能力水平,(二)测验长度 增加同质性题目,可以提高信度(三)测验难度测验难度:过难或过易都会使个体间得分差异减小,降低信度。,(四)测验内容测验内容:试题取样不当,内部一致性低,题意模糊,信度则低。(五)间隔时间间隔时间越短,信度系数越大;间隔时间越长,信度系数越低。,第四节测

18、验的效度,一、效度的概念 1、什么是效度?效度(validity)是指一个测验或量表实际能测出其所要测的心理特质的程度。(1)效度是一个相对的概念:每个测量工具都有自己的目的;内隐特质是通过外显行为间接测得的。(2)效度是测量的随机误差和系统误差的综合反映。(3)判断一个测量是否有效要从多方面收集证据,2、效度与信度的关系(1)信度高是效度高的必要而非充分条件 一个测验效度高,其信度也必然高;但一个测验信度高,其效度不一定高。(2)测验的效度受它的信度制约 rXYrXX 一个测验的信度必然比效度高,至少相等。,二、效度的估计,1、内容效度内容效度(content validity)是指测验题目

19、对有关内容或行为取样的适当程度,即一个测验实际测到的内容与所要测量的内容之间的吻合程度。一个测验要有内容效度必须具备两个条件:(1)要有定义完好的内容范围(2)测验题目应是所界定的内容范围的代表性取样。,2内容效度的确定方法,(1)逻辑分析法:专家根据自己的知识经验对量表的有效性(逻辑性)作出判断,也称逻辑效度。为使内容效度的判断过程更客观,一般采用下列步骤:确定测验内容的总体范围;编制双向细目表;编制评定量表,从测验内容所测的技能、题目对所定义的范围的覆盖率、各种题目数量和分数的比例以及题目形式的适当性等方面,对测验作出总的评价。,(2)统计方法 a、两个评分者之间评定的一致性 b、用两个测

20、验复本来测同一批被试,若相关高,则内容效度可能高,但若相关低,则说明必有一个测验缺乏内容效度。c、再测法(3)经验推测法 通过实践来检验效度,2、构想效度(结构效度),是指一个测验实际测到所要测量的理论结构或特质的程度,或者说测验分数能够说明心理学理论的某种结构或特质的程度。特点:(1)具有不同理论构思的测验,其结构效度无法进行比较;(2)结构效度有时很难获得;(Rubin,1979:测量爱情)(3)结构效度没有单一的指标,是由各方面的证据累积起来进行评价的。,结构效度的确定方法,结构效度确立的一般步骤:(1)提出理论框架;(2)依据理论框架推演出有关测验成绩的假设;(3)用逻辑或实证的方法来

21、证明假设。,具体方法:(1)测验内部寻找证据法分析测验的内容效度:若内容效度高,说明其结构效度也高。分析被试对题目反应的特点:有无社会称许性的题目,如“当事情不顺我意时,我时常动怒。”对该题的回答,也许反映不了要测的性格。计算测验的同质性信度:分半信度、系数、KR20、KR21,(2)测验之间寻找证据法相容效度:新老测验之间的相关(两测验测的是同一心理特质)。若相关高,则说明新测验可能有较高的效度。区分效度:新老测验之间的相关(两测验测的不是同一心理特质),若相关低,则说明新测验可能有较高的效度。因素分析法:得出的因素符合理论的构思,说明效度高。,(3)考察测验的实证效度法根据效标把被试分组,

22、考察其得分差异。根据测验得分差异把被试分组,考察其所测特质(行为表现)的差异。(4)实验法和观察法证实实验前训练实验后,3、效标效度(实证效度),含义、种类及作用效标效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。效标(criterion):被估计的行为是检验测验效度的标准。衡量一个测验是否有效的外在标准。,常用的效标:学业成就临床诊断实际工作表现特殊训练成绩不同团体的总体表现先前有效的测验等级评定。,效标测量的条件,a.有效性:效标测量能真正反映观念效标。b.可靠性:有较高的信度c.客观性:效标可以客观地加以测量d.实用性:经济实用,效标效度的确定方法,(1)相关法测验分数与效

23、标测量之间的相关系数。优点:数量化;可用回归方程进行个人效标预测 缺点:要求预测源与效标呈线性关系;无法提供关于取舍正确性的指标,(2)区分法检验测验分数能否有效地区分由效标所定义的团体。T检验:重叠量计算:,(3)命中率法应用范围:预测源和效标都是二分的。,强调社会公平时使用,总命中率=(B+C)/(A+B+C+D)当测验用于提高工作或学习效率时使用,正命中率=B/(A+B),三、效度的功能,预测误差预测效标分数预测效率指数,四、影响测量效度的因素,1.测验本身的因素2.干扰因素3.样本团体的性质4.效标的性质,第五节项目分析,项目分析:即对项目进行筛选和修订,目的是为了提高测验的信度和效度

24、。定性分析:内容效度、题目编写的恰当性和有效性等的分析。定量分析:主要是指题目难度和区分度的分析。,一、测验的难度,(一)难度(difficulty)的含义难度:指项目的难易程度。在“最高”作为测验中,称为“难度”,而在“典型”作为测验中,则指“通俗性”。两者都是指在总体中,能够正确或确切回答某项目的人数。,(二)难度的计算,1、二分法记分项目(是非题、选择题)的难度用通过率来表示。通过率(易度):P=R/NR:通过人数;N全体被试人数P越大,难度越小,用极端分组法(上下27%):被试较多时,测验总分从高到低排列。分别计算高分组和低分组在某一项目上的通过率,合并:P=(PH+PL)/2选择题难

25、度的校正:CP(KP-1)/(K-1)CP:校正后通过率,P:实得通过率,K:备选答案数目,2、论述题等非二分法记分项目的难度 P=X/Xmax X:所有被试在该项目上的平均得分,Xmax:该项目的满分。,(三)测验难度水平的确定,项目难度 取决于测验的目的、性质和项目形式。1、测验目的:效标参照测验、掌握测验:不考虑难度;选拔测验:难度=录取率2、项目形式 选择题的难度一般应大于猜测概率。3、测验性质:一般都应防止被试得满分,满分的意义是不明确的。,大体而言,难度为0.50时最理想,此时项目具有最大的鉴别力。在实际操作中,让所有项目难度都到达0.50困难很大,而且也不必要。一般只需使项目的平

26、均难度接近0.50,而各个项目的难度在0.50 0.20之间变化。,2、测验难度影响测验分数的离散程度测验过难或过易,分数全距缩小,信度降低。P=0.50时最佳,二、测验的区分度,(一)区分度的含义区分度(discrimination):指测验项目对被试心理品质水平差异的区分能力或鉴别能力。如实际水平高的被试能顺利通过,而实际水平低的被试不能通过,则说明鉴别力强,区分度高。,(二)区分度的计算 1、鉴别指数法 鉴别指数的计算:比较测验总分高和总分低的两组被试在项目通过率上的差别。D=PH-PL D值越大,区分度越高,项目越有效,2相关法,相关法(项目-总分相关):以某一项目分数与效标分数或测验

27、总分的相关作为该项目区分度的指标。相关越高,区分度?,三、区分度与难度的关系,第六节测验编制的一般程序,一、测验的目标分析:对象、用途、目标二、测题的编写三、测验的编排和组织,一测验的目标分析,(一)明确测量对象 年龄、性别、职业、受教育程度、经济状况、民族、文化背景等。(二)明确测量用途用于显示,或用于预测?(三)明确测量目标工作分析:心理变量或行为特征(能力、人格、学业成就)对特定概念下定义(操作定义):具体。确定测验具体内容:双向细目表,二、测题的编写,(一)收集测验资料设计项目的依据(1)资料要丰富:代表性(2)资料要有普遍性:公平性(3)资料要有趣味性,(二)命题原则,内容文字理解社

28、会敏感性,(三)编制要领,如何选择最佳的表现方式?取决于测验的目的、材料性质、测验对象、其他因素。纸笔测验还是操作测验?是客观题还是主观题?概念和原理的记忆简答题 辨别和判断选择题 综合运用论文题 幼儿口头测验 文盲、半文盲、聋哑操作测验 人多团体测验 人少个体测验,三测验的编排和组织,(一)合成测验(二)预测与项目分析(三)信度和效度考察(四)常模制订(五)编写指导手册,第七节心理测验的使用,一、主试资格知识结构专业知识和专业技能职业道德,二、测验的选择,所选测验必须适合测量的目的所选测验必须适合心理测量学的要求,三、测验前的准备及注意事项,(一)测验前的准备工作1、向被试预告测验:测验的时

29、间、地点、内容,让被试做好心理准备。2、熟悉测验程序:测验内容、施测步骤、记分方法、分数解释。3、准备测验材料。4、准备测验环境:通风、采光、噪声、桌椅高度、桌面大小、挂牌以防止以外干扰等。5、熟悉测验的指导语:告诉被试如何选择反应形式(划勾还是涂黑),说明时间限制,例题演示,有时告知被试测验目的。,(二)测验实施的注意事项 按测验手册要求实施测验。控制测验焦虑,不讲威吓被试的话。与被试建立良好的友好关系(rapport)。及时和清楚地记录被试的反应。对特殊问题有所准备(如作弊、被试不配合等)。,四、程序及要素,指导语时限环境条件,五、被试误差及控制方法,1应试技巧与练习效应2动机与焦虑因素3

30、反应定势,六、测验的评分,原始分数的获得原始分数的转换,七、测验结果的报告,分数解释的原则1、主试应充分了解测验的性质与功能。2、对导致测验结果的原因(遗传、经验、测验情景)的解释要慎重,谨防片面极端。3、必须充分估计测验的常模和效度的局限性。4、解释分数应参考其它有关资料(受教育经历、文化背景、面谈内容、习惯、态度、兴趣、动机、健康、言语能力以及其他测验资料)。5、对测验分数应以“一段分数”来解释,而不应以“特定的数值”来解释。6、对来自不同测验的分数不能直接加以比较。,如何向受测者报告测验分数,1、使用当事人所理解的语言。2、要保证当事人知道这个测验测量或预测什么,但并不需要作详细的技术性解释。3、如果分数是以常模为参照的,就要使当事人知道他是和什么团体在进行比较。4、要使当事人认识到分数只是一个估计。5、要使当事人知道如何运用他的分数。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号