《心理测量的基本理论.ppt》由会员分享,可在线阅读,更多相关《心理测量的基本理论.ppt(34页珍藏版)》请在三一办公上搜索。
1、心理测量的基本理论,中国古代的心理测验思想,早在2500多年前,我国古代教育家孟子就根据自己的观察评定学生的个别差异,把人分为中人,中人以上和中人以下三个类别,并说“中人以上,可以语上也;中人以下,不可以语上也。”这实际上相当于现代测量学中的命名量表和次序量表。比孔子稍晚的孟子也说过:“权,然后知轻重;度,然后知长短。物皆然,心为甚。”这明确指出了心理能力和心理特征与物理现象一样具有可测量的特性。,中国古代的心理测验思想,公元6世纪初叶,南朝人刘勰在新论专学篇中提到“使左手画方,右手画圆,无一时俱成”,其原因是“由心不两用,则手不并用也”。他不仅观察到左手画方右手画圆不易实现这种现象,而且认为
2、其原因是一心不能二用,这恐怕应算是世界上最早的“分心测验”了。,中国古代的心理测验思想,南北朝时代学问最通博、最有思想的学者颜之推十分关心儿童的心智发展并对民间有关周岁试儿的实践加以总结。他在颜氏家训风操篇中对此做了详细记载:“江南风俗,儿生一期(指一周岁),为制新衣,舆浴装饰。男则用弓矢纸笔,女则刀尺针缕,并加饮食之物及珍宝服玩,置之儿前,观其发意所取以验贪廉智愚,名之为试儿。”这种针对婴儿期感觉-运动发展的特点,以实物为材料的近似标准化的测试方法可以说是1925年格塞尔(A.Gesell)婴儿发展量表的前导。,中国古代的心理测验思想,中国民间广泛流行的“七巧板”在某些方面可作为创造力测验的
3、一种方法。七巧板又称益智图,它的操作属于典型的发散思维活动,操作的成果是形象转化,值得高度重视。九连环是另一种中国民间的智力游戏,其设计之巧妙,也可以和现代的魔方、魔棍相媲美。七巧板、九连环等后传入西方,受到推崇,如著名心理学家武德沃斯()就把九连环称作“中国式的迷津”,七巧板则被称为“唐图”(Tangram),即“中国的图板”之意。七巧板类型的拼图任务现在几乎为当代多数智力测验和创造力测验所使用,并且已发展成为标准化的纸笔型测验。,中国古代的心理测验思想,隋炀帝大业二年(606年)始置进士科,是科举制度的开端。经隋唐宋元明至清代,科举制度已相当成熟。当时的考试方法主要有:帖经(填补词句中的缺
4、字)、口义(口试)、墨义(笔试)、策问(政事问答)和杂文(即诗赋)等,其中科举考试中的帖经和对偶类似于现代西方言语测验中常见的填字和类比。19世纪科举制度传入欧洲后,很受西方新兴资产阶级的欢迎,并用于他们的官吏考试制度中。科举制度作为中国特有的人才选拔方法,可谓现代人才选拔制度的滥觞。,科学心理测验的产生与发展,首先倡导科学心理测验的学者是英国生物学家和心理学家高尔登(F.Galton)。作为达尔文的表弟,他深受进化论思想的影响,提出人的不同气质特点和智能是按身体特点的不同而遗传的。他设计了测量差异的方法。可视为心理测验的开端。他第一个提出了相关的概念,并由他的学生皮尔逊(K.Pearson)
5、加以发展,创立积差相关法,这使判定心理测验的信度、效度和进行因素分析成为可能。促进心理测验发展做出巨大贡献的是美国心理学家卡特尔(J.M.Cattell)。1890年,卡特尔在心理杂志上发表“心理测验与测量”一文,这是心理测验第一次出现于心理学文献中。他极力主张测验手续和考试方法应有统一规定,并要有常模以便比较。所有这些都是测量学上的重要概念。,科学心理测验的产生与发展,1904年,法国教育部委派许多教育家、医学家和其他科学家组成一个委员会,专门研究公立学校中智力落后儿童的教育方法。作为委员之一,比内(A.Binet)极力主张用一种测验的方法去辨别和发现智力落后的儿童。经过他与助手西蒙(T.S
6、imon)的精心研究,次年在心理学年报上发表了一篇文章,题为“诊断异常儿童智力的新方法”,在这篇文章中他介绍了一个包括30个项目的量表。它是世界上第一个正式的心理测验。19世纪80年代是高尔登的十年,90年代是卡特尔的十年,20世纪头十年则是比内的智力测验的十年。,心理测量的功能,是研究的有力工具人员选拔与安置组织管理和职业指导临床诊断、咨询与治疗学校辅导教育评价的重要手段,本课程将介绍的量表,智力量表比内量表韦氏智力量表瑞文推理测验,人格测验明尼苏达多相人格调查表(MMPl)卡特尔16种人格因素测验(16PF)艾森克人格问卷(EPQ)罗夏测验主题统觉测验,心理评定量表心理症状自评量表(SCL
7、一90)焦虑量表抑郁量表贝克抑郁量表(BDI),什么是测量,测量就是依据一定的法则用数字对事物加以确定。该定义包括三个主要的元素:事物;数字;法则。“事物”,指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征。(心理能力、人格特点等)。“数字”,是代表某一事物或事物某一属性的量。这些数值具有自然数的特点,如区分性,即1就是1,2就是2。数也有序列性或等级性,如123;数也具有等距性,1和2,2和3之间的差的绝对值总是相等的。,“法则”,代表的是测量所依据的规则和方法。例如,用秤量物体的重量,依据的是杠杆的原理;用温度计测物体的温度,依据的是热胀冷缩规律;用尺子量物体的长度,
8、是以相等的小单位构成刻度,把尺子的零点对准物体的一端,看物体的另一端所对着的刻度,即得出长度。而人的心理特征的测量,如智力测验,就是根据智力理论编制,以得分多少衡量智力水平。法则有好坏之分,使用较好的法则可以得到比较理想的结果,而较差的法则所获得的结果则不令人满意。心理现象难以测量,是因为我们很难设计清晰而良好的法则。随着人类认识的不断深入,测量法则不断完善,测量也就越来越精确。,测量要素,任何测量都具备两个要素:即参照点和单位。、参照点:确定事物的量,必须有一个计算起点,这个起点叫做参照点。参照点有两种,一种是绝对零点,例如测量轻重、长度等以零点为参照点,表示什么都测不到。另一种是相对零点,
9、如海拔高度,就是以东海平面作为测量陆地高度的起点。理想的参照点是绝对零点。但心理测量中很难找到绝对零点,多采用人为标定的绝对零点。如智力年龄为0,实际上指的是零岁儿童的一般智力水平,而不能说没有智力。、单位:是测量的基本要求,单位的种类、名称繁多,即使是测量同一事物,也可以用许多单位。如时间的单位有秒、分、时、日、月、年等。好的单位必须具备两个条件:一为有确定的意义。二为有相同的价值,即相邻两个单位点之间的差别总是相等的。一般来说,心理测量的单位不够完善,即无统一的单位,也不符合等距的要求。如智龄是以年龄作为智力的单位,因为智力发展的速度先快后慢,4岁与5岁之间的差别,明显大于14岁与15岁之
10、间的差别。,测量量表,测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。如要测量某事物的属性,只要将欲测量的该事物的属性放在这个连续体的适当位置上,看它们距参照点的远近,便会得到一个测量值,这个测量值就是对这一属性的数量化的说明。由于制定量表的单位和参照点不同,量表的种类也不同。根据量表的精确程度,斯蒂文斯(S.S.Stevens)将测量从低级到高级分成四种水平,即命名量表、顺序量表、等距量表和等比量表。,命名量表,这是测量水平最低的一种量表形式,只是用数字来代表事物或把事物归类。这种量表又可分为两种:1代号用数字来代表个别事物,
11、如学生和运动员的编号等。2类别用数字来代表某一具有某一属性的事物的全体,即把某种事物确定到不同性质的类别中,如用1代表男,用2代表女,或用不同数字代表不同职业等。在命名量表中,数字只用来作标记和分类,而不能作数量化分析,既不能说ABC,也不能做加、减、乘、除的运算。,顺序量表,比命名量表水平高,其中的数字不仅指明类别,同时指明类别的大小或含有某种属性的程度,如学生的考试名次、工资级别、能力等级、对某事物的喜爱程度等。这里的数字包含有数量关系,代表符号是“”,如ABC等,主要用于分等或排出顺序。在顺序量表中,既无相等单位,又无绝对零点,数字仅表示等级,并不表示某种属性的真正量或绝对值。例如100
12、米短跑比赛中李平得了第一名,王红得了第二名,这样我们可以知道李平排在王红的前面,但是我们不知道李平比王红快多少。,等距量表,比顺序量表又进一步,不但有大小关系,而且具有相等的单位,其数值可以相互做加、减运算,但没有绝对的零点,因此不能做乘、除运算。典型的例子是温度计,100C与150C的差别,同150C与200C的差别是一样的,我们可以说某物温度比另一物高多少,但不能说某物温度是另一物的多少倍,因为它的零点是人定的,00C并不意味着没有温度。等距量表的数值加或减一个常数或用一个常数乘或除,不会破坏原来数据之间的关系,因此一个量表上的数值可以转换为另一个具有不同单位的量表上的数值,而且几个不同单
13、位的数值可以转换到一个量表上以便于比较。,等比量表,是最高水平的量表,既有相等单位又有绝对零点。此种量表在物理测量中容易见到,长度、重量、时间等都是等比量表。所得的数值可以做加、减、乘、除运算。如体重:甲80公斤,已40公斤,我们既可以说甲的体重比乙多40公斤,也可以说甲的体重是乙的2倍。那么,心理测量中使用的量表一般是什么量表呢?一般说来,心理测量是在顺序量表上进行的。因为对于人的智力、性格、兴趣、态度等来说,绝对零点是难以确定的。而且,在心理测量中,相等单位也是很难获得的。不过,利用某种统计方法,可以把这种顺序量表得到的数据换算为等距数据来进行统计。,心理测验的定义,心理测验与心理测量心理
14、测验是了解人的工具,一般作名词用,而心理测量则是运用工具,达到了解人类心理的实践活动,它主要作动词使用。心理测验就是对行为样组的客观和标准化的测量。凡物之存在必有其数量。凡有数量的东西都可以测量。虽然我们不能像身高、体重那样来量,但是它必定会反映在人的某种行为之中,于是我们就可能通过对人的行为的测量来推测他的某种心理属性。,心理测验的性质,间接性:无法直接测量人的心理活动,只能测量人的外显行为,也就是说,我们只能通过一个人对测验项目的反应来推论出他的心理特质。相对性:在对人的行为做比较时,没有绝对的标准,我们有的只是一个连续的行为序列。所谓测量就是看每个人处在这个序列的什么位置上客观性:,测验
15、的客观性实际上就是测验的标准化问题。首先,测验用的项目或作业、施测说明、施测者的言语、态度及施测时的物理环境等,均经过标准化,测验的刺激是客观的。其次,评分计分的原则和手续经过了标准化,对反应的量化是客观的。最后,分数的转换和解释经过了标准化,对结果的推论是客观的。,心理测验的重要概念,行为样组:测验选择的一组有代表性行为。以此来推测与其关联的心理特征。标准化:是指测验的编制、实施、记分、解释等程序的一致性。客观性:指测验不受主观支配,可重复,测验的实施、记分和解释都是客观的。常模:是指测验在标准化样组上的分数分布。测验分数相互比较的标准,是解释测验结果的参照。,信度、效度与误差,信度和效度是
16、测验客观性的两个最重要的指标。信度:测验结果的可靠程度。科学的东西必须能够重复,信度问题的实质是一组被试两次测量的一致性问题。效度:测验的准确性,即测验能够测出他们所欲测的特质的程度。,信度、效度与误差,误差:测量中与目的无关的变因所产生的不准确、不一致效应。抽样误差:由抽样变动所引起的误差。只要样本量足够大,就可以忽略。系统误差:与测验目的无关的因子所引起的恒定、系统的、有规律的变化,存在于每次测量中。因为它们在测验中不引起测量结果的不一致性,所以与信度无关。测量误差:与测验目的无关的偶然因素引起的,使得几次测量结果不一致,且这种不一致是无系统的、随机的。测量误差与信度及效度都有关系。信度则
17、完全受测量误差的影响。,效度与信度的关系,(1)高效度,高信度(2)高信度,低效度(3)低信度,低效度,心理测验的分类,一、按测验的功能分类、智力测验 这类测验的功能是测量人的一般智力水平。如Binet-Simon智力测验、Stanford-Binet智力量表、Wechsler儿童和成人智力量表等,都是现代常用的著名智力测量工具,用于评估人的智力水平。、特殊能力测验 这类测验偏重测量个人的特殊潜在能力,多为升学、职业指导以及一些特殊工种人员的筛选所用。常用的如音乐、绘画、机械技巧,以及文书才能测验。这类测验在临床上应用的较少。、人格测验 这类测验主要用于测量性格、气质、兴趣、态度、品德、情绪、
18、动机、信念等方面的个性心理特征,亦即个性中除能力以外的部分。一般有两类,一类是问卷法,一类是投射法。前者如MMPI、16PF、EPQ,后者如罗夏测验、主题统觉测验(TAT)。,心理测验的分类,二、按测验材料的性质分类、文字测验:所用的是文字材料,它以言语来提出刺激,被试者用言语做出反应。MMPI、EPQ、16PF及Wechsler儿童和成人智力量表中的言语量表部分均属于文字测验。、操作测验:也称非文字测验。测验题目多属于对图形、实物、工具、模型的辨认和操作,无须使用言语作答,所以不受文化因素的限制,用于学前儿童和不识字的成人。如罗夏测验、TAT、Raven测验及Wechsler智力量表中的操作
19、量表部分均属于非文字测验。有时两类测验常常结合使用。例如Binet-Simon智力量表开始主要是文字测验,但以后修订的Binet-Simon智力量表,特别是最近的修订本则增加了操作测验成分。Wechsler的三套智力量表(即幼儿、儿童和成人)每套均分成文字的和操作的两类测验。,心理测验的分类,三、按测验材料的严谨程度分类、客观测验 在此类测验中,所呈现的刺激词句、图形等意义明确,只需被试者直接理解,无须发挥想象力来猜测和遐想,故称客观测验。绝大多数心理测验都属这类测验。、投射测验 在此类测验中,刺激没有明确意义,问题模糊,对被试的反应也没有明确规定。被试者做出反应时,一定要凭自己的想象力加以填
20、补,使之有意义。在这过程中,恰好投射出被试者的思想、情感和经验,所以称投射测验。投射测验种类较少,具有代表性的有罗夏测验、主题统觉测验、自由联想测验和句子完成测验。,心理测验的分类,四、按测验的方式分类、个别测验:指每次测验过程中是以一对一形式来进行的,这是临床上最常用的心理测验形式。如Binet-Simon智力量表、Wechsler智力量表。其优点在于主试对被试的言语和情绪状态有仔细的观察,并且有充分的机会与被试合作,所以其结果可靠。、团体测验:指每次测验过程中由一个或几个主试者对较多的被试者同时实施测验。心理测验史上有名的陆军甲种和乙种测验,教育上的成就测验都是团体测验。这类测验的优点在于
21、时间经济,主试者不必接受严格的专业训练即可担任。团体测验材料,也可以个别方式实施,如MMPI、EPQ、16PF等。但个别测验材料不能以团体方式进行,除非将实施方法和材料加以改变,使之适合团体测验。,错误的测验观,自测验问世以来,人们对其毁誉不一。所以如此,其中主要原因是由于对它缺乏客观态度。不客观态度大体分为两类:一是测验完美无缺,另一是测验无用且有害。、测验万能论 有人认为心理测验可以解决一切问题,对测验甚至顶礼膜拜,奉若神明。他们迷信测验,把测验分数绝对化,例如IQ的差别只有1分,也会认为这种差别很有意义。在心理测验风靡西方世界,人们狂热地编制心理测验的上世纪20年代,测验泛滥成灾,忽略了
22、心理测验还只是个粗糙的工具。当测验结果与那些毫无根据的期望大相径庭的时候,对测验的失望、怀疑,乃至敌视情绪便油然而生。、测验无用论随着心理测验的不断应用,人们逐渐认识到测验的局限性和不足。其一,某些人格测验侵犯了个人隐私,违背民主原则。他们认为人的个性和态度是自己的事,与学习或工作的成功无关,不应在作实际决定时加以考虑。其二,测验为宿命论和种族歧视提供了心理学依据。如早期智力测验的结果表明,黑人的平均IQ低于白人的平均IQ,于是下结论说黑人确实比白人差。,正确的测验观,、心理测验是重要的心理学研究方法之一,是决策的辅助工具,除实验法以外,心理测验法的出现是心理科学发展史上的一大进步,是心理学研
23、究中不可缺少的研究方法之一。有许多高级心理过程目前尚无法在实验室进行研究,心理测验就是很好的办法。在进行升学、就业、招聘、晋级等工作时,传统的方法往往是不准确,不可靠,科学性较差的,这时若有相应的心理测验,就可以帮助有关部门做出科学的决策。、心理测验作为研究方法和测量工具尚不完善,尽管心理测验是心理学研究的必要手段,而且实际生活中也在广泛应用,但是心理测验从理论到方法都还存在许多问题,尤其过分夸大心理测验的科学性和准确性是不可取的。因此,我们对心理测验的得分做出解释时要小心,尤其是拿测验预测个别人的行为或心理活动时更应慎之又慎。心理测验的最大问题是理论基础不够坚实。比如,关于智力和人格的定义尚未争论清楚,还没有得到一个统一公认的定义,但智力测验和人格测验已被广泛使用。我们的态度是既要承认心理测验的不完善,又要科学地自信地使用心理测验,我们不应该重犯倒洗澡水把孩子也泼掉的错误。,实施心理测验时的注意事项,测验材料要保密。测验使用者的资格。要使用合适的常模。不能一测定终身。对测验结果的解释要因人而异,要遵循教育性原则。测验结果要保密。,