《多维项目反应理论ppt课件.pptx》由会员分享,可在线阅读,更多相关《多维项目反应理论ppt课件.pptx(17页珍藏版)》请在三一办公上搜索。
1、,多维项目反应理论,IRT,项目反应理论(Item Response Theory,简称 IRT),又称潜在特质理论(Latent Trait Theory)或项目特征曲线理论(Item Characteristic Curse Theory),是为了克服经典测验理论(CTT)的局限而提出的现代测验理论。从测验的内部或微观方面入手,采取数学建模和统计调整的方法,重点讨论被试的能力水平与测验项目之间的实质性关系,测验的每一个项目都有自己的项目特征曲线,描述了每一个特定能力水平的被试答对或答错该项目的概率。,IRT假设之一潜在特质空间的单维性假设什么是潜在特质空间(Latent Trait Spa
2、ce)对于某一特殊行为的发展起作用的所有特质的集合。,维度,在潜在特质空间中互相独立的潜在特质的个数。,一个K维的潜在特质空间可以表示为:H =(1, 2, 3,.,k),总之,潜在特质理论是一切心理测量理论研究的基础。,IRT缺点但严格的单维性是大多数测量工具都难以满足的,这也是IRT受到批评的主要原因。,所以,解决测验的单维性问题及建立多维反应模型是IRT将要研究的任务之一。,多维项目反应理论发展的心理计量学 背景,1、因子分析从线性到非线性传统因子分析(Factor Analysis, FA)认为心理特质与项目反应之间是呈线性关系的, 但实际上, 心理特质与项目反应之间经常是非线性的。在
3、存在非线性关系的情况下, 传统线性因子分析方法从相关矩阵出发进行因子分析, 显然是有缺陷的。1965 年, Horst 在他的著作数据矩阵的因子分析中, 阐述了从完全信息的数据矩阵出发而不是相关矩阵出发进行因子分析的观点(Reckase,1997)。但是 Horst 并没有把他的观点付诸于实际行动。,Christoffersson (1975) 和 Muthn (1978) 把Horst 的工作推进了一步。他们应用正态肩形模型建立了项目反应和被试参数向量的概率模型, 获得了项目阈值参数的估计值, 而这个值实际上类似于 MIRT 模型中的难度值。Muthn 还提出了一个正确观察比例的 M 维向量
4、 P 的模型。他们的工作与当前 MIRT 的观点非常接近, 但他们的公式所欠缺的是没有以每个项目正确反应的条件概率作为空间中被试位置的函数表达。,McDonald (1967) 提出的非线性 FA 方法与目前 MIRT 观点最为相似。他指出了对于 1, 0 计分变量的因子分析问题。认为如果观察变量在因子上的回归能用非线性的方法来解决, 则在两点数据分析中的难度因素可以被很容易地处理。 McDonald 还提出了用来表示项目反应在潜在多维空间上回归的项目反应曲面的基本形式。,1981 年, Bock 和 Aitkin (1981) 建立了 IRT 和FA 之间的直接联系, 从而导致了 MIRT
5、的雏形。他们为多维特质空间定义的正态肩形模型包括了 FA与 IRT 两者的特征。模型如下a, , d 参数相当于目前 MIRT 表达式中所使用的参数, a 是区分度参数向量, 是特质向量, d是难度参数。尽管这个模型实质上是个 MIRT 模型, 但是, 与完整的 MIRT 概念框架相比, 唯一缺乏的是没有把项目参数作为被试和项目交互作用的描述性测量来解释。,2、项目反应理论从单维到多维从因子分析发展的背景可以看出, 一些计量学家意识到传统因子分析的一些缺陷, 提出了利用完整信息的项目反应矩阵, 对被试心理特质与项目反应之间的关系利用非线性概率模型来表达, 建立了FA与IRT之间的连接, 甚至产
6、生了实质上的 MIRT 模型。但是, 他们关注的重点仍然是数据降维, 即进行因子分析而不是被试或项目特征, 而 IRT 关注的重点则是被试和测验项目之间的交互作用, 因而完整的 MIRT 概念框架必然少不了 IRT 的特征。,多维项目反应理论的概述,产生多维项目反应理论是基于因子分析和单维项目反应理论两大背景下发展起来的一种新型测验理论。分类根据被试在完成一项任务时多种能力之间是如何相互作用的, 多维项目反应模型可以分为补偿性模型和非补偿性模型两类。,非补偿性模型,非补偿性模型(MIRT-NC)假设完成某项任务需要多种技能, 被试只有掌握了这个项目所涉及到的所有技能才能答对该题, 这些技能之间
7、是相互独立的, 被试成功应用所有技能的联合概率就是在这些独立技能上成功的条件概率乘积。Whitely (1980) 提出的多成分潜在特质模型(Multicomponent Latent Trait Model, MLTM)是一个典型的非补偿性模型。式中, jk是被试 j 在能力 k 上的掌握水平; aik是项目 i 在能力 k 上的区分度参数; bik是项目 i在能力 k 上的难度水平。模型假设正确完成一个项目需要 K 个能力成分联合起作用, 正确反应的概率会随着任一维度能力的不够而明显降低。,补偿性模型,补偿性模型(MIRT-C)是被试完成某项任务所需的能力之间可以相互补偿, 也就是说在某一
8、能力上的不足, 可以被其他优势技能所补偿, 从而增大他答对该题目的概率(辛涛, 2005)。当前广泛使用的补偿性模型主要有两种: McDonald 的多维正态肩形(MNO)模型(Christoffersson, 1975; McDonald, 1985, 1997)和 Reckase 的多维 Logistic模型(Reckase & McKinley, 1982, 1991, 1997)。,多维 Logistic模型,Reckase和Mckinley (1982)在回顾以往模型的基础上, 最终提出了目前最实用的线性Logistic多维项目反应模型。模型表示如下:,MCMC 算法目前,MCMC已经成为一种处理复杂统计问题的特别流行的工具,尤其在经常需要复杂的高维积分运算的贝叶斯分析领域更是如此。在那里,高维积分运算主要是用来求取普通方法无法得到的后验分布密度。如果合理的定义和实施,MCMC总能得到一条或几条收敛的马尔可夫链,该马尔可夫链的极限分布就是所需的后验分布,MIRT 模型参数估计的MCMC 算法,Gibbs抽样,常用MCMC算法,谢谢观看,