项目反应理论简介课件.ppt

上传人:小飞机 文档编号:1579186 上传时间:2022-12-08 格式:PPT 页数:53 大小:1.21MB
返回 下载 相关 举报
项目反应理论简介课件.ppt_第1页
第1页 / 共53页
项目反应理论简介课件.ppt_第2页
第2页 / 共53页
项目反应理论简介课件.ppt_第3页
第3页 / 共53页
项目反应理论简介课件.ppt_第4页
第4页 / 共53页
项目反应理论简介课件.ppt_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《项目反应理论简介课件.ppt》由会员分享,可在线阅读,更多相关《项目反应理论简介课件.ppt(53页珍藏版)》请在三一办公上搜索。

1、项目反应理论简介,华东师范大学心理系文 剑 冰,1,PPT课件,经典测量理论(CTT),经典测量理论的假设 XTE经典测量理论的信度经典测量理论的效度经典测量理论的试题参数经典测量理论的测验编制,2,PPT课件,经典测量理论的假设,观察分数真分数误差分数 XTE观察分数与误差分数之间互相独立误差分数的平均数为0多次测量的误差分数之间相关为0,3,PPT课件,经典测量理论的信度,信度的概念“真实分数方差在观测分数方差中所占的比率”信度系数的估计方法重测信度(稳定性系数)复本信度(等值性系数)内部一致性信度评分者信度信度系数的应用,4,PPT课件,经典测量理论的试题参数,难度指标(通过率或得分率P

2、值)区分度指标(鉴别力指数D或相关系数r) D PHPL,5,PPT课件,经典测量理论的测验编制,假设被试的特质是正态分布,从而测验总分的分布也是正态测验分数尽可能区分被试,因此测验总分的变异程度越大越好测验中试题的难度中等为好,区分度越大越好,6,PPT课件,经典测量理论的缺陷,参数依赖于样本能力量表与难度量表不统一对于所有被试的测量误差相等无法反应潜在特质与被试作答之间的关系在测验编制问题上的困惑,7,PPT课件,准备知识,标准分数Z0,高于平均,Z0,低于平均P(-1.96Z1.96)=0.950P(-3Z3)=0.997,8,PPT课件,9,PPT课件,项目反应理论(IRT),项目反应

3、理论 (Item Response Theory)三个理论假设单维性假设局部独立性假设项目反应模型(项目特征函数),10,PPT课件,项目反应模型,单参数模型(Rasch模型)双参数模型三参数模型,11,PPT课件,项目反应模型的参数,单参数模型 双参数模型 三参数模型,12,PPT课件,参数的含义(a),13,PPT课件,参数的含义(a),14,PPT课件,参数的含义(b),15,PPT课件,参数的含义(b),16,PPT课件,参数的含义(c),17,PPT课件,参数的含义(c),18,PPT课件,单参数模型,19,PPT课件,双参数模型,20,PPT课件,三参数模型,21,PPT课件,项目

4、反应模型参数的估计,22,PPT课件,项目反应模型参数的估计,反应模式(110)的概率:LP1P2Q3极大似然估计和贝叶斯估计(联合后验分布的众数),23,PPT课件,对=0.5时似然函数的计算,24,PPT课件,能力参数的估计方法,极大似然法(ML)使已知反应模式的似然函数值达到最大MAP(Maximum a Posteriori)使后验概率函数值达到最大EAP(Expected a Posteriori)后验概率函数值的平均数,25,PPT课件,估计项目参数的方法,联合极大似然估计法(JMLE)边际极大似然估计法(MMLE)条件极大似然估计法(CMLE)联合估计时标尺的建立(通常设能力均数

5、为0)P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2) =P(2;2.0,1.35,0.2),26,PPT课件,参数估计时标尺的建立,P(0.5;1.0,-0.8,0.2)=P(2;1.0,0.7,0.2) =P(2;2.0,-0.15,0.2)通常将被试能力平均值设定为0,27,PPT课件,信息函数,试题信息函数测验信息函数(试题信息函数之和),28,PPT课件,信息函数(例),29,PPT课件,信息函数的性质,同一试题信息函数随着所测被试能力的不同而不同;同时试题信息函数受试题自身特征的影响。a,b相同的试题,c值大的信息量小。a值大的试题,只是在较窄的区间内提供的

6、信息量多,a值小的试题,对能力的估计提供帮助不大,但是广泛地分布在较宽区间试题提供信息量最大的位置,是在接近试题难度(比难度稍大)之处,30,PPT课件,模型-资料的拟合度检验,卡方检验将被试按能力分组,,31,PPT课件,项目反应理论的特点与优点,非线性、非确定性的模型参数独立于所使用的样本试题难度与被试能力的统一对于不同能力的被试测量误差也不同提出测验编制的指导原则,32,PPT课件,IRT的其他模型,单维多等级模型 等级反应模型(GRM) 分部评分模型(PCM)多维模型能力有不同的维度,试题的区分度(/难度),在相应的维度上的取值不同,33,PPT课件,项目反应理论的应用,测验编制计算机

7、化自适应测验测验等值测验偏差,34,PPT课件,测验偏差,测验偏差(Bias)或项目功能差异(Differential Item Functioning,DIF )来自不同族群的能力相同被试,在试题上答对的概率不同,则说存在项目功能差异,35,PPT课件,项目偏差与项目功 能差异,项目偏差(item bias) :如果来自不同团体的具有相同能力的个体对某题正确回答的概率不同,那么这道题就存在偏差。但是“偏差”一词常用于社会学中,且带有判断和评价含义,把“偏差”这词语应用于统计学中不适合。项目功能差异(Differential Item Functioning)指的是在控制团体能力之后,一个项目

8、在不同团体中显示的不同统计特性。 项目影响(item impact)是指目标组与参照组在某题上的差异真的是由于两者在测验所测的能力上有差异。,36,PPT课件,非一致性DIF,37,PPT课件,一致性DIF,38,PPT课件,项目反应理论的常用软件,BILOG二级记分,单参,双参,三参模型MULTILOG多级记分,GRM,PARSCALE多级记分,GRM,PCM,GPCM,39,PPT课件,BILOG-MG的使用,40,PPT课件,数据的准备,数据文件是ASCII码的文本文件至少包含ID和答题情况,41,PPT课件,BILOG 程序文件 (*.BLM),IRT calibration of c

9、hinese and maths score.COMMENTGLOBAL DFN=C:YAN2.DAT, NIDW=5, NPARM=2, SAVE;SAVE SCO = YAN2.SCO, PARM = YAN2.PAR, TST = YAN2.TST,IST=YAN2.IST;LENGTH NITEMS=(80);INPUT NTOT=80,NALT=4, KFN=KEY.TXT,OFN=OMIT.TXT;(5A1,80A1)CALIB NQPT=40, CYC=100, NEW=30, CRIT=.001, PLOT=0;SCORE MET=2, IDIST=0, RSC=0, INF=

10、1;,42,PPT课件,BILOG 程序文件 (*.BLM),IRT calibration of chinese and maths score.COMMENTGLOBAL DFN=C:YAN2.DAT, NIDW=5, NPARM=2, SAVE;SAVE SCO = YAN2.SCO, PARM = YAN2.PAR, TST = YAN2.TST,IST=YAN2.IST;LENGTH NITEMS=(80);INPUT NTOT=80,NALT=4, KFN=KEY.TXT,OFN=OMIT.TXT;(5A1,80A1)CALIB NQPT=40, CYC=100, NEW=30,

11、CRIT=.001, PLOT=0;SCORE MET=2, IDIST=0, RSC=0, INF=1;,43,PPT课件,BILOG 程序文件 (*.BLM),IRT calibration of chinese and maths score.COMMENTGLOBAL DFN=C:YAN2.DAT, NIDW=5, NPARM=2, SAVE;SAVE SCO = YAN2.SCO, PARM = YAN2.PAR, TST = YAN2.TST,IST=YAN2.IST;LENGTH NITEMS=(80);INPUT NTOT=80,NALT=4, KFN=KEY.TXT,OFN=

12、OMIT.TXT;(5A1,80A1)CALIB NQPT=40, CYC=100, NEW=30, CRIT=.001, PLOT=0;SCORE MET=2, IDIST=0, RSC=0, INF=1;,44,PPT课件,BILOG 程序文件 (*.BLM),IRT calibration of chinese and maths score.COMMENTGLOBAL DFN=C:YAN2.DAT, NIDW=5, NPARM=2, SAVE;SAVE SCO = YAN2.SCO, PARM = YAN2.PAR, TST = YAN2.TST,IST=YAN2.IST;LENGTH

13、 NITEMS=(80);INPUT NTOT=80,NALT=4, KFN=KEY.TXT,OFN=OMIT.TXT;(5A1,80A1)CALIB NQPT=40, CYC=100, NEW=30, CRIT=.001, PLOT=0;SCORE MET=2, IDIST=0, RSC=0, INF=1;,45,PPT课件,BILOG 程序文件 (*.BLM),IRT calibration of chinese and maths score.COMMENTGLOBAL DFN=C:YAN2.DAT, NIDW=5, NPARM=2, SAVE;SAVE SCO = YAN2.SCO,

14、PARM = YAN2.PAR, TST = YAN2.TST,IST=YAN2.IST;LENGTH NITEMS=(80);INPUT NTOT=80,NALT=4, KFN=KEY.TXT,OFN=OMIT.TXT;(5A1,80A1)CALIB NQPT=40, CYC=100, NEW=30, CRIT=.001, PLOT=0;SCORE MET=2, IDIST=0, RSC=0, INF=1;,46,PPT课件,BILOG 程序文件 (*.BLM),IRT calibration of chinese and maths score.COMMENTGLOBAL DFN=C:YA

15、N2.DAT, NIDW=5, NPARM=2, SAVE;SAVE SCO = YAN2.SCO, PARM = YAN2.PAR, TST = YAN2.TST,IST=YAN2.IST;LENGTH NITEMS=(80);INPUT NTOT=80,NALT=4, KFN=KEY.TXT,OFN=OMIT.TXT;(5A1,80A1)CALIB NQPT=40, CYC=100, NEW=30, CRIT=.001, PLOT=0;SCORE MET=2, IDIST=0, RSC=0, INF=1;,47,PPT课件,BILOG 程序文件 (*.BLM),IRT calibratio

16、n of chinese and maths score.COMMENTGLOBAL DFN=C:YAN2.DAT, NIDW=5, NPARM=2, SAVE;SAVE SCO = YAN2.SCO, PARM = YAN2.PAR, TST = YAN2.TST,IST=YAN2.IST;LENGTH NITEMS=(80);INPUT NTOT=80,NALT=4, KFN=KEY.TXT,OFN=OMIT.TXT;(5A1,80A1)CALIB NQPT=40, CYC=100, NEW=30, CRIT=.001, PLOT=0;SCORE MET=2, IDIST=0, RSC=0

17、, INF=1;,试题参数估计时的设定,画出拟合度差(p=指定数值)的试题,48,PPT课件,BILOG 程序文件 (*.BLM),IRT calibration of chinese and maths score.COMMENTGLOBAL DFN=C:YAN2.DAT, NIDW=5, NPARM=2, SAVE;SAVE SCO = YAN2.SCO, PARM = YAN2.PAR, TST = YAN2.TST,IST=YAN2.IST;LENGTH NITEMS=(80);INPUT NTOT=80,NALT=4, KFN=KEY.TXT,OFN=OMIT.TXT;(5A1,80

18、A1)CALIB NQPT=40, CYC=100, NEW=30, CRIT=.001, PLOT=0;SCORE MET=2, IDIST=0, RSC=0, INF=1;,被试能力估计时的设定,1-ML2-EAP(缺省)3-MAP,0-不做重新标刻(缺省)1-按scale和location线性变换3-按样本的L和S重新标刻3-EAP时潜变量以L为均数S为标准差,测验信息曲线,49,PPT课件,BILOG 结果文件 (*.PH1),ITEM STATISTICS FOR SUBTEST TEST0001 ITEM*TEST CORRELATION ITEM NAME #TRIED #RIG

19、HT PCT LOGIT PEARSON BISERIAL - 1 ITEM0001 480.0 395.0 82.3 -1.54 0.318 0.468 2 ITEM0002 480.0 357.0 74.4 -1.07 0.306 0.415 3 ITEM0003 480.0 444.0 92.5 -2.51 0.252 0.469 4 ITEM0004 480.0 321.0 66.9 -0.70 0.468 0.608 5 ITEM0005 480.0 292.0 60.8 -0.44 0.119 0.151 6 ITEM0006 480.0 265.0 55.2 -0.21 0.16

20、2 0.204 7 ITEM0007 480.0 315.0 65.6 -0.65 0.288 0.372 8 ITEM0008 480.0 247.0 51.5 -0.06 0.391 0.490 9 ITEM0009 480.0 178.0 37.1 0.53 0.128 0.163 10 ITEM0010 480.0 253.0 52.7 -0.11 0.406 0.509,CTT的试题参数,Ln(1-p)/p,50,PPT课件,BILOG 结果文件 (*.PH2),CYCLE 15; LARGEST CHANGE= 0.00007 SUBTEST TEST0001; ITEM PARA

21、METERS AFTER CYCLE 15 ITEM INTERCEPT SLOPE THRESHOLD LOADING ASYMPTOTE CHISQ DF S.E. S.E. S.E. S.E. S.E. (PROB) - ITEM0001 | 1.785 | 0.922 | -1.936 | 0.678 | 0.000 | 2.2 8.0 | 0.147* | 0.146* | 0.265* | 0.107* | 0.000* | (0.9758) | | | | | | ITEM0002 | 1.214 | 0.816 | -1.487 | 0.632 | 0.000 | 3.4 9.

22、0 | 0.118* | 0.124* | 0.224* | 0.096* | 0.000* | (0.9469) | | | | | |,IRT的试题参数,-Slope*threshold,Slope/sqrt(1+slope2),51,PPT课件,BILOG 结果文件 (*.PH3),GROUP SUBJECT IDENTIFICATION MARGINAL WEIGHT TEST TRIED RIGHT PERCENT ABILITY S.E. PROB - 1 11 | | 1.00 TEST0001 80 46 57.50 | -0.4595 0.1175 | 0.00 1 12 |

23、 | 1.00 TEST0001 80 46 57.50 | -0.5095 0.2318 | 0.00 1 13 | | 1.00 TEST0001 80 28 35.00 | -1.7741 0.4445 | 0.00 1 14 | | 1.00 TEST0001 80 58 72.50 | -0.2157 0.3886 | 0.00 1 15 | | 1.00 TEST0001 80 57 71.25 | 0.0378 0.4430 | 0.00 1 16 | | 1.00 TEST0001 80 20 25.00 | -2.2754 0.2127 | 0.00 1 17 | | 1.00 TEST0001 80 63 78.75 | 0.4364 0.1461 | 0.00 1 18 | | 1.00 TEST0001 80 65 81.25 | 0.5205 0.2539 | 0.00,52,PPT课件,试题参数文件 (*.PAR),BILOG保存的外部文件试题参数文件(*.PAR)被试能力估计文件(*.SCO)数据格式与PH2和PH3文件中基本相同,53,PPT课件,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号