《分布式组卷算法的研究毕业设计(论文)word格式.doc》由会员分享,可在线阅读,更多相关《分布式组卷算法的研究毕业设计(论文)word格式.doc(100页珍藏版)》请在三一办公上搜索。
1、分类号 密级 U D C 硕士(博士)(工程硕士)学位论文分布式组卷算法的研究 (题名和副题名)研究生姓名 张 景 中 指导教师姓名、职称 王 海 瑞 教授 学科专业 计算机技术 研究方向 人工智能 论文工作起止日期 2008 年 07 月 01 日 论文提交日期 2009 年 05 月 06 日 摘 要随着计算机技术的发展,计算机辅助教育作为一门新兴的综合学科,越来越受到广大教育工作者的重视。在计算机辅助教育的研究中,组卷算法是评价考试系统好坏的一个主要因素,一个良好的组卷算法对于准确地检验学生学习成绩和教师教学效果起着非常重要的作用。组卷算法是按照一定的要求,由计算机自动地从试题库中选择试
2、题,组成符合总分、总时间要求和试题题型、试题数量、知识点、难度等约束条件要求的试卷。由于组卷要求生成的试卷能最大程度地满足用户的不同需要,并具有随机性、合理性,因此如何设计一个算法从试题库中既快又好地抽出一组最符合考试要求的试卷,是本文研究的目的。首先,本文介绍了组卷算法的研究背景、目的和意义,在国内外大量相关文献分析研究的基础上,着重对组卷算法进行研究。通过对目前常见的组卷技术的分析,指出了常见组卷算法的缺点。在此基础上,提出了将遗传算法应用于组卷问题具有可行性,具有很大的理论和应用研究价值。 其次,以经典测量理论为基础,介绍了组卷的一些基本原则,分析了试卷的评价指标、试题各项指标的作用及几
3、个重要指标间的关系。在此基础上,总结了编制一份试卷所要满足的约束条件,并建立了组卷问题的数学模型,得出了组卷的目标函数、适应度函数等。再其次,介绍了遗传算法的产生与发展、特点与不足,还介绍遗传算法中的一些基本概念,算法的执行流程,编码与适应度函数的设计以及选择算子、交叉算子、变异算子的设计与实现,论证了遗传算法应用于组卷问题的可行性。最后,结合组卷问题的数学模型和组卷问题的特点,基于JGAP开发包,采用了一种分段二进制编码,首次提出了倒置交叉、双变异算子的实现方法。通过仿真实验表明,该算法收敛于局部最优解,稳定性较差,组卷质量较差,种群过早丧失多样性,进入“早熟”。在分段二进制编码的基础上,提
4、出了分段整数编码改进实现方案,设计并实现了相应的交叉和变异算子。通过仿真实验表明,该算法具有很好的稳定性和收敛性,组卷质量较好,但由于种群多样性的丧失,局部寻优能力较弱。为了保持种群的多样性,在分段整数编码的基础上,提出多种群协同进化策略,并应用组卷问题中。通过仿真实验表明,该算法在全局搜索性能和收敛速度上都有显著提高,同时采用了JAVA语言实现了算法的跨平台性和可移植性,还可根据动态试题类型配置和知识点配置,对题库中的试题进行高质量的预选择,实现了动态组卷。该算法组卷质量高,组卷速度不理想,基本上能够满足实际组卷需求,具有较高的应用价值。为了提高组卷效率,提出了将分布式遗传算法应用于组卷问题
5、中,给出了该算法的架构体系和具体实现机制。由于JGAP开发包在通信中出现错误,没有得到实验数据,这将作为以后继续研究的方向。关键词:遗传算法;组卷算法;组卷;种群多样性;数学模型AbstractWith the development of computer technology, computer-aided education as an emerging integrated subject, is received increasing attention by the education workers. In the study of Computer-aided educatio
6、n, Algorithm generating paper evaluation of the examination system is a major factor in good or bad, a good Algorithm accurately testing students for learning and teaching effectiveness of teachers plays an important role.Algorithm generating paper is based on certain requirements, automatically sel
7、ect questions from the test database to form in line with the total score, the total time requirements and test style, test the number of knowledge points, the difficulty of binding conditions, such as papers.To meet the different needs of users and have the random, reasonable, the purpose of this p
8、aper is how to design an algorithm from the questions library fast and well to take a group of the best papers in the examination requirements.Firstly, the paper introduces the research background, purpose and significance, a great deal of relevant literature at home and abroad focusing on the study
9、 Algorithm.The shortcomings of common algorithm are pointed out based on the current analysis of the generating technology. On this basis, the proposed genetic algorithm is applied to the question of the feasibility of test papers, which has great value of theoretical and applied research.Secondly,
10、based on classical measurement theory, the basic principles of test paper is introduced, the evaluation of papers, the role of indicators, a number of important indicators of the relationship are analyzed.On this basis, constraint conditions are prepared and a mathematical model generating papers is
11、 established, also the paper come to the objective function, fitness function, etc.Thirdly, the emergence and development of genetic algorithms, characteristics and shortcomings of the genetic algorithm are introduced in the paper, also some basic concepts, algorithm implementation of processes, enc
12、oding and the design and Implementation of fitness function, selection operator, crossover operator and mutation operator are proposed, then the paper demonstrated that the genetic algorithm is applied to generate papers.Finally, combined with the issue of generating paper problem and the mathematic
13、al model, the inverted cross, double mutation of the implementation are proposed the first time based on JGAP Development Kit, using of a sub-binary code.Simulation experiments show that the existing algorithm converges to local optimal solution, has poor stability and poor quality, loses diversity
14、ahead of time to access to mature. In the sub-binary code, based on a sub-integer encoding to improve the achievement of the program, the corresponding crossover and mutation operator are designed and realized. Simulation experiments show that the algorithm has good stability and convergence, better
15、 quality, but because of the loss of population diversity, local optimization is weak. In order to maintain the diversity of the population , a wide range of groups co-evolutionary strategy based on the sub-integer-coded, is proposed and realized. Simulation experiments show that the global search p
16、erformance and convergence speed of the algorithm are significantly increased, while the cross-platform and portability are realized by the use of the JAVA language of the algorithm, but also a dynamic paper is achieved on the basis of the type of configuration ,dynamic knowledge-point configuration
17、, high-quality pre-selection.Although the algorithms speed is not satisfactory, its high quality has a higher application value, which largely meet the needs of the actual generating paper. In order to improve the efficiency, a distributed genetic algorithm is applied to generating papers, given the
18、 structure of the algorithm and the realization of the system. JGAP development kit get errors in the communications, as the experimental data is notreceived, which will be studied as a future direction.Keywords:Genetic Algorithm; Algorithm Generating Paper; generating paper; diversity of population
19、; mathematical model目录摘 要IAbstractIII1 绪论11.1 组卷算法的研究背景11.2 组卷算法研究的目的和意义21.3组卷算法的研究现状21.3.1组卷算法的研究背景21.3.2几种组卷算法的综合评价41.4 本文的主要工作51.5 本文的组织结构62 组卷问题的基本理论及数学模型82.1组卷的原则82.2组卷的特点92.3影响组卷质量的因素92.3.1信度92.3.2效度122.4影响试题质量的因素132.4.1试题难度132.4.2试题区分度142.6组卷问题的数学模型182.6.1组卷问题的约束条件182.6.2组卷问题的数学模型182.6.3组卷问题的
20、目标函数212.7本章小结233 遗传算法理论243.1遗传算法的产生与发展243.2遗传算法的特点及不足253.3遗传算法中的基本概念263.4遗传算法的运算流程273.5遗传算法的设计与实现283.5.1编码的方法293.5.2适应度函数303.5.3遗传算法算子313.6本章小结344 组卷算法的设计与实现354.1题库的建立354.1.1总题库的E-R图354.1.2题库表结构354.1.3创建题库表结构374.1.4试题属性类结构374.1.5初始化题库算法384.2题库预选394.2.1组卷策略的配置394.2.2试题类型配置类404.2.3试卷配置类414.2.4题库的预选算法4
21、24.3 本文采用的软件开发包JGAP424.3.1 JGAP简介424.3.2 JGAP主要类424.3.3 JGAP实现步骤454.4基于二进制编码的遗传算法的实现454.4.1染色体编码454.4.2初始化种群464.4.3适应度函数的设计474.4.4选择算子的设计474.4.5交叉算子的设计484.4.6变异算子的设计504.4.7遗传算法的终止条件514.4.8组卷算法的实现514.4.9实验524.4.10实验数据分析584.5基于整数编码的改进遗传算法的实现594.5.1编码设计594.5.2生成初始化群体604.5.3交叉算子的设计604.5.4变异算子的设计614.5.5实
22、验624.5.6实验数据分析674.6 多种群协同进化的遗传算法的单机模拟实现684.6.1实现策略684.6.2实验694.6.3实验数据分析754.7 本章小结765 分布式遗传算法的架构775.1 序言775.2 分布式遗传算法775.3 迁移策略785.4分布式遗传算法参数的选择785.5 基于JGAP分布式的架构体系805.6基于JGAP的分布式遗传算法实现机制805.6.1分布式遗传算法的重要类805.6.2分布式遗传算法的具体实现方案815.6.3分布式遗传算法的执行步骤825.6.4分布式遗传算法的实验结果835.7 本章小结836 结论84参考文献86致 谢901 绪论1.1
23、 组卷算法的研究背景随着计算机技术的发展,计算机在各种领域的应用越来越广泛。20世纪50年代,在程序教学理论的基础上,产生了计算机辅助教育(Computer Based Education,CBE)。经过几十年的发展,形成了计算机辅助教学(Computer Assisted Instruction,CAI)和计算机辅助管理(Computer Managed Instruction,CMI)两大分支。我国在计算机教育方面研究比较晚,但也取了很多成就。随着计算机辅助教学的广泛发展,利用计算机的强大功能参与教学,已经成为教育工作者和科研人员广泛关注的研究领域1。智能组卷系统则是CAI的重要组成部分,
24、它是将教育学、教育统计学、教育测量学、考试学、心理学等多种学科与人工智能技术结合起来,模拟专家出卷经验,利用计算机来完成试卷内容的编制2,3。但目前,许多考试的组卷过程并不完全科学,考试手段落后,命题内容、评分标准等由于受各种人为因素的干扰,缺乏普遍的可比性,考试信度和效度较低。如何有效地利用计算机从已有的试题库中,自动、有效地组合相关试题,形成具有专业水准的试卷是一项非常有意义的课题,在过去二十多年的研究中已产生了许多相关的理论知识,并将许多成熟的理论应用到计算机组卷技术中来,使计算机组卷技术得到快速的发展,但由于计算机组卷的约束条件是一种多约束条件求解的组合问题。因此,尽管在计算机组卷技术
25、中取得了较好的效果,但仍然是一项具有非常重要意义的实际课题。1.2 组卷算法研究的目的和意义考试是教学过程中的一个重要环节,是检验学生学习成绩和教学效果的重要手段,在评价学生学习成绩、激发学生的创造力、提高学习效果等方面起着重要作用,同时也为教师改进教学方法、提高教学质量提供了必要的信息。但考试的信度和效度是由试卷的质量来决定的,因此组卷算法的优劣,是影响考试效果的重要因素。由于组卷问题是一个典型的多约束满足问题的求解过程,一般情况下不可能找到最优解,只可以找到较为实用近似解。在组卷过程中,多种约束相互制约,组卷的过程就是试卷参数的满足和试题指标的分配过程,是一个动态变化的过程。但目前的组卷算
26、法在组卷时具有一定随机性和盲目性,在效率和质量上都不尽人意,因此对组卷算法的研究具有一定理论价值和应用价值。本课题是为解决现有计算机考试系统的组卷模块,组卷质量差,组卷效率低,难以满足实际考试需求这一问题而提出的。在对组卷理论研究的同时,结合了遗传算法理论,采用JAVA语言予以实现,来探讨一种适用的跨平台通用算法来解决考试系统中的组卷问题,具有很大的实用价值。1.3组卷算法的研究现状1.3.1组卷算法的研究背景在组卷方面,国内外许多院校、科研机构对此进行了深入的研究。国外的组卷理论主要为了突破经典测试理论CTT13(Classical Test Theory)的各种局限性,基于项目反应理论IR
27、T(Item Response Theory)的试题生成而发展起来的一种全新的测量学理论。国内试题组卷算法主要采用随机选取法、回溯试探法和遗传算法。文献4针对传统的组卷算法具有组卷速度慢、成功率较低、组卷质量不高等缺点,提出了一种用改进的遗传算法来求解组卷问题的方法。文献5 对组卷问题进行了分析,提出了采用遗传算法来解决这个带约束的多目标优化问题,并提出了应用于自动组卷中的基于矩阵编码的遗传算法,充分利用领域知识来设计解的编码和遗传算子。文献6 分析了现存组卷系统的组卷算法及相应的数据库结构的基础上,基于遗传算法提出了一种新的数据库结构,并给定具体结构的确定方法。文献7提出了合理分配试题的知识
28、点和试题难度分布的方法,并将其运用于数学模型中,设计了一种以多目标优化数学模型为选题依据的智能组卷算法。文献8讨论自动组卷问题数学模型的同时,介绍了当前为解决自动组卷问题而采取的三种方法,在分析三种自动组卷方法后引入遗传算法来较好地解决这个问题。文献9分析了目前智能组卷系统的研究现状 ,提出了一种基于单亲遗传算法的智能组卷系统的实现方法。文献10 对组卷系统的要求和目标进行了探讨,在组卷问题的一般过程中应用矩阵理论的方法,为组卷系统的建模问题进行了研究。文献11 根据教育考试理论与统计学, 分析了自动组卷目标要求, 建立了智能组卷系统的数学模型,并提出了一种基于免疫遗传算法的智能组卷算法, 提
29、出了分段编码、段内遗传操作、误差加权适应度评估方法。文献12 在智能组卷方案中,提出一种新的“分段随机抽选法”,并用该算法与传统的组卷算法在生成试卷的效率上进行了比较,同时针对由本算法所引起的修改困难提出了解决方法。文献14中给出了一种基于概率论和自适应遗传算法的智能组卷算法的数学模型。该算法首先以概率论为基础优化初始参数,然后用自适应遗传算法进行组卷操作,优化操作过程,有效地解决了试题库中的试题生成问题。文献15一个基于项目反应理论IRT的试题生成方法-自适应遗传算法,该算法通过调整惩罚因子,自适应地调整适应函数,有效地解决了试题组卷中约束优化问题。文献16以多目标动态评价函数作为评价选择试
30、题的基础,按试题生成的控制指标,从试题库中抽取一组试题构成试卷,使试卷的各项指标与试题生成的控制指标达到较好的一致,解决了基于试题库的试卷生成中多目标条件约束的问题。文献17以模糊数学理论、统计学理论等对用户命题要求进行量化处理,产生试卷的基本模式,然后根据基本模式在题库中随机抽取试题。文献18利用正态分布函数计算试题难度分布的基础上,采用随机抽取和近似匹配的策略进行试题生成。文献19根据对样本试卷的分析得出考生的成绩大致呈正态分布这一结论,提出一种依据正态分布函数计算试题难度分布的方法。以上的研究都是基于单机系统,但关于分布式组卷算法的研究,还没有相关的资料,处于刚起步阶段。但分布式遗传算法
31、应用的例子还是不少,具有一定的借鉴价值。因此,分布式组卷系统的研究具有可行性,一定会取得很好的效果。1.3.2几种组卷算法的综合评价1.3.2.1随机选取法 随机选取法根据组卷的控制指标,随机从试题库抽取一道试题放入试卷中,此过程不断重复,直到组卷完毕,或已无法从题库中抽取满足条件的试题为止。该方法结构简单,组卷成功率低。在组卷条件限制下,随机选取法有时能够取出一组令用户满意的试题,但大多数由于随机选取试题的范围太大,无法确定目前条件下哪些区域能抽出合适的试题,可能会导致死循环,造成组卷失败。1.3.2.2回溯试探法回溯试探法是从某一点出发,将随机选取法所产生的每一状态都记录下来,当搜索失败时
32、修改上次记录的状态类型,然后依据一定的规律,改变一种新的状态类型进行试探,通过不断的回溯试探,直到组卷完成或退回出发点为止。回溯试探法对于小题库而言,组卷成功率较高。但对于大题库来说,运算量大,组卷时间长,内存占用量大,组卷成功率低,因此它不是一种很好地适用于智能组卷的算法。1.3.2.3数据挖掘和知识发现 数据挖掘和知识发现作为一门新的研究领域,涉及到机器学习、模式识别、统计学、数据库和人工智能等学科。它可看作为数据库理论和机器学习的交叉学科20。作为一种独立应用的技术,也被应用于组卷系统中。SavaSers等人在1995年提出了一种把数据库分割处理的算法,降低挖掘过程中的I/O次数,减轻了
33、CPU的负担。H.Toivonen使用抽样(sampling)的方法可以用较小的代价从大型数据库中找出关联规则21。常见关联规则挖掘算法有Apriori算法、DHP算法等。这些算法的提出,不同程度地改进了关联规则发现过程。但至今,提高算法的效率仍然是关联规则发现任务中需要解决的问题。数据挖掘在组卷问题中研究目前却停留在理论上,还缺乏成熟的技术和理论。1.3.2.4遗传算法(GA)GA是一种模拟自然选择和遗传机制的全局寻优算法,克服了随机选取算法的盲目性和随机性,也克服回溯试探法计算量大的问题,其搜索过程是一个迭代过程,通过遗传操作,将每一代的优秀基因遗传到下一代,通过交叉和变异操作产生新的个体
34、。该算法具有很好的收敛性,在进化的过程中,能从群体中选择更满足条件的个体,具有很强的智能性。许多研究人员对基于遗传算法的组卷方法作了深入的研究,取得了比较好的效果。但在进化过程中种群容易失去多样性,陷入局部最优解,发生所谓的“早熟”现象。因此要求初始种群具有多样性。1.4 本文的主要工作本文主要对组卷算法研究的背景、目的和意义及应用现状进行系统总结,分析了现有组卷算法存在的不足;以经典测量理论为基础,介绍了组卷的基本原则,分析了试卷评价指标之间的关系,建立组卷问题的数学模型,并得出组卷问题的目标函数。本文还介绍了遗传算法的产生、发展、特点及不足,适应度函数的设计、遗传算子(选择、交叉、变异)的
35、设计以及遗传算法的具体实现过程。本文结合组卷问题的数学模型和组卷问题的特点,基于JGAP开发包,采用了一种分段二进制编码,首次提出了倒置交叉、双变异算子的实现方法。通过仿真实验表明,该算法收敛于局部最优解,稳定性较差,组卷质量较差,种群过早丧失多样性,进入“早熟”。在分段二进制编码的基础上,提出了分段整数编码改进实现方案,设计并实现了相应的交叉和变异算子。通过仿真实验表明,该算法具有很好的稳定性和收敛性,组卷质量较好,但由于种群多样性的丧失,局部寻优能力较弱。为了保持种群的多样性,在分段整数编码的基础上,提出多种群协同进化策略,并应用于组卷问题中。通过仿真实验表明,该算法在全局搜索性能和收敛速
36、度上都有显著提高,组卷质量高,但组卷速度不理想,基本能够满足实际组卷需求。为了提高组卷效率,提出了将分布式遗传算法应用于组卷算法中,给出了该算法的架构体系和具体实现机制。由于JGAP开发包在通信中出现错误,没有得到实验数据,这将作为以后继续研究的方向。本文基于遗传算法的组卷算法,采用JAVA语言予以实现,该算法具有很好的可移植性及跨平台性。该算法可根据动态试题类型配置和知识点配置,对题库中的试题进行高质量的预选择,实现了动态组卷,具有很好的应用价值。1.5 本文的组织结构 本文共分五章,具体结构如下:第一章本文介绍组卷算法的研究背景、目的和意义,在国内外大量相关文献分析研究的基础上,着重对组卷
37、算法进行研究。通过对目前常见的组卷技术的分析,指出了常见组卷算法的缺点。在此基础上,提出了将遗传算法应用于组卷算法具有可行性,具有很大的理论和应用研究价值。第二章介绍了组卷的原则及特点,分析了影响组卷质量的因素,探讨了有关试题的几个重要属性之间的关系以及组卷问题的约束条件,建立了组卷问题的数学模型,推导出组卷问题的目标函数。第三章介绍了遗传算法的产生与发展、特点与不足,还介绍遗传算法中的一些基本概念,算法的执行流程,编码与适应度函数的设计以及选择算子、交叉算子、变异算子的设计与实现。第四章着重解决了遗传算法在组卷问题中的实现。结合组卷问题的数学模型和组卷问题的特点,基于JGAP开发包,采用了一
38、种分段二进制编码,首次提出了倒置交叉、双变异算子的实现方法,具体实现过程还包括题库的设计,试题的预选择策略的实现,遗传算法的编码方式、选择算子的设计及组卷算法的实现步骤等,通过仿真实验表明,该算法收敛于局部最优解,稳定性较差,组卷质量较差,种群过早丧失多样性,进入“早熟”。在分段二进制编码的基础上,提出了分段整数编码改进实现方案,设计并实现了相应的交叉和变异算子。通过仿真实验表明,该算法具有很好的稳定性和收敛性,组卷质量较好,但由于种群多样性的丧失,局部寻优能力较弱。为了保持种群的多样性,在分段整数编码的基础上,提出多种群协同进化策略,并应用组卷问题中。通过仿真实验表明,该算法在全局搜索性能和
39、收敛速度上都有显著提高,组卷质量高,组卷速度不理想,基本上能够满足实际组卷需求,具有较高的应用价值。第五章着重解决如何缩短组卷时间,提高组卷效率,提出了将分布遗传算法应用于组卷问题中,给出了该算法的架构体系和具体实现机制。由于JGAP开发包在通信中出现错误,没有得到实验数据,这将作为以后继续研究的方向。第六章总结全文,得出基于遗传算法的组卷算法的研究结论,指出其不足之处以及今后的改进方向。2 组卷问题的基本理论及数学模型智能组卷不但能最有效地把专家们(指经验丰富的教师群体)的知识和组卷经验与计算机技术结合在一起,生成符合要求的试卷且比较客观和规范性好(避免个人的主观性和客观性);同时,使用起来
40、又最为方便,对操作人员几乎没有什么专业上的要求22。然而,智能组卷系统的设计并不容易,这是因为:(1)对试卷的要求不同于一般的练习,必须满足教学和考试目标的要求23,24。(2)不同校系的考生对象和不同的考试目标,对试卷要求很不相同25。(3)组卷是一项严肃的教学活动,任何一份试卷都必须是合格的。即使出现很小差错,也是不允许的。如何进行组卷活动,必须在组卷原则的指导下,才能生成符合要求的试卷。2.1组卷的原则对于一般的测试来说,组卷一方面主要是用于检验学生对学科知识的掌握程度,另一方面用于考察教学效果,都属于目标参照性测验。本文研究的组卷算法侧重于目标参照性测验。对于目标参照性测验,组卷的基本
41、原则26主要体现在:(l)组卷要依据考试大纲,全面反映大纲的广度和深度。 (2)组卷要有利于考查学生的学习能力,促进考生的智力发展。(3)组卷要讲究层次,具有一定的区分度。难度过大或过小都会降低试题的区分度。 (4)命题要注重发挥考题对考生学习方法的引导作用。(5)试题一定要不偏不倚,具有一定的深度,能测量出学生的不同知识水平和智能差异。(6)命题的表达语或指导语要清楚无误,以提高考试的信度。2.2组卷的特点组卷就是多约束问题的求解过程,在现阶段不可能找到其完全解,只能在不同程度上满足或接近用户需求,生成相对满意的试卷。组卷算法就是用户输入试卷的具体要求,计算机根据一定的算法去抽取满足要求的考
42、试试题,编排试题、打印试卷供考生考试。在组卷前,必须对试卷的特征进行统计分析,才能设计出合理的组卷算法。组卷问题主要有以下几方面的特征:(l)数据的不精确性、模糊性。组卷算法在题库中如何搜索试题,必须有一些描述这些试题的指标数据。这些指标数据有些是明确的,例如分数、题型等;但有些数据是比较模糊的,例如难度等级;还有些数据是需要测试才能得到的,如该题所需时间等。因此,系统中的数据不仅有精确数据,还有模糊性数据。(2)解的多样性。由于题库中的试题很多,能满足用户要求的试题也很多,即问题的解空间很大,因而,就能在相同的条件下组出多套试卷。(3)知识的特征不同。对于组卷算法,知识大都来源于专家的组卷经
43、验。不同的专家有不同的成卷经验,还没有固定的模式,不能全篇一律,在实践过程中要不断地总结专家经验。所以,在组卷算法研究中就必须不断的更新知识、完善知识,使算法能组出高质量的试卷。2.3影响组卷质量的因素组卷就是按照给定的组卷策略,从题库中抽取适当的题目组成一份符合要求的试卷。根据教育测量理论,衡量试卷质量的基本因素是试卷的信度和试卷的效度27。2.3.1信度1.信度的定义信度(reliability)指的是测量结果的稳定性程度,也就是测量结果的可信程度。对于教育测量,先后向同一对象施测后,所得数值很难做到绝对一致。每次测量结果实际上包含了被测量特质对象的实际水平和测量误差两部分。若测量误差很小
44、,则测量结果肯定是稳定的。由于考试中测试对象的特殊性,影响测量结果的因素有很多,如考试环境、完成时限、主被试关系、被试的动机和情绪等。信度就是指对这种随机误差的控制程度。信度主要包括以下两个等价的定义:(l)信度指可观察分数与真分数的相差程度。可观察分数是指考生通过考试取得的成绩X,真分数是指考生实际具有的分数T,所以误差分数E=X-T。E的数值越大,可观察分数与真分数的差距就越大,即考试的信度也就越低,反之,考试的信度就越高。但要比较两次考试信度的高低,如果用绝对误差E,则会出现错误,所以必须用相对误差(E/T100%)。又因真分数T不可能得到,所以在相对误差公式中用X代替T,即最大相对误差
45、28:而考试误差主要是对一组被试对象而言,因此可以得到如下的方差关系式:其中,为可观察分数方差;为真分数方差;为误差分数方差。信度rxx可定义为: (2)信度是指一种考试对相同的被试者再次实施考试时引起同样结果的程度,即平行考试的相关度。理想情况下,对于每一个考生来说,他在两次考试中的真分数相等,而两次考试所产生的误差方差也应相等,即。此时,考试的信度就可以用两次平行考试的相关系数来表示28。2.信度的估计方法在实际应用中,估计信度常用的方法主要有:重测信度法(test-retest reliability)、复本信度法(altemate-forms reliability)、折半信度法(sp
46、lit-half reliability)等29。n 重测信度法重测信度法指的是同一量表(测验或评价表)对同一组被试施测两次,所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。n 复本信度法它是以四个等值,即题型、题数、难度、区分度等指标都一致,但具体内容不同的试卷,在短时间内对同一个应试群体先后实施两次考试,将两组分数的相关系数作为信度,其实质是通过平行考试来求信度。n 折半信度法折半信度法是将考试试卷分为对等两半,计算两半得分的相关系数,进而估计整个考试试卷的信度。3.影响信度的因素信度是测量过程中随机误差大小的反映。随机误差大,信度就低;随机误差小,信度就高。测量过程受许多因素影响,比如被试、主试、测试内容、施测情景等都会影响测量信度。(l)被试者个体差异的程度(2)试卷的长度(3)试卷内容的同质性程度(4)试卷的难度(5)考试中出现的各种偶然性因素4.提高试卷信度的方法(l)适当增加试卷的长度提高测量信度的一个常用方法是增加一些与原试卷中较好项目同质的项目,增大试卷的长度。新增项目必须与试卷中原有项目同质,数量必须适度。在斯皮尔曼-布朗折半法公式基础上,可推导出试卷长度与信度值的关系式: 其中,n为试题增长后的题量倍数,是原来的信度,是增加题量后的信度。(2)使试卷中所有试题的难度接近正态分布,并控制在中等水平,当试题难