返回列表 发帖

[测验技术] 计算机自适应测试终止测试条件

计算机自适应测试终止测试条件
根据不同的测试目的,计算机自适应测试有不同的终止条件。终止规则是用来控制测试适时地结束。CAT 中用到的终止规则一般有三种:
(1)固定测试长度,根据测试实际需要预先设定每个受测者测试所做试题的题数(即项目长度),满足预设的项目长度就终止测试。这个方法的优点是不用复杂的算法而且容易实现,计算量小,能较精确的统计测验项目的使用率。但是所有受测者的测试题数相同,容易造成在能力估计值达到要求理论精度后,有的受测者继续多做了试题,而有的受测者在测试的控制误差还没有达到预定精度时,测试被强行结束了。缺点是取定一个合适的长度并不容易,且对不同考生,多做题影响不大,也就是浪费了一些时间,少做题直接关系到测试的准确性,可能导致受测者的能力值不准确,无法正确评价学生的能力,使得测试的客观性,科学性大打折扣。
(2)测试长度不定,根据测试的实际需要预先设定测试的精度,满足预定的精度,测试就结束。常见的方法有信息量控制法和相邻能力误差控制法。信息量控制法就是根据受测者当前能力估计值和受测者当前已答题历史情况,计算试题总信息量,达到预定信息量就终止测试。理论上有证明:各项目信息量相加就得到了测试信息量,它的值等于测试估计标准误倒数的平方,这就为测试信息量控制考试结束提供了理论依据。因此,根据需要确定标准误差后,也就确定了测验信息函数的值。当测验求得的信息函数值等于事先确定的值时,可结束施测。由于不同项目所含信息量不同,因此能力不同的被试完成测验所需施测的题目及题目数不同,于是测验的长度因被试的变化而变化,那些能够快速达到测试精度的被试不需浪费时间精力做多余的项目,反之则需多做项目以保证能力估计的准确性。从而更好地体现出“因人施测”的特点。这种方法具有更高的效率,能克服固定测验长度的缺点,但当估计标准误要求过严时,测验可能过长。此时可以预设测验题数的上限,只要题数一测完,即使尚未达到预定的标准,也终止测验,以免浪费被试的宝贵时间。相邻能力误差控制法就是判断相邻两次能力估计值的差,如果差值小于或等于预设的控制精度就结束测试。经研究,信息量法更科学、准确,但每步要计算并保存测试的信息量,实现起来相对复杂。
(3)混合终止规则,首先设定最大允许测试长度,如果在最大测试项目长度内,满足了信息量控制法就结束测试,否则在达到最大允许项目长度时结束测试。终止测验方法是将最大测验题数与最大信息量结合起来使用。我们可以设定预定的测验长度为nk,同时设定每层题库所要达到的测试信息量Ik (I1 +…+ =预定的总信息量),在测验的过程中,测验长度和总测验信息量只要有一个达到了预定值,即可结束测验。
分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友

返回列表