当前位置: X-MOL 学术Educational Measurement: Issues and Practice › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Probabilistic Filtering Approach to Non-Effortful Responding
Educational Measurement: Issues and Practice ( IF 1.402 ) Pub Date : 2023-06-16 , DOI: 10.1111/emip.12567
Esther Ulitzsch 1 , Benjamin W. Domingue 2 , Radhika Kapoor 2 , Klint Kanopka 2 , Joseph A. Rios 3
Affiliation  

Common response-time-based approaches for non-effortful response behavior (NRB) in educational achievement tests filter responses that are associated with response times below some threshold. These approaches are, however, limited in that they require a binary decision on whether a response is classified as stemming from NRB; thus ignoring potential classification uncertainty in resulting parameter estimates. We developed a response-time-based probabilistic filtering procedure that overcomes this limitation. The procedure is rooted in the principles of multiple imputation. Instead of creating multiple plausible replacements of missing data, however, multiple data sets are created that represent plausible filtered response data. We propose two different approaches to filtering models, originating in different research traditions and conceptualizations of response-time-based identification of NRB. The first approach uses Gaussian mixture modeling to identify a response time subcomponent stemming from NRB. Plausible filtered data sets are created based on examinees' posterior probabilities of belonging to the NRB subcomponent. The second approach defines a plausible range of response time thresholds and creates plausible filtered data sets by drawing multiple response time thresholds from the defined range. We illustrate the workings of the proposed procedure as well as differences between the proposed filtering models based on both simulated data and empirical data from PISA 2018.

中文翻译:

一种轻松响应的概率过滤方法

教育成绩测试中针对非努力响应行为 (NRB) 的常见基于响应时间的方法会过滤与低于某个阈值的响应时间相关的响应。然而,这些方法的局限性在于,它们需要对响应是否被归类为源自 NRB 进行二元决策;因此忽略了结果参数估计中潜在的分类不确定性。我们开发了一种基于响应时间的概率过滤程序来克服这一限制。该程序植根于多重插补原则。然而,不是创建多个看似合理的缺失数据替换,而是创建多个数据集来表示合理的过滤响应数据。我们提出了两种不同的过滤模型方法,起源于不同的研究传统和基于响应时间的 NRB 识别的概念。第一种方法使用高斯混合模型来识别源自 NRB 的响应时间子分量。合理的过滤数据集是根据考生属于 NRB 子组件的后验概率创建的。第二种方法定义响应时间阈值的合理范围,并通过从定义的范围中提取多个响应时间阈值来创建合理的过滤数据集。我们根据模拟数据和 PISA 2018 的经验数据说明了所提议程序的工作原理以及所提议的过滤模型之间的差异。第一种方法使用高斯混合模型来识别源自 NRB 的响应时间子分量。合理的过滤数据集是根据考生属于 NRB 子组件的后验概率创建的。第二种方法定义响应时间阈值的合理范围,并通过从定义的范围中提取多个响应时间阈值来创建合理的过滤数据集。我们根据模拟数据和 PISA 2018 的经验数据说明了所提议程序的工作原理以及所提议的过滤模型之间的差异。第一种方法使用高斯混合模型来识别源自 NRB 的响应时间子分量。合理的过滤数据集是根据考生属于 NRB 子组件的后验概率创建的。第二种方法定义响应时间阈值的合理范围,并通过从定义的范围中提取多个响应时间阈值来创建合理的过滤数据集。我们根据模拟数据和 PISA 2018 的经验数据说明了所提议程序的工作原理以及所提议的过滤模型之间的差异。第二种方法定义响应时间阈值的合理范围,并通过从定义的范围中提取多个响应时间阈值来创建合理的过滤数据集。我们根据模拟数据和 PISA 2018 的经验数据说明了所提议程序的工作原理以及所提议的过滤模型之间的差异。第二种方法定义响应时间阈值的合理范围,并通过从定义的范围中提取多个响应时间阈值来创建合理的过滤数据集。我们根据模拟数据和 PISA 2018 的经验数据说明了所提议程序的工作原理以及所提议的过滤模型之间的差异。
更新日期:2023-06-16
down
wechat
bug