第六节 GDM模型(第1页)
第六节GDM模型
G-DINA模型在DINA模型的基础上放宽了假设条件,使之能够更好地拟合实际数据的情形,是模型拟合一般化资料的一个很好的结果。冯戴维提出了一个更加一般化的诊断模型框架(generaldiagnosti)。
一、模型定义
记n个被试在i道题目上的观察作答反应数据为xn=(xn1,xn2,…,xni),每道题目上的得分为xni∈{0,1,2,…,mi}。
记被试水平离散潜变量an=(an1,an2,…,ank),其取值形式为ank∈{sk(0),…,sk(lk)},sk(l)是被试在第k个属性上掌握水平的具体取值,该取值可以是0或1,也可以是-1或1,也可以是其他的取值范围。
记矩阵Q=(qik)i=1,2,…,i;k=1,2,…,K,qik表示在作答项目i时,属性k的作用及大小。如果正确作答项目i需要掌握属性k,那么,qik>0,否则,qik=0。另外,qik>0情形下的取值可能有多种。
假设题目之间局部独立性成立,那么,被试作答反应模式的边际概率可以表示为:
其中,p(a=(a1,…,ak)|g)表示在总体g中a的分布,p(xn1,xn2,…,xni|a,g)表示以总体g中的a为条件,观察反应模式(xn1,xn2,…,xni)的条件分布。这个式子蕴含着被试可以来自多个不同的总体,假设被试间局部独立性也成立,那么,被试作答反应模式的条件概率就可以表示为:
也就是说,被试作答反应模式的条件概率可以表示为被试在各个题目上的作答反应的条件概率(项目反应函数)之积。
在以上定义的基础上,一般诊断模型族(GDM)的项目反应函数定义为:
其中,x为被试在项目上的作答反应得分,x∈(1,2,…,mi),βxig为得分难度指标,γxig=(γxig1,…,γxigK)为K维区分度指标,在式子中使用了转置的形式,g仍然指的是不同总体。当然,如果假设被试总体是单一的,那么就不用考虑这个指标的影响了。
在这个模型中,h(qi,a)起着至关重要的作用。它的作用是定义项目属性向量和被试属性掌握状态之间的组合模式,并且根据其不同组合模式将GDM模型族具体化为具有不同特性的实例模型。如果h(qi,a)的定义模式如下:
GDM将具体化为一个离散的、多维项目反应理论模型。如果qik取值为0或1,那么,
从GDM模型定义可以知道,只有当qik不为0时,被试对属性k的掌握水平才会对项目的作答结果产生影响。以上定义模式中,ak的取值模式可以是任意的,但qik的取值只有0或1。
qik有时候会用于表示被试答对第i题时需要掌握属性k的水平层次。被试在属性k上的掌握水平大于或等于该层次时可以答对,但低于该层次时就会答错。当qik的取值形式不为0和1时,上面关于h(qi,a)的定义形式就不合适了。这时,它的定义模式可以如下:
二、模型的特性
从以上介绍可以知道,GDM其实是定义了一个模型族或认知诊断模型框架。研究者可以通过重定义h(qi,a)的具体形式,以及被试属性掌握水平ak与题目测量的属性水平qik的取值模式,从而获得适合当前数据情境的具体模型。
GDM模型族结合了IRT模型、对数线性模型(log-linearmodels)和潜类别模型(latentclassmodels),除了能够进行一般的被试认知属性掌握模式分类之外,还能够处理多级记分作答数据和属性掌握水平多级化情形,同时又能够处理补偿和非补偿作答数据。
另外,模型提出者还基于EM算法,编制了该模型的参数估计程序——mdltm。