第二节 学校效能的测量(第2页)
近年来,有人提出了一种新的估计学校效能的方法(,s。etal。,2000)。这种方法将学校效能定义为:同一学校某组学生在连续两个年级之间的成绩增长(即在X年级与X—1年级的成绩差)。由于学生是同一组,因此,学生特征是恒定的,只需要考虑学校的影响和学生自然成熟及年龄相关因素的影响,这种方法要求使用同一成就测量工具,在连续两个年级,对同一组学生进行两次测量,同时采用“年级间”准实验回归非连续设计。这种设计有两个主要特点:(1)学生分配到出生日期是随机的;(2)年级水平是唯一的年龄因素。
这种方法将学生的成绩增长分解为两部分,即一年的年龄成长和一年的学校教学,年龄的效果以同年级内学生测验分数在生理年龄上的回归来表示,学校学习的效果以两个年级的年龄回归线之间的非连续性表示,如图13-4所示。
图13-4
(,S。,&Elbaz,J。G。,2000。Themeasurementofschooleffeess。Studiesiioion,26,p。130。)
这种方法的优势在于,采用校内设计方法来估计学校效能,克服了以学校之间的相对比较来确定学校效能的缺陷,其所定义的学校效能具有实质性含义,它能够说明学生取得进步的实际情况,这种操作定义更加符合其实质定义。
此外,采用这种方法来估计学校效能,学校的效果与其他因素对学生学习的影响就不会产生相关(当然,除了年龄以外),学生的出生年龄是随机分配的,可以独立地估计出年龄因素和学校因素对学生学习成就的影响。
显然,这种方法在理念上具有明显的优势,但这种方法的操作使用还存在一定困难。使用这种方法的关键在于,找到能够有效测量连续两个年级学生的学习成绩的同一测量工具,在现实中,要找到这种工具并不那么容易。目前,大多数提倡这种方法的研究,都是采用某种智力测验工具来替代成就测量,但智力测验的结果可能与学校教学相关不高,这可能使我们低估学校教学的效果。此外,智力与年龄的关系也并不是完全线性的,到一定年龄后,智力的增长速度会变慢,这种现象也会使我们低估高年级学校教学的效果。
三、多层线性模型的发展与使用
多层线性模型(以下简称HLM)这一术语最早是由Lih在1972年提出的,然而多层分析思想的出现却远早于此,近半个世纪以来,社会科学研究者就一直在探讨如何区分个体水平和社会背景水平的变量对个体行为的不同影响。在1972年提出HLM后,这种想法并没有在统计上得以实现,因为其参数估计的方法与传统的回归方法不同,当时的计算技术还很难满足这种要求。直到1977年,Dempster、Laird和Rubin等人提出了EM算法,并在1981年,将EM算法应用于解决HLM的参数估计后,HLM的应用才成为可能。此后,在1986年英国伦敦大学教授戈德斯坦(Goldstein)又采用迭代加权广义最小二乘法(iterativelyweightedgesquares)来估计参数。随着参数估计问题的解决,多层线性模型的统计软件也相继出现,进一步推动了HLM在社会科学领域的应用,目前最常见的多层分析软件是HLM、Mlwin。(蔡永红,2006)
社会科学研究,数据结构常常体现为分层嵌套的形式,即低一层的数据嵌套于高一层的结构之中。例如,在教育和心理研究中,探讨学业成绩的影响因素,常常考虑的预测变量有学生的入学成绩、性别、家庭社会经济地位,以及班级大小、班主任和教师的特点、教室环境等,这些变量分别来自两个不同的水平,即学生水平和班级水平,学生嵌套于班级之中。如果再考虑学校的特征,那么,数据的层次扩大到了三层,学生水平嵌套于班级水平,班级水平嵌套于学校水平。
在1980年代以前,由于统计和计算技术的局限,在社会科学领域,探讨多层结构变量之间的关系时,只能采用传统的回归分析方法,对多层数据的处理只能采用两种方式:(1)在学生水平上进行回归分析,在个体水平上对学生的个体变量及班级(或学校)变量进行整合和分析,这个过程实际上是忽略了班级与班级(或学校与学校)之间的差异。(2)在班级(或学校)水平上进行回归分析,在班级(或学校)水平上对学业成绩的个体因素和班级(或学校)因素进行整合分析,这样做的主要问题是忽视了班级(或学校)内学生个体间的差异。
传统的线性回归模型的基本假设是:变量间存在直线关系,变量总体上服从正态分布,方差齐性,个体间随机误差相互独立。后两个假设在分层嵌套设计中往往不成立。例如,不同班级的学生可以假设相互独立,但是同一班级的学生由于受相同班级变量的影响,很难保证相互独立,因此如果采用传统的回归分析方法,误差将会很大。而多层线性模型(HLM)能够将不同层次的变量分层计算,把误差按层次分解为:由第一水平个体间差异带来的,和由第二水平班级间差异带来的,并假设第一水平个体间的测量误差相互独立,第二水平班级带来的误差在不同班级之间相互独立。这样做就提高了差异分解的精度。
与传统的回归分析相比,多层线性模型(HLM)有5个方面的优点:(1)考虑了不同层次的随机误差和变量信息,其标准误差估计、区间估计和假设检验更加准确和有效;(2)可以通过计算不同水平变异在总变异中所占的比率来确定不同水平对因变量的影响程度;(3)可以作为结构方程模型的拓展,用来分析具有多层结构的潜变量之间的因果关系,建立多水平结构方程模型;(4)可以分析重复测量的数据,即将测量看作第一水平,将测试个体看作第二水平;(5)可以分析离散型的数据资料,如二项分布和泊松分布的数据等。
具有嵌套结构的数据,在大规模的社会调查,组织研究、经济研究领域广泛存在,因此,多层线性模型在社会科学研究具有广泛的使用前景。多层线性模型也是一般线性模型的拓展,许多传统统计方法都是它的特例。在两个水平模型中有一个水平的变量为常数时,多层线性模型就简化为传统的回归分析;而单因素方差分析、单因素协方差分析也可以看成是多层分析模型的简化。
与结构方程模型相比,国内社会科学领域对层次线性模型介绍和应用研究都普遍较晚,所发表的研究报告也不多,其中可能有两方面的原因:一是多层模型的统计软件出现得较晚,二是一般研究难以满足多层线性模型对样本量的要求,特别是对水平2(如班级)的样本量要求,虽然并没有统一的标准来判断各水平的样本量多大合适,但一般来说,水平2的样本量都在100以上。
以两水平的多层线性模型为例,假设水平1和水平2都只有一个预测变量,则两水平的多层线型模型可以表示为:
水平1(如学生)Yij=β0j+β1jX1ij+rij
水平2(如班级)β0j=γ00+γ01W1j+μ0j
β1j=γ10+γ11W1j+μ1j
在水平1的方程中,下标“0”表示截距,其中,下标j代表水平1(如学生个体)所隶属的水平2的单位(如某班级)。Yij表示第j班第i个学生因变量的观测值(如:学生的期末考试成绩),下标“1”表示与水平1的预测变量X1有关的回归系数,如果有更多的水平1变量,如X2ij和X3ij,就会有β2j和β3j。β0j表示第j班的截距,γij表示j班第i个学生的测量误差。
对于水平2模型,γ00和γ01分别表示截距β0j对于班级变量W1j的回归直线的截距和斜率,μ0j表示由第j个班级的班级变量带来的截距上的误差。γ10和γ11分别表示截距β1j对于班级变量W1j的回归直线的截距和斜率,μ1j表示由第j个班级的班级变量带来的斜率上的误差。
从上面的数学表达式可以看出,水平1的模型与传统的回归模型类似,所不同的是,回归方程的截距和斜率不再假设为一个常数,而是不同的班级回归方程的截距和斜率都不同,是一个随机变量。每个班级回归方程的截距和斜率都依赖于第2水平的变量,如W1j(假设是班级的学习风气)。
目前,多层线性模型主要应用五个领域:(1)组织和管理研究中的大规模调查数据的分析;(2)个体追踪研究或多次观察的发展研究中的数据分析;(3)对研究文献进行定量分析;(4)利用多层模型较高的统计能力,弥补因水平1单位取样不足而造成的无法进行统计分析的问题,帮助回答水平1数据的问题。
思考题:
1。你如何理解学校效能?
2。简述学校效能的主要测量方法。
[1]郑燕祥。学校效能与校本管理:一种发展的机制。上海教育出版社,2002。11
[2]Mortimore,P。(1993)。SchoolEffeessandtheMaofeffectiveLearningandTeag。SchoolEffeessandSprovement,4,(4)。290-310
[3]引自郑燕祥。学校效能与校本管理:一种发展的机制。上海教育出版社,2002。6-11
[4]王新如,郑文。谈学校组织文化与学校效能。教育科学,1997。7