杜会学系列教材 第十一章 结构方程模型 结构方程模型( Structural Equation Modeling,简略标志为SEM)是一种非 常通用的、主要的线性统计建模技术,广泛应用于心理学、经济学、社会学、行 为科学等领域的研究。实际上,它是计量经济学、计量社会学与计量心理学等领 域的统计分析方法的综合。多元回归( multiple regression)、因子分析( factor analysis)和通径分析( path analysis)等方法都只是结构方程模型中的一种特例。 结构方程模型是统计分析方法中一个新发展的领域,它的应用始见于60年代发 表的硏究论文中,到∫90年代初期开始得到广泛的应用。 简而言之,结构方程模型还是利用联立方程组求解,但是它没有很严格的假 定限制条件,同时允许自变量和因变量存在测量误差( measurement errors)。它 还有另外一些特点优越于多元回归、通径分析、计量经济学中的联立方程组以及 因子分析等方法。计量经济学中的通径分析和联立方程模型( simultaneous equa- tion mode)虽然也使用联立方程组,但是类似于多元回归,它们只能处理有观 察值的变量,并且还要假定其观察值不存在测量误差。然而在社会科学中,许多 变量诸如智力、能力、信任、自尊、动机、成功、雄心、偏见、异化、保守等概 念并不能直接测量。实际上,这些变量基本上是人们为了理解和研究社会的目的 而建立的假设概念,对于它们并不存在直接测量的操作方法。人们可以找到一些
可观察的变量(( observed variables)作为这些潜在变量( latent variables)的“标 识”( indicators),然而这些潜在变量的观察标识总是包含了大量的测量误差。在 统计分析中,即使是对那些可以测量的变量,也总是不断受到测量误差问题的侵 扰自变量测量误差的发生会导致常规回归模型参数估计产生偏差。虽然传统的 因子分析允许对潜在变量设立多元标识,也可处理测量误差,但是,它不能分析 因ξ之间的关系。只有结构方程模型既能够使研究人员在分析中处理测量误差 又可分析潜在变量之间的结构关系 这一章主要介绍结构方程模型及相应的统计分析计算机软件LⅠSREL的使 用 LISREL实际上是英语线性结构关系( Linear structural relations)的缩写。 亡昰庄瑞典阿帕萨拉大学( the University of Uppsala, Sweden)的乔瑞斯考格 ( Karl c. Foresee凞g)和索尔波姆(灬 g Srixon)为进行结构方程模型分析所编写 的计算机软件 应用结构方程模型分析的五个主要步骤 应用结构方程模型有五个主要步骤」 ()模型设定( model specification):即在进行模型估计之前,研究人员先 要根据理论或以往研究成果来设定假设的初始理论模型 (2)模型识别( model identification):这一步骤要决定所研究的模型是否能 够求出参数佔计的惟一解。在有些情况下、由于模型被错误地设定,其参数不能 识别.求不出惟一的估计值,因而模型无解。 (3冫模型佔计( nodel estimation):模型参数可以采用几种不同的方法来估 计最常使用的模型估计方法是最大似然法( maximum likelihood)和广义最小 tEi (generalized least squares (4)模型评价( model evaluation):在取得了参数估计值以后,需要对模型 与效据之间是否拟合进行评价,并与替代模型的拟合指标进行比较。 (5)模型修正( model modification):如果模型不能很好地拟合数据,就需 要付模型进行修正和冄次设定。在这种情况下,研究人员需要决定如何删除、增 加戍修改模型的参数。通过参数的再设定可以增进模型的拟合程度。研究人员可 以根揩 LISREL软件输出中所提供的模型修正指数与初始模型中各通径的检验结 ①参见Bxn, kenneth and j.xtLx,(199) Tcsting Structural Equation Models.New Bury Park Sagc 340
果来决定模型的再设定。一旦需要重新设定模型,就要重复以上五个步骤的工 作。一个拟合较好的模型往往需要反复试验多次。 以上五个步骤构成了应用结构方程模型来研究一个理论模型的基础工作 二、模型的设定 结构方程模型主要是一种证实性( confirmatory)技术,而不是一种探测性 ( exploratory)技术。这就是说,尽管结构方程模型分析中也涉及到一些探测性 的因素,但研究人员主要是通过应用结构方程模型来确定一个特定模型是否合 理,而不是将其用来寻找和发现一种合适的模型。因此, LISREL模型是从设定 一个待定模型开始的。设定模型可以用不同的方法。最简单直接的一种方法是由 怀特( Wright)①建议的,就是通过通径图( path diagram)将自己的模型描述出 来。通径图对于 LISREL是非常基本的手段,因为它使研究人员得以将设定模型 以直接和明了的方式表达出来。通径图有助于研究人员将其对于变量之间关系的 认识得以清晰的表述,并且通径图可以直接转化为建模的方程。在硏制 LISREL 模型框图时有几个常规,即在框图中将观测变量用方型或矩型框代表,对潜在变 量或因子( factor)用圆型或椭圆型代表。变量之间的关系用线条标志,如果 变量之间没有连线则是假设变量之间没有直接联系。线条既可以加单箭头,也可 以加双箭头。单箭头的线条表小假设两个变量之间存在因果作用关系,箭头从原 因变量指向结果变量。双箭头则表示两者之间有相关或是双向的联系,在这种情 况下没有对于因果关系的陈述 图l-1显示了一般结构方程模型假设的图例。如上所述,潜在变量列于图 例中的椭圆型框中,观察变量列于图例中的长方型框中。例如,潜在变量(因子) 有:高中成就(1)和高校第一年成就(2):潜在变量的测量是通过一个或几 个可观察标识指标(如问卷中代表潜在变量的提问的回答)来间接完成的,我们 假设这些标识可以反映潜在变量的情况。在图例中,用三个观察变量(x1为高 中平均成绩,x2为高考成绩,x3为高中教师评价)作为1(高中成就)的标 识,用两个观察变量(y2为高校第一年平均成绩,y3为教师对其高校第一年表 现的评价)作为n(高校第一年成就)的标识。观察变量也可以称为测量变量 ( measured variable),或称为显示变量( manifest variable) K Wright. S.(1934) The method of path coefficients. Ann Math. Statist. 5: 161
XI -Y1 B21 n2 1为高中平均成绩;x2为高考成绩;x3为高中教师评价;x4为学生性别。 为是否在重点院校2为高校第一年平均成绩;y3为教师对其高校第一年表现的评价。 5代表高中成就;52代表性别。71代表是否重点院校;n2代表高校第一年成就 图11-1 LISREI通径图 在 LISREL模型中,变量代表外生潜在变量( exogenous latent variable), 即它们的影响因素处于模型之外;η变量代表内生潜在变量( endogenous latent ariable),即由模型内变量作用所影响的变量。在我们的例子中有一个外生变量 (2)和一个内生变量(n)实际上并不真的是潜在变量。前者代表性别,后者 代表重点大学,它们分别是通过单标识( single indicator)x4和y1即性别和是否 在重点大学这两个变量直接测量的,而且这两个观测变量都没有测量误差。 外生潜在变量的标识(如x1,x2和x3)称为外生标识( exogenous indica tors),内生潜在变量的标识(如y2和y)称为内生标识( endogenous indicators)。前者的测量误差( measurement error)标志为δ,后者的测量误差标 志为e。应特别注意,对外生变量2和内生变量n1的标识变量没有测量误差 (即它们各自的单标识x4和y1的测量误差都规定为0)。这说明我们假设与2与 n1分别通过其标识变量x4和y1被完全无误地测量到了 λ,与λ分别连接观测标识与潜在变量和7。λ(或λ)的第一个下标标 志外生(或内生)标识,第二个下标标志外生(内生)潜在变量。比如,λ21连 接第二个外生标识(x2)到第一个外生潜在变量(1);λ、x连接第三个内生标
识(y3)到第二个内生潜在变量(n2) β与γ都是通径系数( path coefficients)。其第一个下标标志着内生因变量 第二个下标标志着原因变量(或是内生变量或是外生变量)。如果原因变量是外 生的(),通径系数就是y;如果原因变量是另一个内生变量(η),通径系数 就标为。比如,A21是内生变量n1对内生变量n的作用;又比如,y12是第二 个外生变量对第一个内生变量n1的作用。正如多元回归一样,预测总是不能 完美的,总是存在着残差或误差。模型中指向那些内生变量的就是结构方程 的误差项( error or residual term)。 模型的三个基本方程式c②方程模型 从理论上说,一般结构方程模型由三个矩阵方程式所代表①,这是结构方程 n= Bn +I+5 x=A,+δ (3) 对应图11-1中结构方程模型的这三个方程可以表示如下 00 y21 y22L5 y2=/0 (2b) LE 3 04 (3b) 注意上面线性结构关系的方程中没有截距。为了便于推导公式,线性结构关 系模型中,通常使用的变量(如x和ν)是其原始随机变量值距其平均值的离差 c e Joreskog, K. G.(1967)Some contributions to maximum likelihood factor lysis Psychometrika, 32 443--477 ②本章中,矩阵用大写希腊字母表示,向量用小写希腊字母或英文字母表示。矩阵和 向量的元素一般用相应的小写字母表示,具体元素加下标表示