杜会学系列教材 第五章 通径分析 引 科学的最终目的在于揭示事物变化的内在规律,因果关系是事物内在规律的 种基本形式。然而,事物的内在联系并不能直接观察到,所以需要在科学研究中应用 各种方法来加以探索和分析。通径分析便是一种探索系统因果关系的统计方法。 因果关系模型中明确设置自变量和因变量,通过模型分析,检査自变量对于 因变量的作用方向、作用强度和解释能力。并且,因果关系模型还可以用来进行 预测。本书第二章多元回归分析便是因果关系模型的一种。但是,多元回归模型 是一种比较简单的因果关系模型,它所假设的因果关系不存在多环节的因果结 构,尽管多元回归模型中可以包含多个自变量,然而各个自变量对因变量的作用 却是假设为并列存在的。多元回归模型可以用图5-1示意。 在多元回归模型中,各个自变量被假设处于相同的地位,多元回归分析得到的 回归系数(或标准化的回归系数)表示在控制其他自变量的条件下每个自变量对 于因变量单独的净作用。然而对于有些实际研究而言,这种假设显得过于简单,未 必能够达到充分、有效的要求。另外,多元回归可以允许自变量之间存在相关关系 比如图5-1还可以在两个自变量之间加上代表r12的双箭头曲线来表示这一相关关
系。但是由于回归分析一般并不关心m12,所以对这一相关关系的代表线省略。 xI 图5—1多元回归模型因果关系示意图 但是,有时研究人员从经验和理论两方面都有理由认为,变量之间的因果作 用是更复杂的传递过程,一个变量对于某些变量可能是原因变量( cause/ predic tor variable),而对于另外一些变量则可能是结果变量( response variable)。这时 对整个因果结构模型便不能简单地以因变量或自变量的概念来划分变量类型。对 于这样的模型,可以用结构方程组或相应的通径图来表示(见图 31 P 图5—2通径模型的因果结构示意图 通径分析的主要功能是研究变量之间关系的不同形式。通过多元回归的学 习.读者已经了解多元回归在分析上优越于简单回归。由于多元回归的统计控 制.其偏回归系数的数值往往不同于简单回归系数,有时甚至连系数的符号也不 相同。与回归分析相比,通径分析是一种统计分析能力更强大的工具,它还可以 进一步揭示多元回归系数与简单回归系数之间的数量联系。总的来说,简单回归 系数是一个自变量对因变量作用的“毛”测量( gross measure),而多元分析的 偏回归系数则是自变量作用的一种“净”测量( net measure)。类似于通常所说 的毛重中不仅包括净重而且还要加上其他包装填料的附加重量,自变量作用毛测 量也是由净作用加上其他作用所构成的。与净重和毛重之间关系不同的是,影响 作用有正负之分,所以自变量的毛作用并不一定大于其净作用,两者之间的数量
关系可以千变万化。回归分析本身无法对此做出分析和评价,然而通径分析的主 要功能之一便是将毛作用分解为直接作用(相当于上述的净作用)和各种形式的 间接作用,使我们对整个模型系统中变量的因果关系有更为具体、深入的理解。 通径分析的着眼点主要在变量之间作用系数的分解上。比如,进行两个变量 之间的简单回归就可以得到一个简单回归系数。如果我们可以根据理论,在这两 个变量之间加上许多中介变量,形成复杂的因果结构,以通径模型来表示,就有可 能将这个简单回归系数分解为不同因果链条上的作用,得到这一因果关系的更具 体的形式。实际上,通径分析只是结构方程模型这一类十分广泛的模型中的一种。 通径分析不仅能够对于简单回归系数进行分解,而且还可以对简单相关系数 进行分解。通径分析发展的最初动机,便是产生于将简单相关系数分解为不同的 影响部分。分解相关系数实际上与分解回归系数交织在一起。但是,分解相关系 数更具有一般方法论的意义。在研究方法论上,变量之间是否存在相关和偏相关 常常被作为检验因果关系的必要条件之一。因此,尽管有的统计学教科书由于分 解相关系数的通径分析技术比较繁琐(但并不算深奥难懂)而略去不谈,本章仍 然将其作为介绍的主要内容,相信读者学习之后,不仅可以作为一种分析技术应 用于实际研究,而且对于提高统计理论和方法论方面的基本素质有所收益。 二、通径模型的设置 通径模型既可以用结构方程组的形式来表示,也可以用通径图来表示。为了 表达和分析上的简明,一般在通径分析中采用标准化的变量,并按照因果序列给 出相应的下标。 比如,通径模型的结构方程组 对应着一个十分简单的通径图,各变量之间的关系可以从图中一目了然。图5 2便是对应上述结构方程组的通径图。在通径图中以通径(即图5-2中那些带 有箭头的直线)表达因果关系。比如图5-2中ε1与::之间的通径箭头指向 2,说明x1作用于x2。这一因果关系对应着上述结构方程组中的第一个方程。 对于这一因果关系(即x1对x2的作用)的强度,是用通径系数来表达的,即 户21如前所述,对于整个通径模型,很难用因变量或自变量来划分,因为这两 个概念只有在一个方程中才能确定。而对于拥有多个联立方程的整个通径模型则
很难应用。比如,就第一个方程而言,κ2是因变量。然而,就第二个方程而言 2又成了x3的两个自变量之一了。因此,通常在通径分析中不采用y来作为变 量名.而是根据因果链条以序号将变量定名。第二个方程对应着通径图的另一部 分,即从3来看,有两条通径指向它,分别代表了来自z:和x2的作用。为了 区别不同通径系数,一般用该通径箭头所指的结果变量的下标作为通径系数的第 下标,而用该通径的原因变量下标作为通径系数的第二下标。比如,p2代表 s对于x2的影响作用强度,p和px2分别代表x1和2对:3的影响作用。 通径分析模型中的变量分为两类 类是外生变量( exogenous variable),即模型中没有注明它的变化是由什 么因素造成的,也不准备讨论这一问题。可以是一个,也可以是多个。比如,图 5-2中只有一个外生变量z1。但是如果删除通径p2,变量x2就变成了外生变 量。外生变量之间可以用双箭头直线或曲线(,)表示其相关关系。如果设 置外生变量之间无关,即r12=0,则表示相关的双箭头连线可以省略。外生变量 的变化是完全由模型之外的因素决定的,因此不是模型研究的对象 另一类是内生变量( endogenous variable),即由模型中另外一些变量所影响的 那些变量。图5-2的通径模型中有两个内生变量(x2和:3)。内生变量的变化是 由同一模型中的外生变量或其他内生变量所决定的,但是也可能有一部分是由模 型之外的因素所决定,通常用相同下标的e来标志,作为该变量的误差(eror) 此外,我们可以将通径模型内不影响其他变量的内生变量称为最终结果变量 ( ultimate response variable)。图5-2中x便是最终结果变量。最终结果变量可 以有多个,比如将图52中的通径p2删除后,变量2就变成了最终结果变量 三、递归通径模型与非递归通径模型 通径模型有两种基夲类型:递归模型与非递归模型。两种模型在分析时有所 不同。递归模型可以直接通过常规最小二乘法回归(OLS)来取得通径系数估计 值,而对于非递归模型则不能这样做。尽管本章主要介绍递归模型的通径分析 但是要求读者能够预先正确判断一个模型的类型属性,才能保证应用这些分析技 术时不会发生搞错研究对象的问题。 1.递归通径模型 因果关系结构中全部为单向链条关系、无反馈作用的模型称为递归模型 148
( recursive model)。并且这意味着在这种模型中,各内生变量与其原因变量的误 差之间、或各两个内生变量的误差之间必须相互独立,即相关系数为0。图5-2 中便是一个递归模型。 上述简单定义在实际判断是否递归模型时,仍然可能不够明确。对此,我们 可以采取排除法,即如果一个模型不包含非递归模型的特征,即作为递归模型处 理。因此,我们将用一些篇幅简单介绍非递归模型的特征 2.非递归通径模型 与递归模型相对的另一类模型称作非递归模型( nonrecursive model)。如果 个通径模型中包括以下四种情况,便是非递归模型。 先讨论前三种情况。第一种情况是,模型中任何两个变量之间存在双向因果 关系即有直接反馈作用(见图5-3-(a)。第二种情况是某个变量存在自身反馈 (a)两个变量之间存在直接反馈作用 P31 (b)某些变量(上图中为2)在自反馈 P 2 c)某些变量之间构成间接循环圈 图5-3非递归通径模型的三种反馈作用类型 149