第12卷第3期 系统工程理论方法应用 Vol 12No 3 SYSTEM S ENGNEER NG- THEORY M ETHODOLOGY A PPL CAT ON S 文章编号:1005-2542(2003)03-0262-08 结构方程模型与人工神经网络模型的比较 赵海峰,万迪 (西安交通大学管理学院,西安710049) 【摘要】结枃方程模型作为一种统计建模技术越来越多的应用在企业管理硏究中,线性结构方程模型 ① ISREL)是其中最有代表性的一种。针对 L ISR EL应用中的问题引入了人工神经网络方法,在民营企业治 理结构影响企业绩效的案例分析中对人工神经网络方法和 L ISREL方法作了一个对比分析,并根据对比分 析的结果,探讨了两者的互补性以及结合应用的方法 关键词结构方程模型,人工神经网络,公司治理,企业绩效 中图分类号F271 文献标识码A L ISREL and artif ic iaI NeuraI Network Modeling Com par ison Research ZHAO Haifeng, WAN Difang (School ofM anagem ent, Xi'an J iao tong U niv, Xian 710049, Ch ina) (Abstractla s a useful statist ics modeling app roach, structural equation modeling is w idely app lied in re earch fields of en terp rise m anagem ent a typ ical app licat pon L isrEL is introduced to the em p ir ical study on governance issues of civil-runn ing enterprise To deal w ith the common p roblem s arising fo m estm a t n p rocess ofL Isr EL analysis, a com parative analysis is m ade by use of artif ic ial neural ne twork model- g techn ique F inally, a concise com parison at key differences and sm ilarit ies betw een two app roaches and the benefits of com b ination analy sis are offered in the concluson part Key words: structural equatin modeling, artific ial neural network; co rporate go venance; co poraton per- fo m ance 1研究的理论基础 域的统计分析方法的综合。与多元回归、通径分析及 计量经济学中的联立方程组等方法相比,结构方程 11结构方程模型简介 模型有着独特的优势。首先,它没有很严格的假定限 结构方程模型( Structural Equat on Modeling,制条件其次,它允许自变量和因变量存在测量误 SHM)是一种非常通用的线形统计建模技术,广泛差,为分析潜在变量之间的结构关系提供了可能,这 应用于心理学、经济学、社会学、行为科学等领域的是其最大优势所在。结构方程模型的基本原理是“ 研究,是计量经济学、计量社会学与计量心理学等领个二”即两类变量(测量变量和潜在变量)、两个模 型(度量模型和结构模型)以及两条路径(潜在变量 收稿日期2002-07-0 与测量变量之间的路径和潜在变量之间的路径) 基金项目:国家自然科学基金资助项目(79970013);国家社会科 因为在社会科学及管理学等领域许多变量并不能直 学基金助项日(02104,国家自然科学基金优接测量,实际上这些变量基本上是人们为了理解和 作者简介赵海峰(1971-,男,博士生。主要从事公司治理信研究问题的目的而建立的假设概念,对于它们并不 息技术与组织学习的研究。 存在直接的测量方法。人们可以找到一些可观察的 变量作为这些潜在变量的“标识”,然而这些潜在变 91994-2010ChinaAcademicJourmalElectronicPublishingHouseAllrightsreservedhttp://www.enki.net
第 12 卷 第 3 期 2003 年 9 月 系 统 工 程 理 论 方 法 应 用 SYSTEM S EN G IN EER IN G- THEORY M ETHODOLO GY A PPL ICA T ION S Vo l. 12 No. 3 Sep. 2002 文章编号: 100522542 (2003) 0320262208 结构方程模型与人工神经网络模型的比较 赵海峰, 万迪 (西安交通大学 管理学院, 西安 710049) 【摘要】结构方程模型作为一种统计建模技术越来越多的应用在企业管理研究中, 线性结构方程模型 (L ISREL ) 是其中最有代表性的一种。针对L ISREL 应用中的问题引入了人工神经网络方法, 在民营企业治 理结构影响企业绩效的案例分析中对人工神经网络方法和L ISREL 方法作了一个对比分析, 并根据对比分 析的结果, 探讨了两者的互补性以及结合应用的方法。 关键词: 结构方程模型; 人工神经网络; 公司治理; 企业绩效 中图分类号: F 271 文献标识码:A L ISREL and Artif ic ial Neural Network M odeling Compar ison Research ZH A O H a i2f eng , W A N D i2f ang (Schoo l of M anagem en t, X i’an Jiao tong U n iv. , X i’an 710049, Ch ina) 【Abs tra c t】A s a u sefu l statistics modeling app roach, structu ral equation modeling is w idely app lied in re2 search fields of en terp rise m anagem en t. A typ ical app lication L ISREL is in troduced to the emp irical study on governance issues of civil2runn ing en terp rise. To deal w ith the common p rob lem s arising fo rm estim a2 tion p rocess of L ISREL analysis, a comparative analysis is m ade by u se of artificial neu ral netwo rk model2 ing techn ique. Finally, a concise comparison at key differences and sim ilarities betw een two app roaches and the benefits of com b ination analysis are offered in the conclu sion part. Ke y w o rds: structu ral equation modeling; artificial neu ral netwo rk; co rpo rate govenance; co rpo ration per2 fo rm ance 收稿日期: 2002207201 基金项目: 国家自然科学基金资助项目(79970013); 国家社会科 学基金资助项目(02BJY045); 国家自然科学基金优 秀群体资助项目(70121001) 作者简介: 赵海峰(19712) , 男, 博士生。主要从事公司治理、信 息技术与组织学习的研究。 1 研究的理论基础 1. 1 结构方程模型简介 结构方程模型(Structu ral Equation M odeling, SEM ) 是一种非常通用的线形统计建模技术, 广泛 应用于心理学、经济学、社会学、行为科学等领域的 研究, 是计量经济学、计量社会学与计量心理学等领 域的统计分析方法的综合。与多元回归、通径分析及 计量经济学中的联立方程组等方法相比, 结构方程 模型有着独特的优势。首先, 它没有很严格的假定限 制条件; 其次, 它允许自变量和因变量存在测量误 差, 为分析潜在变量之间的结构关系提供了可能, 这 是其最大优势所在。结构方程模型的基本原理是“三 个二”: 即两类变量(测量变量和潜在变量)、两个模 型 (度量模型和结构模型) 以及两条路径(潜在变量 与测量变量之间的路径和潜在变量之间的路径) [1 ]。 因为在社会科学及管理学等领域许多变量并不能直 接测量, 实际上, 这些变量基本上是人们为了理解和 研究问题的目的而建立的假设概念, 对于它们并不 存在直接的测量方法。人们可以找到一些可观察的 变量作为这些潜在变量的“标识”, 然而这些潜在变
第3期 赵海峰,等结构方程模型与人工神经网络模型的比较-263 量的观察标识总是包含了大量的测量误差,这是其输入层进入,通过中间层(隐层)和输出层的处理后, 他的分析方法所难以解决的问题,结构方程模型则主输出层输出。实际应用中根据需要可以设置多个 能够使硏究人员在分析中处理测量误差,并分析潜隐层。采用非线性作用函数,多层前向无反馈神经元 在变量之间的结构关系。线性结构方程模型①LIS-网络可以实现从输入到输出的多元映射 RL)是结构方程模型的一种方法,在20世纪70年 BP网络就是多层前向无反馈神经元网络。早在 代由瑞典统计学家、心理学家 Karl G Jo reskog提1974年, Werbos便已经有了BP算法的描述,1986 出并开发了软件产品,目前应用广泛的版本是LI-年, Rum ellard等人正式对BP算法进行了清晰而严 REL830。 L ISREL的应用主要有三个方面观测变格的说明,BP算法从此引起了广泛的关注,它提供 量用于测量潜在变量的精确程度、变量之间的关系了网络学习行之有效的方法,为神经元网络方法的 以及该模型的可信度。 广泛应用打开了光明的前景。利用BP算法进行学 12人工神经网络技术简介 习的无反馈前向网络称为BP网络。BP(Back-Pmop 人工神经网络( A rtificiaI Neural network)与 agaton)算法即误差反向传播算法,它是一个有导 遗传算法、专家系统并称为人工智能的三大技术。人师的神经元网络学习算法,它的算法思想是:取一对 工神经网络是在对人脑神经研究的基础上,模仿人学习模式,将输入模式经网络输入层、隐层输出层 脑神经网络的结构和行为,建立的一种智能信息处逐层的处理之后,得到一个输出模式,计算网络输出 理网络模型。人工神经网络最典型的形式是连接模模式和期望输出模式的误差,将误差由输出层、隐 型,它由模仿脑神经元的神经元节点和节点间模仿层、输入层的反向顺序序传送,按照减小误差的方向 脑神经元细胞有向连接组成。每个节点都是一个独逐层修正各层连接权重。重复上述过程,直到每一对 立的处理单元,它通过连接接收信息,对信息进行处学习模式,网络的输出误差都达到要求。 理,又将处理的结果由连接输出。用Wi表示神经元13比较研究的理论分析 节点间的连接强度,即权重。权重决定了两个神经元 结构方程模型属于一种因果关系模型,它可以 的相互作用的强弱,它并不是固定的,权重的修正依用来衡量不能通过观察直接得到的变量。在一个包 照Hebb学习规则如果两个神经元同时处于兴奋含有大量复杂性的假设系统的研究中,可以构建 状态,那么它们之间的连接强度应该加强。θ是神经个由潜在结构和可测量模型相互作用而成的结构方 元的阈值,在生理学上的意义是只有当神经元输入程模型,来分析这个不可观察的结构和它的可观测 的加权总和大于阈值时,才产生兴奋。在人工神经元变量之间的关系。一般来说,结构方程模型是一种从 网络中θ只是一个参数。神经元节点的输出是输入统计的角度构建模型的参数化研究方法,它代表了 加权和与阈值的差的函数,这个函数关系称为作用有理论对经验研究的进行指导的一类研究方法。因 函数。根据神经元作用函数的不同,神经元的基本处果模型方法有着一定的局限性,这些局限性包括难 理单元可有不同的作用方式,如线形阈值单元、S型于合并交互影响和进行非线性分析,不能处理定性 激活函数及分段线形激活函数等。网络的学习过程数据和缺失数据。在一些领域,尤其是管理学领域的 就是利用一组学习样本的输入输出模式反复作用于研究中,许多应用结构方程模型进行研究所得到的 网络,通过改变网络的连接权重或拓扑结构,直到对估计结果是背离一些基本理论假设的,尤其是研究 每一个输入样本,输出满足要求。神经元网络通过学中对多重常态的要求是很难被满足的,因为如果没 习就具有了记忆,它把学到的知识分布式存储在网有数量化的变量,几乎无法进行管理科学的研究。矫 络的连接权重上,在必要的时候能回忆起这些知识,正变量0其他多元非线性关系的引入实际上也 因此,有了某一个输入模式,通过神经元网络就能产暗含了对常态的假设,因为那些不可观测指标常常 生特定的输出,这样的神经元网络具有各种信息处是有缺陷的,或者是对其相应的观测变量进行了删 理的能力。神经元网络能实现数学映射、模式分类、减。目前很少有文章对这些问题进行详细的研究和 联想记忆、组合优化问题求解、数据压缩等许多信息分析。 处理功能 由于在大量的相关研究文献中看到结构方程研 人工神经网络的连接方式有以下几种类型:多究方法的缺陷,很容易让人产生将这些研究结果与 层无反馈前向网络、从输出到输入层有反馈的前向非参数方法进行比较的思路。人工神经网络模型不 网络、层内相互结合的前向网络和相互连接型网络需要对变量之间的关系以及测量方法进行严格的假 等。其中应用最广的是多层无反馈前向网络,信息由设,只需要对结构进行约束,当然也并不需要将模型 91994-2010ChinaAcademicJOurmalElectronicPublishingHouseAllrightsreservedhttp://
量的观察标识总是包含了大量的测量误差, 这是其 他的分析方法所难以解决的问题, 结构方程模型则 能够使研究人员在分析中处理测量误差, 并分析潜 在变量之间的结构关系。线性结构方程模型(L IS2 REL ) 是结构方程模型的一种方法, 在 20 世纪 70 年 代由瑞典统计学家、心理学家 Karl G. Jo reskog 提 出并开发了软件产品, 目前应用广泛的版本是L IS2 REL 8. 30。L ISREL 的应用主要有三个方面: 观测变 量用于测量潜在变量的精确程度、变量之间的关系 以及该模型的可信度。 1. 2 人工神经网络技术简介 人工神经网络 (A rtificial N eu ral N etwo rk ) 与 遗传算法、专家系统并称为人工智能的三大技术。人 工神经网络是在对人脑神经研究的基础上, 模仿人 脑神经网络的结构和行为, 建立的一种智能信息处 理网络模型。人工神经网络最典型的形式是连接模 型, 它由模仿脑神经元的神经元节点和节点间模仿 脑神经元细胞有向连接组成。每个节点都是一个独 立的处理单元, 它通过连接接收信息, 对信息进行处 理, 又将处理的结果由连接输出。用W i 表示神经元 节点间的连接强度, 即权重。权重决定了两个神经元 的相互作用的强弱, 它并不是固定的, 权重的修正依 照 H ebb 学习规则: 如果两个神经元同时处于兴奋 状态, 那么它们之间的连接强度应该加强。Η是神经 元的阈值, 在生理学上的意义是只有当神经元输入 的加权总和大于阈值时, 才产生兴奋。在人工神经元 网络中 Η只是一个参数。神经元节点的输出是输入 加权和与阈值的差的函数, 这个函数关系称为作用 函数。根据神经元作用函数的不同, 神经元的基本处 理单元可有不同的作用方式, 如线形阈值单元、S 型 激活函数及分段线形激活函数等。网络的学习过程 就是利用一组学习样本的输入输出模式反复作用于 网络, 通过改变网络的连接权重或拓扑结构, 直到对 每一个输入样本, 输出满足要求。神经元网络通过学 习就具有了记忆, 它把学到的知识分布式存储在网 络的连接权重上, 在必要的时候能回忆起这些知识, 因此, 有了某一个输入模式, 通过神经元网络就能产 生特定的输出, 这样的神经元网络具有各种信息处 理的能力。神经元网络能实现数学映射、模式分类、 联想记忆、组合优化问题求解、数据压缩等许多信息 处理功能。 人工神经网络的连接方式有以下几种类型: 多 层无反馈前向网络、从输出到输入层有反馈的前向 网络、层内相互结合的前向网络和相互连接型网络 等。其中应用最广的是多层无反馈前向网络, 信息由 输入层进入, 通过中间层(隐层) 和输出层的处理后, 主输出层输出。实际应用中根据需要可以设置多个 隐层。采用非线性作用函数, 多层前向无反馈神经元 网络可以实现从输入到输出的多元映射。 BP 网络就是多层前向无反馈神经元网络。早在 1974 年,W erbo s 便已经有了BP 算法的描述, 1986 年, Rum ellart 等人正式对BP 算法进行了清晰而严 格的说明,BP 算法从此引起了广泛的关注, 它提供 了网络学习行之有效的方法, 为神经元网络方法的 广泛应用打开了光明的前景。利用BP 算法进行学 习的无反馈前向网络称为BP 网络。BP (Back2Prop2 agation ) 算法即误差反向传播算法, 它是一个有导 师的神经元网络学习算法, 它的算法思想是: 取一对 学习模式, 将输入模式经网络输入层、隐层、输出层 逐层的处理之后, 得到一个输出模式, 计算网络输出 模式和期望输出模式的误差, 将误差由输出层、隐 层、输入层的反向顺序序传送, 按照减小误差的方向 逐层修正各层连接权重。重复上述过程, 直到每一对 学习模式, 网络的输出误差都达到要求。 1. 3 比较研究的理论分析 结构方程模型属于一种因果关系模型, 它可以 用来衡量不能通过观察直接得到的变量。在一个包 含有大量复杂性的假设系统的研究中, 可以构建一 个由潜在结构和可测量模型相互作用而成的结构方 程模型, 来分析这个不可观察的结构和它的可观测 变量之间的关系。一般来说, 结构方程模型是一种从 统计的角度构建模型的参数化研究方法, 它代表了 有理论对经验研究的进行指导的一类研究方法。因 果模型方法有着一定的局限性, 这些局限性包括难 于合并交互影响和进行非线性分析, 不能处理定性 数据和缺失数据。在一些领域, 尤其是管理学领域的 研究中, 许多应用结构方程模型进行研究所得到的 估计结果是背离一些基本理论假设的, 尤其是研究 中对多重常态的要求是很难被满足的, 因为如果没 有数量化的变量, 几乎无法进行管理科学的研究。矫 正变量[10 ]及其他多元非线性关系的引入实际上也 暗含了对常态的假设, 因为那些不可观测指标常常 是有缺陷的, 或者是对其相应的观测变量进行了删 减。目前很少有文章对这些问题进行详细的研究和 分析。 由于在大量的相关研究文献中看到结构方程研 究方法的缺陷, 很容易让人产生将这些研究结果与 非参数方法进行比较的思路。人工神经网络模型不 需要对变量之间的关系以及测量方法进行严格的假 设, 只需要对结构进行约束, 当然也并不需要将模型 第 3 期 赵海峰, 等: 结构方程模型与人工神经网络模型的比较 — 263 —
系统工程理论方法应用 第12卷 中的所有接点都全部连通,因为学习程序可以在有个因素,以可获得的数据资料——经营者的年龄、任 选择的或者有限制的连接之上进行。这意味着许多职时间等指标来衡量,以此代表经营者的管理经验 结构方程模型可以被转换为一个相应的人工神经网或认知水平。另外将企业各种外部股所占比例也作 络模型,并且使用同样的假设体系和相关数据库。如为影响企业绩效的一个重要因素,考察它们作为总 果应用两个完全不同的数据处理程序来产生出期望体的影响作用。企业的绩效在此主要以两方面指标 的结果,则可以増强假设因果关系的可信度。人工神来衡量,一是体现企业短期盈利能力及长期经营绩 经网络方法是忽略理论,完全凭学习过程探索一组效的3个比率—营业利润率、总资产收益率及所 变量之间的未知的关系,通过对比这两种方法,可以有者权益收益率。另一方面是企业是否通过国家的 证实非参数化的人工神经网络研究方法,并不一定“高新技术企业”认定,这可以对企业的技术水平及 会偏离理论,它一样可以通过自身引导,与通过严格整体素质作出一定的反映。基于研究需要,对数据进 理论指导的分析结果会不谋而合的。 行了筛选,以利润率水平比较接近平均水平的几个 两个模型最主要的共同点是可以针对不可观测行业的企业作为研究的主要对象以剔除行业的影响 的或者潜在的变量构建模型。但是,两者在实现途径作用 上有着显著的差别首先,从本质上讲,结构方程模 假定:①企业内部治理效率对企业的绩效有正 型在进行数据分析之前就己经标识了潜在变量并构面影响,②总体外部持股比例对企业绩效有负面的 建了假设路径,而在人工神经网络的研究中,直到执影响,③高新企业认定对企业的盈利能力有正面影 行数据分析之时,模型的隐层接点仍然没有被明确响,④外部持股比例与内部治理效率之间存在一定 标识出来。其次,假定的变量之间依赖关系的方向也的相关关系⑤所有指标都可以作为衡量所研究变 不同。人工神经网络模型的数据是从输入通过隐层量的有效指标,即它们统计显著。 变量流向输出——即一个前馈型网络,当然也不排22模型结构 除一些更为复杂的包含从输出向输入回流情况的 基于上面的分析及研究假设建立结构方程模 络拓扑结构。而相对的,在结构方程模型中两套观测型,并以通径图的形式描述(见图1)。 变量都与中心的潜在变量相关,而潜在变量之间也 有可能发生关系。两种方法在建模原理上的本质差 别使得研究者必须采用不同的数据处理形式与结 构,因此两个模型中指向4个潜在变量的标识可能 会不尽相同。 6A+xAK 2结构方程模型 x1一个人股所占比例 x2一经营者年龄 x3-经营者在职时间(年),x4一外部股所占比例 21数据收集及理论假设 y一是否高新企业 y一营业利润率 本文所研究数据的来源是西安科委“火炬计划” y一总资产报酬率 y4一所有者权益报酬率 51-代表公司治理效率, 代表外部股所占比例 行动中连续3年(19971999年)对西安市民营企 代表是否高新企业,2一代表企业绩效 业的基本情况调查得到的原始数据,其中1999年的 图1研究模型的 L ISREL通径图 数据最为完整,样本量最大,为本文研究的主要对 图中观测变量列于矩型框中,潜在变量列于椭 象。经过初步筛选,获得有效记录1878条。 圆型中。线条刻画了变量之间的关系,单箭头线条表 本文构建研究模型主要目的是研究公司治理因示假设两个变量之间存在因果作用关系,箭头从原 素与企业绩效之间的相关关系。因为定义公司治理因变量指向结果变量。双箭头则表示两者之间有相 效率的因素很难直接测量本文选择了如下的两类关的联系因果关系并不明确。A表示因子负载,y与 间接变量。一是企业内部人员对企业产权的拥有程B均表示结构通径系数,6和∈分别为观测变量x和 度这是对企业内部治理效率的直接激励因素。对于y的误差项而乙为结构方程的误差项。中为两个外 这个因素,以企业个人持股比例来衡量。这主要是因生潜在变量之间的协方差。该模型中共有8个基础 为本文所研究的民营企业大部分只是经过了股份制 参数矩阵需要估计,分别为观测变量x的因子负 改造而没有发行上市,个人股基本为企业经营者及我矩阵观测变量y的因子负载矩阵、潜在变量玉 员工所拥有二是企业经营者的管理能力或认知水之间的结构通径系数矩阵内生潜在变量n、n之 平,本文认为它主要取决于知识与经验因素。对于这间的结构通径系数矩阵、外生潜在变量而、5之间 2 01994-2010 China Academic Joumal Electronic publishin ingHouseAllrightsreservedhttp://www.cnki.net
中的所有接点都全部连通, 因为学习程序可以在有 选择的或者有限制的连接之上进行。这意味着许多 结构方程模型可以被转换为一个相应的人工神经网 络模型, 并且使用同样的假设体系和相关数据库。如 果应用两个完全不同的数据处理程序来产生出期望 的结果, 则可以增强假设因果关系的可信度。人工神 经网络方法是忽略理论, 完全凭学习过程探索一组 变量之间的未知的关系, 通过对比这两种方法, 可以 证实非参数化的人工神经网络研究方法, 并不一定 会偏离理论, 它一样可以通过自身引导, 与通过严格 理论指导的分析结果会不谋而合的。 两个模型最主要的共同点是可以针对不可观测 的或者潜在的变量构建模型。但是, 两者在实现途径 上有着显著的差别: 首先, 从本质上讲, 结构方程模 型在进行数据分析之前就已经标识了潜在变量并构 建了假设路径, 而在人工神经网络的研究中, 直到执 行数据分析之时, 模型的隐层接点仍然没有被明确 标识出来。其次, 假定的变量之间依赖关系的方向也 不同。人工神经网络模型的数据是从输入通过隐层 变量流向输出——即一个前馈型网络, 当然也不排 除一些更为复杂的包含从输出向输入回流情况的网 络拓扑结构。而相对的, 在结构方程模型中两套观测 变量都与中心的潜在变量相关, 而潜在变量之间也 有可能发生关系。两种方法在建模原理上的本质差 别使得研究者必须采用不同的数据处理形式与结 构, 因此两个模型中指向 4 个潜在变量的标识可能 会不尽相同。 2 结构方程模型 2. 1 数据收集及理论假设 本文所研究数据的来源是西安科委“火炬计划” 行动中连续 3 年(1997~ 1999 年) 对西安市民营企 业的基本情况调查得到的原始数据, 其中 1999 年的 数据最为完整, 样本量最大, 为本文研究的主要对 象。经过初步筛选, 获得有效记录 1 878 条。 本文构建研究模型主要目的是研究公司治理因 素与企业绩效之间的相关关系。因为定义公司治理 效率的因素很难直接测量, 本文选择了如下的两类 间接变量。一是企业内部人员对企业产权的拥有程 度, 这是对企业内部治理效率的直接激励因素。对于 这个因素, 以企业个人持股比例来衡量。这主要是因 为本文所研究的民营企业大部分只是经过了股份制 改造而没有发行上市, 个人股基本为企业经营者及 员工所拥有; 二是企业经营者的管理能力或认知水 平, 本文认为它主要取决于知识与经验因素。对于这 个因素, 以可获得的数据资料——经营者的年龄、任 职时间等指标来衡量, 以此代表经营者的管理经验 或认知水平。另外将企业各种外部股所占比例也作 为影响企业绩效的一个重要因素, 考察它们作为总 体的影响作用。企业的绩效在此主要以两方面指标 来衡量, 一是体现企业短期盈利能力及长期经营绩 效的 3 个比率——营业利润率、总资产收益率及所 有者权益收益率。另一方面是企业是否通过国家的 “高新技术企业”认定, 这可以对企业的技术水平及 整体素质作出一定的反映。基于研究需要, 对数据进 行了筛选, 以利润率水平比较接近平均水平的几个 行业的企业作为研究的主要对象以剔除行业的影响 作用。 假定: ① 企业内部治理效率对企业的绩效有正 面影响; ② 总体外部持股比例对企业绩效有负面的 影响; ③ 高新企业认定对企业的盈利能力有正面影 响; ④ 外部持股比例与内部治理效率之间存在一定 的相关关系; ⑤ 所有指标都可以作为衡量所研究变 量的有效指标, 即它们统计显著。 2. 2 模型结构 基于上面的分析及研究假设建立结构方程模 型, 并以通径图的形式描述(见图 1)。 图 1 研究模型的L ISREL 通径图 图中观测变量列于矩型框中, 潜在变量列于椭 圆型中。线条刻画了变量之间的关系, 单箭头线条表 示假设两个变量之间存在因果作用关系, 箭头从原 因变量指向结果变量。双箭头则表示两者之间有相 关的联系, 因果关系并不明确。Κ表示因子负载, Χ与 Β均表示结构通径系数, ∆和 Ε分别为观测变量 x 和 y 的误差项, 而 Φ为结构方程的误差项。<为两个外 生潜在变量之间的协方差。该模型中共有 8 个基础 参数矩阵需要估计, 分别为: 观测变量 x 的因子负 载矩阵、观测变量 y 的因子负载矩阵、潜在变量 Ν、Γ 之间的结构通径系数矩阵、内生潜在变量 Γ1、Γ2 之 间的结构通径系数矩阵、外生潜在变量 Ν1、Ν2 之间 — 264 — 系 统 工 程 理 论 方 法 应 用 第 12 卷
第3期 赵海峰,等结构方程模型与人工神经网络模型的比较-265 的方差协方差矩阵、结构方程中各误差项的方差协 另外,外生潜在变量之间的协方差小于零,说明 方差矩阵、y变量的测量误差的方差协方差矩阵、x外部股的比例与内部治理效率之间有着负相关关 变量的测量误差的方差协方差矩阵。 系。考虑到两个内生变量的多重相关系数的平方分 23研究结果及数据分析 别为Q2510和Q3248,说明方程的解释能力并不 由软件计算所得的具体的参数估计结果见表是非常强的。 l。从对各参数的估计结果来看,除了A21和n之 8个标识中有2个的斜率小于Q5,而几乎所有 外,其余各参数均统计显著,说明x2和x3可能不是的指标都有正的或负的凹度,这些数据明显偏离了 E的好标识,这与本文认为以时间表示的经营者经常态假设但本文仍然进行了最大似然估计。有很多 验指标能够对经营者能力进行衡量的假设是违背管理领域的研究中都采用了这种做法,但是几乎没 的这一结果说明,对经营者的管理能力及认知水平有对假设进行检验。ML估计偏离常规可能问题不 的影响因素还需作进一步的分析,可能需要选取其大,但实际情况是参数估计和有效性检验结果以 它指标来进行衡量以提高模型的拟合优度。 种未知的模式偏离常规。按照其他管理领域研究的 内生潜在变量之间的通径系数1>0且统计传统做法,似乎可以无视那些非正常现象和关系错 显著,说明企业是否经过“高新技术”认定对企业的误而照常对结果进行解释。在本文的研究中比这些 经营绩效有正面的影响,由于y为虚拟编码的直接传统更近了一步,将把这些数据用人工神经网络的 观测变量,其参照组为没有经过高新技术企业认定,计算方法进行处理以重新审视这些研究结果的解释 所以该结果说明经过高新技术企业认定的企业比没性与合理性 有经过认定的企业有着更好的经营绩效。1和1都 报告的最后提供了一些修正信息,其中提示将 是正值且统计显著,说明内部治理效率对企业绩效因子负载λ2改为自由参数可以相对最大限度地改 有着正面的影响,即内部治理效率高的企业会表现善卡方值,将其减少4501。这一修改可以在一定程 出更好的绩效无论从经营能力还是从是否通过高度上改善模型的拟合优度。本文在下面的研究中将 新认定方面都是如此。%2和都是负值且统计显忽略修正信息的提示,而采用其他非参数分析方法 著,说明外部股的比例对企业绩效有着负面的影响,—人工神经网络技术进行研究期望这一方法可 即外部股的比例越大企业的绩效越差。以上结论说以有助于进一步理清关系结构,同时考察结构方程 明企业内部股比企业外部股的激励效果要大。这与模型的子结构是否足够强壮到可以通过进一步的实 本文的研究假设是一致的。 证检验 表1参数估计表 LAM BDA 2=00031 42=0001521=150241 1=60210 B=a0134 =02473 g=47468 Covariance M atrx of EtA and KSI 00282 0216822340 06809 02168 2340 Squared M uItp le Correlatons fo Structural Equatons n:02510 n:03248 THETA -EPS 442022 y3:Q0901 THTEADELTA x:08979 x2:990334 7420 91994-2010ChinaAcademicjOUrnalElectronicPublishingHouseAllrightsreservedhttp://www.cnki.net
的方差协方差矩阵、结构方程中各误差项的方差协 方差矩阵、y 变量的测量误差的方差协方差矩阵、x 变量的测量误差的方差协方差矩阵。 2. 3 研究结果及数据分析 由软件计算所得的具体的参数估计结果见表 1。从对各参数的估计结果来看, 除了 Κx 21和 Κx 31之 外, 其余各参数均统计显著, 说明 x 2 和 x 3 可能不是 Ν1 的好标识, 这与本文认为以时间表示的经营者经 验指标能够对经营者能力进行衡量的假设是违背 的, 这一结果说明, 对经营者的管理能力及认知水平 的影响因素还需作进一步的分析, 可能需要选取其 它指标来进行衡量以提高模型的拟合优度。 内生潜在变量之间的通径系数 Β21> 0 且统计 显著, 说明企业是否经过“高新技术”认定对企业的 经营绩效有正面的影响, 由于 y 1 为虚拟编码的直接 观测变量, 其参照组为没有经过高新技术企业认定, 所以该结果说明经过高新技术企业认定的企业比没 有经过认定的企业有着更好的经营绩效。Χ11和 Χ21都 是正值且统计显著, 说明内部治理效率对企业绩效 有着正面的影响, 即内部治理效率高的企业会表现 出更好的绩效, 无论从经营能力还是从是否通过高 新认定方面都是如此。Χ12和 Χ22都是负值且统计显 著, 说明外部股的比例对企业绩效有着负面的影响, 即外部股的比例越大, 企业的绩效越差。以上结论说 明企业内部股比企业外部股的激励效果要大。这与 本文的研究假设是一致的。 另外, 外生潜在变量之间的协方差小于零, 说明 外部股的比例与内部治理效率之间有着负相关关 系。考虑到两个内生变量的多重相关系数的平方分 别为: 0. 251 0 和 0. 324 8, 说明方程的解释能力并不 是非常强的。 8 个标识中有 2 个的斜率小于 0. 5, 而几乎所有 的指标都有正的或负的凹度, 这些数据明显偏离了 常态假设, 但本文仍然进行了最大似然估计。有很多 管理领域的研究中都采用了这种做法, 但是几乎没 有对假设进行检验。M L 估计偏离常规可能问题不 大, 但实际情况是参数估计和有效性检验结果以一 种未知的模式偏离常规。按照其他管理领域研究的 传统做法, 似乎可以无视那些非正常现象和关系错 误而照常对结果进行解释。在本文的研究中比这些 传统更近了一步, 将把这些数据用人工神经网络的 计算方法进行处理以重新审视这些研究结果的解释 性与合理性。 报告的最后提供了一些修正信息, 其中提示将 因子负载 Κy 21改为自由参数可以相对最大限度地改 善卡方值, 将其减少 45. 01。这一修改可以在一定程 度上改善模型的拟合优度。本文在下面的研究中将 忽略修正信息的提示, 而采用其他非参数分析方法 ——人工神经网络技术进行研究, 期望这一方法可 以有助于进一步理清关系结构, 同时考察结构方程 模型的子结构是否足够强壮到可以通过进一步的实 证检验。 表 1 参数估计表 LAMBDA Κy 32= 0. 003 1 Κy 42= - 0. 001 5 Κx 21= 15. 024 1 3 Κy 31= 6. 021 0 3 BETA Β21= 0. 013 4 GAMMA Χ11= 0. 042 0 Χ21= 0. 001 7 Χ12= - 0. 002 3 Χ22= - 0. 000 1 PS I Φ1= 0. 247 3 Φ2= 4. 746 8 CovarianceM atrix of ETA and KS I Γ1 Γ2 Ν1 Ν2 Γ1 0. 246 0 Γ2 0. 000 8 47. 458 7 Ν1 0. 028 2 0. 001 6 0. 680 9 Ν2 - 0. 028 2 - 0. 001 6 - 0. 216 8 22. 234 0 PH I Ν1 Ν2 Ν1 0. 680 9 Ν2 - 0. 216 8 22. 234 0 Squared M ultip le Co rrelations fo r Structural Equations Γ1: 0. 251 0 Γ2: 0. 324 8 THETA 2EPS y 2: - 44. 202 2 y 3: 0. 090 1 y 4: 1. 117 0 THTEA 2DEL TA x 1: 0. 897 9 x 2: 99. 033 4 x 3: 6. 742 0 x 4: 22. 450 9 第 3 期 赵海峰, 等: 结构方程模型与人工神经网络模型的比较 — 265 —
系统工程理论方法应用 第12卷 可以从不同的角度评价模型的拟合优度。其中 a Out 卡方检验值为18860,自由度为15,且统计显著。卡 方值显然偏大,但由于模型的样本规模较大,所以并 不能据此判定模型的拟合度不佳。其他拟合优度指 ndogen2 标 GFkAGFkNFKCFE正I及NNFI都在09左 右,指标 RM SEA>005。从整体衡量,该模型的拟 合优度尚可 3人工神经网络模型 31具有BP学习的前馈神经网络模型的构建 有几种不同的方法可以将上文研究中的结构方 图3异性联合型网络图 程模型转换为人工神经网络模型的结构。在本文的32学习过程及结果分析 研究中结合了自动联合网络和异性联合网络这两种 整个人工神经网络的研究分析过程是在BP学 人工神经网络模型构建模型。自动联合网络模型被习规则的基础上进行的。这种方法在人工神经网络 用于分析的第1阶段,其目的是复制所有标识的观的研究中被普遍采用,本文研究的例外之处在于研 测值,这是一项与确定因素分析相应的工作。在学习究过程是建立在理论基础之上而进行的。此外,与传 (或估计)的第2阶段采用的结构是异性联合网络,统的人工神经网络建模原则相比,这里的模型的网 在这个网络中核心非独立变量企业绩效(见图2和络连通性受到了一定的限制,这是为了与上文的 图3中的PERF)期望产生三类输出(标识),另外一LIR且因果模型中预先定义的关系结构保持一致 个内生变量(是否高新企业)则产生近似于观测值的而进行的。图2和图3所示网络图中各连线的权重 标识值。在模型中总共有8个标识变量,数字2-9值描述了关系力的大小(实线表示高度正相关,虚线 代表了这些输入变量(偏离单位#1没有显示出表示高度负相关)。LER且模型是基于总体协方差 来)。公司治理效率和外部股所占比例是两个外生变或相关矩阵进行分析,而人工神经网络模型则在由 量。图2显示了第1阶段釆用的自动联合网络的结单个问卷产生的数据矢量的基础上进行分析。在研 构体系它只局限于测量子模型,即潜在变量与标识究的开始预先随机定义一个初始权重集合,随机地 之间的关系模型。图3显示了第2阶段采用的异性抽取一个问卷的数据,将加权后的输入值加总,并将 联合网络进行分析的情况,在这一阶段的研究中加它们归入各自的结构变量中。将加总值用一个非线 入了结构模型,重点在于探讨潜在变量之间的关系。形的S函数进行变形处理把处理结果向前传入下 整个人工神经网络模型是基于三层理论假设体系构层的并发(非独立潜在变量中去。然后在所有的 建的,并且这一假设体系与在 L ISREL模型研究中隐层重复这一处理过程,最终数据会流向体现标识 采用的因果关系假设保持一致。在人工神经网络领值的输出层。期望输出与实际输出的差异引导着学 域的研究中认为,这些因果关系属于隐藏单元,与外习的过程。每个权重值都会随着学习的速度和失败 部观测变量之间没有直接的联系 的次数而不断更新,其初始值也是影响总体差异的 92012122|2 一个因素。在这种数据处理方式下,数据每经过一次 ■ 前馈处理后,就会随之产生一次偏差纠正过程的反 向传播。 PERF 在模型的训练过程中使用了1/2的的样本(939 个案例),另1样本(939个案例)作为保留样本被 用来检验人工神经网络模型对前面未使用过数据的 EFF EX exogen 归纳能力。在第1阶段的训练中,随着学习速度的不 断减慢,自动联合网络模型的处理过程经过数十万 次反复迭代更新之后逐渐收敛至最优。对于这个拥 有2个外生变量、2个内生变量以及总共8个标识 图2有限连通的自动联合型前馈网络 变量的测量子模型,保留样本的RMS值达到了 Q31。在第2阶段的分析中引入结构关系到人工神 91994-2010ChinaAcademicjOUrnalElectronicPublishingHouse.Allrightsreservedhttp://www.enki.net
可以从不同的角度评价模型的拟合优度。其中 卡方检验值为 188. 60, 自由度为 15, 且统计显著。卡 方值显然偏大, 但由于模型的样本规模较大, 所以并 不能据此判定模型的拟合度不佳。其他拟合优度指 标 GF I、A GF I、N Fl、CF I、IF I 及NN F I 都在 0. 9 左 右, 指标 RM SEA > 0. 05。从整体衡量, 该模型的拟 合优度尚可。 3 人工神经网络模型 3. 1 具有 BP 学习的前馈神经网络模型的构建 有几种不同的方法可以将上文研究中的结构方 程模型转换为人工神经网络模型的结构。在本文的 研究中结合了自动联合网络和异性联合网络这两种 人工神经网络模型构建模型。自动联合网络模型被 用于分析的第 1 阶段, 其目的是复制所有标识的观 测值, 这是一项与确定因素分析相应的工作。在学习 (或估计) 的第 2 阶段, 采用的结构是异性联合网络, 在这个网络中核心非独立变量企业绩效(见图 2 和 图 3 中的 PERF) 期望产生三类输出(标识) , 另外一 个内生变量(是否高新企业) 则产生近似于观测值的 标识值。在模型中总共有 8 个标识变量, 数字 2~ 9 代表了这些输入变量 (偏离单位# 1 没有显示出 来)。公司治理效率和外部股所占比例是两个外生变 量。图 2 显示了第 1 阶段采用的自动联合网络的结 构体系, 它只局限于测量子模型, 即潜在变量与标识 之间的关系模型。图 3 显示了第 2 阶段采用的异性 联合网络进行分析的情况, 在这一阶段的研究中加 入了结构模型, 重点在于探讨潜在变量之间的关系。 整个人工神经网络模型是基于三层理论假设体系构 建的, 并且这一假设体系与在L ISREL 模型研究中 采用的因果关系假设保持一致。在人工神经网络领 域的研究中认为, 这些因果关系属于隐藏单元, 与外 部观测变量之间没有直接的联系。 图 2 有限连通的自动联合型前馈网络 图 3 异性联合型网络图 3. 2 学习过程及结果分析 整个人工神经网络的研究分析过程是在BP 学 习规则的基础上进行的。这种方法在人工神经网络 的研究中被普遍采用, 本文研究的例外之处在于研 究过程是建立在理论基础之上而进行的。此外, 与传 统的人工神经网络建模原则相比, 这里的模型的网 络连通性受到了一定的限制, 这是为了与上文的 L ISREL 因果模型中预先定义的关系结构保持一致 而进行的。图 2 和图 3 所示网络图中各连线的权重 值描述了关系力的大小(实线表示高度正相关, 虚线 表示高度负相关)。L ISREL 模型是基于总体协方差 或相关矩阵进行分析, 而人工神经网络模型则在由 单个问卷产生的数据矢量的基础上进行分析。在研 究的开始预先随机定义一个初始权重集合, 随机地 抽取一个问卷的数据, 将加权后的输入值加总, 并将 它们归入各自的结构变量中。将加总值用一个非线 形的 S 函数进行变形处理, 把处理结果向前传入下 一层的并发(非独立) 潜在变量中去。然后在所有的 隐层重复这一处理过程, 最终数据会流向体现标识 值的输出层。期望输出与实际输出的差异引导着学 习的过程。每个权重值都会随着学习的速度和失败 的次数而不断更新, 其初始值也是影响总体差异的 一个因素。在这种数据处理方式下, 数据每经过一次 前馈处理后, 就会随之产生一次偏差纠正过程的反 向传播。 在模型的训练过程中使用了 1ö2 的的样本(939 个案例) , 另 1ö2 样本(939 个案例) 作为保留样本被 用来检验人工神经网络模型对前面未使用过数据的 归纳能力。在第 1 阶段的训练中, 随着学习速度的不 断减慢, 自动联合网络模型的处理过程经过数十万 次反复迭代更新之后逐渐收敛至最优。对于这个拥 有 2 个外生变量、2 个内生变量以及总共 8 个标识 变量的测量子模型, 保留样本的 RM S 值达到了 0. 31。在第 2 阶段的分析中引入结构关系到人工神 — 266 — 系 统 工 程 理 论 方 法 应 用 第 12 卷