结构方程论坛SEM-Structural·Equation·Modeling's Archiver

semchina 发表于 2011-4-9 12:13

结构方程模式的原理与特性

整体来说,SEM的基本原理若从其字面的涵义而言,涉及了结构化(structural)、假设方程式(hypothesized equation)与模型分析(modeling)等数项基本内涵,以下,即以假设考验、结构化检验与模型分析等三个概念来说明SEM的基本原理。

一、结构方程模式的基本原理

(一)假设考验(hypothesis-testing)
结构方程模式的第一个主要内涵,是统计学当中有关推论统计中的假设考验。假设考验可以说是推论统计最主要的内容,也是行为科学研究核心的观念。在SEM当中,研究者为了验证自己所提出理论观点的适切性,提出一套理论性的建构,此时,不论是针对整体模型的适切性考验,或是个别变项间关系的参数估计,都是以假设考验的方式来检验之。
在方法学上,所谓研究假设(hypothesis)是研究者对于所欲研究的对象之间关系的描述或暂时性的解答,有待研究者搜集实证资料来加以检验。例如,在线性关系(linear relationship)当中,研究假设通常是在说明变项之间具有特定的关系。例如「成就动机的高低会影响学业的表现」,这一个研究假设在假设考验当中,若改以统计的术语来表示,则为「成就动机与学业成绩之间具有相关」,或以 来表示,代表成就动机与学业成绩两个概念之间的关系,研究者对于这两个概念之间具有特定关系的主张,称为对立假设(alternative hypothesis),以H1表示。他之所以称为「对立」假设,是因为他与另一个假设的立场是相对的,该假设是「成就动机与学业成绩之间没有相关」,可以 来表示,此一假设称为虚无假设(null hypothesis),以H0表示,因为他所陈述的是母群体之间不具有特别的关系,在假设考验上是为基本的参考点。
H0与H1这两个假设构成了假设考验的两个对立条件,他们之间具有完全互斥与对立的关系。如果统计的数据证明其中一个为真,另一个假设自动为伪,如果证明其中一个为伪,另一个假设即自动为真。在假设考验的程序当中,研究者只要根据特定的信心水准(或第一类型错误机率),订定一个门槛或关键值(cv; critical value),来决定从样本所计算得到的样本统计量r要多大可视为,即可进行最后的统计决策,整个程序称为假设考验。在SEM当中,除了个别的参数可以进行个别的假设考验,来决定该参数的统计意义,通常一个SEM分析包含有多重的参数需要进行假设考验,因此在进行个别参数的考验之前,应对整体的假设模型进行整体考验(overall tests),以避免多次假设考验所造成的第一类型错误机率的膨胀。不过如果要使SEM的整体研究具有相当的严谨度,除了避免过度使用假设考验、扩大样本等统计技术与研究方法层面的问题之外,更重要的是从研究假设的推导过程来着手,例如是否基于强而有力的理论基础,或是经过严谨的推理过程,得到某一个研究的假设,如此才能有效的提升研究的检定能力(power),得到理想的结果。

(二)结构化验证(structural confirmatory)
社会及行为科学研究的变项关系,通常并不是单纯的一个变项的推论或两变项关系的讨论,而是涉及一组变项之间关系的讨论,这一组变项除了存在有数学的、表面上的关系外,可能还存有潜在的因果性(causality)或阶层性(hierarchy)。例如一项对于学业表现的研究,最常用的解释变项为智力,然而,研究者可能会考虑到除了智力因素外,学生先前学习经验(Exp.),亦会影响学生学习表现(GPA),而先前学习经验的影响,还可能基于成就动机(Ach)的中介作用,间接影响到学业成就,从上述概念中,可以得到如下之研究等式:

方程式1.3与1.4除了说明GPA×IQ、GPA×Exp与GPA×Ach等三组共变关系的存在,更重要的是在陈述智商、学习经验、成就动机与学业表现的影响作用的途径,也就是变项的结构性关系。如果研究者扩增研究变项,或调整变项之间的假设关系,共变关系的表示将更为复杂,结构关系的探讨更突显其重要性。此外,在测验发展的过程当中,一个心理测验内在结构的假设检定,也牵涉到结构化确认的观念,透过一连串的统计运算来计算其适切性 。
不论是因果关系的证明或量表内在结构的确认,均有赖于事前研究变项的性质与内容的厘清,并清楚描述变项的假设性关系,由研究者提出具体的结构性关系的假设命题,寻求统计上的检证。尤其在社会与行为科学领域所探究的变项结构性关系,大多是由一群无法直接观察与测量的抽象命题(或称为构念)所组成,需获得严谨的统计数据来证明构念的存在,此点也是SEM的主要长处之一(Bollen, 1989)。
(三)模型比较分析(modeling analysis and comparison)
SEM 的第三个主要特征,是模块化分析的应用。利用先前所讨论的假设检定与结构化验证功能,结构方程模式可以将一系列的研究假设同时结构成一个有意义的假设模型(hypothetical model),然后经由统计的程序对于此一模型进行检证。不同的模型之间,则可进行竞争比较。
在社会与行为科学的研究中,往往相同的一组变项会因为理论观点的不同,对于变项之间的假设关系亦会有不同的主张,因此,研究者可以基于不同的理论与假设前提,发展出不同的替代模型(alternative model),进行模式间的竞争比较。此一利用假设模型进行统计检证的优点,大大改善了传统路径分析在多组回归等式进行同时估计的限制,也提高了分析的应用广度。
Jöreskog & Sörbom(1996)指出SEM的模块化应用策略有三个层次,第一是单纯的验证(confirmatory),也就是针对单一的先验假设模型,评估其适切性,称为验证型研究;第二是模型的产生(model generation),其程序是先设定一个起始模型,在与实际观察资料进行比较之后,进行必要的修正,反复进行估计的程序以得到最佳契合的模型,称为产生型研究;第三是替代模型的竞争比较,以决定何者最能反应真实资料,称为竞争型研究。
Maccallum & Austin(2000)从文献整理中发现,以单纯的验证与模型产生为目的SEM研究约占20%与25%,涉及竞争比较的SEM研究则有55%。 Maccallum & Austin(2000)认为模型产生型SEM研究有其限制存在,尤其在模型修饰的过程中,往往过度依赖资料所呈现的讯息而忽略理论的意义,过度滥用修正程序以获得对自己有利的结果,是相当危险的作法,使用者应小心为之。相对之下,竞争比较的研究则有较为强固的理论基础,修饰问题较少,而可以发挥较大的弹性与说服力。
结构方程模式的此一模块化分析功能,最主要的一个贡献,即是为社会与行为科学研究界对于抽象理论进行实证的检验提供了一套严谨的程序,使得研究者可以透过统计的分析去检验所提出的理论模型(theoretical model)。此举将假设检定的运用,自单一参数的考验提升至理论模型整体考验的更高层次,突破了传统上计量技术对于理论模型欠缺整合分析能力的困境。

二、结构方程模式的特性

Hoyle(1995)指出,结构方程模式可视为不同统计技术与研究方法的综合体。从技术的层面来看,SEM并非单指某一种特定的统计方法,而是一套用以分析共变结构的技术的整合。SEM有时以共变结构分析(covariance structure analysis)、共变结构模型(covariance structure modeling)等不同的名词存在,有时则单指因素分析模式的分析,以验证性因素分析(CFA)来称呼之;有时,研究者虽然以SEM的分析软件来执行传统的路径分析,进行因果模型(causal modeling)的探究,但不使用SEM的名义,事实上这也是SEM的重要应用之一。不论是用何种名词来称呼,这些分析技术具有一些基本的共同特质(Kline, 1996, pp. 8-13),说明如下。
(一)SEM具有理论先验性
SEM分析最重要的一个特性,是它必须建立在一定的理论基础之上,也就是说,SEM是一个用以检证某一先期提出的理论模型(priori theoretical model)的适切性的一种统计技术。这也是SEM被视为是一种验证性(confirmatory)而非探索性(exploratory)统计方法的主要原因。SEM的分析过程中,从变项内容的界定、变项关系的假设、参数的设定、模型的安排与修正,一直到应用分析软件来进行估计,其间的每一个步骤都必须要有清楚的理论概念或逻辑推理作为依据。从统计的原理来看,SEM也必须同时符合多项传统统计分析的基本假设(例如线性关系、常态性)以及SEM分析软件所特有的假设要件,否则所获得的统计数据无法采信。
以因素分析为例,结构方程模式所使用的因素模式采取了相当严格的限制。研究者对于潜在变项的内容与性质,在测量之初即必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变项的组成模式。分析的进行即在考验这一先期提出的因素结构的适切性,除了测量工具发展时,可以利用此一程序来检验其结构的有效性,也可用于理论架构的检验,因此又被称为验证性因素分析。
(二)SEM同时处理测量与分析问题
过去传统的统计方法,不论分析的内容为何,多把变项视为「真实」、「具体」、「可观测」的测量资料,在分析过程中,并不去处理测量过程所存在的问题,也就是说,「测量」与「统计」是两个独立分离的程序。传统上,如果变项所涉及的概念是如同「智力」或「焦虑」等不易界定的心理概念,研究者为了获得可以分析的资料,会先行讨论测量的方法,并以信度与效度的概念程序来先行进行评估,一旦通过评估的标准,即将所获得的测量资料进行分析。
相对于传统的作法,SEM是一套可以将「测量」与「分析」整合为一的计量研究技术。主要的关键在于SEM将不可直接观察的构念或概念,以潜在变项的形式,利用观察变项的模型化分析来加以估计,不仅可以估计测量过程当中的误差,也可以用以评估测量的信度与效度(如因素效度),甚至可以超越古典测量理论的一些基本假设,针对特定的测量现象(例如误差的相关性)加以检测。另一方面,在探讨变项之间关系的时候,测量过程所产生的误差并没有被排除在外,而是同时包含在分析的过程当中,使得测量信度的概念可以整合到路径分析等统计推论的决策过程中。

(三)SEM以共变量的运用为核心,亦可处理平均数估计
SEM 分析的核心概念是变项的共变量(covariance)。共变量是描述统计中的一种离散量数,利用变异数的离均差和的数学原理,计算出两个连续变项配对分数(paired scores)的变异量,用以反应两个变项的共同变异或相互关联程度。共变量是一个非标准化的统计量数,受到两个变项所使用的量尺或单位的影响,数值可能介于 到 之间,如果将共变量除以两个变项的标准差,即可得出标准化共变量(即Pearson相关系数)。
在SEM当中,共变量具有两种功能,第一是描述性的功能,利用变项之间的共变量矩阵,我们可以观察出多个连续变量之间的关联情形;第二是验证性的功能,用以反应出理论模型所导出的共变量与实际观测得到的共变量的差异。在SEM分析过程中最重要的数学程序,即是在产生模型导出共变矩阵(S matrix)。如果研究者所设定的SEM模型有问题,或是资料估计过程导致S matrix无法导出,整个SEM即无法完成。
除了共变量以外,SEM也可以处理变项的集中倾向的分析与比较,也就是平均数的检验。传统上,平均数检验是以t检定或变异数分析(ANOVA)来进行。由于SEM可以对于截距进行估计,使得SEM可以将平均数差异的比较纳入分析模型当中,同时若配合潜在变项的概念,SEM更可以估计潜在变项的平均数,使得SEM的应用范围更为广泛。
一般而言,SEM主要的优势来自于多元回归与因素分析等主要应用于非实验设计的统计技术,但由于SEM可以处理分组变量与平均数估计,因此实验设计所得出的资料也可以利用SEM来分析。

(四)SEM适用于大样本之分析
由于SEM所处理的变项数目较多,变项之间的关系较为复杂,因此为了维持统计假设不致违反,必须使用较大的样本数,同时样本规模的大小,也牵动着SEM分析的稳定性与各种指针的适用性,因此,样本数的影响在SEM当中是一个重要的议题。
与其它的统计技术一样,SEM分析所使用的样本规模当然是越大越好,但是究竟有没有一个最适规模,则会随着SEM模型的复杂度与分析的目的与种类而有相当大的变化。但是,一般来说,当样本数低于100之时,几乎所有的SEM分析都是不稳定的。Breckler(1990)曾针对人格与社会心理学领域的72个 SEM实征研究进行分析,样本规模介于40至8650之间,中数为198。有四分之一的研究小于样本数500,约百分之二十的研究样本规模小于100。因此,一般而言,大于200以上的样本,才可以称得上是一个中型的样本。若要追求稳定的SEM分析结果,低于200的样本数是不鼓励的。五)SEM包含了许多不同的统计技术综观统计分析技术的内容,可以概略分为平均数检定的变异数分析与探讨线性关系的回归分析两大范畴。事实上,这两者并无本质上的差异,前者可以被归为一般线性模型(general linear model)分析技术,后者则是以变项间的线性关系为分析的内容。随着计算机科技的发展,分析软件功能的提升,使得两种统计模式可以互通,合而为一。
一般线性模型的优点是可以数学方式来整合不同型态的变异来源,可以不断扩充研究者所欲探讨的变项的数目与影响方式,因此一般线性模型逐渐发展出多种多变量统计的概念,例如多变量变异数分析(multivariate analysis of variance)。而回归分析在处理变项的弹性与复杂度的优势似乎有凌驾变异数分析之势,但是变异数分析由于简单清楚的数学原理与容易解释分析的特性,也一直受到研究者的青睐。在SEM当中,虽然是以变项的共变关系为主要内容,但由于SEM模型往往牵涉到大量变项的分析,因此常借用一般线性模式分析技术来整合变项,故SEM分析可以说是多种不同统计分析程序的集合体。

(五)SEM重视多重统计指针的运用
虽然SEM涵括了多种不同统计技术于一身,但是对于统计显著性的依赖性却远不及一般统计分析,主要理由有三:第一,SEM所处理的是整体模型的比较,因此所参考的指针不是以单一的参数为主要考量,而是整合性的系数,此时,个别检定是否具有特定的统计显著性即不是SEM分析的重点所在。第二,SEM发展出多种不同的统计评估指针,使得使用者可以从不同的角度来进行分析,避免过度倚赖单一指针。第三,由于SEM涉及大样本的分析,当样本越大,SEM分析的核心概念卡方统计量的显著性,即受到相当的扭曲,因此SEM的评估指数都特意避免碰触到卡方检定的显著性考验。也因为这个原因,在SEM分析当中,较少讨论到与统计显著性决策有关的第一与第二类型错误议题,显示了SEM技术的优势是在于整体层次(macor-level)而非个别或微视的层次(mocro- level)。
结构方程模型的应用及分析策略 侯杰泰  成子娟
(香港中文大学教育学院  东北师范大学教育学院,130024)

摘要:差不多所有心理、教育、社会等概念,均难以直接准确测量,结构方程(SEM,Structural Equation Modelling)提供一个处理测量误差的方法,采用多个指标去反映潜在变量,也令估计整个模型因子间关系,较传统回归方法更为准确合理。本文主要用一系列有关学习动机的虚拟例子,指出每个问题的主要分析策略,以展示SEM在教育及心理学可以应用的研究范畴。
文内探讨的方法包括:验证性因素、高阶因子、路径及因果分析、多时段(multiwave)设计、单形模型(Simple Model)、及多组比较等。
关键词 结构方程 验证性因素分析 路径及因果分析 高阶因子 多组比较

结构方程(SEM,Structural Equation Modelling)、协方差结构模型(Covariance Structure Modelling、LISREL)等类似名词已渐流行,并成为一种十分重要的数据分析技巧;在大学高等学位研究课程,它是多变量分析 (multivariate analysis)的重要课题;比较重要的社会、教育、心理期刊,也早已特开专栏介绍(如:候,1994;Connell & Tanaka,1987;Joreskog & Sorbom,1982);可见SEM在统计学中所建立的声望及崇高地位是无容置疑的。本文主要用一系列有关学习动机的虚拟例子,来指出每个问题的主要分析策略,以展示结构方程模型在教育及心理学可以应用的研究范畴。

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.