【精辟】结构方程模型的一些资料
[color=Blue][size=4]结构方程模型的一些资料 [转贴 2006-08-02 14:27:32]根據Wilcox(1998)的說法,統計技術的發展在1960年可以視為一個分水嶺。之前的心理計量學的發展以古典的推論統計技術為主,例如t-test、ANOVA、Pearson’s r、least square regression;之後的發展則著重於各種統計問題的校正技術,Wilcox稱之為現代統計學(modern statistics),例如M statistics(trimmed mean statistics)、percentage-bend correlation、Theil-Sen estimator等。至於在90年代盛行的SEM則在他的文章中隻字未提,顯然Wilcox對SEM並沒有特別鍾情,他認為SEM只是least square regression的延伸,更重要的,是他認為SEM是一種心理計量理論與技術的應用,而不是一個新的計量典範。但是,由於我的博士論文是以高階驗證性因素分析來處理方法效應與跨母群恆等檢驗的問題,對於SEM自然是擁護到底,因此,我一直主張SEM會是下一波重要的計量技術的革命。順著Wilcox的觀點,我認為1994年當Structural Equation Modeling期刊第一卷出版後,應該可以稱為統計技術的第三波革命。
第三波革命到底稱得上是革命嗎?我在學時代南加大另一個心理計量領域的卓越教授Linda Collins[2]或許會同意我的話。因為在縱貫資料的計量領域中,SEM已經成為一個指標性與領導性的分析技術。2001年所APA所出版的New Methods for the Analysis of Change?一書中,至少有一半的章節直接以SEM為題,間接與SEM有關的論點則散見於各章節中。
到底什麼是結構方程模式呢?Structural Equation Modeling簡稱SEM是一門基於統計分析技術的研究方法學(statistical methodology),用以處理複雜的多變量研究數據的探究與分析。一般而言,結構方程模式被歸類於高等統計學,屬於多變量統計(multivariate statistics)的一環[3],但是由於結構方程模式有效整合了統計學的兩大主流技術「因素分析」與「路徑分析」,在瑞士籍的統計學者Karl Jöreskog於1970年代提出相關的概念,並首先發展分析工具LISREL軟體之後,有關結構方程模式的原理討論與技術發展便蔚為風潮,普遍成為社會與行為科學研究者必備的專門知識之一。
從發展歷史來看,結構方程模式的起源甚早,但其核心概念在1970年代初期才被相關學者專家提出,到了1980年代末期即有快速的發展。基本上,結構方程模式的概念與70年代主要高等統計技術的發展(如因素分析)有著相當密切的關係,隨著電腦的普及與功能的不斷提升,一些學者(如Jöreskog, 1973; Keesing, 1972; Wiley, 1973)將因素分析、路徑分析等統計概念整合,結合電腦的分析技術,提出了結構方程模式的初步概念,可以說是結構方程模式的先驅者。而後Jöreskog與其同事Sörbom進一步發展矩陣模式的分析技術來處理共變結構的分析問題,提出測量模型與結構模型的概念,並納入其LISREL之中,積極的促成了結構方程模式的發展。
到了今天,關於結構方程模式的專門著作如雨後春筍般的出現,分析軟體亦不斷開發更新,目前坊間已經有數套專門應用於結構方程模式分析的套裝軟體,例如LISREL(Jöreskog & Sörbom, 1989, 1996)、EQS(Bentler,1985,1995)、AMOS(Arbuckle,1997)、MPLUS(Muthén & Muthén, 1998)、CALIS(Hartmann,1992)、RAMONA(Browne,Mels,& Cowan,1994)等,這些分析工具多已能搭配視窗軟體與文書作業系統,使得結構方程模式的分析效能大為提昇,報表呈現與繪圖作業簡化且美觀,更能夠結合網際網路的編輯規格(HTML格式),快速的將結構方程模式的分析結果整理與傳播。
另外,在學術活動方面,根據Hershberger(2003)檢閱1994至2001年間的相關文獻發現,到了2003年的今天,不論在刊登結構方程模式相關論文的期刊數、期刊論文的數量、結構方程模式所延伸出來的多變量分析技術等各方面,均有大幅度的成長,顯示結構方程模式已經是一門發展成熟且高度受到重視的學問與技術。結構方程模式除了擁有專屬期刊《結構方程模式》(Structural Equation Modeling)[4],專門刊登與結構方程模式有關的論文與實證研究,心理學界的重要典籍《心理學年度評論》(Annual Review of Psychology)也於1996年(Bentler & Dudgeon, 1996)與2000年(MacCallum & Austin, 2000)兩度刊登了介紹結構方程模式相關文獻的專文。美國社會學會出版的《社會方法學》(Sociological Methodology)與《社會學方法與研究》(Sociological Methods and Research),以及美國心理學會的《心理學方法》(Psychological Methods)期刊,每一卷也都有相當篇幅有關結構方程模式的應用的論文。在《心理學方法》第七卷第一期中,McDonald與Ho(2002)發表了一篇結構方程模式整理原則與寫作規範(Principles and Practice in Reporting Structural Equation Modeling),作為結構方程模式相關學術文獻的寫作、投稿與編輯的準則,其他在管理學、傳播學、教育學等領域的重要期刊,也有越來越多的相關討論與應用論文。這些學術上的發展趨勢,再再說明結構方程模式在相關領域的重要地位。
三、結構方程模式的成熟
隨著因素分析與路徑分析的成熟發展與技術更新,由因素分析所代表的潛在變項研究模式,與路徑分析所代表的迴歸-因果關連模式這兩種統計概念,在一些統計學家的努力下獲得了整合。以Jöreskog(1973)為例,他所提出的SEM原始構想中,最重要的概念由兩個部分所組成,第一是測量模型(measurement model),反應了觀察變項與潛在變項之間的關係,其構成的數學模型是驗證性因素分析;第二是結構關係的假設考驗,透過結構模型(structure model),使潛在變項之間的關係可以路徑分析的概念來討論。當觀察變項沒有測量誤差時,也就是當潛在變項不存在時,SEM對於結構關係的假設考驗就完全等同於經濟計量學的聯立方程模型分析。
這兩種統計概念的整合,使得研究者可以提出一套完整的理論模式,再透過特定的估計程序,產生各項參數的估計數,進而檢驗理論模式的整體適切性。Jöreskog(1973)據此發展出LISREL統計分析軟體,免除了繁複的計算程序,提高了SEM的應用價值,成為當今社會與行為科學計量研究中最重要的一個統計方法典範(Byrne,1994)。到現在,SEM不僅擁有專屬的期刊結構方程模式(Structural Equation Modeling),多種專門的統計軟體,SEM的研究者也結成一個網路社群SEMNET,是一個由七十餘國將近一千五百位學者專家所結合而成的虛擬化研究社群[5]。
近年來有關SEM在基本原理的重要發展,除了可以應用到非常態化資料的分析,包括了二分變項、順序或類別變項(Browne, 1984; Muthen, 1984),對於特定的問題,例如非隨機性遺漏值的處理,Allison(1987)與Muthén, Kaplan, & Hollis(1987)也提出了因應策略。此外,應用在多層次的抽樣程序的SEM分析(multilevel SEM),以及縱貫性研究的SEM分析,也開始受到研究者的重視與廣泛討論(參見Little, Schnabel, & Baumert, 2001)。一些原創性問題仍不時的出現在期刊上,並引起研究者的重視。
在各研究領域的應用上,Breckler(1990)分析了自1977年至1987年10年間,在人格與社會心理學相關期刊中,曾應用到SEM的72篇論文。文中整理了相關的重要議題,研究分析的策略方法等,說明了SEM在社會與人格心理學研究上具有相當大的發展性。另外,在消費行為研究,Hulland, Chow, & Lam(1996)檢視了186篇在1980至1994年的文章,Baumgartner & Homburg(1996)則檢閱了149篇在1977至1994年的文章,分別從理論、測量、評鑑、測量的操作等不同層面來討論SEM的應用,是回顧行銷與消費者研究領域應用SEM技術的重要文獻。在工業組織心理學領域,James & James(1989)整理了55篇在1978至1987年涉及SEM應用的論文,發現許多論文並沒有檢驗SEM的基本假設與正確的設定。Medsker, Williams, & Holahan(1994)檢視1988至1993年在五種組織研究的期刊當中的28篇文章,並與James & James的研究來對比,結果指出SEM的應用有著長足發展。
最近的一個回顧文獻,是Hershberger(2003)整理自1994到2001年在Psyinfo資料庫中所出現的SEM相關論文的發表情形,整理得相當清楚,對於SEM的發展具有相當的啟示。另外,Maccallum & Austin(2000)回顧1993至1997年間500篇發表於十六種心理學主要期刊的SEM應用論文,對於SEM在心理學研究上的應用有相當完整的整理與介紹。有興趣的讀者可以詳閱這些文章。
台灣有關SEM的討論,最早是林清山教授(1984)在測驗年刊發表的《線性結構關係(LISREL)電腦程式的理論與應用》一文,然而,近二十年來,SEM在國內的討論可以說是相當的冷清,期刊上只有一些零星的論文(如江宗誠,2000; 邱皓政,1997; 馬信行,1999),或各學會學術會議上的小型研討會偶有相關論文發表。在實際的研究中,國內使用SEM為主要分析技術者近年來則有明顯的成長,尤其在社會與行為科學的理論與應用領域,許多博碩士論文與實證研究已經採用SEM技術。在教學上,已經有少數的學校開授SEM課程(例如台灣大學、師範大學、中正大學、輔仁大學等),並有教科書以專章介紹SEM(例如邱皓政,2000a; 陳正昌,1998; 張紹勳,2003),或撰寫專書(邱皓政,2003;黃芳銘,2002)來介紹,但是比起先進國家的發展盛況,國內有關SEM的理論與應用討論,仍然只是一個起步而已,有待大家的關心與投入。
四、SEM發展路上的石頭
儘管SEM的發展風起雲湧,但是同時也遭遇到許多的困境與挑戰。其中質疑音量最大者依然是南加大心理系教授Norman Cliff,他在1983即已經以相當嚴峻的口吻質疑SEM的不當使用。Cliff(1983)對於SEM研究者所企圖追求的因果論證,提出了四個方法學的警告,第一,研究者所獲得的數據無法替我們完全確認或否認一個模型的正確性,因為模型是人為的,而且可以以各種方法重新定義。第二,具有時間性的先後次序證據並不代表因果。第三,潛在變項的命名是一個主觀的歷程,而非客觀的事實,潛在變項的估計存在著名義謬誤(nominalistic fallacy)的陷阱。第四,事後的解釋與調整具有誠信與可信度的問題,也就是駁斥部分研究者大量使用模型修飾程序來獲得理想契合度的不當作法。
Cliff的批評可以說是一種警世之語,事實上,Cliff也相當看重SEM的發展,他在1983年的文章中最後提到:
「……最後,我必須再次強調,像LISREL這類的分析工具的確提供了一個空前的、史無前例的機會,使我們能夠把這類的研究好好的做好。」(p.125)
在Cliff的觀點中,最佳的SEM使用典範,是在恆等性檢驗的應用上,而恆等性的研究多與跨樣本或縱貫研究的資料分析有關,因此也與Collins的立場一致。
最後,我想引用我在南加大的指導教授Dennis Hocevar首度開設《結構方程模式》[6]這門課時所說的話,作為SEM發展的結論:
「如果你不認識他(指SEM),你最好主動去認識他,因為他最後將找上你。尤其是對於心理計量領域的新進研究者來說,少了他,你們在學術上的發展堪慮;對於選修這門課,將SEM作為研究策略選擇之一的學生來說,因為認識他,你們的學術生涯將會增添許多光采。」
參、結構方程模式的構成
Hoyle(1995)指出,結構方程模式可視為不同統計技術與研究方法的綜合體。從技術的層面來看,SEM並非單指某一種特定的統計方法,而是一套用以分析共變結構的技術的整合。SEM有時以共變結構分析(covariance structure analysis)、共變結構模型(covariance structure modeling)等不同的名詞存在,有時則單指因素分析模式的分析,以驗證性因素分析(CFA)來稱呼之;有時,研究者雖然以SEM的分析軟體來執行傳統的路徑分析,進行因果模型(causal modeling)的探究,但不使用SEM的名義,事實上這也是SEM的重要應用之一。
一、結構方程模型的基本元素
■ 測量變項與潛在變項
在SEM模型當中,變項有兩種基本的型態:測量變項(measured variable)與潛在變項(latent variable)。研究者測量得到的測量變項資料是真正被SEM用來分析與計算的基本元素[7];潛在變項則是由測量變項所推估出來的變項。在典型的SEM分析中,測量變項的變異係受到某一個或某幾個潛在變項影響,因此又稱為潛在變項的測量指標(indicators)或外顯變項(manifest variables)。
在SEM的路徑圖中,測量變項是以長方形來表示,如圖二的V1與V2。當測量變項是一個無誤差的測量之時,我們可以視此一變項是一個真實有效的測量,通常人口變項屬於此一類型,例如性別、年齡等。另一類的測量變項可能伴隨著一定的測量誤差,或是反應某種抽象的概念意涵,以SEM的術語來說,這些測量變項是受到特定潛在變項的影響,使得測量變項分數呈現高低的變化。
圖二 潛在變項與測量變項關係圖示
在SEM分析的路徑圖中,潛在變項以橢圓形的符號來表示,如圖二的F所示。一個潛在變項必須以兩個以上的測量變項來估計,稱為多元指標原則。不同變項之間的共變數,反應了潛在變項的共同影響。一個SEM模型中,測量變項一定存在,但潛在變項不可能單獨存在,因為在研究過程當中,潛在變項並不是真實存在的變項,而是由測量變項中所估計出來。
SEM模型中,潛在變項與測量變項之間的關係稱為測量模型(measurement model),圖二所表示的即是最簡單的一組測量模型,其中橢圓形的F代表潛在變項或因素(factor),方形的V1與V2代表測量變項,這兩個變項受到潛在變項F影響的強度,以因素負荷量(l1與l2)表示。測量變項的變異量中,無法被共同的潛在變項解釋的部分稱為殘差(E1與E2),在此可視為是以測量變項去測量潛在特質的測量誤差。測量誤差可以被視為是一個潛在變項,其變異量可被估計,因此在路徑圖中有人以橢圓形符號來表示殘差(表示為一潛在變項)。
■ 內衍變項與外衍變項
沿用過去路徑分析的術語,SEM模型中的變項可以區分為內衍變項與外衍變項。所謂內衍變項(endogenous variables)是指模型當中,會受到任何一個其他變項影響的變項,也就是路徑圖中會受到任何一個其他變項以單箭頭指涉的變項;外衍變項(exogenous variables)則是模型當中不受任何其他變項影響但影響他人的變項,也就是路徑圖中會指向任何一個其他變項,但不被任何變項以單箭頭指涉的變項。
SEM模型中,除了以內衍及外衍變項來區分,如果加上前述測量變項與潛在變項之分,SEM中的變項可以區分為內衍測量變項、外衍測量變項、內衍潛在變項與外衍潛在變項四種類型。當一個潛在變項作為內衍變項時,稱為內衍潛在變項,它所影響的測量變項則稱為內衍測量變項;相對的,當一個潛在變項作為外衍變項時,稱為外衍潛在變項,它所影響的測量變項則稱為外衍測量變項。在SEM模型當中,測量變項可以作為內衍變項,也可以是外衍變項,完全視它背後的潛在變項的性質與角色決定。以圖二當中的變項為例,由於F變項並沒有受任何其他變項的影響,因此是一個外衍潛在變項,此時V1與V2是為外衍測量變項。E1與E2是為V1與V2的測量殘差,如果將E1與E2視為變項,則屬於外衍潛在變項。
若以傳統的自變項(independent variables)與依變項(dependent variables)的關係來看,外衍變項因為不受他人影響,因此必為自變項,而內衍變項多作依變項之用,但也可能作為影響他人的自變項。在迴歸分析中,依變項是為被解釋變項(或稱為效標變項),是一個研究主要關心的焦點所在,因此SEM中的內衍變項可以說是模型中的重要關鍵變項。
當內衍變項同時作依變項與自變項之時,如圖三的V2與V3,表示該變項不僅被他人影響,進而還可能對其他變項產生作用,因此即成為一個中介變項(mediator)。由此可知,內衍變項之間的關係與本身的參數估計是SEM分析相當重要的部分。
內衍變項的一個重要性質是具有殘差,因為內衍變項的變異量不一定能夠被模型當中的其他變項所完全解釋,其他變項解釋內衍變項的不足之處,即為殘差。對於測量變項而言,其變異量無法被完全解釋的殘差部分,稱為測量殘差或獨特量(uniqueness),如果內衍測量變項存在於測量模型當中作為潛在因素的測量指標,殘差可以視為是測量誤差。
對於潛在變項而言,內衍潛在變項的變異量已經排除了測量誤差的影響,因此無法被完全解釋的殘差部分不能視為測量誤差,而是其他變項無法解釋的獨特變異量,這個部分變異量所反應的是模型無法有效解釋內衍潛在變項的部分,也就是過去迴歸分析的1-R2,解釋因子必定來自於模型之外的因素,因此特別給予一個名詞稱為SEM模型的干擾項(disturbance),由於它是無法被其他變項有效解釋的變異量,因此也可以稱之為解釋或預測殘差。
二、變項關係與路徑圖
■ 直接與非直接關係
在SEM當中,變項的關係有直接關係(directional relationship)與非直接關係(nondirectional relationship)兩種主要類型。直接關係表示變項之間具有假設性的線性因果或預測關係,在路徑圖當中以單向箭頭(®)來表示。非直接關係則表示兩個變項之間雖然具有線性的關係,但兩者之間影響關係與方向無法辨認,多以相關來表示,在SEM路徑圖中,以帶有雙箭頭的線段(«)或曲線表示。
不論是直接或非直接關係,兩個變項之間的關係可以參數估計的方式被估計出來,用以反應兩個變項間的路徑(path)或弧徑(arcs)(Pearl, 2000)關係強度。例如圖二當中,潛在變項對於測量變項的關係就是一種直接關係的結構參數,強度以因素負荷量(l)表示之。圖四的兩個潛在變項(F1與F2)關係的結構參數則是迴歸係數,用以說明兩者間的因果關係。
■ 測量模型與結構模型
一個完整的SEM模型,包括了測量模型(measurement model)與結構模型(structural model)兩部份,前者係指實際測量變項與潛在特質的相互關係,後者則說明潛在變項之間的關係,如圖四所示。
在圖四當中,測量變項V1、V2與V3受到同一個潛在變項(F1)的影響,形成一個獨立的測量模型,而測量變項V4、V5與V6則受到另一個潛在變項(F2)的影響,形成另一個獨立的測量模型。兩個潛在變項之間具有因果關係的假設,以單向箭頭來表示。因此,從F1到F2之間是一個結構模型,對於內衍潛在變項F2,無法被F1解釋的干擾部分為D(disturbance)。圖四是利用SEM的路徑圖(path diagrams)來說明SEM模型的變項特性與關係。
圖四 典型的SEM模型圖示
在SEM當中,如果單獨使用測量模式,也就是只有測量模型而沒有結構模型的迴歸關係假設時,即為驗證性因素分析(confirmatory factor analysis),因其檢測的內容是測量題目的因素結構(factorial structure)與測量誤差。進一步的,單獨看待結構模式,其實就是一個傳統的路徑分析(path analysis)模型,可以多元迴歸的概念來說明變項的因果或預測關係。事實上,如果一個SEM模型當中沒有任何潛在變項的假設(亦即沒有測量模型),只存在有測量變項,並探討這些測量變項的因果/預測關係時,就與傳統的路徑模型無異。
值得注意的是,SEM模型與傳統的迴歸分析的不同,除了在於SEM可以同時處理多組迴歸方程式的估計,更重要的是變項關係的處理更具有彈性。在迴歸分析當中,變項僅區分為自變項與依變項,同時這些變項都是無誤差的測量變項,但是SEM模型中,變項的關係除了具有測量關係之外,還可以利用潛在變項來進行觀察值的殘差估計,因此,SEM的模型中,殘差的概念遠較傳統迴歸分析複雜。其次,在迴歸分析中,依變項被自變項解釋後的殘差是被假設與自變項之間的關係是相互獨立,但是SEM分析中,殘差項是允許與變項之間帶有關聯,但是前題是這些特殊的假設也應具有一定的理論邏輯基礎。
肆、結構方程模式的特性
不論是用何種名詞來稱呼SEM,這些分析技術具有一些基本的共同特質(Kline, 1996, pp. 8-13),說明如下。
一、SEM具有理論先驗性
SEM分析最重要的一個特性,是它必須建立在一定的理論基礎之上,也就是說,SEM是一個用以檢證某一先期提出的理論模型(priori theoretical model)的適切性的一種統計技術。這也是SEM被視為是一種驗證性(confirmatory)而非探索性(exploratory)統計方法的主要原因。SEM的分析過程中,從變項內容的界定、變項關係的假設、參數的設定、模型的安排與修正,一直到應用分析軟體來進行估計,其間的每一個步驟都必須要有清楚的理論概念或邏輯推理作為依據。從統計的原理來看,SEM也必須同時符合多項傳統統計分析的基本假設(例如線性關係、常態性)以及SEM分析軟體所特有的假設要件,否則所獲得的統計數據無法採信。
以因素分析為例,結構方程模式所使用的因素模式採取了相當嚴格的限制。研究者對於潛在變項的內容與性質,在測量之初即必須有非常明確的說明,或有具體的理論基礎,並已先期決定相對應的觀察變項的組成模式。分析的進行即在考驗這一先期提出的因素結構的適切性,除了測量工具發展時,可以利用此一程序來檢驗其結構的有效性,也可用於理論架構的檢驗,因此又被稱為驗證性因素分析。
二、SEM同時處理測量與分析問題
過去傳統的統計方法,不論分析的內容為何,多把變項視為「真實」、「具體」、「可觀測」的測量資料,在分析過程中,並不去處理測量過程所存在的問題,也就是說,「測量」與「統計」是兩個獨立分離的程序。傳統上,如果變項所涉及的概念是如同「智力」或「自尊」等不易界定的心理概念,研究者為了獲得可以分析的資料,會先行討論測量的方法,並以信度與效度的概念程序來先行進行評估,一旦通過評估的標準,即將所獲得的測量資料進行分析。
相對於傳統的作法,SEM是一套可以將「測量」與「分析」整合為一的計量研究技術。主要的關鍵在於SEM將不可直接觀察的構念或概念,以潛在變項的形式,利用觀察變項的模型化分析來加以估計,不僅可以估計測量過程當中的誤差,也可以用以評估測量的信度與效度(如因素效度),甚至可以超越古典測量理論的一些基本假設,針對特定的測量現象(例如誤差的相關性)加以檢測。另一方面,在探討變項之間關係的時候,測量過程所產生的誤差並沒有被排除在外,而是同時包含在分析的過程當中,使得測量信度的概念可以整合到路徑分析等統計推論的決策過程中。
三、SEM以共變數的運用為核心,亦可處理平均數估計
SEM分析的核心概念是變項的共變數(covariance)。共變數是描述統計中的一種離散量數,利用變異數的離均差和的數學原理,計算出兩個連續變項配對分數(paired scores)的變異量,用以反應兩個變項的共同變異或相互關聯程度。共變數是一個非標準化的統計量數,受到兩個變項所使用的量尺或單位的影響,數值可能介於 到 之間,如果將共變數除以兩個變項的標準差,即可得出標準化共變數(即Pearson相關係數)。
在SEM當中,共變數具有兩種功能,第一是描述性的功能,利用變項之間的共變數矩陣,我們可以觀察出多個連續變數之間的關聯情形;第二是驗證性的功能,用以反應出理論模型所導出的共變數與實際觀測得到的共變數的差異。在SEM分析過程中最重要的數學程序,即是在產生模型導出共變矩陣(S matrix)。如果研究者所設定的SEM模型有問題,或是資料估計過程導致S matrix無法導出,整個SEM即無法完成。
除了共變數以外,SEM也可以處理變項的集中傾向的分析與比較,也就是平均數的檢驗。傳統上,平均數檢驗是以t檢定或變異數分析(ANOVA)來進行。由於SEM可以對於截距進行估計,使得SEM可以將平均數差異的比較納入分析模型當中,同時若配合潛在變項的概念,SEM更可以估計潛在變項的平均數,使得SEM的應用範圍更為廣泛。
一般而言,SEM主要的優勢來自於多元迴歸與因素分析等主要應用於非實驗設計的統計技術,但由於SEM可以處理分組變數與平均數估計,因此實驗設計所得出的資料也可以利用SEM來分析。
四、SEM適用於大樣本之分析
由於SEM所處理的變項數目較多,變項之間的關係較為複雜,因此為了維持統計假設不致違反,必須使用較大的樣本數,同時樣本規模的大小,也牽動著SEM分析的穩定性與各種指標的適用性,因此,樣本數的影響在SEM當中是一個重要議題。
與其他的統計技術一樣,SEM分析所使用的樣本規模當然是越大越好,但是究竟有沒有一個最適規模,則會隨著SEM模型的複雜度與分析的目的與種類而有相當大的變化。但是,一般來說,當樣本數低於100之時,幾乎所有的SEM分析都是不穩定的。Breckler(1990)曾針對人格與社會心理學領域的72個SEM實徵研究進行分析,樣本規模介於40至8650之間,中數為198。有四分之一的研究小於樣本數500,約百分之二十的研究樣本規模小於100。因此,一般而言,大於200以上的樣本,才可以稱得上是一個中型的樣本。若要追求穩定的SEM分析結果,低於200的樣本數是不鼓勵的。
五、SEM包含了許多不同的統計技術
綜觀統計分析技術的內容,可以概略分為平均數檢定的變異數分析與探討線性關係的迴歸分析兩大範疇。事實上,這兩者並無本質上的差異,前者可以被歸為一般線性模型(general linear model)分析技術,後者則是以變項間的線性關係為分析的內容。隨著電腦科技的發展,分析軟體功能的提昇,使得兩種統計模式可以互通,合而為一。
一般線性模型的優點是可以數學方式來整合不同型態的變異來源,可以不斷擴充研究者所欲探討的變項的數目與影響方式,因此一般線性模型逐漸發展出多種多變量統計的概念,例如多變量變異數分析(multivariate analysis of variance)。而迴歸分析在處理變項的彈性與複雜度的優勢似乎有凌駕變異數分析之勢,但是變異數分析由於簡單清楚的數學原理與容易解釋分析的特性,也一直受到研究者的青睞[8]。在SEM當中,雖然是以變項的共變關係為主要內容,但由於SEM模型往往牽涉到大量變項的分析,因此常借用一般線性模式分析技術來整合變項,故SEM分析可以說是多種不同統計分析程序的集合體。
六、SEM重視多重統計指標的運用
雖然SEM涵括了多種不同統計技術於一身,但是對於統計顯著性的依賴性卻遠不及一般統計分析,主要理由有三:第一,SEM所處理的是整體模型的比較,因此所參考的指標不是以單一的參數為主要考量,而是整合性的係數,此時,個別檢定是否具有特定的統計顯著性即不是SEM分析的重點所在。第二,SEM發展出多種不同的統計評估指標,使得使用者可以從不同的角度來進行分析,避免過度倚賴單一指標。第三,由於SEM涉及大樣本的分析,當樣本越大,SEM分析的核心概念卡方統計量的顯著性,即受到相當的扭曲,因此SEM的評估指數都特意避免碰觸到卡方檢定的顯著性考驗。也因為這個原因,在SEM分析當中,較少討論到與統計顯著性決策有關的第一與第二類型錯誤議題,顯示了SEM技術的優勢是在於整體層次(macor-level)而非個別或微視的層次(mocro-level)。
伍、結構方程模式的基本程序
SEM分析的基本程序可以概分為模型發展與估計評鑑兩個階段。前者在發展SEM分析的原理基礎並使SEM模型符合特定的技術要求,此時研究者的主要工作在概念推導與SEM分析的技術原理的考量;後者則在產生SEM的計量數據來評估SEM模型的優劣好壞,並進行適切或必要的修飾,此時所著重的是分析工具與統計軟體(例如LISREL、EQS、AMOS、MPLUS等)的操作與應用。有關SEM分析的執行流程的概念,請參考圖五。
一、模型發展階段
模型發展階段的主要目的在建立一個適用於SEM分析概念與技術需要的假設模型,牽涉到理論發展、模式設定與模型辨識等三個概念。在圖五當中,這三個概念雖然是以連續的流程圖來表示,但是三者間的關係只是說明概念發生的先後順序,在實際操作上,這三個概念的運作則是相互作用的不斷往覆過程。
理論性發展
(Theoretical Development)
模型辨識
(Model Identification)
抽樣與測量
(Sampling and Measurement)
階段一
模型發展
參數估計
(Parameter Estimation)
模型契合度估計
(Assessment of Fit)
討論與結論
(Discussion and Conclusion)
階段二
估計與評鑑
模型修飾
(Model Modification)
模式設定
(Model Specification)
圖五 結構方程模式的基本程序
首先,SEM模型的建立必定以理論為基礎。所謂的以理論為基礎,並不是說SEM模型一定必須建立在某一個特定的理論之上,而是強調SEM模型的建立必須經過觀念的釐清、文獻整理與推導、或是研究假設的發展等理論性的辯證與演繹過程,最終提出一套有待檢證的假設模型。在前面的章節中,已經指出了SEM的一個重要特性是理論的先驗性,因此,SEM分析的第一個階段,主要目的便是在建構SEM的理論基礎,另外兩個概念,模式設定與模型辨識,也即是根基於理論性推演過程,將SEM模型的理論假設轉換成為適當的技術語言。
配合理論推導的過程,研究者同時必須進行模式界定的重要工作。模式界定(model specification)可以說是第一個階段當中最為具體的步驟,目的在發展可供SEM進行檢驗與估計的變項關係與假設模型。
一般來說,SEM模型的構成有兩個主要的部分,第一是理論或概念的基礎,或是研究者個人的先備知識與經驗,第二是SEM的技術語言與方法要求。當研究者面對於所關心的研究問題之時,除了基於自己的知識基礎與研究興趣來推演出值得探討的研究命題之外,還需對於理論文獻詳加檢閱,以建立嚴謹的科學假設或提出有待驗證的理論模型。
如果研究者選擇使用SEM來探討所提出的假設與理論模型,則必須配合特定的SEM技術語言與各項操作要求,將研究者所提出的假設與理論模型轉換成SEM模式,在此同時也需考量SEM分析當中所可能涉及的各種統計概念所使用的統計原理,納入SEM模型的設定之中,這個由理論發展到技術性模型建立的一整套程序,就是第二個具體步驟「模式界定」的主要任務。而模式界定的具體產品,是建立一個SEM路徑圖。該路徑圖就是模型辨識步驟據以評估的依據,也是第二階段進行估計分析的地圖。
此外,在模式界定的過程當中,有一個非常重要的技術問題,是必須讓SEM模型具有的可辨識性,使SEM的各項數學估計程序可以順利的進行。由於結構方程模式所設定的假設模式,是基於研究者的研究需求所提出,但是,模式的分析必須利用實際蒐集得到的資料,利用分析軟體來進行估計工作。只有在模型符合統計分析與軟體執行的要求,也就是在能夠被有效辨識的情況下,SEM分析才能順利進行。
二、估計與評鑑階段
一旦SEM模型發展完成之後,研究者即必須蒐集實際的測量資料來檢驗所提出的概念模型的適當性。此一階段開始於樣本的建立與測量工作的進行,所獲得觀察資料經過處理後,即依照SEM分析工具的要求,進行各項估計。
樣本的獲得對於SEM分析的結果有著重要的影響。除了樣本規模大小的影響,由於SEM涉及潛在變項的測量,因此SEM分析的結果與樣本結構及測量品質有密切的關係,也就是具有樣本的依賴性(sample realitication)。Bollen(2002)指出,對於某些個體而言,潛在變項是可能存在的概念,但是對於不同的個體,則可能不存在,或有不同的意義,因此在不同的樣本間,SEM的分析可能得到非常不同的結果。
為了因應SEM會隨著樣本的特性而改變結果的性質,SEM的分析工具多提供了評鑑的指標,以反應樣本規模與性質的影響,(例如RMSEA、NNFI、ECVI等指標),同時SEM分析的本身,亦可以處理測量誤差的估計,使測量品質的影響可以被有效的控制,但是研究者仍然必須謹慎的選取研究樣本,維護測量的品質,因為SEM分析的複雜性高,任何一個環節的瑕疵或失誤,都可能造成SEM分析結果產生變化。
SEM的參數估計可以說完全是由電腦來進行,只有少數的部分必須由人工來計算完成(例如測量模型的信度估計),但是如何讓SEM分析順利完成,仍有賴研究者對於電腦軟體正確無誤的指令下達,以及分析工具的各種選項的正確決定。不同的分析軟體各有其優劣,因此操作方法各有不同,SEM的使用者必須對於SEM分析工具的一般性基本原理有深入的瞭解,也必須從操作演練中累積經驗,熟知每一套軟體的優劣與限制,瞭解每一個參數或警告訊息的意義與作用,才能順利完成各項估計與評估程序。
值得注意的是,在估計與評鑑過程中,SEM分析工具通常會提供模型調整與修飾的計量資訊,使用者可以根據這些指數或統計檢定數據,調整先前所提出的假設模型,重新、反覆進行估計與模型評估,此一過程稱之為模型修飾(model modification)。雖然此一作法違反了SEM分析理論先驗性的精神,但是觀察資料背後所潛藏的各種資訊,也是科學研究相當珍貴的線索,從中可能看出研究者在理論推導過程當中的疏忽或盲點,也可能引導研究者繼續推導出更有意義的概念或假設,重新提出一套更趨合理的SEM模型。因此,模型的修正步驟也是一般SEM使用者相當重視的部分。
陸、結語
綜觀SEM近年來的發展,可以發現SEM已經是個高度發展的成熟學科,不僅在學理上有相當程度的進展,在社群活動上也相當的熱絡。學術活動基本上是由研究人員、學者專家與實務工作者所匯聚的科學社群與具體的研究議題與成果所組成,當一個研究領域聚集了足夠的資源,累積了足夠的理論論述與研究發現,匯集了相當的共識之後,方能促成並支持專門期刊的誕生與專屬社群的動力。SEM的發展,正是經歷了這一連串的學術過程,所獲致的一個具體成果。
SEM的相關研究,除了發表在專屬期刊結構方程模式(Structural Equation Modeling)上,也可在各重要期刊上發現,例如心理學評論(Psychological Bulletin)、心理學方法(Psychological Methods)、心理計量學(Psychometrika)、應用心理測量(Applied Psychological Measurement)、多變量行為研究(Multivariate Behavioral Research)、教育與心理測量(Educational and Psychological Measurement)、教育測量的議題與實務(Educational Measurement: Issues and Practices)、社會學方法與研究(Sociological Methods and Research)、社會學方法論(Sociological Methodology)、英國數學與統計心理學期刊(British Journal of Mathematical and Statistical Psychology)等等,國內有關SEM的研究報告則散見在各期刊中。
結構方程模式雖然有種種的優點,但卻面臨與其他高等統計技術相類似的命運。不少人對於統計學具有相當的排斥感,使得大多數的研究者未能觸及SEM之前即已對其抱持敬而遠之的心理,加上早期的SEM語言過份艱澀,龐雜棘手的各種數學矩陣甚至令熟手亦感頭疼,益發突顯了SEM學習理解的困難。綜觀SEM的發展史,學者們無不努力尋求SEM的共識作法,提高大家的接受度,也積極尋求簡化SEM分析軟體操作難度的各種途徑,因而有EQS軟體,或LISREL當中SIMPLIS語言的誕生,使得SEM在1990年代之後有了明顯的「復甦」。同時也因為SEM的重要性與應用日多,而促使許多大學研究所將SEM列入必修課程,迫使愈來愈多的學生開始認真學習。由此可以想見,SEM在國內的推廣勢必遭到相似的困境,國內心理學界本身即缺乏心理計量研究的專屬社群,學生們普遍害怕統計課程,學者的研究亦顯零散,因此,國內測量、測驗、統計、計量領域若要能夠在SEM領域中有所受益,建立正確的認知、落實相關知識的學養、群策群力共謀前景等等皆是重要、基礎而不可或缺的作為。
參考文獻
林原宏(1995)。〈線性結構模式理論與應用簡介〉。《測驗統計簡訊》。3,9-19。
林清山(1984)。〈「線性結構關係」(LISREL)電腦程式的理論與應用〉。《中國測驗學會測驗年刊》,31,149-164。
邱皓政(1997)。〈態度測量與心理測驗發展與檢驗的新趨勢:結構方程模式的應用〉。《世新學報》,7,61-95。
邱皓政(2003)。〈結構方程模式:LISREL的理論、技術與應用〉。台北:雙葉書廊。
馬信行(1999)。〈線性結構模式在教育上的應用及所遭遇的問題〉。《教育與心理研究》,22,1-14。
張紹勳(2001)。《研究方法》。台北,滄海。
黃芳銘(2002)。《結構方程模式理論與應用》。台北,五南。
劉子鍵(1994)。《LISREL-MANOVA與傳統MANOVA的比較及模擬分析》。國立政治大學教育研究所未發表碩士論文。
Allison, P. D. (1987). Estimation of linear models with incomplete data. In C. C. Clogg (Ed.), Sociological methodology (pp. 71-103). San Francisco: Jossey-Bass.
Arbuckle, J. L. (1997). Amos user's guides. Chicago: SmallWaters.
Baumgartner, H. & Homburg, C. (1996). Applications of structural equation modeling in marketing and consumer research: A review. International Journal of Research in Marketing, 13, 139-161.
Bentler, P. M. (1985). Theory and implementation of EQS: A structural equations program. Los Angeles: BMDP Statistical Software.
Bentler, P. M. (1989). EQS Structural Equations Program Manual. Los Angeles, CA: BMDP.
Bentler, P. M. (2001). EQS 6 structural equations program manual. Encino, CA: Multivariate Software. Manuscript in preparation.
Bentler, P. M., & Dudgeon, P. (1996). Covariance structure analysis: Statistical practice, theory, and directions. Annual Reviews of Psychology, 47, 563-592.
Bollen, K. A. (1989). Structural equation modeling with latent variables. New York: John Wiley.
Bollen, K. A. (2002). Latent variables in psychology and the social sciences. Annual Review of Psychology, 53, 605-634.
Breckler, S. J. (1990). Applications of covariance structure modeling in psychology: Cause for concern? Psychological Bulletin, 107, 260-273.
Browne, M. W. (1984). The decomposition of multitrait-multimethod matrices. British Journal of Mathematical and Statistical Psychology, 37, 1-21.
Browne, M. W., Mels, G., & Cowan, M. (1994). Path analysis: RAMONA. SYSTAT for DOS advanced applications (Version 6, pp. 167-224.). Evanston, IL: SYSTAT.
Cliff, N. (1983). Some cautions concerning the application of causal modeling methods. Multivariate Behavioral Research, 18, 115-126.
Clogg, C. C. & Haritou, A. (1997). The regression method of causal inference and a dilemma confronting this method. In V. R. Mckim & S. P. Turner (Eds.), Causality in crisis? Statistical methods and the search for causal knowledge in the social sciences (pp. 83-112). Notre Dame, IN: University of Notre Dame Press.
Cohen, J., & Cohen, P. (1983). Applied multiple regression/correlation for the behavioral sciences (2nd ed.). Hillsdale, NJ: Erlbaum.
Collins, L. M., & Horn, J. L. (1991). Best methods for the analysis of change. Washington, DC: American Psychological Association.
Collins, L. M., Graham, J. W., & Flaherty, B. P. (1998). An alternative framework for defining mediation. Multivariate Behavioral Research, 33, 295-312.
Hershberger, S. (2003). The growth of structural equation modeling:1994-2001. Structural equation modeling,10, 35-46.
Hoyle, R. H. (1995). Structural equation modeling: Concepts, issues, and applications. Thousand Oaks, CA: Sage.
Hulland J, Chow YH, Lam S. (1996). Use of causal models in marketing research: a review. Int. J. Res. Mark. 13: 181-97
James, L. R., & James, L. A. (1989). Causal modeling in organizational research. In C. L. Cooper & I. Robertson (Eds.), International review of industrial and organizational psychology, 1989 (pp. 371-404). Chichester, UK: John Wiley & Sons.
Jöreskog, K. G. (1971). Simultaneous factor analysis in several populations. Psychometrika, 36, 409-426.
Jöreskog, K. G., & Sörbom, D. (1989). LISREL 7: A guide to the program and applications. Chicago: SPSS.
Kaplan, D. (2000). Structural equation modeling: Foundations and extensions. Thousand Oaks, CA: Sage.
Keesling, J. W. (1972). Maximum likelihood approaches to causal analysis. Unpublished doctoral dissertation. University of Chicago.
Kline, R. B. (1998). Principles and practice of structural equation modeling. New York: Guilford Press.
MacCallum, R. C., & Austin, J. T. (2000). Applications if structural equation modeling in psychological research. Annual Review of Psychology, 51, 201-226.
McDonald, R.P., Ho, M. R. (2002). Principles and practice in reporting structural equation analysis. Psychological Methods,7, 64-82.
Medsker, G. J., Williams, L. J., & Holahan, P. J. (1994). A review of current practices for evaluating causal models in organizational behavior and human resources management research. Journal of Management, 20, 439-464.
Muthén, L. K., & Muthén, B. O. (1998). Mplus: The comprehensive modeling program for applied researchers. Los Angeles: Muthén & Muthén.
Muthén, B., Kaplan, D., & Hollis, M. (1987). On structural equation modeling with data that are not missing completely at random. Psychometrika, 52, 431-462.
Pearl, J. (2000). Causality: Models, reasoning and inference. Cambridge, England: Cambridge University Press.
Pedhazur, E. J. (1997). Multiple regression in behavioral research: Explanation and prediction (4th. ed). New York: Thomson Learning, Inc.
Tanaka, J. S. (1993). Multifaceted conceptions of fit in structural equation models. In K. A. Bollen & J. S. Long (Eds.), Testing structural equation models (pp. 10-39). Newbury Park, CA: Sage.
Tabachnick, B. G., & Fidell, L. S. (2001). Using Multivariate Statistics. Needham Heights, MA: Allyn and Bacon.
Tatsuoka, M. M. (1988). Multivariate analysis: Techniques for educational and psychological research. New York: Macmillan.
Wilcox, R. R. (1998). How many discoveries have been lost by ignoring modern statistical methods, 53, 300-314.[/size][/color]
页:
[1]