结构方程建模中的「验证性因子分析」
[p=30, 2, left][font=SimSun]我们首先来解释一下这个图。凡是长方形的都是「观察变量」(可以看得见的东西),凡是椭圆形的都是「构念」(看不见的东西)。在验证性因子分析里面,长方形的测量项目,椭圆形的是因子。凡是箭头指出来的都是“因”,箭头指向的都是“果”。[/font][font=SimSun]凡是双向的箭头代表“只是相关,不知道因果关系”。所以,上面的图可以写成下面的方程组:[/font][/p][p=30, 2, left]
x1 =[font=SimSun]λ[/font][font=Arial]1[/font]
F1[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]1 [/font][/p][p=30, 2, left]
x2 =[font=SimSun]λ[/font][font=Arial]2[/font]
F1[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]2 [/font][/p][p=30, 2, left]
x3 =[font=SimSun]λ[/font][font=Arial]3[/font]
F2[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]3 [/font][/p][p=30, 2, left]
x4 =[font=SimSun]λ[/font][font=Arial]4[/font]
F2[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]4 [/font][/p][p=30, 2, left]
[/p][p=30, 2, left]x1[font=SimSun]与[/font]
x2[font=SimSun]背后的因子是[/font]F1[font=SimSun],[/font]x3 [font=SimSun]与[/font]
x4[font=SimSun]背后的因子是[/font]F2[font=SimSun]。[/font][/p][p=30, 2, left]F1 [font=SimSun]与[/font] F2 [font=SimSun]是相关的(不知道哪一个是因、哪一个是果),相关系数是[/font][font=SimSun]φ[/font]
[font=SimSun]。[/font][/p][p=30, 2, left]
[/p][p=30, 2, left]Var(x1) [/p][p=30, 2, left]= Var([font=SimSun]λ[/font][font=Arial]1[/font]
F1[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]1[/font]) [/p][p=30, 2, left]= ([font=SimSun]λ[/font][font=Arial]1[/font])2Var(F1)+Var([font=SimSun]ε[/font][font=Arial]1[/font])
[font=SimSun](因为[/font]F1[font=SimSun]与[/font][font=SimSun]ε[/font][font=Arial]1[/font]
[font=SimSun]是不相关的)[/font][/p][p=30, 2, left]
[/p][p=30, 2, left]Cov(x1, x2) [/p][p=30, 2, left]= Cov([font=SimSun]λ[/font][font=Arial]1[/font]
F1[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]1[/font],
[font=SimSun]λ[/font][font=Arial]2[/font]
F1[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]2[/font])[/p][p=30, 2, left]=[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]2[/font]
Cov(F1,F1)[/p][p=30, 2, left]=[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]2[/font]
Var(F1)
[font=SimSun](变量自己与自己的协方差就是它的方差)[/font][/p][p=30, 2, left]
[/p][p=30, 2, left]Cov(x1, x3) [/p][p=30, 2, left]= Cov([font=SimSun]λ[/font][font=Arial]1[/font]
F1[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]1[/font],
[font=SimSun]λ[/font][font=Arial]3[/font]
F2[font=Arial] +[/font][font=SimSun]ε[/font][font=Arial]3[/font])[/p][p=30, 2, left]=[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]3[/font]
Cov(F1,F2)[/p][p=30, 2, left]
[/p][p=30, 2, left][font=SimSun]同样的,我们可以把[/font]
x1, x2 , x3,x4 [font=SimSun]的「方差」和它们的「协方差」写成:[/font][/p][p=30, 2, left]
Var(x1) = ([font=SimSun]λ[/font][font=Arial]1[/font])2Var(F1)+Var([font=SimSun]ε[/font][font=Arial]1[/font])
[/p][p=30, 2, left]
Var(x2) = ([font=SimSun]λ[/font][font=Arial]2[/font])2Var(F1)+Var([font=SimSun]ε[/font][font=Arial]2[/font])
[/p][p=30, 2, left]
Var(x3) = ([font=SimSun]λ[/font][font=Arial]3[/font])2Var(F2)+Var([font=SimSun]ε[/font][font=Arial]3[/font])
[/p][p=30, 2, left]
Var(x4) = ([font=SimSun]λ[/font][font=Arial]4[/font])2Var(F2)+Var([font=SimSun]ε[/font][font=Arial]4[/font])
[/p][p=30, 2, left]
Cov(x1, x2) =[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]2[/font]
Var(F1)[/p][p=30, 2, left]
Cov(x1, x3) =[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]3[/font]
Cov(F1,F2)[/p][p=30, 2, left]
Cov(x1, x4) =[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]4[/font]
Cov(F1,F2)[/p][p=30, 2, left]
Cov(x2, x3) =[font=SimSun]λ[/font][font=Arial]2[/font][font=SimSun]λ[/font][font=Arial]3[/font]
Cov(F1,F2)[/p][p=30, 2, left]
Cov(x2, x4) =[font=SimSun]λ[/font][font=Arial]2[/font][font=SimSun]λ[/font][font=Arial]4[/font]
Cov(F1,F2)[/p][p=30, 2, left]
Cov(x3, x4) =[font=SimSun]λ[/font][font=Arial]3[/font][font=SimSun]λ[/font][font=Arial]4[/font]
Var(F2)[/p][p=30, 2, left]
[/p][p=30, 2, left][font=SimSun]为了方便,我们把两个因子([/font]F1[font=SimSun]与[/font]F2[font=SimSun])的方差定为[/font] 1[font=SimSun]。同时[/font]Cov(F1,F2)= [font=SimSun]φ[/font]
[font=SimSun]。为什么要把[/font]F1[font=SimSun]与[/font]
F2[font=SimSun]的方差定为[/font] 1 [font=SimSun]呢?因为因子是我们做出来的,它没有量度单位的,我们要给它[/font][font=SimSun]「标度」([/font][font=SimSun]scaling[/font][font=SimSun])。把它的方差定为[/font][font=SimSun]1[/font][font=SimSun]是其中一种最普遍的「标度」方法。做了「标度」以后,[/font][font=SimSun]上面[/font]10[font=SimSun]条方程就可以简化为:[/font]
[/p][p=30, 2, left]
Var(x1) = ([font=SimSun]λ[/font][font=Arial]1[/font])2+ Var([font=SimSun]ε[/font][font=Arial]1[/font])
[font=SimSun]([/font]1[font=SimSun])[/font][/p][p=30, 2, left]
Var(x2) = ([font=SimSun]λ[/font][font=Arial]2[/font])2+ Var([font=SimSun]ε[/font][font=Arial]2[/font])
[font=SimSun]([/font]2[font=SimSun])[/font][/p][p=30, 2, left]
Var(x3) = ([font=SimSun]λ[/font][font=Arial]3[/font])2+ Var([font=SimSun]ε[/font][font=Arial]3[/font])
[font=SimSun]([/font]3[font=SimSun])[/font][/p][p=30, 2, left]
Var(x4) = ([font=SimSun]λ[/font][font=Arial]4[/font])2+ Var([font=SimSun]ε[/font][font=Arial]4[/font])
[font=SimSun]([/font]4[font=SimSun])[/font][/p][p=30, 2, left]
Cov(x1, x2) =[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]2[/font]
[font=SimSun]([/font]5[font=SimSun])[/font][/p][p=30, 2, left]
Cov(x1, x3) =[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]3 [/font][font=SimSun]φ[/font]
[font=SimSun]([/font]6[font=SimSun])[/font][/p][p=30, 2, left]
Cov(x1, x4) =[font=SimSun]λ[/font][font=Arial]1[/font][font=SimSun]λ[/font][font=Arial]4 [/font][font=SimSun]φ[/font]
[font=SimSun]([/font]7[font=SimSun])[/font][/p][p=30, 2, left]
Cov(x2, x3) =[font=SimSun]λ[/font][font=Arial]2[/font][font=SimSun]λ[/font][font=Arial]3 [/font][font=SimSun]φ[/font]
[font=SimSun]([/font]8[font=SimSun])[/font][/p][p=30, 2, left]
Cov(x2, x4) =[font=SimSun]λ[/font][font=Arial]2[/font][font=SimSun]λ[/font][font=Arial]4 [/font][font=SimSun]φ[/font]
[font=SimSun]([/font]9[font=SimSun])[/font][/p][p=30, 2, left]
Cov(x3, x4) =[font=SimSun]λ[/font][font=Arial]3[/font][font=SimSun]λ[/font][font=Arial]4[/font]
[font=SimSun]([/font]10[font=SimSun])[/font]
[/p][p=30, 2, left]
[/p][p=30, 2, left][font=SimSun]这里有[/font]10[font=SimSun]条方程,所有的「方差」与「协方差」(方程等号左边的)都是已知的(它们都是可以观察的)。同时,我们有[/font][font=SimSun]λ[/font][font=Arial]1[/font],[font=SimSun]λ[/font][font=Arial]2[/font],[font=SimSun]λ[/font][font=Arial]3[/font],[font=SimSun]λ[/font][font=Arial]4[/font], Var([font=SimSun]ε[/font][font=Arial]1[/font]) , Var([font=SimSun]ε[/font][font=Arial]2[/font]) , Var([font=SimSun]ε[/font][font=Arial]3[/font]) , Var([font=SimSun]ε[/font][font=Arial]4[/font]) , [font=SimSun]φ(合共[/font]9[font=SimSun]个参数)是未知的。其实上面这一组的方程是可以为我们估计到[/font]9[font=SimSun]个参数出来的。所以,这是一个「可识别」的模型。因为「方差」与「协方差」的总数(也就是方程的数目)比要估计的参数多了[/font]1[font=SimSun],所以这个模型的「自由度」([/font]d.f.[font=SimSun])是等于[/font]1[font=SimSun]。利用电脑[/font][url=http://www.msc.tcu.edu.tw/]
[/url][font=SimSun]模拟([/font]simulation[font=SimSun]),就可以把这[/font]9[font=SimSun]个参数估计出来。[/font][/p][p=30, 2, left]
[/p][p=30, 2, left][font=SimSun]把这[/font]9[font=SimSun]个参数估计出来以后,我们就可以用这[/font]9[font=SimSun]个参数,重新“复制”(计算)出这[/font]10[font=SimSun]个「方差」与「协方差」的值。因为参数是“估计”出来的,“复制”出来的「方差与协方差值」不可能与我们观察到的「方差与协方差值」一模一样。这是什么意思呢?比如在上面的[/font]10[font=SimSun]条方程里,把方程([/font]6[font=SimSun])除于方程([/font]7[font=SimSun]),我们得到:[/font][/p][p=30, 2, left]
Cov(x1,x3) / Cov(x1, x4) =[font=SimSun]λ[/font][font=Arial]3 [/font][font=Arial]/[/font][font=SimSun]λ[/font][font=Arial]4[/font]
[/p][p=30, 2, left][font=SimSun]同样的,把方程([/font]8[font=SimSun])除于方程([/font]9[font=SimSun]),我们得到:[/font][/p][p=30, 2, left]
Cov(x2,x3) / Cov(x2, x4) =[font=SimSun]λ[/font][font=Arial]3 [/font][font=Arial]/[/font][font=SimSun]λ[/font][font=Arial]4[/font]
[/p][p=30, 2, left]
[/p][p=30, 2, left][font=SimSun]理论上两条方程都可以找到[/font][font=SimSun]λ[/font][font=Arial]3 [/font][font=Arial]/[/font][font=SimSun]λ[/font][font=Arial]4[/font][font=SimSun],但是实际上,数据几乎不可能刚刚是:[/font][/p][p=30, 2, left]Cov(x1, x3) / Cov(x1, x4)= Cov(x2, x3) / Cov(x2, x4)[/p][p=30, 2, left][font=SimSun]所以在电脑[/font][url=http://www.msc.tcu.edu.tw/]
[/url][font=SimSun]做模拟的时候[/font]
[font=SimSun],就要做很多的取舍,令到最后的参数估计能“复制”一个最接近原来的「方差与协方差值」的“参数组”。[/font][/p][p=30, 2, left]
[/p][font=SimSun]我们观察到的「方差与协方差值」与“复制”出来的「方差与协方差值」之差,就叫做这个模型的「拟合度」。「拟合度」有不同的计算方法,所以有不同的「拟合指标」。一般[/font]GFI[font=SimSun],[/font]CFI[font=SimSun],[/font]TLI[font=SimSun]等大于[/font].90[font=SimSun],或是[/font]RMSEA[font=SimSun],[/font]SRMR[font=SimSun]等小于[/font].05[font=SimSun]的话,观察到的「方差与协方差值」与“复制”出来的「方差与协方差值」之差就叫做可以接受。我们叫做「模型拟合」([/font]model fit[font=SimSun])可以接受。也代表模型跟我们的数据吻合。如果「拟合指标」差的话,就代表模型跟我们的数据不吻合,也就是我们的模型很有可能是错误的了。[/font]
页:
[1]