我们首先来解释一下这个图。凡是长方形的都是「观察变量」(可以看得见的东西),凡是椭圆形的都是「构念」(看不见的东西)。在验证性因子分析里面,长方形的测量项目,椭圆形的是因子。凡是箭头指出来的都是“因”,箭头指向的都是“果”。
凡是双向的箭头代表“只是相关,不知道因果关系”。所以,上面的图可以写成下面的方程组:
x1 =λ1
F1 +ε1
x2 =λ2
F1 +ε2
x3 =λ3
F2 +ε3
x4 =λ4
F2 +ε4
x1与
x2背后的因子是F1,x3 与
x4背后的因子是F2。 F1 与 F2 是相关的(不知道哪一个是因、哪一个是果),相关系数是φ
。
Var(x1) = Var(λ1
F1 +ε1) = (λ1)2Var(F1)+Var(ε1)
(因为F1与ε1
是不相关的)
Cov(x1, x2) = Cov(λ1
F1 +ε1,
λ2
F1 +ε2) =λ1λ2
Cov(F1,F1) =λ1λ2
Var(F1)
(变量自己与自己的协方差就是它的方差)
Cov(x1, x3) = Cov(λ1
F1 +ε1,
λ3
F2 +ε3) =λ1λ3
Cov(F1,F2)
同样的,我们可以把
x1, x2 , x3,x4 的「方差」和它们的「协方差」写成:
Var(x1) = (λ1)2Var(F1)+Var(ε1)
Var(x2) = (λ2)2Var(F1)+Var(ε2)
Var(x3) = (λ3)2Var(F2)+Var(ε3)
Var(x4) = (λ4)2Var(F2)+Var(ε4)
Cov(x1, x2) =λ1λ2
Var(F1)
Cov(x1, x3) =λ1λ3
Cov(F1,F2)
Cov(x1, x4) =λ1λ4
Cov(F1,F2)
Cov(x2, x3) =λ2λ3
Cov(F1,F2)
Cov(x2, x4) =λ2λ4
Cov(F1,F2)
Cov(x3, x4) =λ3λ4
Var(F2)
为了方便,我们把两个因子(F1与F2)的方差定为 1。同时Cov(F1,F2)= φ
。为什么要把F1与
F2的方差定为 1 呢?因为因子是我们做出来的,它没有量度单位的,我们要给它「标度」(scaling)。把它的方差定为1是其中一种最普遍的「标度」方法。做了「标度」以后,上面10条方程就可以简化为:
Var(x1) = (λ1)2+ Var(ε1)
(1)
Var(x2) = (λ2)2+ Var(ε2)
(2)
Var(x3) = (λ3)2+ Var(ε3)
(3)
Var(x4) = (λ4)2+ Var(ε4)
(4)
Cov(x1, x2) =λ1λ2
(5)
Cov(x1, x3) =λ1λ3 φ
(6)
Cov(x1, x4) =λ1λ4 φ
(7)
Cov(x2, x3) =λ2λ3 φ
(8)
Cov(x2, x4) =λ2λ4 φ
(9)
Cov(x3, x4) =λ3λ4
(10)
这里有10条方程,所有的「方差」与「协方差」(方程等号左边的)都是已知的(它们都是可以观察的)。同时,我们有λ1,λ2,λ3,λ4, Var(ε1) , Var(ε2) , Var(ε3) , Var(ε4) , φ(合共9个参数)是未知的。其实上面这一组的方程是可以为我们估计到9个参数出来的。所以,这是一个「可识别」的模型。因为「方差」与「协方差」的总数(也就是方程的数目)比要估计的参数多了1,所以这个模型的「自由度」(d.f.)是等于1。利用电脑
模拟(simulation),就可以把这9个参数估计出来。
把这9个参数估计出来以后,我们就可以用这9个参数,重新“复制”(计算)出这10个「方差」与「协方差」的值。因为参数是“估计”出来的,“复制”出来的「方差与协方差值」不可能与我们观察到的「方差与协方差值」一模一样。这是什么意思呢?比如在上面的10条方程里,把方程(6)除于方程(7),我们得到:
Cov(x1,x3) / Cov(x1, x4) =λ3 /λ4
同样的,把方程(8)除于方程(9),我们得到:
Cov(x2,x3) / Cov(x2, x4) =λ3 /λ4
理论上两条方程都可以找到λ3 /λ4,但是实际上,数据几乎不可能刚刚是: Cov(x1, x3) / Cov(x1, x4)= Cov(x2, x3) / Cov(x2, x4) 所以在电脑
做模拟的时候
,就要做很多的取舍,令到最后的参数估计能“复制”一个最接近原来的「方差与协方差值」的“参数组”。
我们观察到的「方差与协方差值」与“复制”出来的「方差与协方差值」之差,就叫做这个模型的「拟合度」。「拟合度」有不同的计算方法,所以有不同的「拟合指标」。一般GFI,CFI,TLI等大于.90,或是RMSEA,SRMR等小于.05的话,观察到的「方差与协方差值」与“复制”出来的「方差与协方差值」之差就叫做可以接受。我们叫做「模型拟合」(model fit)可以接受。也代表模型跟我们的数据吻合。如果「拟合指标」差的话,就代表模型跟我们的数据不吻合,也就是我们的模型很有可能是错误的了。 |