Rank: 9 Rank: 9 Rank: 9

1^# 跳转到 » 倒序看帖

字体大小: tT

semchina发表于 2011-4-9 14:50 | 只看该作者

结构方程建模中的「验证性因子分析」

我们首先来解释一下这个图。凡是长方形的都是「观察变量」（可以看得见的东西），凡是椭圆形的都是「构念」（看不见的东西）。在验证性因子分析里面，长方形的测量项目，椭圆形的是因子。凡是箭头指出来的都是“因”，箭头指向的都是“果”。
凡是双向的箭头代表“只是相关，不知道因果关系”。所以，上面的图可以写成下面的方程组：

x1 =λ1
F1 +ε1

x2 =λ2
F1 +ε2

x3 =λ3
F2 +ε3

x4 =λ4
F2 +ε4

x1与
x2背后的因子是F1，x3 与
x4背后的因子是F2。

F1 与 F2 是相关的（不知道哪一个是因、哪一个是果），相关系数是φ
。

Var(x1)

= Var(λ1
F1 +ε1)

= (λ1)2Var(F1)+Var(ε1)
（因为F1与ε1
是不相关的）

Cov(x1, x2)

= Cov(λ1
F1 +ε1,
λ2
F1 +ε2)

=λ1λ2
Cov(F1,F1)

=λ1λ2
Var(F1)

（变量自己与自己的协方差就是它的方差）

Cov(x1, x3)

= Cov(λ1
F1 +ε1,
λ3
F2 +ε3)

=λ1λ3
Cov(F1,F2)

同样的，我们可以把
x1, x2 , x3,x4 的「方差」和它们的「协方差」写成：

Var(x1) = (λ1)2Var(F1)+Var(ε1)

Var(x2) = (λ2)2Var(F1)+Var(ε2)

Var(x3) = (λ3)2Var(F2)+Var(ε3)

Var(x4) = (λ4)2Var(F2)+Var(ε4)

Cov(x1, x2) =λ1λ2
Var(F1)

Cov(x1, x3) =λ1λ3
Cov(F1,F2)

Cov(x1, x4) =λ1λ4
Cov(F1,F2)

Cov(x2, x3) =λ2λ3
Cov(F1,F2)

Cov(x2, x4) =λ2λ4
Cov(F1,F2)

Cov(x3, x4) =λ3λ4
Var(F2)

为了方便，我们把两个因子（F1与F2）的方差定为 1。同时Cov(F1,F2)= φ
。为什么要把F1与
F2的方差定为 1 呢？因为因子是我们做出来的，它没有量度单位的，我们要给它「标度」（scaling）。把它的方差定为1是其中一种最普遍的「标度」方法。做了「标度」以后，上面10条方程就可以简化为：

Var(x1) = (λ1)2+ Var(ε1)

（1）

Var(x2) = (λ2)2+ Var(ε2)

（2）

Var(x3) = (λ3)2+ Var(ε3)

（3）

Var(x4) = (λ4)2+ Var(ε4)

（4）

Cov(x1, x2) =λ1λ2

（5）

Cov(x1, x3) =λ1λ3 φ

（6）

Cov(x1, x4) =λ1λ4 φ

（7）

Cov(x2, x3) =λ2λ3 φ

（8）

Cov(x2, x4) =λ2λ4 φ

（9）

Cov(x3, x4) =λ3λ4

（10）

这里有10条方程，所有的「方差」与「协方差」（方程等号左边的）都是已知的（它们都是可以观察的）。同时，我们有λ1,λ2,λ3,λ4, Var(ε1) , Var(ε2) , Var(ε3) , Var(ε4) , φ（合共9个参数）是未知的。其实上面这一组的方程是可以为我们估计到9个参数出来的。所以，这是一个「可识别」的模型。因为「方差」与「协方差」的总数（也就是方程的数目）比要估计的参数多了1，所以这个模型的「自由度」（d.f.）是等于1。利用电脑
模拟（simulation），就可以把这9个参数估计出来。

把这9个参数估计出来以后，我们就可以用这9个参数，重新“复制”（计算）出这10个「方差」与「协方差」的值。因为参数是“估计”出来的，“复制”出来的「方差与协方差值」不可能与我们观察到的「方差与协方差值」一模一样。这是什么意思呢？比如在上面的10条方程里，把方程（6）除于方程（7），我们得到：

Cov(x1,x3) / Cov(x1, x4) =λ3 /λ4

同样的，把方程（8）除于方程（9），我们得到：

Cov(x2,x3) / Cov(x2, x4) =λ3 /λ4

理论上两条方程都可以找到λ3 /λ4，但是实际上，数据几乎不可能刚刚是：

Cov(x1, x3) / Cov(x1, x4)= Cov(x2, x3) / Cov(x2, x4)

所以在电脑
做模拟的时候
，就要做很多的取舍，令到最后的参数估计能“复制”一个最接近原来的「方差与协方差值」的“参数组”。

我们观察到的「方差与协方差值」与“复制”出来的「方差与协方差值」之差，就叫做这个模型的「拟合度」。「拟合度」有不同的计算方法，所以有不同的「拟合指标」。一般GFI，CFI，TLI等大于.90，或是RMSEA，SRMR等小于.05的话，观察到的「方差与协方差值」与“复制”出来的「方差与协方差值」之差就叫做可以接受。我们叫做「模型拟合」（model fit）可以接受。也代表模型跟我们的数据吻合。如果「拟合指标」差的话，就代表模型跟我们的数据不吻合，也就是我们的模型很有可能是错误的了。

结构方程建模中的「验证性因子分析」

楼主热帖

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]

站长推荐关闭

结构方程模型专题（1-13）

结构方程建模中的「验证性因子分析」

楼主热帖

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]

站长推荐 关闭

结构方程模型专题（1-13）

站长推荐关闭