结构方程论坛SEM-Structural·Equation·Modeling's Archiver

心理学辅导 发表于 2011-7-2 22:10

关于0或1类型变量做CFA,以及潜变量与综合得分的算法一些想法与疑惑

<br /> 本人在最近拟合一份测量中国居民健康素养的问卷,问卷的条目得分方式在种种努力探讨后(涉及对错的条目,您认为成年人的正常脉搏次数是多少?<br /> <br /> ①30~50次/分钟<br /> ②60~100次/分钟<br /> ③100~120次/分钟<br /> ④不知道,答对为1,答错为0),最终仍悲剧的成为了0、1类型的变量。本人开始质疑0、1类型的变量不符合结构方程连续内生变量的前提条件,但在参考了一些文献后发现有人尝试的做了,小弟非常有幸的联系到了作者进行了邮件意见交换,由于对面是大神,我是菜鸟,对方说的我也不能完全理解,就直接贴出来给大家看了:<br /> <br /> 我的问题:<br /> 如果以得分的形式去处理这份问卷,那么所有的题目的答案都将转化为0或1的形式。结构方程有一个假设条件是数据应是连续的正态内生变量,0、1的形式好像不属于这一范畴。所以我想问下现有的形式能不能实现结构方程的处理或者说您对一份非心理类问卷做了什么样处理可以使其可以完成结构方程的处理?谢谢<br /> <br /> 大神A的解答:<br /> 假设条件:在CFA分析里,内生变量你指什么?我想你是说观测变量吧,在SEM谈内生和外生才更有意义。关于0、1变量问题,先思考:如果这个量表为3级、5级或9级选项,是否可以做CFA?这些分数连续且服从正态分布?为什么大家都这么做呢?因为虽然MLE或ULS对分布敏感,特别是小样本,但另有对分布不敏感的方法可用,如GLS,ADF.关于参数估计不同算法的性质和样本量与分布的关系,不是本文研究的内容,故而不提,你有兴趣可以多读些相关文献,但首先复习下Liapunnov中心极限定理。<br /> &nbsp; &nbsp;事实上,正态分布或起码是连续分布的要求是有的,但那只是对本质而言,而非测量结果。比如考试成绩(能力)记录为及格和不及格(观测变量),虽然观测变量是01变量,但本质“能力”还是可以假设为连续的。如果本质是“性别”,观测变量为性染色体X的个数,那么这个就不服从基本假设了。最后,结构方程分析或CFA并非心理问卷专用,健康素养的内涵与其说是生物医学范畴不如说是心理学范畴,所以,“对一份非心理类问卷做了什么样处理可以使其可以完成结构方程的处理”本身不是个合适的问题。<br /> <br /> <br /> <br /> 我本以为所谓的连续或等级变量是相对与测量变量的本质而言,因而进行了证实性因子分析,在我完成数据拟合后又去请教了自己学校的导师,简称大神B。<br /> <br /> 大神B的解答:<br /> 他断然否定了我以0-1变量进行CFA的拟合,他的依据是你的最终数据实际上是完全由0、1组成的矩阵,在计算相关系数时是没有意义的,即便你拥有大样本(我用了13000的样本,因为大神A文章中的有一句话:虽然在大样本条件下,对二分类变量做CFA,参数的极大似然估计是渐进无偏的),同一资料,0-1类型,等级类型,连续类型拟合出的相关系数都是不一样的,将连续变量转换成等级类型后得出的相关系数与连续变量得出的相关系数尚存在差距,0-1类型的就更不用说了。他给出的解决方案是通过LISREL编程将变量转化成四分类相关系数(小弟完全不明白这是什么)的方法进行处理后再计算。<br /> <br /> <br /> 以上是第一个问题,现在说第二个问题,综合得分的计算。<br /> 通过问卷的形式大家也可以看出,所有条目以0-1得分的形式算出总分是不合理的。测量变量得分的简单相加一般都不是好的评估指标,虽然其计算简单,但是,它既没有<br /> 考虑到各测量项目的方差或权重的不同,也没能分离出测量误差。所以我想通过EFA或者CFA去计算量表的综合得分,我起初的想法是如果通过EFA去算综合得分,我就以公因子的方差贡献率去做为它的权重。如果我以CFA去计算,就以潜变量的方差作为权重。但悲剧的是,大神B又断然否决了我的想法<br /> 大神B的意见:首先,综合得分的计算应该优先考虑使用CFA,但我从来没有听过以潜变量的方差去做权重这种算法来计算综合得分,我不知道它的依据何在,LISREL有自己一套计算综合得分的程序,大概十几页,(问之,哪里可得,忘了,大神回:我都看的英文的记不住名字)。你自己去看看吧,小弟一直用AMOS做的,所以完全接不上话,哎。悲惨的我又去研读了下大神A的文章,大神A对这个也没有很好的说明,所以我很迷茫,贴出来大家看看好了:<br /> <br /> 大神A:因子得分和综合得分的计算 计算第i因子的非标化因子得分Li=∑jbij(Aj-Bj),其中bij为非标化的回归系数(regression weight),Aj为第j问卷项目的得分,取值为0或1,Bj为第j问卷项目的平均得分,取值为,i=1,2,j=1, 2, 3, 4, 5,6, 7;计算基本健康技能综合得分S = (^σ12L1+^σ22L2) /((^σ12+σ22),其中, ^σ12、σ22分别为L1和L2的方差估计值,这是使用非标化因子方差作权重<br /> 我想请教下这个因子得分公式的出处,完全没有看懂,大神B也说没见过。希望强人能解答下。<br /> <br /> 我的问题是:1,0、1的变量怎样处理才能进行分析<br /> &nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp;&nbsp;2 ,综合得分的计算LISREL有专门的算法否?<br /> &nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp;&nbsp; &nbsp; 对于2个问题大家有什么看法。小弟先谢谢大家了.最后附上大神A的那篇文章。 </p><p></p>

amos 发表于 2011-7-2 22:15

为什么没人看呢 哎

结构方程 发表于 2011-7-2 22:20

用Mplus处理是否更合理些,我毕业论文里也碰到了类似问题,后来没办法,得毕业,仍然按0、1计分,对应的潜变量只记了个总分,作为单指标潜变量处理的,如何处理单指标潜变量温忠麟书上有;关于潜变量指标得分,之前论坛上有讨论,我见过的用LISREL同学,大多数是算维度得分,虽然这样做不合理,但感觉心理学报等上面发出的文章好像也这么处理的,以上仅为个人想法,请大牛指点!!!

dataanlysis 发表于 2011-7-2 22:25

<strong> 3# <i>sunwq2007</i> </strong><br /> 其实潜变量的得分是可以通过LISREL算出来的,它有自己的一套程序,很简单,你可以去看一下,不会花很长时间。但如何通过潜变量去算综合得分就没见到了。不太想看老外的文章,要复习数学,比较累。现在看来必须看了。国内的就是这样,说不清他的方法到底对不对,可能因为我也比较弱。(注:如果只做到验证性因子分析,那么潜变量得分就是因子得分,大家不要误解)

结构方程爱好者 发表于 2011-7-2 22:30

<strong> 1# <i>IAMGPS</i> </strong> <br /> <br /> 通过LISREL编程将变量转化成四分类相关系数?<br /> 这个过程怎么进行?amos能做吗?

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.