结构方程论坛SEM-Structural·Equation·Modeling's Archiver

数据分析 发表于 2011-7-2 16:44

一个老生常谈的问题:虚拟变量与分类变量能否在一个SEM中并存?

论坛上有不少童鞋和我有着同样的问题,那就是关于SEM变量标准化的问题,版主曾在一个贴子下很模糊地说参考Fisher 1946文章, 可是文章不给个标题,非牛人的我就无从参考,遂又将版上其他童鞋已经提过的问题又再次提问,希望有经验的研究者能给我们一些答案或建议:<br /> <br /> 我的调查问卷的答案设计,有三种方式:1)“有”,“没有”型,以1或0定量<br /> 2)程度型,以1,2,3,4分别定量”完全不同意“,”不好说“,”同意“,”完全赞同“<br /> 3)让受访者直接填数字,比如,考试分数。<br /> <br /> 为了使用SEM,我将第3个”考试分数“分类一下,使其成为分类变量,1:90以上,2:80-90,3:70-80, 4:60-70,5:不及格<br /> <br /> 即使这样,我还有一个担心就是变量的标准化,我需不需要按照0-1变量的标准来定义我的分类变量,即:<br /> 1)“有”,“没有”型,以1或0定量<br /> 2)1,2,3,4程度型变量以0.25, 0.5&nbsp;&nbsp;0.75 1 (控制在0-1之间)<br /> 3)由高考分数转化的分类变量改为:0.2, 0.4, 0.6, 0.8,1(也和2)一样,控制在0-1之间<br /> <br /> 这样就可以保证所有的观测变量都在同一个区间0-1之间。需要这样处理吗?还是说0-1虚拟变量可以和1-4或1-5分类变量同时使用在SEM中?

51jijin 发表于 2011-7-2 16:49

本来是想回复前面那个悬赏贴的,但是一则怕有人说我财迷,二则那贴的主题太分散,我想还是一次回答一个问题比较好,<br /> 谈一些我个人的观点,不知道对错,别问我要文献依据,自己去网上找。<br /> <br /> 1.&nbsp;&nbsp;楼主的这个问题的实质,是 “等级变量和非正态变量”如何分析的问题,0-1变量,只是等级变量的特例<br /> <br /> 2、在一般的分析中,我们是假设将等级变量(李科特变量就是典型的等级变量)作为连续变量在处理。事实上这样做的统计结果是有偏的。<br /> <br /> 3、如果你用的是原始数据进行分析,那么你应当知道,在生成 psf 后,需要有一个将等级变量设置为连续变量的过程。<br /> <br /> 4、有文献分析认为,对于7点尺度以上的等级变量,与连续变量的统计分析结果差别不大。我一直想验证这一结论,但是我没有时间。<br /> <br /> 5、如果你不想将等级变量连续化,或者你不能将等级变量连续化(如0-1二分变量),那么,你可以按以下步骤来处理,虽然这是SEM方法分析等级数据或高度非正态分布数据时的不得已的方法,但是聊胜于无。<br /> <br /> =====================这是传说中的分隔线====================<br /> <br /> 当观测变量是数值型变量,但是却高度非正态时,用lisrel的默认方法来进行分析,通过计算协方差矩阵或者积差相关矩阵,并且用ML或者GLS方法来拟合,是错误的,因为这会严重歪曲参数估计的值,得到错误的卡方值和标准误。(有文献认为是低估)<br /> <br /> 较好的方法,是采用等级样本协方差矩阵,用WLS方法进行估计,并采用正确的加权矩阵。同时,样本容量要求尽可能的大,否则有害无益。<br /> <br /> 仅供参考。                   <ul class="s_clear">

心理学辅导 发表于 2011-7-2 16:54

<strong> 1# <i>yellowriver</i> </strong> <br /> <br /> 补充一下: 你对数据进行标准化之前,需要先了解一下标准化的意义和作用。<br /> 对于正态分布(包括很大程度上偏离正态分布的伪正态分布)的数据来说,是否对数据进行标准化,对结果影响不大。<br /> 另外:你将连续变量转为 等级变量,实际上损失了很多信息,属于 倒行逆施。                   <ul class="s_clear">

华南心理学 发表于 2011-7-2 16:59

知道了,谢谢

心理学辅导 发表于 2011-7-2 17:04

学习了,谢谢

variable 发表于 2011-7-2 17:09

在lisrel 及mplus中不管是連續或類別變項並存皆可<br /> 透過求得特殊矩陣來進行分析

database 发表于 2011-7-2 17:14

我果真是菜鸟级的。。。

考博论坛 发表于 2011-7-2 17:19

先对变量做逻辑回归,然后再估计结构方程系数的时候不要选ML,用WLS,加权最小二乘~~&amp;nbsp; 如果类别多的话,可以把它当数值处理,去平均水平就行了~~我可不是瞎说阿,美国人在考虑收入分组的时候就是这么干的<br /> 转载:本文来自: 人大经济论坛 详细出处参考:http://bbs.pinggu.org/viewth ... 1&amp;from^^uid=98225

sopheia 发表于 2011-7-2 17:24

可是我想问一下 如何做逻辑回归 或者说分组回归,哪位大牛能提供以下参考资料?

51jijin 发表于 2011-7-2 17:29

3个月来最经典的回复了

页: [1]

Powered by Discuz! Archiver 7.2  © 2001-2009 Comsenz Inc.