缺失值的处理
SEM对缺失值很敏感,所以要正确处理。缺失值的处理针对非随机性的缺失,没有什么好方法,一般针对随机和完全随机的方法包括:
插补的方法:
1.均数、中位数和众数:这种方法很简单,就直接替换就好,但最好要结合实际问题而论,要是您的问题对边缘值很敏感,用均值显然是不合适的。
2.建模插补法:这种方法的效果比较好。
分类变量的分析一般使用列联表分析等技术,连续变量主要是通过建立模型用于预测缺失值,具体的模型根据实际建模而定,也可以根据分布形态来预测,像指数分布、正态分布、混合分布等,进一步的可以使用模拟技术来预测。
3.多重插补法:就是对多次插补的结果进行综合分析,得出最终的结论。
[img]/attachments/201202/ET40549201202011942271.gif[/img]
找了很久。
页:
[1]