关于SEM系数异常值的处理办法
[align=left]最近看到论坛上好多人发帖问SEM系数异常值该如何处理。下面是本人总结的一些方法,有的地方可能有待进一步的论证,也希望高手拍砖![/align][align=left]像一些前提条件我就不说了,比如数据的预处理、建模等首先是没有问题的才行。[/align][align=left]1.如果涉及到多变量联合正态分布的问题,可以不必过于严格,只要峰度、偏度不是太高一般问题不大,如果该问题很严重的话,可以使用函数转换,不同的问题需要不同的函数转换,如序列的数据与横截面的数据要求的稍有不同,像序列相关(不是共线性)的话,建议负二倍正弦变换,横截面的多用对数等等。[/align][align=left]2.参数约束的方法最常用,主要根据拟合信息和理论依据来选择什么样的方法,像约束相等或为某个具体的数值、根据先验分布确定区间、也可以根据自抽样推断估计的信息综合考虑。[/align][align=left]3.此外,一个很重要的方法是马尔科夫链-蒙特卡洛的结果,这种方法主要用于模拟,设定样本可以获得均值、置信区间、分布特征、自相关等信息,这种方法一般都会非常稳定。[/align][align=left]4.如果是因非线性问题导致的模型拟合不足,或不够稳定。转换回归是个不错的选择,其基本思想是将非线性通过某种算法转换为线性,然后在尝试模型的拟合。一般会好一些。[/align][align=left]5.分样本分别建模,然后取均值(这种方法是见过,不过感觉不是很好,可能是适合特殊的样本吧)[/align][align=left]当然不同问题需对症下药。[/align][img]/attachments/201202/ET42230201202061750031.gif[/img]
页:
[1]