样本量带来的问题
样本量的大小会时刻影响系数的解释,线性方程中最重要的几个指标均受到样本量的影响,如F、R2、回归系数等等,这样一来,根据样本量的不同,其解释,尤其是推广的意义将发生剧烈的变化,通常情况下,显著性可以用于推广结果,但大样本下的结果,会使得原本很小的系数(或影响关系)变的显著,那么这个结果该如何视之!与次类似的还有筛选变量的过程中,筛选标准将不足以采信。
一般常用的解决方法是参考相关系数与相关程度的对应表,而不仅仅视显著性而定。具体系数的解释上也要小心,不过可以根据行业规则解释,也可以按数据本身的特点,像均值、全距等信息,解释变量间精确的数量关系。
2013-7-25 14:07:21 上传
筛选变量过程中可以结合:
1)信息准则可以用于判断模型的简约性,故可以提供筛选准则;
2)在一些线性模型中,偏R2也被用于这类问题的处理,相对不会受到样本量的影响,例如逐步判别的分析方法中。
3)最后一个就是模型本身的特点,如构建线性,非线性模型中,模型残差本身提供了很多这方面的信息,例如残差线性趋势。
页:
[1]