残差图在方差分析中的应用

残差图在方差分析中的应用

首页冒险解谜Residual更新时间:2024-05-06

残差的定义

残差(Residual)就是指观测值与其相应拟合值之间的差(见图1,图2)。残差(或误差)由ei确定 。最适合的直线即是残差平方和最小的那条线。残差有如下特征:1)平均值等于0;2)正态分布的;3)应随机分布。

图1 图2

残差图的作用

残差图用于检查模型的拟合优度,确认模型的适合性。

残差图的使用时机

在使用方差分析(ANOVA)、回归分析(Regression)、试验设计(DOE)的时候,都要用到此分析。

残差图的解读

残差值在回归和方差等分析过程中特别有用,因为残差值表示模型能在多大程度上解释观测数据中的变异。它是检查回归及方差分析模型“优劣”的诊断工具。Minitab 提供的残差图有“单独示图”选项,也有“四合一”图形的选项。“四合一”的参见图3,由4部分图形构成:

残差的正态概率图。此图用于残差的正态性检验。如果残差呈正态分布,则此图中的点一般应该形成一条直线。如果图中的点不能形成一条直线,则正态性假设可能不成立。一般数据点占据了对角线,则数据是正态分布的;也可以采用“粗铅检测”做直观判定。在此图中的正态性产生怀疑,则需要对残差数据进行正态性检验(见图4)。

图4

残差与拟合值。此图应显示残差在0两侧的随机模式。此图横轴代表预测值,纵轴代表残差值。因此此图上的点应该分布在一条水平的带子中。若图中有明显的“喇叭口”或弯曲的形状,则表示残差的标准差不是常数,而是随着预测值而变化。这就提示原来的模型假设可能有问题。如果某个点远离大多数点,则该点可能是异常值。残差图中也不应该有任何可识别的模式。

残差的直方图。一种显示残差的一般特征(包括典型值、展开和形状)的研究性工具。一侧的长尾可能表示偏斜分布。如果有一个或两个条形与其他条形距离较远,这些点有可能是异常值。残差应服从正态分布,此图同正态概率图功能类似,均可以对其进行正态性检验。

残差与数据顺序。这是一个所有残差以收集数据的顺序排列的图,可以用于找出非随机误差,特别是与时间相关的效应。此图横轴代表观测值顺序,纵轴代表对应的残差值。这些残差值应在横轴(即残差为0)上下随机波动,不应有任何上升、下降、摆动、跳跃等趋势。若有某种趋势存在,则说明数据观测过程中受到某个未知因素的影响,则应该找出此因素并加以控制。此图有助于检查残差彼此不相关这一假设。

因此,通过以上图3,图4残差图及正态检验判读,可以得出残差模型是“不适配”的结论。图5输出的残差四合一图是正常的情形。

图5

残差异常形态及改进

残差的存在的形态可能指出所选择的模型不适配。如果形态较明显,单变量线性模型可能不是所具有的数据的最佳拟合,或者说,还有其它的关键“ X”。

异常形态举例:

-曲线(起点低,逐渐上升,然后下降);

-随数据收集的时间变化;

图6

-不等变差(一般情况下,值越大,变差越大);

图7

-一个或两个极端值。

图8

改进不良拟合(模型不适配)的方法

针对回归模型出现的特征,可参考下表图9,经过相关工具评估验证后,并采取推荐的解决方案去优化改进。

图9

如果确定模型不满足上面所列标准,就应该:进行检查以确定数据输入是否正确或数据太少等,特别是观测值是否标识为异常。如果残差适度的偏离正态性,不需要过多的关注。尽管如此,我们总是习惯去检查残差,因为它能让我们更好的了解数据。

来源:言质有锂

注:本站转载的文章大部分收集于互联网,文章版权归原作者及原出处所有。文中观点仅供分享交流,如涉及版权等问题,请您告知,我将及时处理!

查看全文
大家还看了
也许喜欢
更多游戏

Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved