回归方程及回归系数验检性著显的.
3 回归方程及回归系数的显著性检验§
1、回归方程的显著性检验回归平方和与剩余平方和(1)
是否确实存在线性关系呢?这, 回归效果如何呢?因变量与自变量建立回归方程以后我们要进一步研究因变量, 取值的变化规律。
的每是需要进行统计检验才能加以肯定或否定, 为此常用该次观侧值每次观测值的变差大小, 次取值是有波动的, 这种波动常称为变差,
次观测值的总变差可由而全部, 的差(称为离差)来表示与次观测值的平均值总的离差平方和,
: 其中它反映了自变量称为回归平方和 , 是回归值与均值之差的平方和,。
)为自变量的个数的波动的变化所引起的, 其自由度(,
), 是实测值与回归值之差的平方和或称残差平方和称为剩余平方和(的自由度为其自由度。
总的离差平方和。
它是由试验误差及其它因素引起的,
,
, 是确定的即, 如果观测值给定则总的离差平方和是确定的, 因此大则反之小,
或者, 与, 大所以且回归平方和都可用来衡量回归效果, 越大则线性回归效果越显著小则如果越小回归效果越显著, ; 则线性回大, 说剩余平方和0, =如果则回归超平面过所有观测点归效果不好。
复相关系数(2)
人们也常引用无量纲指标, 为检验总的回归效果, (3.1)
或.
, (3.2)
称为复相关系数。
因为回归平方和实际上是反映回归方程中全部自变量的“方差贡献”, 因此因此的相关程度。
显然, 就是这种贡献在总回归平方和中所占的比例表示全部自变量与因变量
因此它可以作为检验总的回归效果的一个指标。
但, 回归效果就越好, 。
复相关系数越接近1
常有较大的并不很大时, 相对于,
与回归方程中自变量的个数及观测组数有关, 当应注意
一般认为应取, 的适当比例的5到10至少为倍为宜。
值与, 因此实际计算中应注意
检验(3)
就是要检验假设, 是否存在线性关系要检验与
, (3.3)
应用统计量否则认为线性关系显著。
检验假设无线性关系, 与成立时当假设, 则
, (3.4)
它服从自由度为即及的分布, , 这是两个方差之比
, (3.5)
应有则当给定检验水平成立, α下, 可检验回归的总体效果。
如果假设用此统计量统计量
, (3.6)≤
由对于给定的置信度α值为, , 的值分布表可查得如果根据统计量算得的个自变量的总体回归效果是显著, 为O, 即不能认为全部, 则拒绝假设即否则认为回归效果不显著。
的,
检验对回归方程进行显著性检验的方法称为方差分析。
上面对回归效果的讨论可归结于一个利用。
如表方差分析表中, 3.1方差分析表表3.1
来方差比方差平方和自由度源回
归
剩余
总
计
: 的以下关系可以导出与根据与的定义,
,。
值多大时回归效果才算是显著的问题。
因为对给定的检验水平α, 由利用这两个关系式可以解决
分布表可查出: 的临界值, 然后由即可求出的临界值
, (3.7)
时, 当则认为回归效果显著。
的回归方程进行显著性检验。
2.13.1利用方差分析对例例。
3.2 方差分析结果见表 3.2 表方差比差方源来平方和自由度
归回
余剩
计总
, 所以例2.1取检验水平分布表得, 而α=0.05, 查的回归方程回归效果是显著的。
2、回归系数的显著性检验前面讨论了回归方程中全部自变量的总体回归效果, 但总体回归效果显著并不说明每个自变量
对因变量都是重要的, 即可能有某个自变量对并不起作用或者能被其它的的作用所代替, 因此对这种自变量我们希望从回归方程中剔除, 这样可以建立更简单的回归方程。
显然某个自变
: 就要检验假设, 是否显著因此检验每个自变量0, 就应取值为则它的系数, 作用不显著量如果对.
, (3.8) ,
: (1) 检验
: 假设下, 可应用在检验
, (3.9) ,
个元素。
其中为矩阵的对角线上第
对应的临界值分布表中可查出与α则拒绝假设对给定的检验水平α, 从, 如果有,
如果有0, 即认为与则接受假设,
有显著差异, 这说明有重要作用不应剔除; 对
应予剔除。
对成立, 即认为这说明不起作用,
: 检验(2)
分布的统计量1, 亦可用服从自由度分别为与的检验假设
, (3.10)
分布表其中, 的主对角线上第为矩阵个元素。
对于给定的检验水平α从
有重要作用。
对则拒绝假设中可查得临界, 如果有认为, ,
可以剔除。
一般一次对, 即认为自变量不起重要作用, 则接受假设, 如果
且这个自变量是所有不显著自变量中值最小者, 然后再建立回归方程, 检验只剔除一个自变量, 并继直到建立的回归方程及各个自变量均显著为止。
续进行检验,
(3.9)因为由, , 最后指出上述对各自变量进行显著性检验采用的两种统计量与实际上是等价的有式及(3.10), 式知
(3.11)
的回归方程各系数进行显著性检验。
3.2例2.1对例: 经计算
,
于是
,
其中=0.004577。
由(3.7)式知=0.002223,
,
,
, , 因为查分布表得,
比胸围, 及, 所以两个自变量都是显著的。
又由说明体长
的影响更大。
对体重
如果应用检验, 查分布表有, 又由
,
,
均为重要都是显著的,
, , 因为因此及应保留在回归方程中。
变量,
偏回归平方和(3)
还可应用偏回归平方和进行检验。
, 检验某一自变量是否显著
的回归平方和为个自变量
,
如果自并设, 个自变量的回归平方和设为, 则剩下的个自变量中去掉
,
就表示变量的偏回归平方和或贡献。
可以证明,
中的贡献在回归平方和称为则
, (3.12)
对回归方程的, 或者说越大, 说明在回归方程中越重要, 对的作用和影响越大偏回归平方和的一个指标。
)贡献越大。
因此偏回归平方和也是用来衡量每个自变量在回归方程中作用大小(贡献大小
的偏回归平方和分别为和2.1中,
例如在例
,
,
大。
的作用比 , 说明在回归方程中
: 的偏回归平方和分别为又如在例及 2.2中
,
,
,
,
在回归方程中所起的作用最小,
最大 , 的值最小即, 说明在回归方程中所起的作用最大。