当前位置:文档之家› 回归方程和独立性检验知识点

回归方程和独立性检验知识点

回归方程和独立性检验
知识点
Document number:NOCG-YUNOO-BUYTT-UU986-1986UT
回归分析和独立性检验
一、回归分析
1、回归直线方程 a x b y
ˆˆˆ+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=n
i i
n
i i i
x x
y y x x
b
1
2
1
)()
)((ˆ=
∑∑==--n
i i
n
i i
i
x n x
y
x n y
x 1
2
21
(由最小二乘法得出,考试时给出此公式中的一
个)
x b y a
ˆˆ-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。

) 2、几条结论:
(1)回归直线过样本的中心点)(y x ,。

(2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。

(3)斜率b 的含义(举例):
如果回归方程为y=+2, 说明x 增加1个单位时,y 平均增加个单位; 如果回归方程为y=-+2,说明x 增加1个单位时,y 平均减少个单位。

(4)相关系数r 表示变量的相关程度。

范围:1≤r ,即 11≤≤-r
r 越大.,相关性越强.。

0>r 时,y 与x 正相关;0<r 时,y 与x 负相关。

(5)相关指数2R 表示模型的拟合效果。

范围:]10[2,
∈R 2R 越大.,拟合效果越好.
,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀,
带状区域宽度越窄,拟合精度越高)。

2R 表示解释变量x 对于预报变量y 变化的贡献率。

例如:64.02≈R ,表明“x 解释了64%的y 变化”,或者说“y 的差异有64%是由x 引起的”。

(6)线性回归模型 e a bx y ++=, 其中e 叫做随机误差。

(y 是由x 和e 共同确定的。


二、独立性检验
1、原理:假设性检验(类似反证法原理)。

一般情况下:假设分类变量X 和Y 之间没有关系,通过计算2K 值,然后查表对照相应的概率P ,
发现这种假设正确的概率P 很小,从而
推翻假设,最后得出X 和Y 之间有关系的可能性为(1-
P),
也就是“X 和Y 有关系”。

(表中的k 就是2K 的观测值,即2K k =) 2、2⨯2列联表: (考试给出)
部分对照表(考试时会给出用到的一部分数
据):
3、范围:),0(2+∞∈K ; 性质:2
K 越大.,说明变量间越有关系...。

三、典型例题
例1、右表中是生产某种产品x (吨)与相应消耗的煤y (吨)记录数
据:
(1)画出数据的散点图;
)
)()()(()
(2
2d b c a d c b a bc ad n K ++++-=
(3)当7=x 时,25.535.077.0=+⨯=y 所以,估计..
生产7吨产品时,消耗的煤约为吨。

例2、为了考察某药物预防疾病的效果,现对105
人进行试验调查,得到2⨯2列联表。

试判断:服用药物和患病之间是否有关系
解:105=n ,10=a ,45=b ,20=c ,30=d
75
305055)20453010(1052
2
⨯⨯⨯⨯-⨯⨯=K
≈> (提示:运算时尽量先约分化简,再计算)
所以,有1-=%的把握认为服用药物和患病之间有关系。

相关主题