回归分析和独立性检验
一、回归分析
1、回归直线方程 a x b y
ˆˆˆ+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=n
i i
n
i i i
x x
y y x x
b
1
2
1
)()
)((ˆ=
∑∑==--n
i i
n
i i
i x n x
y
x n y
x 1
2
21
(由最小二乘法得出,考试时给出此公式中的一个)
x b y a
ˆˆ-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。
) 2、几条结论:
(1)回归直线过样本的中心点)(y x ,。
(2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。
(3)斜率b 的含义(举例):
如果回归方程为y=2.5x+2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y=-2.5x+2,说明x 增加1个单位时,y 平均减少2.5个单位。
(4)相关系数r 表示变量的相关程度。
范围:1≤r ,即 11≤≤-r
r 越大.,相关性越强.。
0>r 时,y 与x 正相关;0<r 时,y 与x 负相关。
(5)相关指数2
R 表示模型的拟合效果。
范围:]10[2
,
∈R 2R 越大.,拟合效果越好.
,(这时:残差平方和越小,残差点在带状区域内的分布比较均匀, 带状区域宽度越窄,拟合精度越高)。
2R 表示解释变量x 对于预报变量y 变化的贡献率。
例如:64.02
≈R ,表明“x 解释了64%的y 变化”,或者说“y 的差异有64%是由x 引起的”。
(6)线性回归模型 e a bx y ++=, 其中e 叫做随机误差。
(y 是由x 和e 共同确定的。
)
二、独立性检验
1、原理:假设性检验(类似反证法原理)。
一般情况下:假设分类变量X 和Y 之间没有关系,通过计算2
K 值,然后查表对照相应的概率P , 发现这种假设正确的概率P 很小,从而推翻假设,最后得出X 和Y 之间有关系的可能性为(1-P), 也就是“X 和Y 有关系”。
(表中的k 就是2
K 的
观测值,即
2K k =)
)
)()()(()(2
2
d b c a d c b a bc ad n K ++++-=
2、2⨯2列联表: (考试给出)
部分对照表(考试时会给出用到的一部分数据):
3、范围:),0(2
+∞∈K ; 性质:2K 越大.,说明变量间越有关系...。
三、典型例题
估计..
生产7吨产品时,消耗的煤约为5.25吨。
例2、为了考察某药物预防疾病的效果,现对105人进行
试验调查,得到2⨯2列联表。
试判断:服用药物和患病之间是否有关系?
解:105=n ,10=a ,45=b ,20=c ,30=d
75
305055)20453010(1052
2
⨯⨯⨯⨯-⨯⨯=K
≈6.109>5.024 (提示:运算时尽量先约分化简,再计算)
所以,有1-0.025=97.5%的把握认为服用药物和患病之间有关系。