线性回归方程分析
n
(xi x)(yi y)
i 1
n
n
(xi x)2 ( yi y)2
i 1
i 1
注:⑴ r >0 时,变量 x, y 正相关; r <0 时,变量 x, y 负相关;
--
--
⑵①| r | 越接近于 1,两个变量的线性相关性越强;
②| r | 接近于 0 时,两个变量之间几乎不存在线性相关关系。
②制作散点图,判断线性相关关系
③线性回归方程: y bx a (最小二乘法)
最小二乘法:求回归直线,使得样本数据的点到它的距离的平方最小的方法
n
xi yi nx y
b
i 1 n
i 1
xi2
2
nx
a y bx
注意:线性回归直线经过定点 (x, y)
2.相关系数(判定两个变量线性相关性): r
故 eˆi yi yˆi yi bˆxi aˆ , eˆ 称为相应于点 (xi , yi ) 的残差。
n
( yi yˆi )2
⑶回归效果判定-----相关指数(解释变量对于预报变量的贡献率)
R2
1
i 1 n
( yi yi )2
i 1
n
2
( R2 的表达式中 ( yi y) 确定)
3.线形回归模型: ⑴随机误差 e :我们把线性回归模型 y bx a e ,其中 a,b 为模型的未知参数, e 称为随机误差。
随机误差 ei yi bxi a ⑵残差 eˆ :我们用回归方程 yˆ bˆx aˆ 中的 yˆ 估计 bx a ,随机误差 e y (bx a) ,所以 eˆ y yˆ 是 e 的估计量,
--
讲义编号:
学员编号:
学员姓名:
课
题
授课日期及时段
教学目标
重点、难点
环球雅思学科教师辅导讲义
组长签字:
签字日期:
年
级: 高二
课时数:3
辅导科目: 数学
学科教师:闫建斌
线性回归方程
2014-2-11
18:00-20:00
线性回归方程基础
教学内 容
1、本周错题讲解
2、知识点梳理
1.线性回归方程 ①变量之间的两类关系:函数关系与相关关系
时间 x
1
2
3
4
5
命中率 y
0.4
0.5
0.6
0.6
0.4
小李这 5 天的平均投篮命中率为________;用线性回归分析的方法,预测小李该月6号打 6 小时篮球的投篮 命中率为________.
解析 小李这 5 天的平均投篮命中率
错误!=错误!=0.5,
可求得小李这 5 天的平均打篮球时间错误!=3.根据表中数据可求得错误!=0.01,错误!=
n(ad bc)2
。
(a b)(c d )(a c)(b d )
(4)临界值 k0 表:
P(k 2 k0 )
0.50
k0
0.455
0.40 0.708
0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
父亲身高 x/cm
174
176
176
176
178
儿子身高 y/cm
175
175
176
177
177
则 y 对 x 的线性回归方程为 A.错误!=x-1 C.错误!=88+错误!x
B.错误!=x+1 D.错误!=176
( ).
解析 因为错误!=错误!=176,
-y =错误!=176,
又 y 对 x 的线性回归方程表示的直线恒过点(错误!,错误!),
典型例题
1.(2011·山东)某产品的广告费用 x 与销售额 y 的统计数据如下表:
广告费用 x/万元
4
2
3
5
销售额 y/万元
49
26
39
54
根据上表可得回归方程错误!=错误!x+错误!中的错误!为 9.4,据此模型预报广告费用为6万元时销售额为
( ).
A.63.6 万元
B.65.5 万元
C.67.7 万元
D.72.0 万元
解析 ∵错误!=错误!=错误!,错误!=错误!=42,
又\o(y,\s\up6(^))=错误!x+错误!必过(错误!,错误!),∴42=错误!×9.4+错误!,∴错误!=9.1.
∴线性回归方程为错误!=9.4x+9.1.
∴当 x=6 时,错误!=9.4×6+9.1=65.5(万元). 答案 B 2.(2011·江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
所以将(176,176)代入 A、B、C、D 中检验知选C. 答案 C
--
--
3.(2011·陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量 x 和 y 的 n 由这些样本点通过最小二乘法得到的线性回归直线(如图),以下 ( ). A.x和y的相关系数为直线 l 的斜率 B.x 和 y 的相关系数在0到 1 之间 C.当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 D.直线 l 过点(错误!,错误!)
如果 k k0 ,就推断“ X ,Y 有关系”,这种推断犯错误的概率不超过 ;否则,在样本数据中没有发现足够证据支 持结论“ X ,Y 有关系”。 (5)反证法与独立性检验原理的比较:
反证法原理 在假设 H 0 下,如果推出矛盾,就证明了 H 0 不成立。
--
--
独立性检 验原理
在假设 H 0 下,如果出现一个与 H 0 相矛盾的小概率事件,就推断 H 0 不成立,且该推断 犯错误的概率不超过这个小概率。
i 1
注:① R 2 得知越大,说明残差平方和越小,则模型拟合效果越好;
② R 2 越接近于 1,,则回归效果越好。
4.独立性检验(分类变量关系): (1)分类变量:这种变量的不同“值”表示个体所属的不同类别的变量。 (2)列联表:列出两个分类变量的频数表,称为列联表。
(3)对于 2 2 列联表: K 2 的观测值 k
解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的
个样本点,直线l是 结论中正确的是
绝对值越接近1,两个变量的线性相关程度越强,所以 A、B 错误.C 中n
为偶数时,分布在 l 两侧的样本点的个数可以不相同,所以 C 错误.根据回
归直线方程一定经过样本中心点可知 D 正确,所以选 D. 答案 D 4.(2011·广东)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月 1 号到 5 号每天打篮球时间 x(单位:小时)与当天投篮命中率 y 之间的关系: