当前位置:文档之家› 高二统计案例

高二统计案例

【例题精讲】 【例 1 】 有下列关系:
R2 越接近于 1,则回归效果越好。
1
( 1)人的年龄与他(她)拥有的财富之间的关系;
( 2)曲线上的点与该点的坐标之间的关系;
( 3)苹果的产量与气候之间的关系;
( 4)森林中的同一种树木,其断面直径与高度之间的关系;
( 5)学生与他(她)的学号之间的关系,其中有相关关系的是

A. y =0.08 x- 1.23
B. y =0.08 x+1.23
C. y =1.23 x- 0.08
D. y =1.23 x+0.08
二、填空题. 8.若有一组数据的总偏差平方和为
100,相关指数为 0.5 ,则其残差平方和为 _________.
9.在求两个变量 x 和 y 的线性回归方程过程中,计算得
相关系数最大,则应去掉的一组数据所对应的点是(

A. (3 , 10)
B. (4 , 5)
C. (10 , 12)
D. (1 , 2)
7.假设关于某设备的使用年限 x 和所支出的维修费用 y(万元),有如下的统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
若由资料可知 y 对 x 呈线性相关关系,则线性回归方程为(
该回归方程是

,则
4
11
9
8
5
( 1)变量 y 对 x 进行相关性检验;( 2)如果 y 对 x 有线性相关关系,求回归直线方程;
( 3)若实际生产中,允许每小时的产品中有缺点的零件最多为
10 个,那么机器的运转速度应控制在什么
范围内 ?
8.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国 人受过 9 年或更少教育的百分比 ( x) 和收入低于官方规定的贫困线的人数占本州人数的百分比

A.回归分析
B.独立性检验分析
C.残差分析
D.散点图分析
【能力提高】
7.一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,
每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:
转速 x(转 / 秒)
16 14 12 8
每小时生产有缺点的零件数 y(件)
线性回归方程 ①变量之间的两类关系:函数关系与相关关系;②制作散点图,判断线性相关关系;
③线性回归方程: y bx a (最小二乘法)
n
xi yi nx y
b
i1
n
xi2
2
nx
i1
a y bx
注意:线性回归直线经过定点 (x, y) .
相关系数(判定两个变量线性相关性):
r
n
( xi x)( yi y)
个性化教学辅导教案
学科: 数学 教学 课题
年级: 十一年级
任课教师:
授课时间: 2018 年 月 日
导函数求参数范围问题
教学 目标
1、熟练运用统计案例中的公式进行计算 2、学会分析统计数据
教学 重点 : 统计案例公式的运用 重难点 难点 : 数据的分析
【知识要点】
教学过程
§1.1 回归分析的基本思想及其初步应用
y 对 x 的回归方程.
【例 3 】营养学家为研究食物中蛋白质含量对婴幼儿生长的影响,调查了一批年龄在两个月到三岁的婴幼 儿,将他们按食物中蛋白质含量的高低分为高蛋白食物组和低蛋白食物组两组,并测量身高,得到下面的 数据:高蛋白食物组
年龄 0.2 0.5 0.8
1
1 1.4 1.8 2
2 2.5 2.5 3 2.7
( y i y ) 2 ; ⑵残差: ei y i yi ; ⑶残差平方和:
( yi yi ) 2 ;
i1
i1
⑷回归平方和:
n
( yi
i1
n
y) 2 - ( yi yi ) 2 ;⑸相关指数 R 2 1
i1
n
(yi
i1 n
(yi
i1
yi )2

yi )2
注: ① R 2 的值越大,说明残差平方和越小,则模型拟合效果越好;②
y=7.19 x+73.93 ,用这个模
型预测这个孩子 10 岁时的身高,则正确的叙述是(

A.身高一定是 145.83 cm
B.身高在 145.83 cm以上
C.身高在 145.83 cm以下
D.身高在 145.83 cm左右
2
3.两个变量 y 与 x 的回归模型中,分别选择了
好的模型是(

A.模型 1 的相关指数

【例 2 】 某种书每册的成本费 y(元)与印刷册数 x(千册)有关,经统计得到数据如下:
x
1
2
3
5
10
20
30
50 100 200
y 10.15 5.52 4.08 2.85 2.11 1.62 1.41 1.30 1.21 1.15
检验每册书成本费 y 与印刷册数倒数 1 之间是否具有线性相关关系,如有,求 x
i1
n
n
( xi x)2 ( yi y) 2
i1
i1
注: ⑴ r >0 时,变量 x, y 正相关; r <0 时,变量 x, y 负相关;
⑵① | r | 越接近于 1,两个变量的线性相关性越强;
② | r | 接近于 0 时,两个变量之间几乎不存在线性相关关系.
回归分析中回归效果的判定:
n
n
⑴总偏差平方和:
A.总偏差平方和
B.残差平方和
C.回归平方和
) D.相关指数 R2
2.已知回归直线的斜率的估计值是 1.23 ,样本点的中心为 (4 , 5) ,则回归直线的方程是(

A. y =1.23 x+ 4
B. y =1.23 x+5
C. y =1.23 x+0.08
D. y =0.08 x+1.23
3.相关系数 r 可用来衡量两个变量之间线性相关关系的强弱, 其计算公式为:
C.模型 3 的相关指数
R2 为 0.98 R2 为 0.50
4 个不同模型,它们的相关指数 R2 如下,其中拟合效果最
B.模型 2 的相关指数 R2 为 0.80 D.模型 4 的相关指数 R2 为 0.25
4.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为
y =60+90x,下列判断正确的是(

A.劳动生产率为 1000 元时,工资为 50 元
B.劳动生产率提高 1000 元时,工资提高 150 元
C.劳动生产率提高 1000 元时,工资提高 90 元
D.劳动生产率为 1000 元时,工资为 90 元
5.在回归分析中,残差图中纵坐标为(

A.残差
B.样本编号
C. x
D. en
6.通过 e1,e2,, , en 来判断模拟型拟合的效果, 判断原始数据中是否存在可疑数据, 这种分工称为 (

A.越大
B.越小
C.无法判断
D.以上都不对
5.利用独立性检验来考虑两个分类变量 X 和 Y是否有关系时,通过查阅下表来确定断言“ X 和 Y有关系”
的可信度.如果 k >5.024 ,那么就有把握认为“ X 和 Y 有关系”的百分比为(

P K 2 k 0.50 0.40 0.25
0.15
0.10
0.05
0.025 0.010 0.005 0.001
k
0.455 0.708 1.323 2.072 2.706 3.84 5.024 6.635 7.879 10.83
A. 25%
B. 75%
C. 2.5 %
D.97.5 %
6.如图所示,有 5 组 ( x, y) 数据,去掉其中一组后,剩下的 4 组数据的线性
பைடு நூலகம்
【基础达标】
1.在画两个变量的散点图时,下面哪个叙述是正确的(

A.预报变量在 x 轴上,解释变量在 y 轴上
B.解释变量在 x 轴上,预报变量在 y 轴上
C.可以选择两个变量中任意一个变量在 x 轴上 D.可以选择两个变量中任意一个变量在 y 轴上
2.一位母亲记录了儿子 3~9 岁的身高,由此建立的身高与年龄的回归模型为

则以下正确的命题是( A. r 只能取正值
B. r 可以取任意实数
) C. r 只有大于 0.75 时才认为两个变量有很强的线性相关关系
D. r 大于 0.75 时才认为两个变量有很强的线性相关关系
4.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两
个变量有关系的可能性就(
50 个州的成年 ( y) 的数据,
建立的回归直线方程如下 y 0.8x 4.6 ,斜率的估计等于 0.8 说明 或更少教育的百分比 ( x) 和收入低于官方的贫困线的人数占本州人数的百分比
“大于 0”或“小于 0” )
;成年人受过 9 年
( y) 之间的相关系数
.(填
3
课后练习
一、选择题.
1.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是(
身高 54 54.3 63 66 69 73 82 83 80.3 91 93.2 94 94 低蛋白食物组
年龄 0.4 0.7 1 1 1.5 2 2 2.4 2.8 3 1.3 1.8 0.2 3
身高 52 55 61 63.4 66 68.5 67.9 72 76 74 65 69 51 77 身高与年龄近似有线性关系, 检验: 不同食物的婴幼儿的身高有无差异; 若存在, 这种差异有何特点 ?
相关主题