当前位置:文档之家› 【高考数学】专题十 概率与统计第二十九讲 回归分析与独立性检验(含答案)

【高考数学】专题十 概率与统计第二十九讲 回归分析与独立性检验(含答案)


取的 16 个零件的尺寸:
抽取次序 1
2
3
4
5
6
7
8
零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
抽取次序 9
10
11
12
13
14
15
16
零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得
x
正确的是
A. x 与 y 正相关, x 与 z 负相关 C. x 与 y 负相关, x 与 z 负相关
2.(2014 湖北)根据如下样本数据
B. x 与 y 正相关, x 与 z 正相关 D. x 与 y 负相关, x 与 z 正相关
x
3
4
5
6
7
8
y
4.0
2.5
− 0.5
0.5
− 2.0
− 3.0
得到的回归方程为 yˆ = bx + a ,则
=
1 16
16 i =1
xi
=
9.97 , s
=
1 16
16 i =1
( xi
− x)2
=
1 16
(
16 i =1
xi2
−16x 2 )
16
16
0.212 , (i − 8.5)2 18.439 , (xi − x)(i − 8.5) = −2.78 ,其中 xi 为抽取的
i =1
i =1
第 i 个零件的尺寸, i =1,2,…,16.
专题十 概率与统计
第二十九讲 回归分析与独立性检验
2019 年
1.(2019 全国 1 文 17)某商场为提高服务质量,随机调查了 50 名男顾客和 50 名女顾客, 每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
系,根据一组样本数据( xi , yi )(i=1,2,…,n),用最小二乘法建立的回归方程为 $y =0.85x − 85.71,则下列结论中不.正.确.的是
A.y 与 x 具有正的线性相关关系
B.回归直线过样本点的中心( x , y )
C.若该大学某女生身高增加 1cm,则其体重约增加 0.85kg D.若该大学某女生身高为 170cm,则可断定其体重必为 58.79kg 6.(2011 山东)某产品的广告费用 x 与销售额 y 的统计数据如下表
广告费用 x(万元) 4 2 3 5 销售额 y(万元) 49 26 39 54
根据上表可得回归方程 yˆ = bˆx + aˆ 中的 bˆ 为 9.4,据此模型预报广告费用为 6 万元时销
售额为
A. 万元
B.65.5 万元
C.67.7 万元 D.72.0 万元
二、填空题
7.(2015 北京)高三年级 267 位学生参加期末考试,某班 37 位学生的语文成绩,数学成绩
与总成绩在全年级中的排名情况如下,甲、乙、丙为该班三位学生.
从这次考试成绩看,
①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是

②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是

三、解答题
8.(2018 全国卷Ⅱ)下图是某地区 2000 年至 2016 年环境基础设施投资额 y (单位:亿元)
(2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异?
附: K 2 =
n(ad − bc)2

(a + b)(c + d )(a + c)(b + d )
P(K2≥k) 0.050 0.010 0.001
k
3.841 6.635 10.828
2010-2018 年
一、选择题
1.(2015 湖北)已知变量 x 和 y 满足关系 y = −0.1x +1,变量 y 与 z 正相关,下列结论中
的折线图.
为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回 归模型.根据 2000 年至 2016 年的数据(时间变量 t 的值依次为1,2 ,…,17 )建立模
型①: yˆ = −30.4 +13.5t ;根据 2010 年至 2016 年的数据(时间变量 t 的值依次为
4.(2012 新课标)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn 不
全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线 y = 1 x +1 上,则 2
这组样本数据的样本相关系数为
A.−1
B.0
C.12
D.1
5.(2012 湖南)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关
A. a 0 , b 0 B. a 0 , b 0 C. a 0 , b 0 D. a 0 , b 0 3.(2014 江西)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关
系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最 大的变量是
(1)求 (xi , i) (i = 1, 2,,16) 的相关系数 r ,并回答是否可以认为这一天生产的零件
尺寸不随生产过程的进行而系统地变大或变小(若| r | 0.25 ,则可以认为零件的尺寸不
随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在 (x − 3s, x + 3s) 之外的零件,就认为这
1,2 ,…,7 )建立模型②: yˆ = 99 +17.5t .
(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
9.(2017 新课标Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min 从该
生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽
n
(xi − x )( yi − y)
i =1

n
n
(xi − x )2 ( yi − y)2
条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在 (x − 3s, x + 3s) 之外的数据称为离群值,试剔除离群值,估计这条生产线当天生
产的零件尺寸的均值与标准差.(精确到 0.01)
附:样本 (xi , yi ) (i = 1, 2,, n) 的相关系数 r =
相关主题