概率与统计的综合
1.(2016·河北名校联考)某校高三学生体检后,为了解高三学生的视力情况,该校从高三六个班的300名学生中以班为单位(每班学生50人),每班按随机抽样方法抽取了8名学生的视力数据.其中高三(1)班抽取的8名学生的视力数据与人数见下表:
(2)已知其余五个班学生视力的平均值分别为
4.3,4.4,4.5,4.6,4.8.若从这六个班中任意抽取两个班学生视力的平均值作比较,求抽取的两个班学生视力的平均值之差的绝对值不小于0.2的概率.
解:(1)高三(1)班学生视力的平均值为4.4×2+4.6×2+4.8×2+4.9+5.18=4.7,故用上
述样本数据估计高三(1)班学生视力的平均值为4.7.
(2)从这六个班中任意抽取两个班学生视力的平均值作比较,所有的取法共有15种,而满足抽取的两个班学生视力的平均值之差的绝对值不小于0.2的取法有:(4.3,4.5),(4.3,4.6),(4.3,4.7),(4.3,4.8),(4.4,4.6),(4.4,4.7),(4.4,4.8),(4.5,4.7),(4.5,4.8),(4.6,4.8),共有10种,故抽取的两个班学生视力的平均值之差的绝对值不小于0.2的概率为P =1015=23
.
2.(2016·天津模拟)电影《霹雳再现》预计在2017年1月上映.某地电影院为了了解当地影迷对票价的看法,进行了一次调研,得到了票价x (单位:元)与渴望观影人数y (单位:万人)的结果如下表:
(1)若y 与x (2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;
(3)根据(2)中求出的线性回归方程,预测票价定为多少元时,能获得最大票房收入.
参考公式:b ^=
∑i =1
n
x i y i -n x y ∑i =1
n
x 2i -n x
2
,a ^=y -b ^
x .
解:(1)由表中数据易知,y 随x 的增大而减小,故y 与x 之间是负相关. (2)由表中数据可得x =45,y =3.5,
∑i =1
4
x i y i -4x y =-35,∑i =1
4
x 2i -4x 2
=500, 则b ^=
∑i =1
4
x i y i -4x y
∑i =1
4
x 2i -4x
2
=-0.07,
a ^
=3.5+0.07×45=6.65,
所以,所求线性回归方程为y ^
=-0.07x +6.65.
(3)根据(2)中的线性回归方程,若票价为x 元,则渴望观影人数为(-0.07x +6.65)万人, 可预测票房收入为z =x (-0.07x +6.65) =-0.07x 2+6.65x ,
易得,当x =47.5时,z 取得最大值,即票价定为47.5元时,能获得最大票房收入. 3.(2016·武汉调研)某城市随机抽取一年内100天的空气质量指数(AQI)的监测数据,结果统计如下:
⎩⎪⎨⎪
⎧
0,0≤x ≤100,4x -400,100<x ≤300,2 000,x >300,
若在本年内随机抽取一天,试估计这一天的经济损失超过400元的概率;
(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为严重污染.根据提供的统计数据,完成下面的2×2列联表,并判断是否有95%的把握认为“该城市本年的空气严重污染与供暖有关”?
附:K2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
解:(1)记“在本年内随机抽取一天,该天的经济损失超过400元”为事件A. 由y>400,得x>200.
由统计数据可知,空气质量指数大于200的频数为35,
所以P(A)=35
100=
7
20.
(2)根据题设中的数据得到如下2×2列联表:
将2×2列联表中的数据代入公式计算,得
K2=100×(22×7-63×8)2
30×70×85×15
≈4.575.
因为4.575>3.841,
所以有95%的把握认为“该城市本年的空气严重污染与供暖有关”.
4.(2016·全国甲卷)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
(1)记A)的估计值;
(2)记B 为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求P (B )的估计值;
(3)求续保人本年度平均保费的估计值.
解:(1)事件A 发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为60+50
200
=0.55,故P (A )的估计值为0.55.
(2)事件B 发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为30+30
200
=0.3,故P (B )的估计值为0.3.
(3)由所给数据得
调查的200名续保人的平均保费为0.85a ×0.30+a ×0.25+1.25a ×0.15+1.5a ×0.15+1.75a ×0.10+2a ×0.05=1.192 5a .
因此,续保人本年度平均保费的估计值为1.192 5a .
5.(2016·山东高考)某儿童乐园在“六一”儿童节推出了一项趣味活动.参加活动的儿童需转动如图所示的转盘两次,每次转动后,待转盘停止转动时,记录指针所指区域中的数.设两次记录的数分别为x ,y .奖励规则如下:
①若xy ≤3,则奖励玩具一个; ②若xy ≥8,则奖励水杯一个; ③其余情况奖励饮料一瓶.
假设转盘质地均匀,四个区域划分均匀.小亮准备参加此项活动. (1)求小亮获得玩具的概率;
(2)请比较小亮获得水杯与获得饮料的概率的大小,并说明理由. 解:用数对(x ,y )表示儿童参加活动先后记录的数, 则基本事件空间Ω与点集S ={(x ,y )|x ∈N ,y ∈N , 1≤x ≤4,1≤y ≤4}一一对应. 因为S 中元素的个数是4×4=16, 所以基本事件总数n =16.
(1)记“xy≤3”为事件A,则事件A包含的基本事件数共5个,即(1,1),(1,2),(1,3),(2,1),(3,1).
所以P(A)=5
16,即小亮获得玩具的概率为
5
16.
(2)记“xy≥8”为事件B,“3<xy<8”为事件C.
则事件B包含的基本事件数共6个,即(2,4),(3,3),(3,4),(4,2),(4,3),(4,4).所以P(B)
=6
16=
3
8.
所以事件C包含的基本事件数共5个,
即(1,4),(2,2),(2,3),(3,2),(4,1).
所以P(C)=
5
16.因为
3
8>
5
16,
所以小亮获得水杯的概率大于获得饮料的概率.
6.(2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的
部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
解:(1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.
依题意,w至少定为3.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:
根据题意,该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).。