当前位置:文档之家› 统计案例练习习题(答案已做)

统计案例练习习题(答案已做)

欢迎阅读③线性回归方程: y bx a (最小二乘法)nx i y i nxyi1b nx i 2 nx 2i1a y bx注意:线性回归直线经过定点 (x,y ) 。

2. 相关系数(判定两个变量线性相关性): rn(x i x)(y i y)i1 nn(x i x)2 (y i y) 2 i 1 i 1注: ⑴r >0时,变量 x, y 正相关; r <0 时,变量 x, y 负相关;2)|r | 越接近于 1,两个变量的线性相关性越强; |r| 接近于 0时,两个变量之间几乎不存在线性相关关系。

3.回归分析中归效果的判定:n1)回归平方和:(y i y )2i1nn (y i y i )(yi yi)2 相关指数 R 2 1 i n 1i 1(y i y i )i1注: ① R 2得知越大,说明残差平方和越小,则模型拟合效果越好;② R 2 越接近于 1,,则回归效果越好。

、选择题统计案例专题练习(高二文)、知识点归纳 1.线性回归方程①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系4.独立性检验(分类变量关系): 随机变量 K 2 越大,说明两个分类变量,关系越强,反之, 越弱。

K=欢迎阅读1.下列属于相关现象的是()A.利息与利率B.居民收入与储蓄存款C.电视机产量与苹果产量D.某种商品的销售额与销售价格2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()2 2 2 2A.K2 3.841 B.K2 3.841 C.K2 6.635 D.K2 6.635 3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.其中不是函数关系的有()A.0 个B.1 个C.2 个D.3 个4.当K2 3.841时,认为事件 A 与事件 B ()A.有95%的把握有关B.有99%的把握有关C.没有理由说它们有关D.不确定5.已知回归直线方程y bx a ,其中 a 3且样本点中心为(1,2),则回归直线方程为()A.y x 3 B.y 2x 3 C.y x 3 D.y x 3 6.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300 名学生,得到如下列联表:你认为性别与是否喜欢数学课程之间有关系的把握有()A.0 B.95% C.99% D.100%8.在回归直线方程y a bx 中,回归系数 b 表示()A.当x 0时,y的平均值B.x变动一个单位时,y 的实际变动量C.y 变动一个单位时,x的平均变动量D.x 变动一个单位时,y的平均变动量9.对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的C.回归分析中,如果r 2 1,说明x 与y 之间完全相关D.样本相关系数r ( 1,1)10. 在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x 轴上,预报变量在y轴上(C)可以选择两个变量中任意一个变量在x轴上(D)选择两个变量中任意一个变量在y 轴上11、一位母亲记录了儿子3~9 岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93 用这个模型预测这个孩子10 岁时的身高,则正确的叙述是()A. 身高一定是145.83cm;B.身高在145.83cm 以上;C.身高在145.83cm以下;D. 身高在145.83cm 左右.12、两个变量y 与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B. 模型2的相关指数R2为0.80C.模型3的相关指数R2为0.50D. 模型4的相关指数R2为0.2514、工人月工资y(元)依劳动生产率x(千元)变化的回归直线方程为y? 60 90x ,下列判断正确的是()A.劳动生产率为1000元时,工资为50 元B. 劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90 元D. 劳动生产率为1000元时,工资为90元15、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就()A. 越大B.越小C.无法判断D.以上都不对16、对分类变量X 与Y 的随机变量K 2的观测值K ,说法正确的是()A . k 越大," X 与Y 有关系”可信程度越小;B . k 越小," X 与Y 有关系”可信程度越小;C . k 越接近于0," X 与Y 无关”程度越小D . k 越大," X 与Y 无关”程度越大17、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100 个吸烟的人中必有99人患有肺病;B. 从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D. 以上三种说法都不正确.18、设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y 关于x 的回归直线的斜率是b,纵截距是a ,那么必有()A. b 与r 的符号相同B. a 与r 的符号相同C. b 与r 的相反D. a 与r 的符号相反则与的线性回归方程为必过()A.(2,2)点B. (1.5 ,0)点C. (1,2)点D. (1.5 ,4)点20、已知回归直线的斜率的估计值是1.23 ,样本点的中心为(4 ,5),则回归直线的方程是()A. y =1.23x + 4B. y =1.23x+5C. y =1.23x+0.08D. y =0.08x+1.2321、为研究变量 x 和 y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程 l 1和l 2 ,两人计算知 x 相同, y 也相同,下列正确的是 ( )A. l 1与l 2重合B. l 1与l 2一定平行C. l 1与l 2相交于点 (x,y)D. 无法判断 l 1和l 2是否相交 22、下列说法正确的有 ( )①回归方程适用于一切样本和总体。

②回归方程一般都有时间性。

③样本取值的范围会影响回 归方程的适用范围。

④回归方程得到的预报值是预报变量的精确值。

23、考察棉花种子经过处理跟生病之间的关系 得到如下表数据:根据以上数据,则 ( ) A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C.种子是否经过处理决定是否生病 D. 以上都是错误的 24.某化工厂为预测某产品的回收率 y ,需要研究它和原料有效成份含量之间的相关关系,现取了 8 对观测值,计算得:8x i y i 1849 ,则 y 与 x 的回归直线方程是()i1A. y 11.47 2.62x B. y 11.47 2.62x C. y 2.62x 11.47 x D. y 11.47 2.62x25.如图所示,图中有 5 组数据,去掉 B 组数据后,剩下的 4 组 性最大( )A. EB. C C. D D. A26.为调查吸烟是否对患肺癌有影响, 某肿瘤研究所随机地调查 如下结果(单位:人)根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A. 90% B. 95% C. 99% D. 100%27.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:A. ①②B. ②③C. ③④ 数据的线性相关了 9965 人,得到D. ①③888x i 52 , y i 228 , x i 2478 , i 1i 1i1你认为婴儿的性别与出生时间有关系的把握为()A.80% B.90% C.95% D.99%28.已知线性相关关系的两个变量建立的回归直线方程为y a bx ,方程中的回归系数b()A.可以小于0 B.只能大于0 C.可以为0 D.只能小于029.每一吨铸铁成本y c (元)与铸件废品率x%建立的回归方程y c 56 8 x,下列说法正确的是()A.废品率每增加1%,成本每吨增加64 元B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8 元D.如果废品率增加1%,则每吨成本为56 元30.下列说法中正确的有:①若r 0,则x增大时,y也相应增大;②若r 0,则x增大时,y也相应增大;③若r 1,或r 1,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上()A.①② B.②③C.①③ D.①②③二、填空题31.对于回归直线方程y 4.75x 257 ,当x 28时,y的估计值为.32.直线回归方程y a bx 恒过定点.34、若一组观测值(x1,y1)(x2,y2)⋯(x n,y n)之间满足y i=bx i+a+e i (i=1 、2. ⋯n)若e i 恒为0,则R2为35、若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为___________ 回归平方和为____37、某考察团对全国10大城市进行职工人均平均工资x与居民人均消费y进行统计调查, y与x具有相关关系,回归方程y? 0.66x 1.562 (单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为()三、解答题38、某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392 名成年人进行调查,所得数据如下表所示:100件产品,对于教育机构的研究项目,根据上述数据能得出什么结论.39、某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取 检验后得到如下联表: 请问甲、乙两线生产的产品合格率在多大程度上有关系? 40、若两个分类变量 X 与 Y 的列联表为: 则“X 与 Y 之间有关系”这个结论出错的可能性为多少? 四、课下练习 1.在画两个变量的散点图时,下面哪个叙述是正确的 ( A. 预报变量在 x 轴上,解释变量在 C.可以选择两个变量中任意一个在 2.下列说法正确的有 ( ) ①回归方程适用于一切样本和总体。

y 轴上x 轴上) B.解释变量在 D. 以选择两个变量中任意一个在 y 轴上 x 轴上,预报变量在 y 轴上 ②回归方程一般都有时间性。

③样本取值的范围会影 响回归方程的适用范围。

④回归方程得到的预报值是预报变量的精确值。

相关主题