第十二章 线性回归分析练习题一、最佳选择题1.X Y S ,表示( )。
A.Y的离散程度 B .ˆY对Y 的离散程度 C .Y 和X 的离散程度 D .Y 对ˆY的离散程度 E.X 的离散程度 2. 用最小二乘法确定直线回归方程的原则是各观察点距直线的( )。
A . 纵向距离之和最小B .纵向距离的平方和最小C .垂直距离之和最小D .垂直距离的平方和最小确E .纵向距离的平方和最大3. Y =14+4X 是1-7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重 换成国际单位kg ,则此方程( )。
A . 截距改变B . 回归系数改变C . 两者都改变D .两者都不改变E .相关系数改变4.直线回归系数假设检验,其自由度为( )。
A. nB. n -1C. n -2D. 2n -1 E. 2(n -1)5. 当r =0时,Y=a +bX 回归方程中( )。
A .a 必大于零B .a 必等于XC .a 必等于零D .a 必等于YE .a 必等于b6.在多元线性回归分析中,应变量总离均差平方和可以分解为回归平方和与残差平方和 两部分,试回答残差系指 ( )。
A .观察值i Y 与估计值ˆiY 之差 B .观察值i Y 与平均值Y 之差C .估计值ˆiY 与平均值Y 的平方和之差 D .观察值i Y 与平均值Y 之差的平方和E .观察值i Y 与估计值ˆiY 之差的平方和二 、问答题1.用什么方法考察回归直线是否正确?2.简述回归系数方差分析Y 的平方和自由度的分解。
3.简述回归分析中Y 的标准差Y S 与剩余标准差X Y S ,的区别和联系。
4. 简述Y S ˆ与0Y S 的区别。
5.举例说明如何用直线回归方程进行预测和控制? 6.直线回归分析时怎样确定自变量和因变量? 7.简述曲线回归常用的几种曲线形式。
三、计算题1.一个产科医师发现孕妇尿中雌三醇含量与产儿体重有关,并且两者之间成正相关。
现收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。
结果如下表,求直线回归方程并对回归系数作假设检验。
待产妇尿中雌三醇含量与新生儿体重关系编号 尿雌三醇 新生儿体重 编号 尿雌三醇 新生儿体重 (mg/24h ) (kg ) (mg/24h ) (kg ) (1) (2) (3) (4) (2) (3) 1 7 2.5 17 17 3.2 2 9 2.5 18 25 3.2 3 9 2.5 19 27 3.4 4 12 2.7 20 15 3.4 5 14 2.7 21 15 3.4 6 16 2.7 22 15 3.5 7 16 2.4 23 16 3.5 8 14 3.0 24 19 3.4 9 16 3.0 25 18 3.5 10 16 3.1 26 17 3.6 11 17 3.0 27 18 3.7 12 19 3.1 28 20 3.8 13 21 3.0 29 22 4.0 14 24 2.8 30 25 3.9 15 15 3.2 31 24 4.3 16 16 3.22.为探讨某地饮水中氟含量与氟骨症的关系,试对测量得到的下列8对数据进行直线相 关分析 。
氟含量(mg/L )X : 0.47 0.64 1.00 1.47 1.60 2.86 3.21 4.71患 病 率(%)Y : 22.37 23.31 25.32 22.29 28.57 35.00 46.07 46.08(1)按此资料绘制散点图?(2)求直线回归方程并对回归系数作假设检验。
(3)试估计氟含量为2.00 mg/L 时,患病率平均增加多少,计算其95%的可信区间,并 说明其含义。
(4)求氟含量为2.00 mg/L 时,患病率Y 值的95%的容许范围,并解释其含义。
练习题参考答案一、最佳选择题:1.D 2.B 3.C 4.C 5.D 6.A二 、问答题1.答:用以下三种方法判定: (1)直线必须通过点(X ,Y )。
(2)若纵坐标、横坐标无折断号,将此线左端延长与纵轴相交,焦点的纵坐标必等于截距a 。
(3)直线是否在自变量X 的实测范围内。
2.答:SS 总即2Y Y ∑(-),为反应变量Y 的离均差平方和,表示在未考虑X 与Y 的回归关系时Y 的变异,可分解为两部分的变异,一部分为回归平方和,另一部分为剩余平方和,分别用SS 回和SS 剩表示。
这三个平方和,各有其相应的自由度ν,其关系为:ννν总回残=+,1n ν=-总,1ν回=,n -2ν残=。
3.答:Y S 表示在总体中,当X 为某一定值时,个体Y 值的波动范围。
而剩余标准差,Y XS 是指当X 对Y 的影响被扣除后,Y 方面仍有变异。
这部分变异与X 无关,纯属抽样变异。
当X 与X 接近且充分大时,可用,Y X S 代替Y S 。
4.答:Y ∧是X 对应Y 的总体均数的一个样本估计值,YS ∧是反映其抽样误差大小的标准误,其计算公式为YXYX YS S S ∧==0Y S 是反映个体Y 值的容许区间大小的,也就是说当总体中X 为某定值时,Y 值由于随机误差影响在0Y ∧上下波动的范围的大小就取决于标准差Y S ,其计算公式为0Y YXYX S S S ==。
5.答:步骤如下:(1)根于研究目的确定预报因子(X )和预报量(Y ),由X 估计Y 值,收集资料。
(2)建立预报方程bX a Y +=,并进行回归系数假设检验。
若P 小于检验水准,则回归方程成立。
(3)根据回归方程在X 实测范围内对Y 进行预测,并计算X 为某定值时,个体Y 值波动范围(容许区间)。
例如:1-7岁儿童,X 为年龄,Y 为体重,可根据年龄预测(估计)体重。
统计控制是利用回归方程进行逆估计,如要求因变量Y 值在一定范围内波动,可以通过控制自变量X 的取值来实现。
步骤同前。
例如:针刺哑门穴,进针深度Y 与颈围X 间存在直线关系,可根据X 取值达到控制Y 的目的。
6.答:(1)Ⅰ型回归中,X 为精密测定和严格控制的变量,Y 为正态变量。
表示原因的为X ,表示结果的为Y 。
(2)Ⅱ型回归中,X 、Y 均为服从正态分布的随机变量,互为因果,可计算两个回归方程。
何者为X ,何者为Y ,根据研究目的确定。
如身高、体重两变量,若目的只是由身高估计体重,则确定X 为身高,Y 为体重。
7.答:曲线回归常用的几种曲线形式有: (1)指数函数(()a bX Y e +=),当b >0时,Y 随X 上升而上升;当b <0时,Y 随X 上升而下降。
(2)幂函数(b Y aX =),当b >0时,Y 随X 上升而上升;当b <0时,Y 随X 上升而下降。
(3)对数函数(ln Y a b X =+),当b >0时,Y 随X 上升而上升,先快后慢;当b <0时,Y 随X 上升而下降,先快后慢。
(4)logistic 函数(11a bXY e +=+),当b >0时,Y 随X 上升而下降;当b <0时,Y 随X 上升而上升。
三、计算题 1.解: (1)计算获得:534X =∑,29876X=∑,99.2Y =∑,2324.8Y =∑,1750XY =∑,3.2X =,17.23Y =()()53499.2175041.2031X X Y Y ⨯--=-=∑()225349876677.4231X X -=-=∑代入公式:()()()4120.061677.42X X Y Y b X X --===-∑∑ 3.20.06117.23 2.15a Y bX =-=-⨯= ˆ21.50.061Ya bX X =+=+(2)回归系数假设检验:0:0H β=,即孕妇尿中雌三醇含量与产儿体重有直线关系1:0H β≠,即孕妇尿中雌三醇含量与产儿体重无直线关系 0.05α=由上面的计算结果: ()2677.42X X -=∑,()26.74Y Y -=∑,()() 4.12X X Y Y --=∑()2241.2ˆ 6.74 4.23677.42Y Y -=-=∑.0.38X Y S ==,0.15b S ==所以,0.614.140.15t ==自由度31229v =-=,查t 值表,0.01/2,29 2.756t =,0.01P <,按0.05α=检验水准,拒绝0H ,认为待产妇24小时尿中雌三醇含量与产儿体重之间存在线性回归关系。
2.解:(1) 散点图如下氟含量与患病率的散点图0510152025303540455000.511.522.533.544.55氟含量(mg/L)患病率(%)(2) 由原始数据及散点图初步分析,估计本资料有直线趋势,故作下列计算 15.96X =∑,247.02X =∑, 2.00X =249.01Y =∑,28468.78Y =∑,31.13Y =,594.25XY =∑()22215.9647.0215.188XXX l X n =-=-=∑∑ ()222249.018468.78718.038YYY l Y n =-=-=∑∑()()15.96249.01594.2597.488XYX Y l XY n ⨯=-=-=∑∑∑97.486.4215.18XY XX l b l ===31.13 6.42 2.0018.29a Y bX =-=-⨯=回归系数假设检验:0:0H β=,即氟含量与患病率之间无线性关系 1:0H β≠,即氟含量与患病率之间有线性关系 0.05α=718.028YY SS l ==总2297.48625.98315.18XY XX l SS l ===回718.028625.98392.045SS SS SS =-=-=剩总回①方差分析(见表):方差分析表变异来源 SS df MS F P 回归 625.983 1 625.983 40.805 <0.01剩余 92.045 6 15.341总变异718.0287计算得16.147F =,查F 界值表,得P <0.01,按0.05α=水准,拒绝0H ,接受1H ,可认为氟含量与患病率间有直线关系。
② t 检验:0:0H β=,即氟含量与患病率之间无线性关系 1:0H β≠,即氟含量与患病率之间有线性关系 0.05α=718.028YY SS l ==总2297.48625.98315.18XY XX l SS l ===回718.028625.98392.045SS SS SS =-=-=剩总回3.92Y X S •===0 6.38b b t S -====按6v =,查t 界值表,得0.001P <,按0.05α=水准,拒绝0H ,接受1H ,结论同上。
本题t F ===39.681.40,故可用直线回归方程ˆ18.29 6.42Ya bX X =+=+来描述患病率与增加氟含量的关系。