测试题1.下列说法中错误的是()A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1,2,3,…, n)将散布在一条直线附近B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。
C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与 x之间的回归直线方程是()A.B. C.D.3.回归直线必过点()A.(0,0)B. C. D.4.在画两个变量的散点图时,下面叙述正确的是()A.预报变量在轴上,解释变量在轴上B.解释变量在轴上,预报变量在轴上C.可以选择两个变量中任意一个变量在轴上D.可以选择两个变量中任意一个变量在轴上5.两个变量相关性越强,相关系数r()A.越接近于0 B.越接近于1 C.越接近于-1 D.绝对值越接近16.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为()A.0 B.1 C.-1 D.-1或17.一位母亲记录了她儿子3到9岁的身高,数据如下表:年龄(岁)3456789身高(94.8104.2108.7117.8124.3130.8139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()A.她儿子10岁时的身高一定是145.83B.她儿子10岁时的身高在145.83以上C.她儿子10岁时的身高在145.83左右D.她儿子10岁时的身高在145.83以下8.两个变量有线性相关关系且正相关,则回归直线方程中,的系数()A.B.C.D.能力提升:9.一个工厂在某年每月产品的总成本y(万元)与该月产量x(万件)之间有如下数据:x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求每月产品的总成本y与该月产量x之间的回归直线方程。
10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业部门内随机抽选了10个企业作样本,有如下资料:产量x(千件)40424855657988100120140生产费用y(千元)150140160170150162185165190185(1)计算x与y的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为,求系数,。
综合探究:11.一只红铃虫的产卵数y和温度x有关。
现收集了7对观测数据列于表中,试建立y与x之间的回归方程。
温度x/℃21232527293235产卵数y/个711212466115325参考答案:基础达标:1.B尽管两个变量x与y之间不存在线性相关关系,但是由试验数据仍可求出回归直线方程中的和,从而可写出一个回归直线方程。
2.A由回归直线经过样本点的中心,由题中所给出的数据,将,代入中适合,故选A。
3.D回归直线,必然经过样本点的中心,其坐标为,故选D。
4.B5.D6.B7.C8.A9.解析:(1)画出的散点图如图所示:(2),,,∴,。
所以所求回归直线方程为。
10.解析:(1)制表:1401501600225006000 2421401764196005880 3481602304256007680 4551703025289009350565150422522500975067916262412624412798788185774434225162808100165100002722516500912019014400361002280010140185196003422525900合计777165770903277119132938,,,,∴,即x与y的相关系数r≈0.808。
(2)因为,所以可以认为x与y之间具有很强的线性相关关系。
(3),。
综合探究:11.解析:散点图如图所示:由散点图可以看出:这些点分布在某一条指数函数的图象的周围。
现在,问题变为如何估计待定参数c1和c2,我们可以通过对数变换把指数关系变为线性关系。
令,则变换后样本点应该分布在直线(,)的周围。
这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了。
由题中所给数据经变换后得到如下的数据表及相应的散点图x21232527293235z 1.946 2.398 3.045 3.178 4.190 4.745 5.784由图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。
计算得,,,。
设所示的线性回归方程为,则有,,得到线性回归方程,因此红铃虫的产卵数对温度的非线性回归方程为。
总结升华:(1)在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系。
根据已有的函数知识,可以发现样本点分布在一条指数函数曲线的周围,其中c1和c2是待定参数。
(2)选择适当的非线性回归方程。
然后通过变量代换,将非线性回归方程化为线性回归方程,并由此来确定非线性回归方程中的未知参数。
(3)由散点图来挑选一种跟数据拟合得最好的函数时,往往有回归分析撰稿吕宝珠审稿谷丹责编:严春梅课程标准的要求(1)理解回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法;理解解释变量与预报变量的相关关系是一种非确定性关系;(2)能读或画出两个变量的散点图,并能根据散点图来粗略判断两个变量是否线性相关;(3)理解线性回归模型;(4)理解样本相关系数是衡量两个变量之间线性相关性强弱的参数的意义,了解样本相关系数的具体计算公式.(5)了解解释变量和随机变量的组合效应的含义及表示总的效应的参数:总偏差平方和;了解样本的数据点和它在回归直线上相应位置的残差是随机误差的效应的意义及随机误差的效应(即各个样本的各个点的随机误差的效应的平方和)的参数:残差平方和;了解表示解释变量效应的参数:回归平方和;了解刻画回归效果的相关指数的含义及计算公式。
(有关计算公式只要求了解含义,不须记忆下来,考试时会给出相关公式的).(6)了解残差分析的方法及意义,会读或会作残差图.重点和难点分析内容精讲1.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系。
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.2.回归分析:一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。
通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。
对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。
两个变量具有相关关系是回归分析的前提。
(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度。
粗略地看,散点分布具有一定的规律。
4. 回归直线设所求的直线方程为,其中a、b是待定系数.,,相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。
5.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把=叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.6.相关系数的性质:≤1,且越接近1,相关程度越大;且越接近0,相关程度越小.7.显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。
它必须在每一次统计检验之前确定。
8.显著性检验:由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0.05或r0.01;例如n=7时,r0.05=0.754,r0.01=0.874 求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当≤r0.05或r0.01,认为线性关系不显著。
典型例题:1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x (万件)之间由如下一组数据:X 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.98 2.07Y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26 3.36 3.50 1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.解析:i123456789101112xi1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 1.982.07yi2.25 2.37 2.40 2.55 2.64 2.75 2.923.03 3.14 3.26 3.36 3.50x i yi2.432.2642.8563.2643.5904.074.6435.0905.6526.0966.6537.245,,,,1)画出散点图:2)在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值=0.576<0.997891, 这说明每月产品的总成本y(万元)与该 r0.05月产量x(万件)之间存在线性相关关系。
3)设回归直线方程,利用,计算a,b,得b≈1.215, ,∴回归直线方程为:2.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)施化肥量x15202530354045水稻产量y330345365405445450455 1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程。
解析:1)画出散点图如下:2)检验相关系数r 的显著性水平: i 1 2 3 4 5 6 7 x i 15 20 25 30 35 40 45 y i 330 345 365 405 445 450 455 x i y i49506950912512150155751800020475,,,,,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值r 0.05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系。