变量的相关关系编稿:丁会敏审稿:王静伟【学习目标】1.明确两个变量具有相关关系的意义;2.知道回归分析的意义;3.知道回归直线、回归直线方程、线性回归分析的意义;4.掌握对两个变量进行线性回归的方法和步骤,并能借助科学计算器确定实际问题中两个变量间的回归直线方程;【要点梳理】【高清课堂:变量的相关关系 400458 知识讲解1】要点一、变量之间的相关关系变量与变量之间存在着两种关系:一种是函数关系,另一种是相关关系。
1.函数关系函数关系是一种确定性关系,如y=kx+b,变量x取的每一个值,y都有唯一确定的值和它相对应。
2.相关关系变量间确定存在关系,但又不具备函数关系所要求的确定性相关关系分为两种:正相关和负相关要点诠释:对相关关系的理解应当注意以下几点:(1)相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄.当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化.例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性.而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计.3.散点图将收集到的两个变量的统计数据分别作为横、纵坐标,在直角坐标系中描点,这样的图叫做散点图。
通过散点图可初步判断两个变量之间是否具有相关关系,她反映了各数据的密切程度。
要点二、正相关、负相关(1)正相关:在统计数据中的两个变量,一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关。
如:家庭年收入越高,年饮食支出越高。
反映在散点图上它们散布在从左下角到右上(2)负相关:如果两个变量中,一个变量的值由小到大变化时,另一个变量的值由大到小变化,那么这种相关称为负相关。
在散点图中,对应数据的位置为从左上角到右下角的区域。
按表中所列数据制作的散点图如图。
C 5 8 16 18 28 30 35 D64565042373221(3)无相关关系:如果关于两个变量统计数据的散点图如下图所示,那么这两个变量之间不具有相关关系。
例如,学生的身高与学生的学习成绩没有相关关系。
要点诠释:利用散点图可以大致判断两个变量之间有无相关关系。
【高清课堂:变量的相关关系 400458 知识讲解2】 要点三、线性回归方程 1.回归直线方程(1)回归直线:观察散点图的特征,发现各个大致分布在通过散点图中心的一条直线附近。
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。
求出的回归直线方程简称回归方程。
2.回归直线方程的求法设与n 个观测点(,i i x y )()1,2,,i n =⋅⋅⋅最接近的直线方程为$,y bx a =+,其中a 、b 是待定系数. 则$,(1,2,,)i i y bx a i n =+=L .于是得到各个偏差µ(),(1,2,,)i i i i y y y bx a i n -=-+=L .显见,偏差$i i y y -的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n 个偏差的平方和.2222211)()()(a bx y a bx y a bx y Q n n --++--+--=Λ表示n 个点与相应直线在整体上的接近程度. 记21()ni i i Q y bx a ==--∑. 上述式子展开后,是一个关于a 、b 的二次多项式,应用配方法,可求出使Q 为最小值时的a 、b 的值.即1122211()()()n ni i i ii i n ni ii i x x y y x ynx y b x x xnx a y bx====⎧---⎪⎪==⎪⎨--⎪⎪=-⎪⎩∑∑∑∑, ∑==n i i x n x 11,∑==ni i y n y 11相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析上述求回归直线的方法是使得样本数据的点到回归直线的距离的平方和最小的方法,叫做最小二乘法。
要点诠释:1.对回归直线方程只要求会运用它进行具体计算a 、b ,求出回归直线方程即可.不要求掌握回归直线方程的推导过程.2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实标意义.否则,求出的回归直线方程毫无意义.因此,对一组数据作线性回归分析时,应先看其散点图是否成线性.3.求回归直线方程,关键在于正确地求出系数a 、b ,由于求a 、b 的计算量较大,计算时仔细谨慎、分层进行,避免因计算产生失误.4.回归直线方程在现实生活与生产中有广泛的应用.应用回归直线方程可以把非确定性问题转化成确定性问题,把“无序”变为“有序”,并对情况进行估测、补充.因此,学过回归直线方程以后,应增强学生应用回归直线方程解决相关实际问题的意识.【典型例题】类型一:变量间的相关关系与函数关系例1.下列图形中具有相关关系的两个变量是( )【答案】 C【解析】A 、B 中显然任给一个x 都有唯一确定的y 值和它对应,是函数关系;C 中从散点图可看出所有点看上去都在某条直线附近波动,具有相关关系,因此变量间是不相关的。
举一反三:【变式1】下列两变量中具有相关关系的是( )(A)正方体的体积与边长;(B)匀速行驶的车辆的行驶距离与时间;(C)人的身高与体重;(D)人的身高与视力【答案】选(C).例2.某小卖部为了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶杯数与当天气气温x/℃26 18 13 10 4 -1 杯数y 20 24 34 39 50 64 请画出散点图,并判断它们是否有相关关系。
【解析】散点图如下图:从图中发现气温与杯数之间具有相关关系,当气温的值由小到大变化时杯数值由大变小,所以气温和杯数成负相关。
【总结升华】画出散点图可帮助分析变量间是否具有相关关系,但不是唯一的判断途径。
举一反三:【高清课堂:变量的相关关系 400458 例1】x y)(i=1,2,…,10),得散点图【变式1】对变量x, y 有观测数据(,i iu v)(i=1,2,…,10),得散点图2. 由这1;对变量u ,v 有观测数据(,i i两个散点图可以判断图1 图2A.变量x 与y 正相关,u 与v 正相关B.变量x 与y 正相关,u 与v 负相关C.变量x 与y 负相关,u 与v 正相关D.变量x 与y 负相关,u 与v 负相关【答案】C年平均气温(℃)12.51 12.74 12.74 13.69 13.33 12.84 13.05 年降雨量(mm)748 542 507 813 574 701 432因为图中各点并不在一条直线的附近,所以两者不具有相关关系,求回归直线方程是没有意义的。
【总结升华】用回归直线进行拟合两变量关系的一般步骤为:①作出散点图,判断各点是否散布在一条直线附近。
②如果各点散布在一条直线附近,那么可用公式求出线性回归方程;如果各点不在一条直线附近,那么求出的回归直线方程没有意义。
类型二:回归直线方程的求解例3x 2 4 5 6 8y 30 40 60 50 70 (1(2)求回归直线方程;【解析】(1)根据表中所列数据可得散点图如下图。
(2i 1 2 3 4 5x i 2 4 5 6 8y i30 40 60 50 70x i y i60 160 300 300 560 因此,2555x==,250505y==,521145iix==∑,511380i iix y==∑。
于是可得51522215138055506.5145555i iiiix y x ybx x==-⋅-⨯⨯===-⨯-∑∑$;$$50 6.5517.5a y bx=-=-⨯=$,因此,所求回归方程是$ 6.517.5y x=+。
【总结升华】求线性回归直线方程的步骤为:第一步:列表i i i i x y x y ,,;第二步:计算211nni i i i i xy x x y ==∑∑,, , ; 第三步:代入公式计算b a ,的值; 第四步:写出直线方程. 举一反三:【变式1】 某产品的广告费用x 与销售额y 的统计数据如下表:根据上表可得回归方程ˆˆybx a =+中的b 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元 【答案】选B【解析】4235492639543.5,4244x y ++++++====r u r$$$429.4 3.59.1a y bx ∴=-=-⨯=,∴回归方程为$9.49.1y x =+,∴当6x =时,$9.469.1y =⨯+=65.5,故选B .【变式2】 观察两相关变量得如下数据:求两变量间的回归方程.【答案】$y x =计算得:0x =,0y =。
1021110ii x==∑,101110i i i x y ==∑。
∴1012102110110100111010010i ii xiyi x ybxx==--⨯===-⨯-∑∑$。
$$000a y bxb =-=-⋅=$$。
∴所求回归直线方程为$y x =。
类型三:利用回归直线对总体进行估计(2)如果一个学生的总成绩为450分,试预测这个学生的数学成绩。
515222120123395137765550.1322012581979455i ii i i x y x ybx x==-⋅-⨯⨯==≈⎛⎫--⨯ ⎪⎝⎭∑∑$, $$33920120.13214.68355a y bx=-≈-⨯≈$。
∴回归方程为$0.13214.683y x =+。
(2)根据上面求得的回归方程,当总成绩为450分时,$0.13245014.68374y =⨯+≈。
即数学成绩大约为74分。
【总结升华】利用回归直线,可以进行预测,但并不是一定能达到预测的结果。
事实上,有可能因其他的随机因素而出现偏差。
举一反三:【变式1】为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( ).【答案】C【变式2】下表是某地搜集到的新房屋的销售价格y ,(单位:万元)和房屋的面积x (单位:m 。