选择回归模型
知识讲解
回归分析
1、回归分析的侧重点应先求回归直线方程,并进行相应的估计预测,但这类的题数据的处理与计算量可能很大,学习中应谨慎把握. 对于独立性检验问题,应以K2的计算与临界值的比较来判断分类变量的相关与无关为主.
2、线性回归分析是统计中的一个重要内容,随着新课标的实施和新课程高考改革的不断深入,这部分的内容也将回越来越受到重视. 非线性回归问题有时并不给出经验公式,这时候我们可以画出已知数据的散点图,把它与必修模块数学1中学过的各种函数(幂函数、指数函数、对数函数、二次函数等)图象比较,挑选一种跟这些点拟合最好成的函数,然后采取适当的置换,把问题化为线性回归问题,使其得到解决。
3、回归直线方程求解需要复杂的运算,随着新课程标准的继续实施和新课程高考改革的不断深入,考查同学们数据处理能力,特别是运用计算器等现代技术工具对进行数据处理的能力,将是改革的方向之一. 有关理论要求同学们理解,但公式也不需要死记硬背.
典例精讲
一.选择题(共11小题)
1.(2018秋?曾都区校级期中)某公司为了增加其商品的销售利润,调查了该商品投入的广告费用x与销售利润y的统计数据如表,由表中数据得线性回归),则下列结论中错误的是(方程=x+
3256(万元)广告费用x
11579(万元)销售利润y
B.y>A.0与x正相关
0C.回归直线过点(4,8<)D.
与当天气温y春2018?邢台期末)如表是某饮料专卖店一天卖出奶茶的杯数2.
(的线性回归方程y关于xx(单位:℃)的对比表,已知由表中数据计算得到x),+27,则相应于点(1020)的残差为(为=
510152025℃气温/
1420161426杯数
1.D.C.﹣A1.﹣B0.50.5
家商城进行调研时,获3潍坊期末)某产品生产厂家的市场部在对4?2018.(春之间的四组数据如表:(单位:万件)y元)x得该产品售价(单位:和销售量
44.55.56(元)售价x
9121110(万y销售量
件)
之间的线性回归y为决策产品的市场指导价,用最小二乘法求得销售量x与售价)1.4x=方程为﹣元,则销售量约为(8,若售价为+
万件.B万件6.1.A6.5.CD万件6.3.万件6.7
4.(2017秋?高安市校级期末)已知变量x与变量y之间具有相关关系,并测得如下一组数据
2.3﹣B.=﹣0.7x+10.3=0.7x.A
0.7C.=﹣10.3x+0.7=10.3x﹣D.
bx u=1作线性变换后得到的回归方程为>0吉安期末)曲线y=ae)(a(5.2018春?2)a的单调递增区间为(y=x +bx+0.6x﹣.则函数
∞)+.(,(C.,+∞)D,B.(10A.(,+∞)+∞)
万元的统计数据万元与销售额y?(2018春石家庄期末)某产品的广告费用x.6
,据此模型预报广告费,其中根据以上数据可得回归直线方程
)m,的值为(用为6万元时,销售额为65.5万元,则
m=53,m=54m=54,C.,D.Bm=52,.A.
,且7.6+0.4x﹣=之间的线性回归方程为y,x南阳期末)已知变量?春2018(.7.变量x,y之间的一组相关数据如表所示,则下列说法错误的是()
x681012
26ym3
A.变量x,y之间呈现负相关关系
B.m的值等于5
C.变量x,y之间的相关系数r=﹣0.4
D.由表格数据知,该回归直线必过点(9,4)
根据以上样本数据,她建立的身高y(cm)与年龄x(周岁)的线性回归方程为,给出下列结论:+73.96=7.19x
具有正的线性相关关系与x①y
;)42,117.1②回归直线过样本点的中心(
;145.86cm③儿子10岁时的身高是
.7.19cm④儿子年龄增加1周岁,身高约增加
)其中,正确结论的个数是(
B.2C.3D.A.14
薛城区期末)广告投入对商品的销售额有较大影响.某电商对连续?20189.(春个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元)5 34256x广告费
7141295950y销售额
由上表可得回归方程为=10.2x+,据此模型,预测广告费为8万元时的销售额约为()
A.90.8B.72.4C.98.2D.111.2
10.(2017秋?南沙区校级期中)已知x与y之间的一组数据如图,则y与x的回)
必过定点(=bx+a归直线方程
3102x
7135y
A.(1.5,4.D(0,0)).B(1.5,0)C.(0,4)
11.(2017秋?正定县校级月考)(理)某公司为了增加其商品的销售利润,通过调查得到的该商品投入的广告费用x与销售利润y的统计数据如表:由表中)=x,则下列结论正确的是(l数据,得回归直线:
2 3 5 6万元广告费用x/
117 5 9 万元销售利润y/
B.A.<0>0
D.直线l8.5lC.直线过点(4,)过点(2,5)
小题)5二.填空题(共
相组数据和变量VU与5Y?2018.12(春西城区校级期中)变量X与相对应的组
用b表示变量Y与X之间的回归系数,b表示变量V与U之间的回归系数,则21b 与b的大小关系是.21
13.(2018春?三明期中)一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据列于下表中,试建立y与x之间的回归方
程.
21232527293235℃温度x
325115116624217y产卵数
的根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=Ce2周围(其中c,c是待定的参数),在上式两边取对数,得lny=cx+lnc,再令2121z=lny,则z=cx+lnc,而z与间的关系如下:21
X21 232527293235
5.7843.1783.045z2.3984.1901.9464.745
观察z与x的散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方程来拟合.利用计算器算得a=﹣3.84,b=0.27,z与x间的线性,因此红铃虫的产卵数对温度的非线性回归方程3.84=0.27x﹣回归方程为
.为
开平区校级期中)下表是某数学老师及他的爷爷、父亲和儿子的秋?.(201714身高数据:
176170173c=1父亲身高
)cm(
182176170a=2儿子身高
)cm(
该老师用线性回归分析的方法预测他孙子的因为儿子的身高与父亲的身高有关,.身高为
(单位:年)和所思明区校级月考)已知关于某设备的使用年限?2017(.15秋x(单位:万元)有如下的统计资料:支出的维修费用y
x23456
7.05.53.82.26.5y
由表可得线性回归方程=x+0.08,若规定当维修费用y>12时该设备必须报废,据此模型预报该设备使用年限的最大值为.
16.(2017秋?梁园区校级月考)某城市2007年到2011年人口总数与年份的关系如表所示.据此估计2017年该城市人口总数.
01234(年)年份2007+x
1975811(十万)人口数y
)==3.2,(参考数据和公式:
三.解答题(共4小题)
17.(2017秋?石家庄期末)某兴趣小组欲研究某地区昼夜温差大小与患感冒就诊人数之间的关系,他们分别到气象局与某医院抄录了1到5月份每月10号的
昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期1月10日2月10日3月10日4月10日5月10日
81013129)(°Cx昼夜温差
1725182628(个)就诊人数y
该兴趣小组确定的研究方案是:先从这5组数据中选取一组,用剩下的4组数据求线性回归方程,再用选取的一组数据进行检验.
(Ⅰ)若选取的是1月的一组数据,请根据2至5月份的数据.求出y关于x的.=
x线性回归方程
,2(Ⅱ)若由线性回归方程得到的估计数据与所选出的检验数据的误差不超过则认为得到的线性回归方程是理想的,试判断该小组所得的线性回归方程是℃时,因6否理想?如果不理想,请说明理由,如果理想,试预测昼夜温差为
感冒而就诊的人数约为多少?
)==,=(参考公式:18.(2017秋?广州期末)某汽车4S店关于某品牌汽车的使用年限x(年)和所
支出的维修费用y(千元)有如下的统计资料:
x23456
7.03.56.02.06.5y
(1)在所给的直角坐标系中画出散点图并判断使用年限与所支出的维修费用是否线性相关;如果线性相关,试求y关于x的回归直线方程;
(2)若使用超过8年,维修费超过1.5万元时,车主将处理掉该车估计第10年年底时,车主是否会处理掉该车?
)﹣=(=,=
19.(2017秋?益阳期末)某企业为了推广新产品,决定投入部分资金进行新产
品的宣传活动.为了研究投入宣传资金x万元与新产品的销售额y万元的关系,该企业收集了投入宣传资金x万元与新产品的销售额y万元的对应数据如下:
x1234
600500200y300
(Ⅰ)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;并预测若投入宣传资金5万元时,新产品的销售额约为多少万元?
(Ⅱ)若用表示投入宣传资金x万元的“预测信度值”,若“预测信度值”
不超过100时,根据(Ⅰ)中求得的线性回归方程作出预测的结果是可信的,否则预测的结果不可信;依此标准,当投入宣传资金x万元在什么范围内取值时?由(Ⅰ)中求得的线性回归方程作出的预测都是可信的.
﹣参考公式:最小二乘法求线性回归方程系数公式:,==
)
参考数据:1×200+2×300+3×500+4×600=4700.
20.(2017秋?新绛县期末)某地区某中草药材的销售量与年份有关,下表是近
;之间的回归直线方程)利用所给数据求年销售量(1y与年份x
(2)利用(1)中所求出的直线方程预测该地2018年的中草药的销售量.
参考公式:。