当前位置:
文档之家› 选修1-2统计案例 ppt课件
选修1-2统计案例 ppt课件
作散点图,并由计算器得:y和t之间的线性回归方程为 y=0.367t-202.54,相关指数R2=r2≈0.8962=0.802
将t=x2代入线性回归方程得: y=0.367x2 -202.54
当x=28时,y=0.367×282-
202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。
-200
方案2解答
平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a 就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a
温度 温度的平方t 产卵数y/个
21 441 7
23 529 11
25 625 21
27 729 24
29 841 66
32 1024 115
35 1225 325
回归分析
1. 从一组样本数据出发,确定变量之间的数学 关系式
2. 对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出哪 些变量的影响显著,哪些不显著
3. 利用所求的关系式,根据一个或几个变量的 取值来预测或控制另一个特定变量的取值, 并给出这种预测或控制的精确程度
回归分析与相关分析的区别
产卵数y/个
350 300 250 200 150 100
50 0 0
t
150 300 450 600 750 900 1050 1200 1350
合作探究
指数函数模型
-10
450 400 350 300 250 200 150 100
50 0
-5-50 0
产卵数
气 温
5
10 15 20 25 30 35 40
假设线性回归方程为 :ŷ=bx+a
由计算器得:线性回归方程为y=19.87x-463.73
分析和预测
相关指数R2=r2≈0.8642=0.7464
当当xx==2288时时,,yy==191.98.78×7×282-486-436.733.≈739≈3 93
所以,一次函数模型中温度解释了74.64%的产卵数变化。
复习回顾
1、线性回归模型:
y=bx+a+e,
其中a和b为模型的未知参数,e称为随机误差。
2是、随数机据误点差和的它效在应回,归称直e$线i =上y相i 应$y位i 为置残的差差。异(yi $yi )
3、对每名女大学生计算这个差异,然后分别将所得
的值平方后加起来,用数学符号表示为:n ( yi $yi )2 i 1
方案3
问题1 问题2
如何选取指数函数的底?
y c1ec2x
非线性关系
y c110c2x
对数变换
y=bx+a 线性关系
方案3解答
对数变换:在 y c110c2x中两边取常用对数得
lg y lg(c110c2x ) lg c1 lg10c2x lg c1 c2x lg10 c2x lg c1
1. 相关分析中,变量 x 变量 y 处于平等的地位;回 归分析中,变量 y 称为因变量,处在被解释的地 位,x 称为自变量,用于预测因变量的变化
2. 相关分析中所涉及的变量 x 和 y 都是随机变量; 回归分析中,因变量 y 是随机变量,自变量 x 可 以是随机变量,也可以是非随机的确定变量
3. 相关分析主要是描述两个变量之间线性关系的密 切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制
令 z lg y, a lg c1, b c2 ,则 y c110c2x
就转换为z=bx+a
温度xoC z=lgy 产卵数y/个
21 0.85 7
23 1.04 11
25 1.32 21
27 1.38 24
29 1.82 66
32 2.06 115
35 2.51 325
由计算器得:z关于x的线性回归方程 为z=0.118x-1.665 ,y 100.118x-1.665 相关指数R2=r2≈0.99252=0.985
问题:一只红铃虫的产卵数y与温度x有关,现收 集了7组观测数据,试建立y与x之间的回归方程
温度x 21 23 25 27 29 32 35 产卵数y 7 11 21 24 66 115 325
解:1)作散点图; 350 300
250
200
产卵数
150
100
50
0
20
22
24
26
28
30
32
34
36
当x=28oC 时,y ≈44 ,指数回归
模型中温度解释了98.5%的产卵数的
2.8 2.4
2 1.6 1.2 0.8 0.4
0 0
z
36
x
9 12 15 18 21 24 27 30 33 36 39
变化
最好的模型是哪个?
产卵数
400 300 200 100
0 0
-100
5
10 15 20 25 30
93>66 ? 模型不好?
奇 怪 ?
合作探究
问题1 问题2 问题3
二次函数模型
方案2
选用y=bx2+a ,还是y=bx2+cx+a ?
如何求a、b ?
y=bx2+a 非线性关系
变换 t=x2
y=bt+a 线性关系
400 产卵数
300
200
-40
-30
-20
100
0
-10
0
-100
气
10
20
30
温 40
从散点图中可以看出产卵数和温度之间 温度 的关系并不能
用线性回归模型来很好地近似。这些散点更像是集中
在一条指数曲线ห้องสมุดไป่ตู้二次曲线的附近。
探索新知
选变量
一元线性模型
方案1
解:选取气温为解释变量x,产卵数
350
为预报变量y。
300
250
画散点图
200
150
100
选模型 估计参数
50
0 0 3 6 9 12 15 18 21 24 27 30 33 36 39
35
40
线性模型
产卵数
400
300
200
100
气
0
温
-40 -30 -20 -10 0 10 20 30 40
-100
-200
450 产卵数
400
350
300
250
200 150
气
100
温
50
0
-10 -5-50 0 5 10 15 20 25 30 35 40
二次函数模型
指数函数模型
最好的模型是哪个?
称为残差平方和,它代表了随机误差的效应。
刻画模型拟合的精度
n
( yi yˆi )2
相关指数:R2
1
i 1 n
( yi y)2
i 1
R2取值越大,则残差平方和越小,即模型的拟合效果 越好.
建立回归模型的基本步骤
1)确定解释变量和预报变量; 2)画出散点图; 3)确定回归方程类型; 4)求出回归方程; 5)利用相关指数或残差进行分析.