当前位置:文档之家› 非线性回归分析

非线性回归分析


bˆ luv / luu 0.00082917
aˆ v ubˆ 0.00896663
y
x
0.00082917 0.00896663x
9
用类似的方法可以得出其它三个曲 线回归方程,它们分别是:
y 106.3147 3.9466ln x y 106.3013 1.1947 x
y 100 11.7506e1.1256/x
10
曲线回归方程的比较
我们上面得到了四个曲线回归方程,通常可采用如
下二个指标进行选择。 (1)决定系数R2:类似于一元线性回归方程中相关系
数,决定系数定义为:
R2 1
( yi yi )2 ( yi y )2
R2越大,说明残差越小,回归曲线拟合越好, R2从总
体上给出一个拟合好坏程度的度量。
11
(2)剩余标准差s:类似于一元线性回归中标准差的估计 公式,此剩余标准差可用残差平方和来获得,即
s
( yi yi )2
n2
s为诸观测点yi与由曲线给出的拟合值 yˆi 间的平均偏离程 度的度量,s越小,方程越好。
12
在观测数据给定后,不同的曲线选择不会影响
n
的取值,但会影响到残差平方和 ( yi y)2的取值。 i 1
18 111.00
19 111.20
4
确定可能的函数形式
为对数据进行分析,首先描出数据 的散点图,判断两个变量之间可 能的函数关系,图是本例的散点 图。
观测这13个点构成的散点图,我 们可以看到它们并不接近一条直 线,用曲线拟合这些点应该是更 恰当的,这里就涉及如何选择曲 线函数形式的问题。
8 y (%)
3
钢包的重量y与试验次数x数据
序号 1 2 3 4 5 6 7
x
y
序号
2 106.42 8
3 108.20 9
4 109.58 10
5 109.50 11
7 110.00 12
8 109.93 13
10 110.49
下面我们分三步进行。
x
y
11 110.59
14 110.60
15 110.90
16 110.76
6
本例中,散点图呈现呈现一个明显的向上且上 凸的趋势,可能选择的函数关系有很多,比如, 我们可以给出如下四个曲线函数:
1) 1/y=a+b/x 2) y=a+blnx 3) y a b x 4) y 100 a ex/b (b 0)
在初步选出可能的函数关系(即方程)后,我们必 须解决两个问题:如何估计所选方程中的参数? 如何评价所选不同方程的优劣?
8
参数估计计算表
ui 2.05088194
u 0.15776015
ui2 0.53721798
nu 2 0.32354744
n 13
uivi 0.01883495
nuv 0.01865778
vi 0.11826672
v 0.00909744
luu 0.21367054
luv 0.00017717
年份
1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 合计
商品流通费用率(%) yi
7.0 6.2 5.8 5.3 5.0 4.6 4.5 4.4 4.2 4.0 51.0
商品零售额(万元)xi
10.2 11.7 13.0 15.0 16.5 19.0 22.0 25.0 28.5 32.0 -
R2 1 0.5743 0.9729, s 0.5743 0.2285
21.2105
13 2
其它三个方程的决定系数及剩余标准差可同 样计算,我们将它们列在表中。
14
四种曲线回归 决定系数及剩余标准差
模型编号 R2
s
(1) 0.9729 0.2285
(2) 0.8773 0.4864
(3) 0.7851 0.6437
回顾-一元一次线性回归
步骤:
指标评价 回归公式
1.观察散点图 2.判断是什么关系; 3. 回归参数计算; 4. 判断系数; 5.显著性检验(注意H0) 6.失拟合检验(注意需要的条件)
相关系数,判断系数
显著性检验 H0假设的含义;方差分析表;F(1,n-2)
失拟合检验 条件?F(m-2,n-m)
1
回归分析内容
7
6
5
4
3
x (万元)
5
10
15
20
25
30
35
图 6.5.1 商品零售额与商品流通费用率的散点图
5
首先,如果可由专业知识确定回归函数形式,则应 尽可能利用专业知识。当若不能有专业知识加以确 定函数形式,则可将散点图与一些常见的函数关系 的图形进行比较,选择几个可能的函数形式,然后 使用统计方法在这些函数形式之间进行比较,最后 确定合适的曲线回归方程。为此,必须了解常见的 曲线函数的图形,。
(4) 0.9623 0.2696
可以看出,第一个曲线方程的决定系数最大,剩 余标准差最小,在这四个曲线回归方程中,不论 用哪个标准,都是第一个方程拟合得最好。因此, 近似得比较好的定量关系式就是
y
x
0.00082917 0.00896663x
15
例子
例 设某商店 1991~2000 年的商品流通费用率和商品零售额资料如下表:
因此,对选择的曲线而言,决定系数和剩余标准差
n
都取决于残差平方和 (yi yi )2,从而,两种选择准
i 1
n
则是一致的,只是从两个不同侧面作出评价。 (yi yi )2
i 1
13
表给出第一个曲线回归方程的残差平方和的
计算过程,
由于n=13,
13
(
yi
y)2
0.5743

, 故其
i 1
决定系数及剩余标准差分别为:
一元线性
一元非线性 带虚拟变量 多元线性
步骤: 1.观察散点图,2.判断是什么关 系,3. 回归,4. 判断系数;5。显著 性检查(注意H0),6.失拟合检验 (注意需要的条件)
多元非线性和 逐步回归
Logistic回归
2
一次非线性回归
炼钢厂出钢水时用的钢包,在使用过程中由于钢水 及炉渣对耐火材料的浸蚀,其容积不断增大。现在钢 包的容积用盛满钢水时的重量y (kg)表示,相应的试 验次数用x表示。数据见表,要找出y 与x的定量关系 表达式。
7
对上述非线性函数,参数估计最常用的方法 是“线性化”方法。 以1/y=a+b/x为例,为了能采用一元线性回归 分析方法,我们作如下变换u=1/x,v=1/y 则曲线函数就化为如下的直线v=bu 这是理论回归函数。对数据而言,回归方程为
vi=a+ bui + i
于是可用一元线性回归的方法估计出a,b。
相关主题