当前位置:文档之家› 4-曲线拟合

4-曲线拟合

2 ( y i C 0 C1 x1i C 2 x 2 i ) 0 C 0 Q 2 ( y i C 0 C1 x1i C 2 x 2 i ) x1i 0 C1 Q 2 ( y i C 0 C1 x1i C 2 x 2 i ) x 2 i 0 C 2
• 拟合直线方程中的b可写为
b
Lxy Lxx

x i yi
1 ( xi )( yi ) m 1 2 xi ( xi )2 m
•与插值法比较 ① 离散数据点含有随机误差,拟合曲线不必通过所 有数据点,(插值多项式必须通过插值节点) ② 曲线拟合处理随机变量问题,允许一个自变量对 应多个不同的函数值;
• 插值法只适用于确定性变量问题,自变量与函数 值有确定的一一对应关系。 ③ 插值法一般不能外推
• 问题:
*
y
*
* * *
x
*
*
*
* * *
• 是否可拟合成直线? • 得到的直线方程是否可用? #
• 4.1.2 线性相关系数与显著性检验
拟合的方程能否使用(反映原函数关系),必须通 过检验 •以实验观测值的平均值为基准 • 实验值yi的离差为
第四章 曲线拟合
4 曲线拟合
• 插值法适用于处理确定性变量问题,即变 量与自变量有确定的函数关系。如数据表误 差大,插值法则不适合,应该用曲线拟合。
拟合:离散数据→连续光滑曲线
• 曲线拟合应用 1. 经验建模——通过观测数据寻找相关变量之 间的数学表达式 (能否举出所学化工课程中 的这种表达式或经验模型?) 2. 参数估值——数学关系或模型可从理论导出, 模型关系式中的参数由实验数据求取(如化 工热力学中的安托因方程、化学反应工程中 的阿累尼乌斯方程等)。 • 本节讨论:最小二乘法、一元线性拟合、显 著性检验、多元线性拟合 #
4.1 一元线性拟合 4.1.1 最小二乘原理
• 例:实验测得不同温度下的8组数据如下表,现希 望根据实验数据建立溶解度w与溶液温度t的数学表 达式
j 1 2 3 4 5 6 7 8
t/oC w/g· l-1
t1 w1
t2 w2
t3 w3
t4 w4
t5 w5
t6 w6
t7 w7
t8 w7
解: 作图知 t 和w 大致呈直线关系,但无论怎样划线, 也不能使直线通过所有的点,总会存在误差. • 问题:选哪一条线最好? (怎样取直线的截距a和斜 率b?) • 所选直线 ˆ 的方程写为 y a bt
* w/g· l-1 * * * * *
*
• 目标: 选择的线与观测数
据之间的误差最小.
#
t/oC
ˆ • 选择的线 yi a bxi , 观测数据 yi
两者偏差
ˆ i yi yi yi f ( x )
y * 残差,反映了实验观测值yi与 拟合直线计算值的偏离程度 (xi,yi) * * * *
• 最小二乘原理——使所求近似函数或回归直线的 残差平方和最小。#
ˆ Q ( yi yi )2 ( yi a bxi )2 min • 残差平方和
i 1 i 1

m
m
•a和b的取值应该使Q达到最小,Q取最小值的必要 条件为 Q Q 0 a b 正规方 m 程组 m Q ( xi x )( yi y ) 2 ( yi a bxi ) 0 a i 1 b i 1 m m Q ( xi x ) 2 2 ( yi a bxi ) xi 0 i 1 a y bx b i 1
解 用最小二乘法求直线中的a和b并进行显著性检验。
(1) 直接调用拟合函数 polyfit(x,y,1) (2)进行相关系数检验时,用到的相关系数临界值数 据(表4-2),已存为Excel下的.xls文档,程序可直接 读入。本例中“alpha0.01.xls”和“alpha0.05.xls”分 别为=0.01和=0.05的相关系数临界值数据的文件名,; (3) 星号*标志:线性相关性的显著程度,“*” 和 “**”分别代表显著和高度显著。 参考程序及计算结果见教材p.43.
全部实验点的平均值
1 m 1 m x x i y yi m yi m i 1
• x的离差
2 2
xi x
• x的离差平方和
1 L xx ( xi x ) xi ( xi ) 2 m
• x和y的离差乘积之和
L xy ( xi x )( yi y ) xi yi 1 ( xi )( yi ) m
例题4-2 某矾土矿物成分用x表示,SiO2用y表示, 实验数据如下,已知x和y间存在线性关系,试计 算a和b并进行相关系数检验
X 67 54 72 64 39 22 58 43 46 34
Y
24
15
23
19
16
11
20
16
17
13
解 本例程序与例4-1完全相同,只需将例4-1程序中x 和y数据按本题数据改写即可。 请自己上机练习 运行后输出 a=5.4366346 b=0.2397468 alpha =0.01 Rmf=0.765 R=0.920295 ** alpha =0.05 Rmf=0.632 R=0.920295 *
i 1 i 1 m m
• 残差平方和是C0,C1,C2的函数
Q Q(C0 , C1 , C2 )
• 残差平方和是C0,C1,C2的 Q Q(C0 , C1 , C2 ) 函数 • 根据多元函数极值存在的必要条件,要使Q达到最 小,分别令Q对每一系数的偏导数为零,得到三个方 程 Q
• 如果回归方程不显著,是否说明 x 和 y 间没有函 数关系 ? •只表明 x 和 y 间建立线性关系不合适,并不说明 二者间没有函数关系 。 #
y
*
*
* *
* * *
x
例题4-1 已知实验数据x和y间存在线性关系,试拟合 方程并进行相关系数检验
X Y 1.36 14.10 1.49 15.10 1.73 16.80 1.81 17.40 1.95 18.40 2.16 19.40
拟合方程 : y= 5.4366346+ 0.2397468 x
4.2 多元线性拟合
• 多个自变量的离散函数,常拟合为线性多元函数 • 两个自变量的问题——已知离散函数数据
yi x1i y1 x11 y2 x12 y3 x13 … … … … … … ym x1m
x2i
x21
x22
x23



x2m
正规方 程组
•含有未知数C0,C1,C2的3元线性方程组 可写成矩阵形式 #
•正规方程组的矩阵形式
系数矩阵 • 第一行 和第一列 乘x0,令 x0=1,矩 阵各项值 未变,但 形式变得 有规律
1 x1i x2 i
2 x0 x0 x1i x0 x 2 i
ˆ • 根据数据 ,确定二元线性方程 y C0 C1 x1 C2 x2
即要确定 C0,C1,C2
ˆ • 对以上二元线性模型,实测数据 yi与模型计算值 y 之间的残差平方和为
ˆ Q ( yi yi )2 [ yi (C 0 C1 x1i C 2 x2 i )]2
• 总平方和 S总由 S残 与 S回构成
S总=S残+S回 •回归平方和越大,残差平方和就越小,则回归效 果就越好
定义比值判断回归效果
S回 S总 ( yi y ) 2 ˆ
m i 1 m i 1
( y

L2xy Lxx Lyy
R2
i
y)
2
比值越大,回 归效果越好
•相关系数
R S回 S总 Lxy Lxx Lyy
• 显著性检验——当 R 的绝对值达到一定值时才可 用回归直线表示 x 与 y 的关系 • 相关函数R与显著性水平的关系表(表4-2) • R的临界值——与观测次数m及显著性水平有关 • m-2: 自由度 :0.05和0.01,显著性水平 • R小于 =0.05 时的值:不显著,反之则显著(以* 表示) • R大于= 0.01时的值:高度显著(以**表示); #
S总>=S回,有R2<=1 • 相关系数 R 用于评价两个变量间的线性相关程度
•R的取值: ① R = 0 ,表明原离散函数 x 与 y 之间不存在线性关 系,称 为线性无关; ② 0 < |R| < 1 ,x 与 y 存在线性关系 |R|越接近于1,线性相关性越大; R<<1,说明yi 与yi 偏离大,回归直线不能代表原 离散函数; ③ |R| = 1 ,所有数据点都在回归直线上,称完全 线性相关,表明 x 和 y 有确定的函数关系
变量
常数 项
C 0 y i C1 yi x1i C 2 y x i 2 i
C 0 y i x 0 C1 yi x1i C 2 y x i 2 i
ˆ ˆ yi y ( yi yi ) ( yi y)
• 全部实验点的离差平方和称为总平方和记为S总
ˆ ˆ S总=Lyy=((yi i y ))2 ( yi yi )2 ( yi y )2 y y2
i 1 i1 i 1 i 1
m m
m
• 多元线性拟合两种检验方式
1、用复相关系数检验拟合效果好坏的指标,计算 式与一元线性拟合类似
( yi y ) 2 / ( yi y ) 2 ˆ
i 1 i 1 m m
R S回 / S总
2、用 F 检验,计算一个 F 比值,与F分布临界值 比较 S回 / n0 F 比值计算 F 自变量个数 S剩 (m n0 1) /
相关主题