数据资料与拟合模型剖析
精度:Q
2 i
( yi bxi )2
yi2 2b xi yi b2
xi2
i
i
i
i
i
估计:bˆ xi yi xi2 lxy lxx
讨论:bˆ1
1 n
i
yi xi
1 n
bi
模型:bi
yi xi
b i
yi
bxi
xii
bˆ
xi yi xi2
xi2bi xi2
xi2 xi2
bi
• 模型:y = a + bx,数据:yi a bxi i , i 1,, n
• 2. 线性最小二乘法
模型:y = b,
数据: yi b i ,
i 1,, n
精度: Q i2 (yi b)2 (yi2 2yib b2) yi2 2( yi )b nb2
估计:
bˆ
1 n
yi
y
• 模型:y = bx,数据:yi bxi i , i 1,, n
16.33亿
讨论
xi 49 54 59 64 69 74 79 84 89 94 yi 5.4 6.0 6.7 7.0 8.1 9.1 9.8 10.3 11.3 11.8 yi 5.24 5.97 6.70 7.43 8.16 8.90 9.62 10.36 11.09 11.82 0.16 0.03 0.00 -0.43 -0.06 0.20 0.18 -0.06 0.01 -0.02 yi 5.55 6.06 6.62 7.23 7.90 8.64 9.44 10.31 11.26 12.31 -0.15 –0.06 0.08 –0.23 0.20 0.46 0.36 –0.01 –0.13 –0.51
年 份 xi 49 .0 6.7 7.0 8.1 9.1 9.8 10.3 11.3 11.8 模型值 5.24 5.97 6.70 7.43 8.16 8.90 9.62 10.36 11.09 11.82
误差 .16 .03 .00 -.43 -.06 .20 .18 -.06 .01 -.02
§3.2 数据资料与拟合模型
一. 数据资料与数学模型
1. 数据资料
数据资料 是在实际问题中收集到的观测数值。
是组建数学模型的重要依据和检验数学模 型
数据获取的年重鉴要报标表准、。学术刊物、网络资源、实验观测等等
数据误差 观测数据中一般都包含有误差。正确对待和处理这
些误差是数学建模中不可回避的问题. 系统误差:偏差,来自于系统,有规律,可避免。 随机误差:无偏,来自随机因素,无规律,不可免
数。 1. 在坐标系上作观测数据的散点图。 2. 根据散点分布的几何特征提出模型 3. 利用数据估计模型的参数 4. 计算拟合效果
例3.1
• 假设:人口随时间线性地增加
• 模型:y = a + b x
• 参数估计
• 观测值的模型:
•
yi = a + b xi + εi ,i = 1,…,n
• 拟合的精度:
• 模型将侧重于选择规律的简单的数学表达
• 在简单的数学表达式中选择拟合效果好的
• 插值模型:模型以拟合效果为主。
• 要求精确地拟合观测数据,即在观测点之 间插入适当的数值。
• 40. 其他利用数据组建的模型:判别模型、 主成分模型、分类模型、因子模型、趋势 面模型、时间序列模型等。
二. 经验模型与最小二乘法
x
1 n
n i 1
xi
,
y
1 n
n i 1
yi
n
lxy (xi x)( yi y) lxx (xi x)2 i 1
参数估计
• 可以算出:a = – 1.93, b = 0.146 • 模型:y = – 1.93 + 0.146 x
• 拟合效果
•
yˆi a bxi ˆi yi yˆi
2. 资料与模型
10. 数据资料可以直接应用于数学模型的组建。
20. 对于情况较复杂的实际问题(因素不易化简, 作用机理不详)可直接使用数据组建模型寻 找简单的因果变量之间的数量关系, 从而对未知的情形作预报。 这样组建的模型为拟合模型。
30. 拟合模型的组建主要是处理好观测数据的误 差,使用数学表达式从数量上近似因果变量 之间的关系。
结论
• 1. Q1 = 0.2915 < 0.7437 = Q2. 线性模型更 适合中国人口的增长。
• 2. 预报:1999年12.55亿,13.43亿
• 3. 人口白皮书:
•
2005年13.3亿, 2010年14亿
• 模型 I 2005年13.43亿,2010年14.16亿
• 模型II
14.94亿,
3. 拟合模型
• 10. 拟合模型的组建是通过对有关 变量的观测数据的观察、分析和 选择恰当的数学表达方式得到的。
• 20. 拟合模型组建的实质是数据拟 合的精度和数学表达式简化程度 间的一个折中。折中方案的选择 将取决于实际问题的需要。
• 30. 经验模型和插值模型
• 经验模型:问题主要是探讨变量间的内在 规律,容许出现一定的误差。
• 1. 经验模型及其组建
• 在简单模型中选择拟合效果好者。
• 例3.5 人口预测
• 1949年—1994年我国人口数据资料如下:
年 份 xi 49 54 59 64 69 74 79 84 89 94 人口数 yi 5.4 6.0 6.7 7.0 8.1 9.1 9.8 10.3 11.3 11.8 建模分析我国人口增长的规律, 预报1999年我国人口
模型二 人口自然增长模型
y aebx
设数据满足 最小二乘法
算得
ln y ln a bx
ln yi ln a bxi i
n
n
Q
2 i
(ln yi ln a bxi )2
i 1
i 1
aˆ 2.33 bˆ 0.0177
模型
y 2.33e0.0177x
拟合精度 Q 2 0.7437
•
Q = i 2 = (yi - a – b xi)2,
•
误差平方和。
• 最小二乘法:
• 求参数 a 和 b,使得误差平方和最小。
n
n
Q
2 i
( yi a bxi )2
i 1
i 1
na ( xi )b yi ( xi )a ( xi2)b xi yi
a y bx , b lxy lxx