当前位置:文档之家› sup曲线拟合与回归分析 ppt课件

sup曲线拟合与回归分析 ppt课件

通常不存在一組解來滿足這 21 個方程式。
在一般情況下,只能找到一組 ,使得等號兩邊的
差異為最小,此差異可寫成
yA 2(yA )T(yA )
此即為前述的總平方誤差 E
MATLAB 提供一個簡單方便的「左除」(\)指
令,來解出最佳的
2020/12/27
10
線性迴歸:曲線擬合
利用「左除」來算出最佳的 值,並同時畫出 具有最小平方誤差的二次曲線

0
a
1、a
的一次式
2
令上述導式為零之後,我們可以得到一組三元一次
線性聯立方程式,就可以解出參數 佳值。
a
0、
a
1、a
的最
2
2020/12/27
8
線性迴歸:曲線擬合
假設 21 個觀察點均通過此拋物線,將這 21 個點帶入拋物線方程式,得到下列21個等式:
a0 a1 x1 a2 x12 y1 a0 a1 x2 a2 x2 2 y2
範例10-2: census01.m
load census.mat plot(cdate, pop, 'o');
% 載入人口資料 % cdate 代表年度,pop 代表人口總數
A = [ones(size(cdate)), cdate, cdate.^2];
y = pop; theta = A\y;
a0 a1 x21 a2 x212 y21
亦可寫成
1 1
x1
x2
x12 x22
1
2
y1
y2
1
x 21
x
212
3
y21
A
y
其中 2020/12/27
A、 y為已知,
為未知向量。
9
線性迴歸:曲線擬合
上述21個方程式
21 個方程式,只有 3 個未知數(1,2,3T,所以
2020/12/27
12
提示
左除的概念,可記憶如下:原先的方程式是 A*theta = y,我們可將 A移項至等號右邊, 而得到 theta = A\y。必須小心的是:原先 A 在乘式的第一項,所以移到等號右邊後,A 仍 然必須是除式的第一項。
若我們要解的方程式是 theta*A = y,則同樣 的概念可得到最小平方解 theta = A/ y。
1~21。當輸入為 x i
yi
模型的預測值為 f(x i;a 0 ,a 1 ,a 2 ) a 0 a 1 x i a 2 x i2
平方誤差: yi f(xi)2
總平方誤差 示如下:
E是參數
a 0 、a 1 、a 2 的函數則可表
E ( a 0 ,a 1 ,a 2 ) 2y 1 i f( x i) 2 2y 1 i a 0 a 1 x i a 2 x i22
50 0 1750
1800
1850
1900
年度
1950
5
2000
線性迴歸:曲線擬合
上圖資料點走勢,通過這些點的曲線可能是二 次拋物線,假設為 y f( x ;Байду номын сангаас 0 ,a 1 ,a 2 ) a 0 a 1 x a 2 x 2
其中y為輸出,x為輸入, a 0、 a 1 及 a 2 則為此模型
是否会认为老师的教学方法需要改进? • 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭 • “不怕太阳晒,也不怕那风雨狂,只怕先生骂我
笨,没有学问无颜见爹娘 ……” • “太阳当空照,花儿对我笑,小鸟说早早早……”
2020/12/27
4
線性迴歸:曲線擬合
觀察資料是美國自 1790 至 1990 年(以 10 年為一單位)的總人口,此資料可由載入檔案 census.mat 得到
的參數。
參數相對於y呈線性關係,所以此模型稱為「具有 線性參數(Linear-in-the-parameters)」的模型。
找出最好的參數值,使得模型輸出與實際資料 越接近越好,此過程即稱為線性迴歸(Linear Regression)
2020/12/27
6
線性迴歸:曲線擬合
線性迴歸
假設觀察資料可寫成 (xi , yi ),i= 時,實際輸出為 y i 。
200
預測人口數
美國人口總數
150
100
50
0 1750
1800
1850
1900
1950
2000
年度
由上述範例,我們可以找出最佳的
a 0 ,a 1 ,a 2 21 , 2 1 .5 3 ,0 3 .0 10 0 654
因此具有最小平方誤差的拋物線可以寫成:
y f(x ) a 0 a 1 x a 2 x 2 21 2 1 .5 3 x 3 1 0 .0 00 x 2654
範例10-1: censusPlot01.m
load census.mat plot(cdate, pop, 'o'); xlabel('年度'); ylabel('美國人口總數');
% 載入人口資料 % cdate 代表年度,pop 代表人口總數
250
200
美國人口總數
150
100
2020/12/27
迴歸分析與所使用的數學模型有很大的關係
模型是線性模型,則此類問題稱為線性迴歸 (Linear Regression)
模型是非線性模型,則稱為非線性迴歸
2020/12/2(7 Nonlinear Regression)。
2
精品资料
• 你怎么称呼老师? • 如果老师最后没有总结一节课的重点的难点,你
% 利用「左除」,找出最佳的 theta 值
plot(cdate, pop, 'o', cdate, A*theta, '-'); legend('實際人口數', '預測人口數'); xlabel('年度'); ylabel('美國人口總數');
2020/12/27
11
線性迴歸:曲線擬合
250
實際人口數
i 1
i 1
2020/12/27
7
線性迴歸:曲線擬合
求得參數 a 0、a、1 a 2 的最佳值
求出E 對 a 0、a 1 、a 2 的導式,令其為零,即可解 出 a 0、 a 1、a 2 的最佳值。
平方誤差 E 為 a 0、a 1 、a 2 的二次式
導式
E 、E
a0 a1
及 E
a2

a
MATLAB 程式設計 曲線擬合與迴歸分析
2020/12/27
1
線性迴歸:曲線擬合
曲線擬合(Curve Fitting)
建立的數學模型是「單輸入、單輸出」(Singleinput Single-output,簡稱SISO)
其特性可用一條曲線來表示
在資料分析上都稱為迴歸分析(Regression Analysis),或稱為資料擬合(Data Fitting)
相关主题