当前位置:
文档之家› 7、高级实验设计—回归的最优设计(Optimized Design)
7、高级实验设计—回归的最优设计(Optimized Design)
说明在 D-优良性意义下,方案W1优于方案W2。
在给定的因子空间某一区域 上,在所有可
能设计出的方案中,信息矩阵行列式值最大的方案 称为因子区域
上的 D-最优方案。显然,D-最
优方案是对所给定的因子区域而言,不同的因子区
域可能存在不同的 D-最优方案。
(二)G-优良性
根据试验方案 (W) 进行试验,获得了 y1 , y2 ,, y N
2
(7.10)
以 2 为单位时,设回归值的方差为 d ( x, W ) ,则:
ˆ ( x,W )) F ( x) A1 (W ) F ( x) d ( x, W ) D ( y (7.11) F ( x)C (W ) F ( x)
回归值的方差 d ( x, W ) 在给定的因子区域 上总有一个最大值 max d ( x,W ) 。根据回归值最
其中
其回归方程为:
ˆ ( x,W ) bF ( x) y
b 的方差与协方差矩阵为:
(7.8)
D(b) 2 ( X X ) 1 2 A1
(7.9)
ˆ ( x,W ) 的方差为: 回归值 y
ˆ ( x,W )) D(bF ( x)) 2 F ( x) A1 (W ) F ( x) D( y F ( x)C (W ) F ( x)
根据模型,F ( x) ( f1 ( x), f 2 ( x)) (1, x) ,由式 (7.5)得方案 W1的信息矩阵为:
1 6 0 3 0 A(W1 ) nt F ( xt ) F ( xt ) nt (1 xt ) 2 t 1 t 1 xt 0 4 0 2
第七章
回归的最优设计
回归的正交设计、回归的旋转设计各有其优点, 但均未涉及统计意义上的优劣。
回归的最优设计的出现背景:从统计意义上来 研究不同试验方案的优劣,建立最优方案。
对于一定的回归模型→在给定的因子空间的某
一区域上可以设计出多种试验方案→试验后每个方
案都可估计出回归模型中的参数→建立回归方程 不同方案所建立的回归方程,其回归值与观察 值拟合的程度不相同。 在可能设计出的试验方案中,能使回归值与观 察值拟合最好的那个方案,就是最优方案,即最优 设计。
xn pn
n t 1
其中, pt 称点 xt 的测度,且 pt 1
将离散方案转化为连续方案称为方案的规范
化。 任一离散方案都可通过规范化转化为连续方 案,但连续方案一般只能转化为一个近似的离散 方案。
在实际中使用的都是离散方案,但在 D-最优
设计中,要直接编制离散方案却相当困难,往往 是先编制连续方案,然后再过渡到离散方案。
1 , 2 ,, m 是 m 个待定参数;
是服从正态分布的相互独立的随机变量;
f1 ( x) f 2 ( x) F ( x) f ( x) m
(1 , 2 ,, m )
对于模型(7.1),
第一节 回归 D-最优设计原理
一、回归模型与试验方案
由于变量之间的关系不同,回归模型 与试验方案就有很多种。 在讨论最优设计原理时,对模型和方 案需要给出更一般的形式与定义。
(一)回归模型(数学模型)
不论因变量与自变量之间存在何种回归关系,
可设其回归模型为:
y 1 f1 ( x ) 2 f 2 ( x ) m f m ( x )
其中,x1 , x2 ,, xn 称为方案 W 的谱点,且 n N t
t 1 n
如果把离散方案中每个点的重复次数改用其
nt 与总次数 N 的比值 Pt 表示,且 Pt 可以在 N
[0, 1] 中任意取值,则称为连续方案,即:
x1 , W (N ) : p, 1
x2 , , p2 , ,
(7.5)
连续方案的信息矩阵为:
A(W ) pt F ( xt ) F ( xt )
t 1
n
pt f12 ( xt ) pt f1 ( xt ) f 2 ( xt ) pt f1 ( xt ) f m ( xt ) 2 pt f 2 ( xt ) f m ( xt ) pt f 2 ( xt ) 2 对称部分 pt f m ( xt )
方案 W2的回归值方差为:
2 d ( x,W2 ) (1 x) 10 1 10
1 1 1 10 (3x 2 2 x 2) 10 3 x 10
函数 (3x 2 2 x 2) 在 1 x 1 上的最大值为7, 所以,
1 d ( x,W1 ) (1 x) 6 0
0 1 1 2 ( 3 x 2) 1 x 12 4
函数 3x 2 2 在 1 x 1 上的最大值为5,所以,
1 1 5 2 max d ( x,W1 ) max( 3x 2) 5 12 1 x 1 12 12 1 x 1
(7.6)
二、D-优良性与G-优良性
(一)D-优良性 在回归最优设计中, 1943年 Wald 提出信息 矩阵行列式极大值判别法。1959年 Kefier 称这种 判别法为 D-最优性,即 D-优良性。
在同一模型下,对两个不同的试验方案 W1与 W2, 如果方案 W1的信息矩阵行列式的值大于方案 W2的信
(7.3)
信息矩阵为:
A X X F ( x ) F (x)
1
N
(7.4)
式中 F ( x ) 是 F ( x ) 的转置向量。
f1 ( x1 ) f1 ( x2 ) X f (x ) 1 N
f 2 ( x1 ) f 2 ( x2 ) f 2 ( xN )
1,2,, N
(7.1)
用矩阵表示为:
E ( y) F ( x)
(7.2)
式中的 x 是给定的因子区域 中一点,若因子空
间为 P 维欧氏空间,则 x 为 P 维向量: ( x 1 , x 2 ,, xP )
f1 ( x ), f 2 ( x ), , f m ( x ) 都是连续函数;
N 个观察值,用最小二乘法去估计模型(7.2)中参
数 ,设其估计值为 b (b1 , b2 ,,b m ) ,则:
ˆ b (X X ) 1 X Y A1 X Y (7.7)
y1 y2 Y y N
3 3
其行列式为:
A(W1 ) 2
2
3 0 0 2
24
相关矩阵为:
1 13 C (W1 ) 20
其行列式为:
0 1 2
1 C (W1 ) 6 0
1 1 24 4
0
对于方案 W2同样可得出:
6 2 3 1 A(W2 ) 2 4 2 1 2 A(W2 ) 2
f m ( x1 ) f m ( x2 ) f m ( xN )
(二)试验方案
假若试验是在给定的因子空间的一组点上 x1 , x2 ,, xN 进行,每个点可以只作一次,也可 重复若干次。这一组点与其对应的重复次数所 组成的集体,称为一个 离散方案 ,若用 W(N) 表示,则: x1 , x2 , , xn W (N ) : n , n , , n 2 n 1
1 1 7 2 max d ( x,W2 ) max( 3x 2 x 2) 7 10 1 x 1 10 10 1 x 1
故 max d ( x,W1 ) max d ( x,W2 )
1 x 1 1 x 1
说明在 G-优良性意义下,方案W1也是比方案 W2 好。
2 1
f 6 x1 , x2 ) x1 x2
就得到二元二次回归模型:
2 2 Y 0 1 X 1 2 X 2 12 X 1 X 2 11 X X 1 22 2
y 1 f1 ( x ) 2 f 2 ( x ) m f m ( x )
x
大方差的大小可以判断试验方案的优劣。对于因子 区域 上的任意两个试验方案 W1与 W2,若回归
值的最大方差 W1小于 W2,即:
max d ( x,W1 ) max d ( x,W2 )
x x
则说在 G-优良性意义下,方案 W1比方案 W2好。
例如在例 7.1中,方案 W1的回归值的方差为:
由(7.3)与(7.4)可得到离散方案的信息矩阵为:
A(W ) nt F ( xt ) F ( xt )
t 1
n
nt f12 ( xt ) nt f1 ( xt ) f 2 ( xt ) nt f1 ( xt ) f m ( xt ) 2 nt f 2 ( xt ) f m ( xt ) nt f 2 ( xt ) 2 对称部分 nt f m ( xt )
若试验方案是由 N 个试验点 x1 , x2 ,, xN 组成,则模型(7.1)的结构矩阵为:
f1 ( x1 ) f 2 ( x1 ) f1 ( x2 ) f 2 ( x2 ) X f (x ) f (x ) 2 N 1 N
f m ( x1 ) f m ( x2 ) f m ( xN )
y 1 f1 ( x ) 2 f 2 ( x ) m f m ( x )
当 m6:
f1 x1 , x2 ) 1
f 2 x1 , x2 ) x1