农作物施肥效果分析
(1992年A题)
某研究所为了研究N、P、K三种肥料对于土豆和生菜的作用,分别对每种作物进行了三组实验,实验中将每种肥料的施用量分为10个水平,在考察其中一种肥料的施用量与产量关系时,总是将另二种肥料固定在第7个水平上,实验数据如下列表格所示,其中ha表示公顷,t表示吨,kg表示千克,试建立反映施肥量与产量关系的模型,并从应用价值和如何改进等方面作出评价.
施肥量与产量关系的实验数据
一、符号说明:
W:农作物产量.
x:施肥量.
N、P、K:氮、磷、钾肥的施用量.
C W:农产品价格.
C N, C P, C K:氮、磷、钾肥的价格.
a,b,b0,b1,b2,c,c0,c1,c’0,c’1:常数(对特定肥料,特定农作物而言)
二、模型假设
1. 研究所的实验是在相同的正常实验条件(如充足的水分供应,正确的耕作程序)下进行的,产量的变化是由施肥量的改变引起的,产量与施肥量之间满足一定的规律。
在实验中,除施肥量,其它影响因子(如环境条件、种植密度等)均处于同等水平。
2. 土壤本身已含有一定数量的氮、磷、钾肥,即具有一定的天然肥力(从数据可以看出,当各种养分的施肥量都为0时,产量并不为0)。
3. 每次实验是独立进行的,且对于N、P、K施用量来说无系统误差,
模型的误差项均服从同分布的正态分布。
三、问题分析
题目要求建立反映施肥量与产量关系的模型,显然这是一个回归分析的问题,但是什么样的回归模型能体现施肥量与产量之间的关系呢?这就需要从问题的实际背景出发来考察。
一元回归分析理论(1-17页)及其实现(25-30页)
农学规律表明,施肥量与产量一般满足这样的关系:它分成三个不同的区段,在第一区段,当施肥量比较小时,作物产量随施肥量的增加而迅速增加,第二区段,随着施肥量的增加,作物产量平缓上升,第三区段,施肥量超过一定限度后,产量反而随施肥量的增加而下降在长期的实践中,农学家们已经总结出关于作物施肥效果的经验规律,并建立了相应的理论
1. Nicklas和Miller理论:
设h为达到最高产量时的施肥量,边际产量(即产量W对施肥量x的导数)d W/d x与(h-x)成正比例关系,即
d W/d x=a(h-x) (1)
从而W=b0+b1x+b2x2 (2) 2. 米采利希学说:
只增加某种养分时,引起产量的增加与该种养分供应充足时达到的最高产量A与现在产量W之差成正比,即
dW/d x=c(A-W) (3)
从而 W =A (1-exp(-cx )) (4) 考虑到土壤本身的天然肥力,上式可修正为
W =A (1-exp(-cx +b )) (5)
3. 英国科学家博伊德发现,在某些情况下,将施肥对象按施肥水平分成几组,则各组的效应曲线就呈直线形式。
若按水平分成二组,可以用下式表示(其中x i 表示分组值):
010
1max (0)
()i i c c x x x c c x x x x +≤<⎧⎪⎨''+≤<⎪⎩ (6) 四、模型与结果
为考察氮、磷、钾三种肥料对作物的施肥效果,我们以氮、磷、钾的施用量为自变量,土豆和生菜的产量为因变量描点作散点图(见图1,图2)。
图1 土豆产量和三种肥料施肥量之间的散点图
图2 生菜产量和三种肥料施肥量之间的散点图
从图中看出,氮肥对于作物产量的贡献大致呈多项式关系,磷肥
对于作物产量的关系大致为分段直线形式,至于钾肥,对土豆而言,大致呈指数关系。
对生菜而言,随着施用量的增加,产量的上升幅度很小.这样,我们得到了对施肥效果的定性认识。
我们建立了一元肥料效应回归模型,并在回归分析之前,用Chauvenent 准则进行修正,剔除异常值.根据对问题的初步分析,氮肥的施肥效果应满足Nicklas 和Miller 理论所描述的关系,运用二次多项式回归,得到
氮肥对土豆的回归方程:W =14.74+0.197N -0.00034N 2 (7) 氮肥对生菜的回归方程:W =10.23+0.101 N -0.00024 N 2 (8) (shifeidata.m )
磷肥的施用对作物产量的增加表现为分段直线形式,运用线性回归,得到
磷肥对土豆的回归方程:
32.0770.084(0101.04)
39.9680.0059(101.04342)P P W P P +≤<⎧=⎨
+≤≤⎩
(9) 磷肥对生菜的回归方程:
6.8090.052(0202.54)20.1960.00472(202.54685)
K K W K K +≤<⎧
=⎨
+≤≤⎩ (10)
从钾肥对土豆的实验数据可以看出,当施用量超过一定限度后,产量的增加很不明显,因此用(5)式来描述其施肥效果是合理的,用指数回归分析得到
钾肥对土豆的回归方程:W =42.17(1-exp(-0.01K -0.641)) (11)
对生菜来说,钾肥的施用对产量的影响很小.通过线性回归得到钾肥对生菜的回归方程:W=16.2269+0.00395K (12) 可以得到每种肥料的最佳施用量,这无疑为生产提供了极为重要的信息.此外,模型的建立并不依赖于任何特殊条件,这种方法可以适用于任何地区,考察任意一种肥料对于作物产量的效应,具有一定的推广价值
五、多元回归模型和交互效应的讨论
从实验设计的角度来看,该研究所采用的设计方案是因素轮换法,即在考察每一种肥料的效应时,总将另二种肥料的施用量固定在第7个水平上. 而此问题中三种肥料用量共同作用于农作物产量,因此仅仅建立一元回归模型是不行的,必须通过多元回归模型来反映虑农作物产量和施肥量之间的关系。
从上述分析可知,农作物产量和各种施肥量之间一般都不能用线性模型来描述,因此有必要考虑非线性回归模型。
此外因为任何光滑的函数都可用足够高阶的多项式来近似,所以针对这个问题,我们可以建立三元多次多项式模型。
又由农业学的经验知,可以采用三元二次多项式来描述.
下面以土豆为例进行说明。
(一)全回归
模型的形式为
()2220N P K NN PP KK NP NK KP E W =B +B N +B P+B K +B N +B P +B K +B NP+B NK +B KP
为了对参数进行估计,对数据进行重新整理后,观测方程为
=+Y X βε
其中130(,,)W W '=Y ,130(,,)e e '=ε,0(,,,,)N NK KP B B B B '=β
可以用回归的方法,求出回归系数,但对本题而言,下列处理表
明,交互系数是无法确定的. 由于所给出的实验全都分布于三条平行于坐标轴的直线上,并且这三条直线交于公共点(n0,p0,k0),以n=N-n0,p=P-p0,k=K-k0作为现的变量,称为相对施肥量,则相对产量W()可表示为:
w(n,p,k)=b 0+b n n+b p p+b k k+b nn n 2+b pp p 2+b kk k 2+b np np+b nk nk+b kp kp 在新的坐标系中,所有的试验点都在坐标轴上,至少有两个坐标为0,这样所有的交叉项全消失了(资料矩阵后三列全为0),即不可能由实验结果来确定交互系数,因而试验方法本身注定了交互效应是无法求出的
(也可从直观的角度看出交互效应是无法从数据计算的。
若b np =0,当n 变为n+δ,则响应变量w(n,p,k)的改变只依赖于n ,而不依赖于其它自变量;反之,若b np 0,当n 变为n+δ,则响应变量w(n,p,k)的改变依赖于n 和其它自变量)
因此我们只能建立不包含交互效应的模型
多元回归分析理论(18-22页)及其实现(30-47页)
22212.83610.19030.08420.07350.00030.00020.0001W =+N +P+K N P K ---- (13)
从输出的相关统计量可知,模型拟合得很好,而且各个参数在显著性水平0.05下都是现在显著的.
为了消除量纲对模型的影响,在建立模型之前,我们最好先对数据进行标准化,即
'()/()
'()/()'()/()'()/()
W W W W N N N N P P P P K K K K σσσσ=-=-=-=- 这样新的模型为
222' 2.82220.4168'0.7583' 1.2589'0.3759'0.1084'0.1546'W =+N +P +K N P K ---- (14)
(二)逐步回归
在回归模型里面,并不是所有的自变量对模型都有显著的影响,这个时候我们就需要通过一些方法来筛选变量,最常用的方法是逐步回归法
逐步回归理论及其实现(逐步回归讲义)
六、实验方法的建议(响应曲面法与设计)
响应曲面法(或RSM 法),是数学方法和统计方法相结合的产物,是用来对所感兴趣的相应受多个变量影响的问题进行建模和分析的,其目的是优化这个响应。
响应和自变量之间是一种函数关系,它们所描绘出来的曲面就叫做响应曲面。
如果曲面有弯曲,一般这种函数关系多采用二阶多项式模型。
RSM 的最终目的是确定系统的最优运行条件或确定因素空间中满足运行规的区域。
本题中为了估计肥料的交互效应,我们通过响应曲面法设计了一个正交试验表,将氮、磷、钾肥的用量以第7个水平为中心等问题分为五个水平,作一个五水平三因子的正交表,总共需进行15次实验,将所得数据运用直观分析和方差分析,可以方便地得到氮、磷、钾肥对作物的总效应.试验安排如下
表 正交设计表
.
.页脚.。