当前位置:文档之家› 数据挖掘课程设计

数据挖掘课程设计

试验设计及数据挖掘技术课程设计一、均匀设计试验方案的构造(10/每小项,共20分)已知一试验有四个因素,他们的试验范围及因素水平见表1:表1、因素水平表1、请给出12拟水平的因素水平表2、请给出12拟水平的试验方案二、回归分析建模(15分/每小项,共30分)表2为一个试验的试验方案及结果,请对表2的数据进行数据中心化的回归分析建模并对所得的回归方程进行F显著性检验,要求如下:1、用一次项加交叉项的模型建模,如有不显著项须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程及其系数进行F显著性检验。

一次模型加上交叉项模型:Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1*X2+A7*X1*X3+A8*X1*X4+A9*X1* X5+A10*X2*X3+A11*X2*X4+A12*X2*X5+A13*X3*X4+A14*X3*X5+A15*X4*X5参数:N=16, M=10, B1=5, T2=1> 回归分析结果:I=1 B=3.89295774647887 F=39453.829110832I=2 B=-9.50704225352109E-02 F=376.478873266637I=3 B=5.02394366197183 F=65708.1591596774I=4 B=-6.60140845070422 F=113449.605172517I=5 B=2.83239436619718 F=83540.5277055669I=8 B=-.754866310160428 F=56931.8445755423I=10 B=-3.87700534759358E-02 F=2400.11415542456I=12 B=9.54545454545455E-02 F=3904.68750028214剔除F2剔除后保留的6个变量项:回归分析结果:I=1 B=3.82584921292461 F=42.4793566222967I=3 B=5.16561723280862 F=87.1202672010196I=4 B=-6.45973487986744 F=136.239845488711I=5 B=2.79884009942005 F=90.9365341824574I=8 B=-.682283105022831 F=64.3454168594943I=12 B=.143607305936073 F=16.2893368976606BO=557.203196347032 F=73.3441801574753 R=.996608742535172S=9.95102629716467 FO=1.54J Y Y* Y-Y* A/%1 527 520.371958854929 6.62804114507082 1.257692816901482 453 459.688956732606 -6.68895673260624 -1.476590890200053 481 484.602297102518 -3.60229710251843 -.7489183165318994 462 452.668565786338 9.33143421366236 2.019790955338175 614 619.295396337196 -5.29539633719594 -.8624424001947786 557 563.339306859151 -6.33930685915118 -1.138116132702197 682 676.098557501334 5.90144249866648 .8653141493645878 562561.575785089262 .424214910737533 7.54830802024079E-029 556 557.76766427196 -1.76766427196003 -.31792522876978910 538 536.591511464705 1.40848853529451 .261800842991544> 回归方程:Y*=557.203196347032+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.459734 87986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.682283105022831)*(X3-30)*(X4-45)+(. 143607305936073)*(X1- 25)*(X5- 140)II、对方程各项进行F检验f1= 1, f2= M-2=10-2=8F12=16.289>F1,8(0.01)= 11.3 ∴方程各项通过α=0.01的F检验。

III、对整个方程(或者总方程)进行F检验f1=N*-1=6, f2=M-N*=10-6=4F= 73.34 >F6,4(0.01)= 15.2,∴总的方程通过α=0.01的F检验。

3、二次全模型(一次项,二次项加上交叉项)建模,如有不显著须手动剔除之(请保留6个变量项),请拷贝手动剔除后的参数及方程,最后对方程其系数进行F显著性检验。

二次全模型(一次项,二次项加上交叉项)建模:Y=A0+A1*X1+A2*X2+A3*X3+A4*X4+A5*X5+A6*X1^2+A7*X2^2+A8*X3^2+A9*X4^2+A10*X5^2+A11*X1*X2+A12*X1*X3+A13*X1*X4+A14*X1*X5+A15*X2*X3+A16*X2*X4+A17 *X2*X5+A18*X3*X4+A19*X3*X5+A20*X4*X5参数:N=21, M=10, B1=5, T2=2剔除后保留的6个变量项:> 回归分析结果:I=1 B=3.82584921292461 F=86.7697973506949I=3 B=5.16561723280862 F=177.954859283416I=4 B=-6.45973487986744 F=278.288202179139I=5 B=2.79884009942005 F=185.750097699096I=10 B=-.131901408450704 F=36.4010641102972I=13 B=-1.20464788732394 F=151.811777236324BO=581.62676056338 F=150.336666495772 R=.99834120225772 S=6.96261766428546 FO=1.54J Y Y* Y-Y* A/%1 527 520.756420878211 6.24357912178937 1.184739871307282 453 459.164871582436 -6.16487158243575 -1.36089880406973 481 482.907622203811 -1.90762220381117 -.3965950527673954 462 456.721623860812 5.27837613918803 1.142505657832915 614 617.0766******** -3.07663628831824 -.5010808287163266 557 561.120546810273 -4.12054681027348 -.7397750108210927 682 680.151615575808 1.8483844241922 .2710241091190928 562 559.881110190555 2.11888980944468 .3770266564848199 556 557.24357912179 -1.24357912178971 -.22366530967440810 538 536.975973487987 1.02402651201317 .190339500374194 > 回归方程:Y*=581.62676056338+(3.82584921292461)*(X1-25)+(5.16561723280862)*(X3-30)+(-6.4597348 7986744)*(X4-45)+(2.79884009942005)*(X5-140)+(-.131901408450704)*(X5-140)^2+(-1.204 64788732394)*(X3- 30)*(X4- 45)II、对方程各项进行F检验f1= 1, f2= M-2=10-2=8F10=36.40>F1,8(0.01)= 11.3 ∴方程各项通过α=0.01的F检验。

III、对整个方程(或者总方程)进行F检验f1=N*-1= 6, f2=M-N*=10-6=4F= 41.05093 >F6,4(0.01)= 15.2,∴总的方程通过α=0.01的F检验。

三、优化计算寻优(10分/每小项,其20分)一个试验的试验范围及所得的数学模型(回归方程)如下:Y = 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2 -5.2094E-03*(X2- 3)*(X3- 800)X1:20~40;X2:2.0~4.0;X3:700~900,实验得到的最大值为Y= 90.21、用网格优化法寻优求Y的最大值,给出相应的程序及优化结果程序:10 INPUT"ZM="; ZM20 INPUT"G=";G30 S1=(40-20)/G:S2=(4-2)/G:S3=(900-700)/G40 FOR X1= 20 TO 40 + S1/2 STEP S150 FOR X2= 2TO 4 + S2/2 STEP S260 FOR X3= 700 TO 900 + S3/2 STEP S370 Y1= 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^280 Y2=( -5.2094E-03)*(X2- 3)*(X3- 800)90 Y=Y1+Y2100 IF Y< ZM THEN 140110 IF Y>ZM THEN ZM =Y120 PRINT TAB(1) "X1=";X1;TAB(16)"X2=";X2;TAB(31)"X3=";X3;130 PRINT TAB(46) "Y=";ZM140 NEXT X3,X2, X1150 END结果:RUNZM=? 90.2G=? 20X1= 20 X2= 2 X3= 700 Y= 92.09601X1= 20 X2= 2 X3= 810 Y= 92.14664X1= 20 X2= 2 X3= 820 Y= 92.21457X1= 20 X2= 2 X3= 830 Y= 92.29304X1= 20 X2= 2 X3= 840 Y= 92.38208X1= 20 X2= 2 X3= 850 Y= 92.48166X1= 20 X2= 2 X3= 860 Y= 92.5918X1= 20 X2= 2 X3= 870 Y= 92.71249X1= 20 X2= 2 X3= 880 Y= 92.84374X1= 20 X2= 2 X3= 890 Y= 92.98554X1= 20 X2= 2 X3= 900 Y= 93.137892、用蒙特卡罗优化法寻优求Y的最大值,给出相应的程序及优化结果程序:10 INPUT"ZM="; ZM20 INPUT"N=";N30 G=20*N35 S1=(40-20)/N:S2=(4-2)/N:S3=(900-700)/N40 FOR I =1 TO G50 A1=INT(N*RND(1))60 A2=INT(N*RND(1))70 A3=INT(N*RND(1))90 X1= 20+ A1*S1100 X2= 2 + A2*S2110 X3= 700 + A3*S3120 Y1= 90.7893-4.6267E-02*(X1- 30)-0.8373*(X2- 3)+ 5.2768E-05*(X3- 800)^2 130 Y2=( -5.2094E-03)*(X2- 3)*(X3- 800)140 Y=Y1+Y2150 IF Y< ZM THEN 190160 IF Y>ZM THEN ZM =Y170 PRINT TAB(1)"X1=";X1;TAB(16)"X2=";X2;TAB(31)"X3=";X3;180 PRINT TAB(46)"Y=";ZM190 NEXT I200 PRINT TAB(1)"S1=";S1;TAB(16)"S2=";S2;TAB(32)"S3=";S3210 END结果:RUNZM=? 90.2N=? 2000X1= 22.42 X2= 3.303 X3= 873.7 Y= 91.05659X1= 29.8 X2= 2.909 X3= 721.4 Y= 91.16348X1= 39.42 X2= 2.641 X3= 891.2 Y= 91.26351X1= 28.51 X2= 2.11 X3= 853.6 Y= 92.00355X1= 29.73 X2= 2.334 X3= 898 Y= 92.20621X1= 21.98 X2= 2.214 X3= 879.5 Y= 92.47751X1= 21.75 X2= 2.177 X3= 884.9 Y= 92.60446X1= 22.48 X2= 2.103 X3= 888.6 Y= 92.71652X1= 23.5 X2= 2.052 X3= 890 Y= 92.75568X1= 22.59 X2= 2.06 X3= 892.6 Y= 92.82512X1= 21.96 X2= 2.08 X3= 899.4 Y= 92.92936X1= 23.26 X2= 2.03 X3= 899.1 Y= 92.93231X1= 20 X2= 2.026 X3= 895.4 Y= 93.0318X1= 20.47 X2= 2.033 X3= 898.5 Y= 93.04806X1= 20.16 X2= 2.037 X3= 899.5 Y= 93.07246S1= .01 S2= .001 S3= .1四、配方均匀设计(7.5分/每小项,其15分)1、一个饲料的配方由四种主要的成分组成,根据试验条件的允许和精度的要求,需要选择UM14(144)表来安排试验,请用相应的软件生成该配方试验方案表。

相关主题