1. 统计推断(实验12)—区间估计、假设检验[mu,sigma,muci,sigmaci]=normfit(x,alpha); %%正态分布检验 [ht,sigt,cit]=ttest(x,mu); %%t 检验[hz,sigz,ciz,zval]=ztest(x,mu,sigma,alpha,tail); %%z 检验 tail 默认为0① P297第2题:(1)分别用两个月的数据验证这种说法的可靠性; 编程:x1=[]; x2=[]; alpha=0.05;[mu1,sigma1,muci1,sigmaci1]=normfit(x1,alpha) %%一月份的均值和标准差以及其置信区间 [mu2,sigma2,muci2,sigmaci2]=normfit(x2,alpha) %%二月份的均值和标准差以及其置信区间 运行结果:(1月)mu1 =115.1500; sigma1 =3.8699;muci1 =113.3388 116.9612; sigmaci1 = 2.9430 5.6523 (2月)mu2 =120.7500; sigma2 =3.7116muci2 =119.0129 122.4871; sigmaci2 =2.8227 5.4211(2)分别给出1月和2月汽油价格的置信区间(05.0=α); 编程:x1=[]; x2=[]; mu=115; alpha=0.05;[h1,sigma1,ci1]=ttest(x1,mu,alpha,0) %%一月份汽油价格的置信区间 [h2,sigma2,ci2]=ttest(x2,mu,alpha,0) %%二月份汽油价格的置信区间 运行结果:(1月)h1 =0; sigma1 =0.8642; ci1 =113.3388 116.9612(2月)h2 =1; sigma2 =1.3241e-006; ci2 =119.0129 122.4871(3)如何给出1月和2月汽油价格差的置信区间(05.0=α) 编程:x1=[]; x2=[]; alpha=0.05;[h1,sigma1,ci1]=normfit(x2-x1,alpha) %数据看成同一个加油的数据,其价格差和置信区间 [h2,sigma2,ci2]=ttest(x2,x1,alpha,0) %数据完全随机时,用总体的t 分布检验 运行结果:h1 = 5.6000; sigma1 =5.4715; ci1 =3.0393 8.1607 h2 =1; sigma2 =2.0582e-004; ci2 =3.0393 8.1607结果分析:根据运行结果,我们可以知道数据完全随机时,用t 分布检验获得的结果更为合理准确。
②第5题P297:分析:这里一件产品只有合格和不合格之分,用X=0表示合格品,X=1表示废品,可以说总体服从0-1分布,由题意得,合格率为90%,则废品率为10%,)1(2p p p X -==σμ,方差的期望双方的置信概率为95%,alpha=1-95%=0.05.虽然X 不服从正态分布,但根据概率论中心极限定理,党样本容量充分大时,对样本均值 x 有,,,近似的服从)1,0(N ,由此可对总体废品率p 作如下的假设检验:.,:0100p p H p p H ≠>≤这时应作单侧检验,取)1,0(N 的1-alpha 分位数alpha u -1,设样本的废品率为x ,np p x z /)01(0--=μ,满足alpha u z -≤1时接受H ;否则拒绝)(10H H 接受编程:n=50; %样本容量 x=7/n; %样本废品率 p0=1-0.9; %样本废品率期望alpha=1-0.95; %置信概率 sig=(1-p0)*p0; %样本废品率方差 z=(1-p0)/sqrt(sig^2/n); %计算zq=norminv(1-alpha); %计算正态分布上侧分位数 if z<qdisp('接受该批货物') elsedisp('不接受该批货物') end运行结果:不接受该批货物 第一问:不应该接受该批货物。
第二问:不妨对这批产品再抽取更多的样品进行检验,该检验的前提是样本容量n 足够大,让其满足正程序正态分布所需的条件。
③第3题P298:假设两份试卷的显著性水平为0.05,则认为两个份试卷难度相似,可以先对两个样本进行正态分布检验2/122221221α-≤+-=u n s n s x x z ,但是由于样本容量比较小,对两个样本进行t 检验。
利用样本数据分别求出两个样本的总体标准差,(包括双侧和单侧检验) 编程:function [h,sig]=ztest2(x1,x2,sig1,sig2,alpha,tail) n1=length(x1); n2=length(x2); x1bar=mean(x1); x2bar=mean(x2);z=(x1bar-x2bar)/sqrt(sig1^2/n1+sig2^2/n2); if tail==0u=norminv(1-alpha/2); sig=2*(1-normcdf(abs(z))); if abs(z)<=u h=0; else h=1; end end if tail==1u=norminv(1-alpha); sig=1-normcdf(z); if abs(z)<=u h=0; elseh=1; end endif tail==-1u=norminv(alpha); sig=1-normcdf(z); if abs(z)>=u h=0; else h=1; end endx1=[]; x2=[];x1bar=mean(x1); %求第一份试卷成绩均值 x2bar=mean(x2); %求第二份试卷成绩均值 y1=(x1-x1bar)*(x1-x1bar)'; %求2)11(∑-bar x x y2=(x2-x2bar)*(x2-x2bar)'; %求2)22(∑-bar x xn1=length(x1); %两个样本的个数sig1=sqrt(y1/n1); %第一份试卷的成绩的标准差 sig2=sqrt(y2/n1); %第一份试卷的成绩的标准差 [p,sig]=ztest2(x1,x2,sig1,sig2,0.05,0)%进行z2检验 [pt.sigt]=ttest2(x1,x2) %进行t2检验 运算结果:p =0 sig =0.0922 pt =sigt: 0答:认为两份试卷难度相同2. 数据的统计与分析(实验11) ① 第1题P272(1)设n=36,求x 在38与43之间的概率;E x =Ex=40, D x =Dx/n=52/36=(5/6)2;编程:n=36;sigema=sqrt(5^2/n);mu=40; normcdf(43,40,5/6)-normcdf(38,40,5/6) 运行结果:0.9916(2)设n=64,求x 与总体均值之间不超过1的概率; (0,1)x Nx-888(1)(,0,1)(,0,1)55585P x P norm cdf norm cdf μμ⎛⎫-≤=≤=-- ⎪⎝⎭编程:n=64;sigema=sqrt(5^2/n);mu=40;normcdf(41,40,5/8)-normcdf(39,40,5/8) %不超过1即在39与41之间 运行结果:0.8904(3)Y=norminv(0.025,0,1); %求N~(0,1)概率为(1-0.95)/2=0.025的分位数 X=39;SIGEMA=5;mu=40 ; %总体均值不超过1的一个下限 n=(SIGEMA*Y)^2/(X-40)^2 %求对应该分位数Y ,X=39时,n 的值 运行结果:n =96.0365 ② 第8题P273分析:设灯泡更换的价格为a=70(包括灯泡成本和安装费用) 不亮灯泡单位时间罚款为b=0.02 灯泡更换周期为T 灯泡总数为K未坏灯泡的回收价为c=5根据题意可知,设x 为某品牌灯泡的平均寿命,则x 服从正态分布)2^100,4000(N,记概率密度函数为)(x p ,则更换灯泡的费用为Ka,承受的惩罚费用为⎰∞--Tdxx p x T Kb)()(,灯泡的回收价值为⎰∞--Tcdx x p K ))(1(得目标函数(单位时间内的平均费用)为:Tcdx x P K dx x p x T KbKa TF TT⎰⎰∞-∞----+=))(1()()()( ①为得到最佳更换周期,即)(T F 取得最小值,令0=dTdF 可得⎰∞--=TT p T F dx x xp )()()(2σμ ②联立①②化简得c a T F c b T p b cT -=-+-)()()()(2μσ ③编程:a=70; b=0.02; c=5; mu=4000; sigma=100; t=mu; %设定T 的初值step=0.1; %t 增加或减少的步长 var=0.01; %比较vp 左右端的误差限vp=(mu*b-c)*normcdf(t,mu,sigma)+(c*t-sigma^2*b)*normpdf(t,mu,sigma); %计算vp 左端 if vp>(a-c) %vp 左端大于右端,T 减少 while (vp-(a-c))>varvp=(mu*b-c)*normcdf(t,mu,sigma)+(c*t-sigma^2*b)*normpdf(t,mu,sigma); t=t-step; endendif vp<(a-c) %vp 左端小于右端,T 减少 while ((a-c)-vp)>varvp=(mu*b-c)*normcdf(t,mu,sigma)+(c*t-sigma^2*b)*normpdf(t,mu,sigma); t=t+step; end end t运行结果如下:vp=64.9540 t =3.9094e+003③ 第7题{}0000()()()()()()()(1)()2()()()2()()()(2)()()()0()()2(()n n n nn nn n n V n b a x a c n x p x dx b a np x dx a A KAn An V n p x A c p x dx p x b A p x dx K K An A p x dx cp x dx bp x dx KAn cp x dx bp x dx A p x dx K∞∞∞∞∞=----+-=-⎧⎫⎧⎫'=--++-⎨⎬⎨⎬⎩⎭⎩⎭=-++=∴+=-⎰⎰⎰⎰⎰⎰⎰⎰⎰0()1)()()()2np x dx An cp x dx b c p x dx A K∞∞-∞∞∞≈=∴+-=-⎰⎰⎰⎰()()2()(2)()2()1()()n n n An b c p x dx A cKAn p x dx A c b c KA p x dx A n c b c k∞∞-∞∴-=--∴=---∴=----⎰⎰⎰用迭代法求上述方程的根,或令右边n=20003. 插值与数值积分(实验3) ① P65第3题:编程:x0=[];y0=[];s1=trapz(x0,y0)s2=y0(1)+y0(7)+4*sum(y0(2:2:6))+2*sum(y0(3:2:5)); %%用梯形公式计算积分为s2=s2*0.2/3 %%用辛普森公式计算积分为s3=(1.5*1.5-0.3*0.3)*0.5-(cos(1.5)-cos(0.3))/3 %%精确值运行结果:s1 =1.3739; s2 =1.3749; s3 =1.3749②第11题P66编程:s0=41288;x0=[]; y1=[]; y2=[]; x=7.0:4.0:158.0;y11=interp1(x0,y1,x); %y1的分段线性插值y12=interp1(x0,y2,x); %y2的分段线性插值y21=interp1(x0,y1,x,'spline'); %y1的三次样条差值y22=interp1(x0,y2,x,'spline'); %y2的三次样条插值s1=(40/18)^2*(trapz(x0,y2)-trapz(x0,y1)) %%梯形数值积分w1=s1-s0 %误差计算s2=(40/18)^2*(trapz(x,y12)-trapz(x,y11)) %%段线性插值w2=s2-s0 %误差计算s3=(40/18)^2*(trapz(x,y22)-trapz(x,y21)) %%三次样条插值w3=s3-s0 %误差计算运行结果:s1 =4.2414e+004 ; w1 = 1.1256e+003s2 =4.2156e+004 ; w2 = 868.2195s3 =4.2108e+004 ; w3 = 820.2353③P66第12题:由题意知多个点的数据,假设相邻两点之间存在线性关系,可以利用辛普森公式或梯形公式计算该桥梁一天的车流量。