2009期末复习题注:这份答案是在2009年最后一晚做出来的,时间比较紧,所以可能有些地方不严谨,有什么错误还请各位多包涵。
处理一个问题有很多合理的办法,这份答案所列出的只不过代表个人的想法,仅供参考。
这份答案算是送大家的新年礼物吧,预祝大家期末考试顺利,一年都有好运孟帅1. 设随机变量X 和Y 相互独立,且都服从正态分布N(0,32),而921,,,X X X 和921,,,Y Y Y 分别是来自总体X 和Y 的样本,则统计量U =292221921YY Y X X X ++++++ 服从什么分布?为什么?解:分子分母同除以9得到服从N (0,1), 服从X ²(9)分布,因此U 服从 t (9)分布(课本92页)2.某大学来自A,B 两市的新生中分别抽取10名和11名男生调查身高,测得他们的身高分别为cm x 176=,cm y 172=,样本方差分别为3.1121=S ,1.922=S 。
不妨设两个城市的男生的身高分别服从正态分布),(21σμN 和),(22σμN ,求21μμ-的95%的置信区间,并请在0.05水平下判断两个城市的男生身高是否相等?解: 但是 未知,构造111页)91i X ∑9119i i X =∑9213i i Y =()∑22212σ=σ=σ2σ()()12X Y --μ-μ。
=10, =11, =11.3,=9.1, =176, =172。
代入T 表达式得到T= 。
T 服从t ( + -2)查附表7得到 =2.093得到 的置信区间为:(1.088,6.912) 这个区间不包含0,可以直接判定在0.05水平下两城市男生身高不相等。
如果想严谨一点就在进行假设检验:原假设:两城市男生身高相等;备择:两城市男生身高不等。
检验统计量,和 比较。
如果T 大于,拒绝原假设,否则接受。
3.随机调查了某校200名沙眼患者,经用某种疗法治疗一定时期后治愈168人,试求总体治愈率的95%置信区间。
解:样本率p=0.84,用大样本正态近似法求解,置信区间为:(,)(课本115页)S ω1n 2n 21S 22S XY 1n 2n ()1241.3915-μ-μ()12μ-μ()219t 0.05X Y-()219t 0.05()219t 0.052p u α-2p u α+n=200,查附表4得 =1.96095%置信区间为(0.789,0.891) 4.假设从两个总体)1,0(~N X 和)1,1(~N Y等概率地抽取样本并进行分类,分类过程如下:如果样本值大于96.1则判定为总体Y ,否则就判断为总体X ,试问:将总体X 错判为总体Y 的概率是多少?将总体Y 错判为总体X 的概率是多少?解:P (总体X 错判为总体Y )=P (X >1.96),查附表4, =1.96故P (X >1.96)=0.025P (总体Y 错判为总体X )=P (Y ≤1.96)=P (Y-1≤0.96), 而Y-1服从N (0,1)查附表3得到Φ(0.96)=0.8315,故P (Y ≤1.96)=0.8315 5.为测定某药的剂量x 与血药浓度γ之间的关系,测得如下数据:求γ关于x 的回归方程,并检验方程的显著性(01.0=α)。
解:求回归方程:可以用公式手算,2u 0.052u0.0561622166i i i ii X Y X YXX==- β=-∑∑a Y X=-β当然,考试时允许用计算器的,把上面的数据直接键入,很快便出结果了。
回归方程:检验方程的显著性:原假设:无线性关系;备择:回归效果显著计算统计量 , ,(课本229-230页) 剩下的就是狂按计算器。
F=343.88,查附表8得到 =21.2,所以拒绝原假设,方程回归效果显著。
当然,用r 检验也可以,二者本质上是一样的,在此不再赘述。
6.在诱发大白鼠鼻咽癌的试验中,一组用亚硝酸向鼻腔滴注(鼻注组),另一组在鼻注的基础上加维生素B 12肌注(鼻注+B 12),试验数据如下:试问 ”鼻注” 与 ”鼻注+B 12” 对大鼠诱发癌的作用是否有关联?用什么方法检验?假如上述数据列表中的第二格的数据变为6,该方2.7763.453x γ=+()2U F n Q=-()621i i U ==γ-γ∑()621i i i Q ==γ-γ∑()0.0114F ,法是否还适用?为什么? 解:用X ²检验。
原假设:无关联;备择:有关联a=52,b=19,c=39,d=3,n=113计算统计量 =5.287(课本166页)查附表6得到 所以拒绝原假设。
数据列表中的第二格的数据变为6,这个时候用X ²检验就有点勉强了,四格表的数据画成柱形图时,成对角线斜坡状是最理想的,而此时出现了6和3两个很小的状态,正态性很差,因而不适合。
此时应当用精确概率检验:a=52,b=6,c=39,d=3,n=100代入得 P=0.244>0.05,故不拒绝原假设,既无关。
7:随机抽取8名健康者的血液,将其的血滤液放置不同时间(0,45m ,90m ,135m ),测定血糖浓度,每个受试者有4个测定值。
请问,应该用什么方法分析血糖在不同放置时间的变化?假如要分析各个时间点的差异,应该如何判定?为什么?受试放置时间(分)()()()()()220.5n ad bc n a b a c b d c d --χ=++++()20.051 3.841χ=()()()()a b a c b d c d P n a b c d +!+!+!+!=!!!!!者 编号 0 1 45 2 90 3 135 4 (1) 95 95 89 83 (2) 95 94 88 84 (3) 106 105 97 90 (4) 98 97 95 90 (5) 102 98 97 88 (6) 112 112 101 94 (7) 105 103 97 88 (8)95929080解:时间为单因素,不同时间为不同水平。
原假设:;备择:不全相等。
=1833.96875, =890.38,=943.59=9.89,F 服从于F (3,28)分布查附表8得到 =2.95,因此拒绝原假设,即时间对血糖浓度有影响。
既然时间对血糖浓度有影响,那么就要进行两两比较,以分析各1234μ=μ=μ=μ()48211T ij j i SS x x ===-∑∑e SS A SS ()()41324A e SS F SS /-=/-()0.05328F ,个时间点的差异。
本题中只有四个水平,用单纯的t 检验当然是可以的,但不推荐。
下面将以Q 检验法为例:=101, =99.5, =94.25, =87.125R=max{ - }=13.875在0.05水平,k=4,f=28下查q 表(相当郁闷的是,表里没有28自由度的数据,只好用内插法了)q (4,24)=3.90, q (4,30)=3.84。
得到q (4,28)=3.86q=13.929>q (4,28)因此拒绝原假设。
四个组的均值两两做差,绝对值大于的认为有显著性差异,发现从第二组到第三组就有显著差异了。
(注:Q 、S 检验课本上没有细述,在第八章-方差检验的课件上) 8:对一组胃炎病人先后服用两种药物,然后分别测定其最大排酸量(mmol/h ),请问,应该用什么方法分析两种药的效果之间的差异。
为什么?需要注意什么问题?1x 2x 3x 4xix j xe S =R q =()()()()443028304244302430qq q q ,28-,-=,-,-()428T e D q S =,⨯/T D病例 甲药 乙药 病例 甲药 乙药 编号 XY编号 XY1 11.51 8.84 12 14.56 12.49 2 12.05 10.49 13 9,468.043 22.26 22.28 14 11.20 9.44 4 3.11 1.78 15 16.53 14.12 5 2.03 1.76 16 8.05 6.67 6 4.61 3.85 17 4.54 3.87 7 1.23 0.91 18 9.22 7.93 8 2.53 2.04 19 6.08 4.92 9 3.96 2.99 20 8.657.5210 4.683.9221 13.92 11.93 1111.76 9.932210.36 14.68解:这是一组配对资料,可以考虑使用配对T 检验(课本129页)。
采用t 检验首要数据考虑的正态性。
当然,这一点一般是默许我们使用的。
只有当数据波动特别明显是才考虑(第九题就不符合正态性)。
配对T 检验:设,D 服从N (μ,σ²) 原假设:μ=0;备择:μ≠0。
=3.389t 服从于t (22-1)分布。
查附表7得到 =2.080i i i D X Y =-0.9954550D t -μ-==()0.05221t故拒绝原假设。
采用符号检验或者秩检验也可以。
例如符号检验,根据原始数据的大小定义+、-号:+、+、-、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、+、-。
即使不计算也能看出来+太多了。
S=min{ }=2, 在α=0.05,n=22情况下,查附表12得到 =5, 因而拒绝原假设。
9:用两种方法测定同一批人血清样品中的黄体生成素(HCG-CH )含量(mg/L ),试分析两法的效果,能否用固相法取代双抗体法。
解:这同样是配对资料的分析,但是和上一题不同,本体绝对不可以用T 检验。
数据的波动太大,要是这样的数据也能当做正态,那这个世界就和谐了。
可以考虑使用符号检验,wilcoxon 符号秩检验。
n n +-,sα符号检验法:原假设:两种方法效果相同;备择:不相同。
差值标记:+、0、+、+、+、+、+、-、0、-、+、+。
差值为零的不计入。
S=2,n=10,α=0.05。
查附表12得到 =1, S > ,所以接受原假设。
符号秩检验: 差值绝对值序列:0.65、2.8、14.3、22.5、29、200、910、1100、(-)1120、(-)4840对应的秩为1到10=1+2+3+4+5+6+7+8=36, =9+10=19 T=19根据n=10,α=0.05查附表13得到 =8,T > ,因而接受原假设。
10:两组大鼠,一组为药物组、另一为空白对照组。
两组大鼠在4个不同级别的压力(分别是20、40、60、80mmHg)下测量数据,所得数据为在不同压力作用下测量的计量资料(一只大鼠同时有四个不同的数据)。
现要对两组大鼠的测量数据进行统计分析比较,以了解药物对不同压力下测量的数据有无影响。
请问采用哪种统计分析方法? 解:上课的时候老师说过10题和11题仅仅是提醒我们处理数据时要 注意同质性原则,统计方法不作要求。