应用数理统计复习题一、填空题1.设总体212~(,),,,...,n X N X X X μσ为样本,样本均值及样本方差分别为,221111,()n n i i i i X X S X X n n ====-∑∑,设112,,...n n X X X X +与独立同分布,则统计量~Y =。
2.设21~(),~T t n T 则。
3.设总体X 的均值为μ,12,,...,n X X X 为样本,当a = 时,E 21()nii Xa =-∑达到最小值。
4. 设总体212~(,),,,...,n X N X X X μσ为样本,1||,()nii D XE D μ==-=∑则5.设总体X 的均值和方差分别为a , b , 样本均值及样本方差分别为221111,()n n i i i i X X S X X n n ====-∑∑,则 E (S 2 )= 。
6.在总体~(5,16)X N 中随机地抽取一个容量为36的样本,则均值 X 落在4与6之间的概率 =6. 设总体X 服从参数为λ的泊松分布,1.9,2,2,2.1, 2.5为样本,则λ的矩估计值为ˆλ= 。
7. 设总体212~(,),,,...,n X N X X X μσ为样本,12211ˆ()n i i i c XX σ-+==-∑,若2ˆσ为2σ的无偏估计,则 c = 。
8. 设总体12~(,1),,,...,n X U X X X θθ+为样本,则θ的矩估计量为 ,极大似然估计量为 。
9. 设总体212~(,),,,...,n X N X X X μσ为样本,μ未知,σ2已知,为使μ的置信度为1-α的置信区间长度不超过L ,则需抽取的样本的容量n 至少为 。
10. 设总体212~(,),,,...,n X N X X X μσ为样本,μ、σ2未知,则σ2的置信度为1-α的置信区间为 。
11设X 服从二维正态),(2∑μN 分布,其中⎪⎪⎭⎫⎝⎛=∑⎪⎪⎭⎫ ⎝⎛=8221,10μ令Y =X Y Y ⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫⎝⎛202121,则Y 的分布为 (要求写出分布的参数) 12. 设总体X 在区间]1,[+θθ上服从均匀分布,则θ的矩估计=θˆ ;=)ˆ(θD 。
13. 设n X X ,,1 是来自正态总体),(2σμN 的样本,2,σμ均未知,05.0=α. 则μ的置信度为α-1的置信区间为 ;若μ为已知常数,则检验假设,::20212020σσσσ<↔≥H H (20σ已知),的拒绝域为 。
14.设X 服从p 维正态),(∑μp N 分布,是来自n X X X ,,,21 X 的样本,则∑的最小方差无偏估计量=∑ˆ ;μ-X 服从 分布。
15设(X 1,…,X n )为来自正态总体),(~∑μp N X 的一个样本,∑已知。
对给定的检验水平为α,检验假设0100::μμμμ≠↔=H H ,(0μ已知)的统计量为 拒绝域为 。
16.某试验的极差分析结果如下表(设指标越大越好):表1 因素水平表表2 极差分析数据表则(1)较好工艺条件应为。
(2)方差分析中总离差平方和的自由度为。
(3)上表中的第三列表示。
17.为了估计山上积雪溶化后对河流下游灌溉的影响,在山上建立观测站,测得连续10年的观测数据如下表(见表3)。
表3 最大积雪深度与灌溉面积的10年观测数据则y关于x的线性回归模型为二、简述题1.检验的显著性水平及检验的p值。
2.参数的点估计的类型、方法、评价方法。
3.假设检验的思想、推理依据及参数假设检验的步骤。
4.方差分析的目的及思想(结合单因素)。
5.简述正交实验设计中的数据分析方法 6主成分分析。
7.典型相关分析。
8.贝叶斯判别法。
9.聚类,分类。
10.线性回归分析的主要内容及应用中注意的问题。
11.系统聚类法的算法思想及步骤。
12.如何看待多元统计方法在实际数据处理中的作用与地位。
三、计算及证明题1.设总体X 的概率密度为1,0(,)00x x e x f x x αλαλλ--⎧>=⎨≤⎩,其中λ>0是未知参数,α>0是已知常数,12,,...,n X X X 为样本,求λ的矩估计和极大似然估计。
2. 设总体X 的概率密度为22(),0(,)0x x f x θθθθ-⎧<<⎪=⎨⎪⎩其它,其中θ>0是未知参数,12,,...,n X X X 为样本,求1)θ极大似然估计,2)总体均值μ的极大似然估计。
3. 设总体X 的概率密度为233,0(,)0x x f x θθθ⎧<<⎪=⎨⎪⎩其它,其中θ>0是未知参数, 12,X X 为样本。
1)证明:11221227(),(,)36T X X T max X X =+=都是θ的无偏估计。
2)比较12,T T 的有效性。
4. 设总体X 服从参数为λ的泊松分布,对于假设01:0.5,:2H H λλ==,0H 的拒绝域为12{3}D X X =+≥,试求此检验问题犯第一类错误(弃真)及犯第二类错误(取伪)的概率。
5.考虑一元线性回归模型: 01,1,2,..i i i Y X i n ββε=++=,其中i ε相互独立且服从2(0,)N σ分布,求参数01,ββ的极大似然估计,并证明它们是无偏估计。
6. 考虑一元线性回归模型:01,1,2,..i i i Y X i n ββε=++=,其中i ε相互独立且服从2(0,)N σ分布,记11122121ˆˆ{...,,...,}/n nnA c Y c Y c Y c c c E βββ==+++=为常数,且,求A 中使得1ˆ()D β最小的1ˆβ 7. 某种产品在生产时产生的有害物质的重量(单位:克)Y 与它的燃料消耗量(单位:千① 求经验线性回归方程;② 试进行线性回归的显著性检验(01.0=α); ③ 试求x 0=340时Y 0的预测区间(05.0=α). ④若要求有害物质的重量在250~280um 之间,问燃料消耗量应如何控制?(05.0=α) 8在某锌矿的南北两支矿脉中,各抽取样本容量分别为10与9的样本分析后, 算得其样本含锌(%)平均值及方差如下: 南支:1x =0.252,21S =0.140,1n =10 北支:2x =0.281,22S =0.182,2n =9若南北两支锌含量均服从正态分布,且两样本相互独立,在α=0.05的条件下, 问南北两支矿脉含锌量的平均值是否有显著差异?已知:2439.0)8,9(975.0=F ,3572.4)8,9(025.0=F ,1098.2)17(025.0=t9设由一组观测数据(,)1,2,,i i x y i n =,,计算得到150,200x y ==,25,75xx xy l l ==,求y 对x 的线性回归方程。
10设有三台机器A 、B 、C 制造同一种产品。
对每台机器观察5天的日产量。
记录如下(单位:件) A : 41,48, 41, 57, 49 B : 65,57, 54 ,72, 64 C : 45,51, 48, 56, 48 试问:在日产量上各台机器之间是否有显著差异?(05.0=α), 已知:79.3)12,2(05.0=F11设),(i i x Y 满足线性模型 i i i x x Y εββ+-+=)(10, ),0(~2σεN i ,n i ,2,1=,∑==ni i X n x 11,诸i ε相互独立。
试求(1)参数T ),(10βββ=的最小二乘估计T )ˆ,ˆ(ˆ10βββ=; (2)10ˆ,ˆββ的方差;(3)2σ的无偏估计。
12单因素方差分析的数学模型为i j i j i i j i n j r i N X ,...,2,1;,...,2,1),,0(~,2==+=σεεμ,n n i ni =∑=1。
诸j i ε相互独立。
(1)试导出检验假设r r H H μμμμμμ,...,,::211210↔=== 中至少由两个不相等的统计量。
(2)求2σ的一个无偏估计量。
(3)设μμμμ====r 21,∑==in j ji i i Xn X 11,求常数C 使统计量∑=-=ri i X C 1||ˆμσ为σ的无偏估计.13车间里有5名工人,3台不同型号的机器生产同一种产品,现在让每个工人轮流在3台机试问这5位工人技术之间和不同型号机器之间对产量有无显著影响?)84.3)8,4(,46.4)8,2(,05.0(05.005.0===F F α14设有线性模型77665544332211332εεεεεεε+-=++=+-=++=+-=+-=++=b a Y b a Y b a Y b a Y b a Y b a Y b a Y其中7654321,,,,,,εεεεεεε相互独立且同服从正态),0(2σN 分布,(1)试求的最小二b a ,乘估计量b aˆ,ˆ; (2)试求b a Yˆ5ˆˆ+=的概率分布。
15某数理统计教师随机地选取18名学生把他们分为3组,每一组各采用一种特殊的教学方假设学生成绩服从正态分布,试问:在显著水平05.0=α下这三种教学方法的教学效果有无显著差异?哪种教学效果最好?注:70.2)15,2(05.0=F(注:可编辑下载,若有不当之处,请指正,谢谢!)。