&5.3 统计量及其分布习题与解答5.31.在一本书上我们随机地检查了 10页,发现每页上的错误数为 4560314214试计算其样本均值,样本方差和样本标准差 解样本均值又=;二—^亠3. 样本方差 sX j - x ■ 4 - 34 - 3 二3-78,n -1 y 19 _样本标准差s 二 s 2 =1.94. 2证明:对任意常数c,d 有nn'X j - c y j - d ]_ I * - x yn X- c Y- d .j 1j z!nn_n_送(X _c )(y j_d )=Z (X j_X+X-c )(y j _Y + y _ d )=送(X j -X )( y )+i 1 八j =1j =1八n_nn_迟(X -c jt yj _ y )+迟(Xj -X )( yj -d ) + 瓦(X -c )( y-d ),j 1 j j 二 jj mnn_由一 i X j —X i ; = 0〕 y — y :U 0,得j=1imnn__'X —c y j —d ! _ iX j —X y j— y n X-c y — d ,j 1j *因而结论成立.3.设X 1,..., X n和%,..., y n 是两组样本观测值,且有如下关系: y=3X j -4, i=1,2.., n,试求样本均值X 和y 间的关系以及样本方差 S X 和Sy 的关系.1 n-1 n..八y Y i 3X j - 4 =n i 42 11E 3x i 4 3x+4n—lJXj-X 化因而得y二3x-4与 2 2S厂9S x4•记xn+1n -1X n d -X n,n =1,2.…,证明SnS n 1J X i(X i -x nx+xnILn +1X(X i -X n )n +^1 ■X n+1)n+1 n+1(X i -X n+1 n+1 n+1X i 「X -X n+1 )2n+1 n+1 (X n+1 -X n) -4 二3x-4,3/X in y21 nX n+1 -*n (n +1 丿n-11 n_ 21 _ 2(X i -X n ) X n+1 -X nn n -1 ijn 11 - 2I.X n +1 - X nn 15•从同一总体中抽取两个容量分别为 n,m 的样本,样本均值分别为X 1,X 2,样本方差分别为s 2,s ;,将两组样本合并,其均值力差分别为2x,s ,证明:-mx 2 x 二 2 222(n - 1)s (m-1)s 2 nm(X [-x 2)s 二证设取自同一总体的两个样本为X 11 , X 12,...,X in ; X 21,X22,…,X 2m .由x ;'1代…NnX^ %…B 得x 11 ... ■ x 1n x 21x 22 …x 2mmx 21 n— — - 2.-- ---- —[Z (X [i — X [ + X [— X ) +》(X 2i 一 X 2 * X 2 — x)]1 ° — — —2 ----------------------------------------------------------------------- ------------------- - 2[£ (冷一人)+n(x 〔—x) +瓦(X? —X 2)+m(x 2 -x)i An^ mx 2 221 2S n 1(X i -X n )-n i J i _ 2X n+1 -X n由s 2亠' (N i -为)22n -1 y,S 21佑“2m -1 id1(X 1i -x)2-n m -1 y(X 2i -X )]nx-i mx 2)m(X 22 1 n 二(n - 1)s2 (m -1)S22. n(X1n m 'n m -1_ (n - 1)s2 (m-g2 . nm(% -x2)6.设有容量为n 的样本A,它的样本均值为X A ,样本标准差为S A ,样本 极差为R A ,样本中位数为口人•现对样本中每一个观测值施行如下变换ax b ,如此得到样本B,试写出样本B 的均值,标准差极差和中位 数.解 不妨设样本A 为:x 1,x 2,...,x^:?,样本B 为:y 1,y 2,...,y 」,且 ax +b,i=1,2,…,n,— y 〔 y 2 …ynax 1 b ax 2 b …ax n by B ax A b,s B = —(y j _ yB )2= —(ax b _ ax _ b)2 = a 2s A ,n - 1 yn -1 i因而 S B = |a s A.R B 二 y (n )- y (1)= ax (n ) b- ax ⑴- b = a(x (n^ x (“)= aR a ,y 口 , n 为奇数, (_T )1 2(ax nb, n 为奇数()1-(ax n b ax n b), n 为偶数S 2 =(% _x)2 (x 2 - x)2 =(%证:2 22二(X 1 -X 2) . (X 2 - X 1)_ (X 1 -X 2)=a m Ab7•证明溶量为2的样本X I ,212X 2的方差为T )2© —于 2 2X i X 2\28.设X i ,…,X n 是来自U (一1,1)的样本,试求E(X)和Var (x) 解 均匀分布的均值和方差分别为0和1/3,该样本容量为n,1 因而得 E x 二 0,Var x , 3n9.设总体二阶矩存在 X i ,..., X n 是样本,证明X-X 也X j- X (iH j)的相 关系数为-(n-1)'对次你能够给予解释吗? 2,则 p —XrCov(“X j X)Jvar(X j -x)Jvar(X j -x)由 Cov(X j - x, X j - x) = Cov(x ,X j )-Cov(x ,x) - Cov(X j,x) + Cov(x, x)--a 2由于,Cov(X i,X j )二 0,Cov(x,x),n1 n., Cov(x i ,x) = Cov(x j ,x) = Cov(x ix i )= 一 n im nVar(x - x) = Var(X j - x) = Var(X [ - x)“j—"22(n ® 2n n(n -1Xn所以订X i -x,X j -x) — (n -1)_1n__由于v (X i - x^ 0 ,故其中任意一个偏差X i - x 的增加,都会使另一i 三 个偏差X j -X 减少的机会增加,因而两者的相关系数为负.10.利用切比雪夫不等式求抛均匀硬币多少次才能使正面朝上的频率证不妨设总体的方差为因而 Cov(x - x,X j -x)落在(0.4,0.6)间的概率至少为0.9.如何才能更精确地计算这个次数?是 多少? 解 均匀硬币正面朝上的概率p=0.5,设X n 为n 次抛硬币中正面朝上的 次数,则有X nD b n 据题意选取次数n 应满足X np (0.4 — 0.6) — 0.9n此式等价于p (X n - 0.5n a 0.1n )£ 0.1 ,利用切比雪夫不等式估计上25 再由不等式 0.1可得粗糙的估计n- 250.即抛均匀硬币250次n后可满足要求.事实上,利用x 的渐近正态性可以得到更精确的结论.由中心极限定理 知样本均值 X = ',vn (x —0.5)/J0.5江 0.5[ N (0,1),故nP (0.4 x 0.6)= P (d x — 0.5/0.5 匸/5) = 2 (冷/5) T - 0.9,即门(jn/5) 一0.95,故行/5一 1.645这就给出较精确的上界 n 启(5況1.645),这表明只需抛均匀硬币68次就可满足要求.两 个结果差异很大,说明切比雪夫不等式是一个较为粗糙的不等式,在能 够使用大样本结果的情况下应尽量使用中心极限定理 .11.从指数总体Exp (1厂)抽取了 40个样品试求X 的渐近分布. 解 由于指数总体Exp (1八)的均值为二,方差为二2,于是x 的渐近分(日2、布为N.12. 设X i ,...,x 25是从均匀分布U (o,5)抽取的样本,试求样本均值x 的式左端概率的上界 p( x^ -0.5n 色 0.1 n)兰 n 0.5(1-0.5) (0.1 n)225n渐近分布.解均匀分布U (0,5)的均值和方差分别为5/2和25/12,样本容量为25, 因而样本均值X的渐近分布为N12 12 丿13. 设X i,..., X20是从二点分布b(1,p)抽取的样本,试求样本均值x 的渐近分布.解二点分布b(1,p)的均值和方差分别为p和p(1-p),样本容量为20, 因而样本均值X的渐近分布为N '' P,卫生PI 20丿14•设X1,…,X8是从正态总体N 10,9中抽取的样本,试求样本均值x 的标准差.解来自正态分布的样本均值仍服从正态分布,均值保持不变,方差为原来方差的1/n,此处总体方差为9,样本容量为8,因而Va「X二9/8的标准差为3,2/4 = 1.06.15. 切尾均值也是一个常用的反映样本数据的特征量,其想法是将数据的两端的值舍去,而剩下的当中的值来计算样本均值,其计算公式X」1厂X(h:」2厂…心_*])(h:是X 書乔,其中0: 1 /2是切尾系数,M)岂人刀乞…乞X(n)是有序样本。
现我们在某高校采访了16名大学生,了解他们平时的学习情况,以下数据是大学生每周用于看电视的时间:15 14 12 9 20 4 17 26 15 18 6 15 5 8取:=1/16,试计算其切尾均值:解 将样本进行排序得x (i )= 4,…,“6)=26,当:=1/16时,由题意得,切尾均值16. 有一个分组样本如下试求该分组样本的样本均值.样本标准差,样本偏度和样本峰度 解计算过程列表如下因而可得样本均值,样本偏度和样本峰度分别为X(2).….X (15)X 1/16 :145 6 …20 14180= 12.86. 1417.检查四批产品其批量与不合格率如下 批号 批量 不合格品率1 100 0.052 300 0.063 250 0.04 41500.03试求这四批产品的总不合格率解 这批产品的总不合格率为100 0.05 300 0.06 250 0.04 150 0.03100+300 + 250 + 15018.设总体一等概率取1,2,3,4,5,现从中抽取一个容量为4的样本,试分 别求X (1)和X ⑷的分布.201620723,192880/20 1620/20 3/2 心98, 2 二296340/20一 3「0.742.2(1620/20)二 0.047.P (x (1)P (x (1)由古典概率可得P (x (1)- k )二=1)= P(x (1)-1)-P(x (1)- 2) = 1- =2) = P(x (1)- 2) - P(x (1) 、4,k = 123,4,5. 飞-k< 5 J=0.5904,-3) =P ©<5>二0.28,=3) = P(x (1)- 3) - P(x (1)- 4)二®4 ⑵I 0.104,5P (x (i )= 4) = P (x (i )一 4) - P (x (i )一 5)=P (x ⑴=5) = P (x (1^5> = 0.0016,i5丿这就给出了(i )的分布列类似的,p (x (4)乞 k ) =($4,k =1,2,3,4,5.5p (x (4)=1) = p (x (4)咗 1) = 0.0016, p (x (4)二 2) =p (x ⑷乞 2) - p (x (4)空1) = 0.024p (x ⑷二 3) = p (x^)乞 3) -p (x ⑷乞 2) = 0.104 p (x ⑷二 4) = p (x ⑷乞 4) -p (x ⑷乞 3) = 0.28 p (x (4) = 5)= 1 - p (x 4 乞 4) =0.5904这就给出X (4)的分布列19.设X"…,为6是来自N (8,4)的样本,试求下列概率(1) P (xJ 10);2 P (X (D 5).解 ⑴ p (x (16) 10) = 1— p (x (16)「0) = 1一(P (X 1「0)1610 — 8 16 16=1 _(①(^_))16= 1_ 0.84136= 0.9370,=0.0245_ 8(2)p(x (i )5厂個心 5))16=(1- :」(〒))16--16二邛(1.5)1 二 0.330820.设总体为韦布尔分布Wei(m,),其密度函数为m Ap)(x; m, ) = mx ^exp{-(-)m }, x 0, m 0, 0现从中得到样本%,…,X n ,,证明x(1)仍服从韦布尔分布,并指出其参数.解由总体分布的密度函数可得总体的分布函数 F(x)为因而最小次序统计量X (D 的分布函数为上f上『P x (1^ x = 1 - P x(1)x i ; = 1 -(e )n = 1 - e , x 0.这说明 x (1)D Wei(m ). 21.设总体密度函数为p(x)二6x(1 - x),0 :: x 1,兀,…,X g 是来自该总体的样本,试求样本中位数的分布. 解总体分布函数为F(x)二;6t(1-t)dt = 3x 2-2x 3 二 x 2(3-2x),0 空 x 「,1 一 F(x) = (1- X )2(2X 1),0 乞 1.故样本中位数m °.5二x (5)的精度分布密度函数为F(x )” 厂x _(t )dt 「°ed(-2二 3780x 9(1 - x)9(3 - 2X )4(2X 1)4这个精确密度函数是26次多项式,使用是不方便的,譬如P m °.5 £ 0.7) 用上述密度函数是可以求的,可就是不方便,寻求近似计算就十分必要.F面来寻求m °.5的渐进分布,由于总体中位数是xo.5二0.5,且P( x 0.5 = 0.5) = 6 x 0.5 x (1 — 0.5) = 3/ 2,利用此渐进分布容易算出概率 P (讥.5丈0.7 )=①(1.8) = 0.9641.22.设X 1,...,X n 是来自U (0j )的样本,X (1) X (n )为其次序统计,令y^, i = 1,...,n -1,y n 二 X (n),x(i 1)证明%,..., y 相互独立.证 令U i =x (i ),i = 1,2,..., n,则U i ,...,U n 的联合密度函数为p(u 1,..., u n ) = n!/二 n ,0 岂 u^ …乞 u n 乞二y y .2.y n ,Un 二 y n,1,..n7 1,0/e 其Jacobi 行列式绝对值为2n —1(F(x))411丿p(x)(1- F(x))4 9(X 2(3-2X ))4I 4丿6x(1 - x)((1 - x 2)(2x1))4故在n = 9时m °.5的渐近分布为m (o.5)D ”(心,21) = N(0.5,丄) 814np (X 0.5)作变换y n-^U n-1/U n ,其逆变换为U n —1二 y ndn ,其中0 yJ =丫2丫3..必,联合密度函数为p(%,…,y n)二n!y2y;...yT(1/T n二(2y2)(3y2)…仲"YJo y「1,^ 1,...,n — 1,0 齐该联合密度函数为可分离变量,因而%, ..y“相互独立,且y i Be(1,1^U(0,1),yJ Be(2,1),...,y n_i「Be(n-1,1),y“/让Be(n,1).n+1。