& 统计量及其分布习题与解答1. 在一本书上我们随机地检查了10页,发现每页上的错误数为4 5 6 0 3 1 4 2 1 4 试计算其样本均值,样本方差和样本标准差. 解 样本均值1...45 (4)x= 3.10n x x n +++++== 样本方差()()()2222111... 3.78,19x 4343ni i n x s=⎡⎤==++=⎢⎥-⎣⎦---∑样本标准差 1.94.s ==2.证明:对任意常数c,d,有 证 ()()()()()()11x .nni iiii i x c d x Y n X c Y d y y ==--=--+--∑∑()()()()()()()()()()()()111111x+x-c x x x nn niiiiiii i i nnniiiii i i xc d x y Y y d x y xc y xd c y d y y y y ======--=--+-=--+--+--+--∑∑∑∑∑∑,由 ()()11x 00nn i i i x y y ==-=-=∑∑,,得 ()()()()()()11x x-c nnii i i i i xc yd x y y n y d ==--=--+-∑∑,因而结论成立.3.设1,...,n x x 和1,...,n y y 是两组样本观测值,且有如下关系:3412...i i y x i n =-=,,,,试求样本均值x 和y 间的关系以及样本方差2x s 和 2y s 的关系.解 ()()()()111221222111133443x-411119911343x+4x n n ni i i i i i ny i nnxi i y y x x n n n in i i n n y y s x x s ========-=-==-==--∑∑∑-∑---∑∑,因而得3-4y x =与229y x s s =.4.记 ()2n 21111x 12....1x n i nn i i x n n n i s x =====-∑-∑,,,,,,证明()()n+1n 1n 22211x x x ,111.1n 1x n n n x n n n n n x s s ++=+-+-=+++-证()()()()()()()()1n n+1n 1n+1n+1n n+1n 2222n+11n+1n+111122n n+1n+1n+112n n n n+1n+1n 111x x x x+x x 1111x x x 111x ()x x 11(x x )x x 121(x )x x x x x n i i n n i i n n i i n i n i n n i i i i xn n n n n n x X X n n X X n nX x n n n s +=++=====++-===+++=+-+⎡⎤=-=-+-⎢⎥⎣⎦=-+-+-=-+--+-∑∑∑∑∑∑,()22n+1n+11x x .n+- 由()()22n n n+1n n+1n+1n n+1n 11111x 0(x x )x x x x (x x )nn n i i i i x n n ===-=-=-=+-∑∑∑,,得()()()()2222221n n+1n n+1n 122n n+1n 122n+1n 111(x )x x x x 11111(x )x x 1111x x .1n n i i n i i n n s X n n n n n X n n n n s n n +==⎛⎫⎛⎫=-+-+- ⎪ ⎪++⎝⎭⎝⎭-=⨯-+--+-=+-+∑∑5.从同一总体中抽取两个容量分别为n,m 的样本,样本均值分别为1x ,2x ,样本方差分别为2212,s s ,将两组样本合并,其均值,方差分别为2,,x s 证明:1222221212,(1)(1)().1()(1)nx mx x n mn s m s nm x x s n m n m n m +=+-+--=++-++- 证 设取自同一总体的两个样本为1112121222,,...,;,,...,.n m x x x x x x 由111212122212......,,n mx x x x x x x x n m++++++==得1112122212.......n m x x x x x nx mx x n m n m+++++++==++由2211111()1n i i s x x n ==--∑2222211,()1m i i s x x m ==--∑ 221211211122211222211122211212122212121[()()]11[()()]11[()()()()1()()(1)(1)1n mi i i i n m i i i i n m i i i i s x x x x n m x x x x x x x x n m x x n x x x x m x x n m nx mx nx mx n x m x n s m s n m n m n m n m =======-+-+-=-+-+-+-+-=-+-+-+-+-++-+--+-++=++-+∑∑∑∑∑∑1-2221212(1)(1)()1()(1)n s m s nm x x n m n m n m -+--=++-++- 6.设有容量为n 的样本A,它的样本均值为A x ,样本标准差为A s ,样本极差为A R ,样本中位数为A m .现对样本中每一个观测值施行如下变换y ax b =+,如此得到样本B,试写出样本B 的均值,标准差,极差和中位数.解 不妨设样本A 为{}12,,...,,n x x x 样本B 为{}12,,...,,n y y y 且,1,2,...,,i i y ax b i n =+=12122222211()(1)()(1)()(1)......,11()(),11.(),n n B A n n i B i B A i i B A B n n n A y y y ax b ax b ax b y ax b n n s y y ax b ax b a s n n s a s R y y ax b ax b a x x aR ==+++++++++===+=-=+--=--==-=+--=-=∑∑因而 1()2()(1)22,(),n n n y n y y n +++为奇数,1为偶数21()2122,1(),2n n n ax b n ax b ax b n +⎛⎫⎛⎫+ ⎪ ⎪⎝⎭⎝⎭++++为奇数为偶数.A am b +=7.证明:容量为2的样本1,2x x 的方差为22121()2s x x =-证:2222212121212222122112()()()()22()()()442x x x xs x x x x x x x x x x x x ++=-+-=-+----=+=8.设1,...,n x x 是来自(1,1)U -的样本,试求()E x 和()Var x解 均匀分布(1,1)U -的均值和方差分别为0和1/3,该样本容量为n,因而得()()10,,3E x Var x n==9.设总体二阶矩存在1,...,n x x 是样本,证明i x x -也()j x x i j -≠的相关系数为1(1)n ---对次你能够给予解释吗证 不妨设总体的方差为2σ,则(,)(,)i j Cov x x x x x x x x ρ----=由,,,(,)()()()(,)i j i j i j Cov x x x x Cov x x Cov x x Cov X x Cov x x --=--+由于, 2,()0,(,),i j Cov x x Cov x x nσ==2,11(,)(,)()n i j i i i Cov x x Cov x x Cov x x n n σ====∑因而2(,),i j Cov x x x x nσ--=-1222122()()()(1)...(1)(1)()i j n Var x x Var x x Var x x n x x x n n Var n n σσ-=-=------+-==2(1),n nσ-=所以1(,)(1)i j x x x x n ρ---=--由于1()0ni i x x =-=∑ ,故其中任意一个偏差i x x -的增加,都会使另一个偏差j x x -减少的机会增加,因而两者的相关系数为负.10.利用切比雪夫不等式求抛均匀硬币多少次才能使正面朝上的频率落在,间的概率至少为.如何才能更精确地计算这个次数是多少解 均匀硬币正面朝上的概率p=,设n x 为n 次抛硬币中正面朝上的次数,则有(,).nx b n p 据题意选取次数n 应满足(0.40.6)0.9nx p n<<≥此式等价于(0.50.1)0.1n p x n n -≥< ,利用切比雪夫不等式估计上式左端概率的上界20.5(10.5)25(0.50.1),(0.1)n n p x n n n n⨯--≥≤= 再由不等式250.1n≤可得粗糙的估计250n ≥.即抛均匀硬币250次后可满足要求.事实上,利用x 的渐近正态性可以得到更精确的结论.由中心极限定理知样本均值(0.5)/(0,1),nx x x N n=-故(0.40.6)0.5/0.5210.9,P x P <<=-<=Φ-≥即5)0.95,Φ≥故5 1.645≥这就给出较精确的上界2(5 1.645)67.65n ≥⨯=,这表明只需抛均匀硬币68次就可满足要求.两个结果差异很大,说明切比雪夫不等式是一个较为粗糙的不等式,在能够使用大样本结果的情况下应尽量使用中心极限定理.11.从指数总体(1/)Exp θ抽取了40个样品,试求x 的渐近分布. 解 由于指数总体(1/)Exp θ的均值为θ,方差为2θ,于是x 的渐近分布为2,40N θθ⎛⎫ ⎪⎝⎭.12.设125,...,x x 是从均匀分布(0,5)U 抽取的样本,试求样本均值x 的渐近分布.解 均匀分布(0,5)U 的均值和方差分别为5/2和25/12,样本容量为25,因而样本均值x 的渐近分布为51,.212N ⎛⎫⎪⎝⎭13.设120,...,x x 是从二点分布(1,)b p 抽取的样本,试求样本均值x 的渐近分布.解 二点分布(1,)b p 的均值和方差分别为p 和p(1-p),样本容量为20,因而样本均值x 的渐近分布为(1),20p p N p -⎛⎫ ⎪⎝⎭14.设18,...,x x 是从正态总体()10,9N 中抽取的样本,试求样本均值x 的标准差.解 来自正态分布的样本均值仍服从正态分布,均值保持不变,方差为原来方差的1/n,此处总体方差为9,样本容量为8,因而()9/8,Var x x =的标准差为4 1.06.=15.切尾均值也是一个常用的反映样本数据的特征量,其想法是将数据的两端的值舍去,而剩下的当中的值来计算样本均值,其计算公式是[][][][](1)(2)()...,2n n n n x x x x n n ααααα++-+++=-其中01/2α<<是切尾系数, (1)(2)()...n x x x ≤≤≤是有序样本。