卡方分布及其它分布
r1
0, r2
6 ,n n4
5,6,
性质 4 tn 分布由于只有 n 1阶矩存在,故没有矩母函数存在。
性质 5
如 X 1 和 X 2 独立同分布于 2 n ,则随机变量Y
2x
20
然后利用刚刚的讨论可知
11
11 1
11
T (x; n)
2
2
I x2 /(nx2 ) ( 2 ,
n) 2
2
I n /(nx2 ) ( 2 ,
n) 2
综上所述便得我们所要的结论。
t 分布的密度函数及证明
设 , z 为相互独立随机变量, 服从正态 N (0,1), z 服从自由度为 n 的 2 —分布,则
t=
z n 的密度函数为
n 1
ft (x)
f
/
(x)
z/n
(
2
)
• (1
x2
n1
)2
n (n)
n
2
称 ft (x) 是自由度为 n 的 t —分布(或 Student 分布)的密度函数,
证:首先,易知与 z n 相互独立,事实上,
F (x, y) P{ x, z y} P{ x, z ny2}
, z
n
n
P{ x}• P{z ny2}
P{ x}• P{ z y} n
F (x) • F
z ( y),当y 0时. n
F
,
z (x) 0 F (x) • 0 F (x) • F
(x),当y 0时.
z
n
n
故得证与 z n是相互独立的 . (其实,由商的密度函数为
f
1
(x)
二、 卡方分布的性质::
(1) (可加性)
设Yi
~
2 ni ,i
,i
1,,
k , 且相互独立,则
Y1
Yk
~
2 n,
,
这里 n ni , i .
(2)
E(
2 n ,
)
n
,
Var(
2 n ,
)
2n
4.
证明 (1)根据定义易得。
(2)设 Y
~
2 n,
,则依定义,Y可表示为
Y
X
2 1
X
2 n1
X
n 2
(
n
1)
2
( n )
n1
(n x2 ) 2
2
n 1
(
2
)
(1
x2
n1
) 2.
n ( n) n
2
证明过程用到公式
( )
0
x1ex dx
2
0
y 21e y2 dy
( 0).
t 分布的 w 特征函为:
(t)
( n 1)
2
(1 x^2)^ ( n 1)wal(x,t)dx
n ( )
n
2 n
,
其中 X i ~ N (0,1), i 1,, n 1, X n ~ N ( ,1), 且相互独立,于是
n
E(Y )
E
(
X
2 i
),
(1)
i 1
n
Var(Y )
V
ar(
X
2 i
).
(2)
i 1
因为
E(
X
2 i
)
Var(X i )
E(Xi )2
1, 1 ,
i
1,, n i n.
中判别积分收敛的法则很容易看出。
若 r n ,且 r 为奇数,由于函数 x r (1 x 2 / n)(n1) / 2 是 x 的奇函数,因此,r 0 ;
若
rn
且
r
为偶数,可以算得
r
r
nr
/2
(n
1•3• 2)(n
5(r 1) 4)(n
r)
特别
E(X ) 0,Var(X ) n , n 3,4, n2
4、与标准正态分布相比,t 分布的中心部分较低,2 个尾部较高。
5、变量 t 的取值范围在 到 之间
图 1 自由度为 1、5、∞的 t 分布
t 分布有如下性质:
性质 1
令 g(x) (1
2
x ) (n1) / 2
n
则 g (x) n 1 (1 x 2 )(n3) / 2 • x
n
1,
代入( i
3,
i 1,, n 1,
E
X
4 n
2
6
3.
于是
Var(
X
2 i
)
EX
4 i
(EX
2 i
)
2
3 1
2,
i 1,, n 1,
Var
(
X
2 n
)
EX
4 n
(
EX
2 n
)
2
2
4.
代入(2)便证明了第二条结论。
三、 卡方分布的概率密度函数:
P x2 z
1
2
n 2
1
n
x
n1
2 z
d
0
2
1
2
n 2
1
n
z n 1
2 2 d
0
2
即, 2 的密度函数为
f
z2
x
2
n 2
1
n 2
z
n 1 z
2 e2
,当z
0
0,其他
称这个密度函数所定的分布为自由度为
n
的
2
分布,记作
2 (n)
。它的图像
如下:
图(一) 2 分布密度函数图
t 分布的有关知识
t 分布的概述及其历史
在概率论和统计学中,学生 t-分布(Student's t-distribution)应用在当对呈 正 态 分 布 的 母 群 体 的 均 值 进 行 估 计 。它 是 对 两 个 样 本 均 值 差 异 进 行 显 著 性 测 试 的 学 生 t 测定的基础。t 检定改进了 Z 检定,不论样本数量大或小皆可应用。在样本数量大 (超过 120 等)时,可以应用 Z 检定,但 Z 检定用在小的样本会产生很大的误差,因 此样本很小的情况下得改用学生 t 检定。在数据有三组以上时,因为误差无法压低, 此时可以用变异数分析代替学生 t 检定。 当母群体的标准差是未知的但却又需要估计时,我们可以运用学生 t-分布。 学生 t-分布可简称为 t 分布。其推导由威廉·戈塞于 1908 年首先发表,当时他还在都柏林的 健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一 笔名。之后 t 检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为 学生分布 由于在实际工作中,往往 σ 是未知的,常用 s 作为 σ 的估计值,为了与 u 变换区别,称为 t 变换 t= x u ,统计量 t 值的分布称为 t 分布。
f
x2
x
2
n 2
1
n 2
x
n 1
2e
x 2
,当x
0
0,其他
设随机变量 X1,.... Xn相互独立且都服从 N(0,1)。现在来推导随机变 数
^2 1 ^2 ..... n ^2的分布。
1,
n
的密度函数为 1 2n^
n
^
1 2
x
1
^
2
x
n
^
2
2
当z 0时,P 2 z P 12 X n 2 z 0
B(1 , 1 n)
n
22
当 x 0时,上式为
0
T (x; n)
1
(1 y 2 ) (n1) / 2 dy x
B(1 , 1 n) n
0
22
1
(1
B(1 , 1 n)
y2 n
)
( n 1)
/
2
dy
A1
A2
22
由于 t( y; n)dy 1,故立即可得 A1 1/ 2 ,为了计算 A2 ,我们做变换 t y 2 /(n y 2 ) 则
另外,写论文的过程中也使我们对论文的格式有了一个了解,更规范更具 体,为以后的学业报告做了一次很好的准备。论文属于科学性的文章,它有严格 的书写格式规范,因此一篇好的论文一定 要有正确的格式,论文格式错误就不 能得到好成绩,因此我们写论文时要端正态度,注意书写格式。
多元课程的设计更加是丰富了我们的业余生活,让大家聚在一起讨论题目, 其乐融融。这样的课程设计也能使我们找到志同道合的朋友,发现生活中的点滴 数学趣事,从实际出发思考题目,同时我们对计算机的知识也有了一定的加深, matlab 的使用等等。
f1 (x2 x) f2 (x2 ) x2 dx2.
2
故
n
2( )
f
(x) 2 •
z n
( n )
2
1 2
e x e dx ,
x2 x22 2
n
nx22 2
0
2
2
令u x2 n x2 ,则上式变为 2
n
f
(x)
z n
( n )
n2
n1
0
2u neu2 du
(n x2 ) 2
2
n
=
dx
=
六、 论证过程中的心得体会:
首先通过对卡方的研究和证明,提高了我们对数学的兴趣。其次,通过这 次的推导和搜索资料进行分析,大大提高了我们的独立思考的能力,我们当中很 多同学之前都很害怕类似的证明题,这一次的合力解决难题使我们信心倍增。 当然同时,这个合作锻炼了我们团队合作的能力,分工合作解决问题,有的人负 责收集资料,有点人负责推导公式,有的人负责输入文章,整理公式,等等。这 让大家明白了团结的力量。做出合理的时间安排, 做任何事情,合理的时间安 排非常重要,多元课程设计也是一样,事先要做好一个规 划,课程设计一共分 5 个板块(定义,性质,特征函数,密度函数,分布函数,心得体会)。你每 天 要做完哪几个板块事先要确定好,这样做才会使自己游刃有余,保证在 2 周时间 内内完成论文,以避免由于时间上的不妥,以致于最后无法完成论文。