应用数理统计概述不确定性数学:1 . 概率论、数理统计),,(P F Ω 2 . 模糊数学 )}(,{x x ϕM 3 . 灰色数学 ],[b a H 4 . 未确知数学 )}(],,{[x F b a对于上述各个数学分支,各自有相应的运算法则和适用范围。
(一) 概率论:1.),,(P F Ω: E 是一个随机试验,Ω 为E 的全体基本事件的集合 F 由Ω的一些子集为元素 所构成的集合人们通过对某事件A 的频率)(A f 的研究,发现了概率 )(A P 和性质及运算 2.讨论的一般方法: 随机变量 → 分布 → 数学期望、方差等(宏观指标) ① 对于一维 : )(ωξξ= )(i i x ωξ= ∑<=<=x x i i p x P x F }{)(ξ, i i p x P ==}{ξ ;⎰∞-=<=xdt t p x P x F )(}{)(ξ, 0)(≥x p .⎰∑∞+∞-∞==dx x xp p x E i i i )(1或ξ; 2)(ξξξE E D -=② 对于n 维 : 随机变量),,,(21n ξξξ → 实数),,,(21n x x x},{})({),,(2211121n n ni i i n x x x P x p x x x F <<<=<==ξξξωξω ;(二) 数理统计:1.基础:统计量⎪⎩⎪⎨⎧=∑=数据分区间处理经验型,如:公式型,n i in 11ξξ 及其分布 ⎩⎨⎧经验分布(直方图)分布如:统计分布2χ2. 样本的处理:① 参数估计; ② 假设检验(参数假设检验<本科>、非参数假设检验<分布拟合 与 两总体相等性检验>);③ 回归分析; ④ 方差分析 与 正交试验设计.数理统计的基本概念与抽样分布(复习)一. 基本概念:1. 总体ξ( 被研究对象的全体 );2. 样本 (n ξξξ,,,21 ) → 观测值(样本值 或 样本点) (n x x x ,,,21 ) 定理:→)()(~x p x F 或ξ∏∏==ni i n i i n x p x F 1121)()(~),,,(或ξξξ3.统计量 针对要解决的问题而构造的相应的样本的函数 ),,,(21n T T ξξξ = 注:统计量不含任何未知参数, ∑==ni in11ξξ如:等212*)(11ξξ--=∑=ni in S,它是公式性质的量.二.经验分布函数与直方图:目的:用观测值(数据)去估计和推断总体ξ的分布)()(x p x F 或 即:用数据 → 样本分布)(x F n ≈)(x F ; 直方图)(x p n ≈)(x p1.经验分布函数: ① 定义 若n x x x ,,,21 →ξ记 )(x n ν 为 n x x x ,,,21 中<x 的个数,则称)(x n ν为 经验频数 ; 并称+∞<<∞-=x nx x F n n )()(ν 为总体ξ的 经验分布函数(样本分布函数).② 操作 将)()2()1(21,,,,,,n n x x x x x x → 则⎪⎪⎩⎪⎪⎨⎧>-=≤<≤==+)()1()()1(11,,2,10)()(n k k n n x x n k x x x n k x x n x x F ν易知:1})()({lim =<-∞→εx F x F P n n ; )())((x F x F E n =;1}0)()(lim{==-+∞<<∞-∞→x F x F SupP n x n (格利汶科 Гливенко)2.直方图: 总体ξ的分布称为理论分布,即:)()(x p x F 或这里是用样本(数据)构造经验分布)(x p n ≈)(x p 其中)(x p n 的图象称为直方图① 离散型:设总体ξ的分布列 i i p x P ==}{ξ 未知,若n ξξξξ,,,21 →令 )(x i ν 表示该抽样中事件}{i x =ξ出现的次数, 则用n i p nx ii ,,2,1)( =≈ν 事实上,)(∞→−→−n p niPi ν② 连续型:设总体ξ的分布密度)(x p 未知,若n ξξξξ,,,21 →设 ),[],[)()1(b a n ⊂ξξ, 将 ),[),[1+−−→−i i m a a b a 个分 令 i ν 为样本落在),[1+i i a a 中的个数,则⎰+=<≤−→−+1)(}{1i ia a i i Pidx x p a a P nξν ≈ma b a P i -=}{ξ所以 ≈=}{i a P ξn m m i ab m ni<-=-⋅;1,,2,1 ν故③ 作图实例: (P.65 例1考察钢的含硅量ξ的)(x p n , 以此说明直方图的作法)1+i i处理方法 :找 95.0,64.0)()1(==n x x ;确定 )955.0,635.0[),[=b a ;确定小区间个数 16=m 以得 组距02.0=-ma b ; 计算 i ν ;画出以 ),[1+i i a a 为底边,高为的各个矩形 .有p.67 直方图p注: 区间个数m 的大小应根据数据个数n 的大小而定; 当n 、m (m <n ) 都充分大( 即:缩小组距 ) 时,)(x p n 的上边缘将以光滑的曲线)(x p 为极限.)(x p ≈三.常用统计分布: 1.分布2χ:① 若n N ξξξξ,,,)1,0(~21 →,则 统计量 )(~2122n ni iχξχ∑==② 若n N ξξξσμξ,,,),(~212 →,则 )(~)(12222n n i χμξσχ∑-=③ 分布2χ的密度曲线为: ④ 分布2χ的实用性结论⑴ 若 22221,,,m χχχ 独立,且),,2,1()(~22m k n k k =χχ则)(~1212∑∑==mk k mk kn χχ称为分布2χ的可加性⑵ 若)(~22n χχ则)()1,0(22∞→−→−-n N nnLχ⑶ 若)(~22n χχ则)()1,0(1222∞→−→−--n N n Lχ 或 )()1,12(22∞→-−→−n n N Lχ证明思路:}122{)(2x n P x F n <--=∆χ}2{}2)12({222n x nn P n x P εχχ+<-=-+<=其中 0lim =∞→n n ε 所以 )(21lim )(lim 22x dt ex F tx n n n nΦ==-+∞-∞→∞→⎰επ2.t 分布:① 若ξ、η独立,且)1,0(~N ξ,)(~2n χη则 统计量 )(~n t nt ηξ=② 若),(~2σμξN ,)(~22n χση,ξ、η独立,则 )(~n t nt ημξ-=xp③ t 分布的密度曲线为: ④ 结论 :设 )(~n t t ,记 密度为)()(x p n t则 ∞→n lim )()(x p n t )(2122+∞<<-∞=-x exπ一般 )30(2)(>≈n ex p t π3.F 分布:① 若ξ、η独立,且)(~2m χξ,~2χηm ξ推论:若),(~n m F F ,则 ,(~1n F F② F 分布的密度曲线为:4.分位数(分位点): αx αλ ① 分位数的概念:(i )下侧分位点 αx 使 αξαα==<)(}{x F x P (ii )上侧分位点αλ 使αλξα=≥}{P 显然αλξα-=<1}{P ② 几种分布的常用分位数说明:(本教材利用下侧分位点作为分位数,有)(i ) 标准正态分布 )1,0(~N U , α的分位数记为αu ,即:ααα=Φ=<)(}{u u U P (查正态表)或 αααα=≥⇒-=>-}{1}{21uU P u U P(ii )2χ分布:)(~22n χχα的分位数记为 )(2n αχ,即:αχχα=<)}({22n P (查2χ表) 或 αχχχχαα=≥<-}{2212222及P注:当n >45 时,使用 22)12(21)(-+≈n u n ααχ(iii )t 分布: )(~n t t α的分位数记为 )(n t α,αα=<)}({n t t P (查t 表)注:当n >45 时,使用 ααu n t ≈)(x或 αααα=≥⇒-=>-)}({1)}({21n tt P n t t P(iv )F 分布:),(~n m F F α的分位数记为 ),(n m F α,即:αα=<)},({n m F F P (查F 表) 或 ααα=≥<-}{212FF F F P 及注: ),(1),(1m n F n m F αα=-四.抽样分布的常用结论:1.,),(~1),(~122∑==nk knN nN σμξξσμξ,则)1,0(~N nσμξ-且2. 1,,,),(~21211n N ξξξσμξ →设2,,,),(~21222nN ηηησμη →独立与且}{}{21k k ηξ)1,0(~)()(222121212221N n n σσμμηξσσ+---为已知,则,若21212222111)()(n n S w+---==μμηξσσσ则未知,若)2(~21-+n n t 2)1()1(2212*222*1121222211-+-+-=-++=n n S n S n n n S n S n S w 其中∑=--=11212*1)(11n k kn Sξξ ∑=--=21222*2)(11n k kn Sηη3. ),,(~2σμξN )1(~1---=-*n t n S nSμξμξ则4. ),1,0(~N ξ 独立;或与则)(22*S S ξ ;且)1(~)()1(222*2--=-=∑n Sn nSi χξξ),,(~2σμξN 独立;或与则)(22*S S ξ;且)1(~)(1)1(22222*22--=-=∑n Sn nSiχξξσσσ5. 1,,,),(~21211n N ξξξσμξ →设2,,,),(~21222n N ηηησμη → 则)1,1(~2121222*22211--⋅*n n F S n S n σσ注:对于非正态总体的抽样分布,一般不易求出.但在大样本抽样的情况下,样本均值ξ有如下的近似分布: 设总体ξ,ξD 存在,n ξξξξ,,,21 → 则ξ近似服从 ),(2⎪⎪⎭⎫⎝⎛n D E N ξξ 五.顺序统计量与样本极差: 1.顺序统计量的概念:设n ξξξξ,,,21 →n x x x ,,,21 →排序 )()2()1(,,,n x x x , 则 ),,,(21)(n k k x x x f x =称),,,(21)(n k k f ξξξξ = 为 顺序统计量 (它不含未知参数)称)(k ξ为样本的第k 个顺序统计量, k nk ξξ≤≤=1)1(min 为样本的最小顺序统计量knk n ξξ≤≤=1)(max 为样本的最大顺序统计量.2. 样本极差的概念:设n ξξξξ,,,21 →)()2()1(,,,n ξξξ →称 ji nj i n n R ξξξξ-=-=≤≤,1)1()(m a x 为 样本极差注:关于样本极差的分布,若 ),1,0(~N ξ 那么,样本极差的分布函数、分位数、nER 、nDR在较详细的数理统计用表中,都有已编制的数值表可查.。