当前位置:文档之家› 统计学复习整理

统计学复习整理


(4)如果被抽总体不是正态分布总体,但具有平均数μ 和方差
σ
2 ,当随样本容量n的不断增大,样本平均数 x 的分布也越来 越接近正态分布,且具有平均数μ ,方差σ 2 /n 。
不论总体为何种分布,只要是大样本(n≥30),就可运用中 心极限定理,认为样本平均数的分布是正态分布,在计算 样本平均数出现的概率时,样本平均数可按下式进行标准 化。
收集数据
描述统计 推断统计
整理与分析
资料积累 开发应用
计数资料整理用单项式分组法 计量资料整理用组距式分组法 变异数种类:极差,方差,标准差,变异系数 (CV=s / x × 100%,标准差:样本平均数)
(三)算术平均数的重要性质 离均差之和等于零。
Σ(x-x) = 0
离均差平方和最小。
Σ(x-x) 2 <Σ(x-a) 2
(1)伯努利大数定律 设m是n次独立试验中事件A出现的次数, 而p是事件A在每次试验中出现的概率,则对 于任意小的正数ε,有如下关系:
n
lim P {
m p n
<ε}= 1
若试验条件不变,重复次数n接近无限大时,频率与理 论概率的差值必定要小于一个任意小的正数ε,即这两者可 以基本相等,这几乎是一个必然要发生的事情。
(2)辛钦大数定律 设x1,x2,x3,…,xn是来自同一总体的变量, 对于任意小的正数ε,有如下关系:
n
lim P {
x
<ε}= 1
若试验条件不变,重复次数n接近无限大时,随机变量的 X与总体平均数之间的差一定小于一个任意小的正数ε,即这 两者可以基本相等,这几乎是一个必然要发生的事情。
3、n , 2 可使两类错误的概率都减小.
1、总体方差σ2已知,无论n是否大于30都可采用u检验法 2、总体方差σ2未知,但n>30时,可用样本方差s2来代替 总体方差σ2 ,仍用u检验法
x u= sx
3、总体方差σ2未知,且n<30时,可用样本方差s2来代替 总体方差σ2 ,采用df=n-1的t检验法
互作也有正效应(协同作用)与负效应(拮抗作用)之分。
准确性(accuracy),也叫准确度,指在调查或试验中某一试验指标或性状的观测值与
其真值接近的程度。

精确性(precision),也叫精确度,指调查或试验中同一试验指标或性状的重复观
测值彼此接近的程度。
生物统计分析的一般过程
统计设计 统计调查、 实验
假设检验
概念 :
假设检验(hypothesis test)又称显著性检验 (significance test),根据总体的理论分布和小概率原理, 对未知或不完全知道的总体提出两种彼此对立的假设,然 后由样本的实际结果,经过一定的计算,作出在一定概率 意义上应该接受的那种假设的推断。
=0.05/0.01
x =

n
(1)样本平均数分布的平均数=总体平均数。
x =
(2)样本平均数分布的方差=总体方差除以样本容量。

2 x
=

2
n
(3)如果从正态分布总体N(μ ,σ 2)进行
抽样,其样本平均数 x 是一具有平均数 μ ,
方差σ 2/n的正态分布,记作N(μ ,σ 2/n)。
中心极限定理 (central limit theorem)
二项分布(贝努里分布):B(n,p)
现已求出某事件发生的概率,若试验N次,则该事件发生的 理论次数为: 理论次数=NP(x)
一、二项分布
统计学证明,服从二项分布B(n,p)的随机变量x所 构成的总体的平均数μ x 、标准差σ x与n、p这两个参 数有关。
μ
x=n p
x = npq
在二项分布中,事件A发生的频率 x/n称为二项 成数,即百分数或频率。则二项成数的平均数和标 准差分别为:


双尾 检验 分位数
u 0.05=1.96 u 0.01=2.58

否定区
接受区
否定区
接受区
否定区
单尾 检验 分位数
u 0.05=1.64 u 0.01=2.33
两类错误
假设检验的两类错误
H0正确 否定H0 接受H0 错误() 推断正确(1-) H0 错误 推断正确(1-) 错误()
第一类错误(type I error),又称弃真错误或 错误; 第二类错误( type II error ) ,又称纳伪错误或 错误
结论
1、 两类错误既有联系又有区别
错误只在否定H0时发生
错误只在接受H0时发生
错误增加 错误减小 错误增加 错误减小
结论 2、 还依赖于 - 0 的距离
μ
p =p
p = pq/n
泊松分布: 对于小概率事件,可用泊松分布描述其概率分布。 二项分布当p<0.1和np<5时,可用泊松分布来近似。
μ =λ σ 2 =λ σ=
如果所有可能样本的某一统计数的平均数等于总体的相应 参数,则称该统计数为总体相应参数的无偏估计值。
样本平均数的标准误差(标准误) (standard error of mean)
x t sx
同标准正态分布曲线一样,统计应用中最为关心的是 t分布曲线下的面积(即概率P)与横轴t值间关系。 为使用方便,统计学家编制不同自由度#43;∝)
F分布曲线的形状仅决定于df1和df2。在df1=1或2时, 2 F分布曲线呈严重倾斜的反向J型,当df1≧ 3时, 转为左偏曲线。
( 2), 6.统计数:描述样本特征的数,是样本观测的已知函数
样本平均数(
x
),样本方差(s 2),
7.效应:通过施加试验处理,引起试验差异的作用。效应是一个相对量,而非绝对量,
表现为施加处理前后的差异。效应有正效应与负效应之分。
8. 互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。
1. 统计学特点:概率性,二元性,归纳性
2. 大数定律: 样本容量越大,样本统计数与总体参数之差越小 3. t分布与t检验法 4.变量: 或变数,指相同性质的事物间表现差异性或差异特征的数据。( xi )
5.参数:描述总体特征的数,通常未知,用希腊字母表示,总体平均数(),总体方差
(二)方差(Variance) (自由度,字母)
样本
S2 = σ 2=
(x-x ) 2
n-1
总体
(x-μ
N
)2
(三)标准差(standard deviation, Sd)
S =
(x-x ) 2
n-1
x
=
2
2 ( x ) -
n n-1
大数定律:是概率论中用来阐述大量随机
现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与 总体参数之差越小。
u =
x x
x
=
x
/
n
(3)从两个独立正态分布总体中抽出的样本平均数差 数的分布,也是正态分布。
N (1 2 ,
2 x1 x2
)
t分布的平均数μ 和方差σ
t 2
t
t = 0(df 1)
df = (df 2) df 2
2 t
t分布曲线与横轴所围成的面积为1。
相关主题