当前位置：文档之家› 统计学复习整理

统计学复习整理

（4）如果被抽总体不是正态分布总体，但具有平均数μ 和方差
σ
2 ，当随样本容量n的不断增大，样本平均数 x 的分布也越来越接近正态分布，且具有平均数μ ，方差σ 2 /n 。
不论总体为何种分布，只要是大样本(n≥30)，就可运用中心极限定理，认为样本平均数的分布是正态分布，在计算样本平均数出现的概率时，样本平均数可按下式进行标准化。
收集数据
描述统计推断统计
整理与分析
资料积累开发应用
计数资料整理用单项式分组法计量资料整理用组距式分组法变异数种类：极差，方差，标准差，变异系数 (CV=s / x × 100%,标准差：样本平均数)
（三）算术平均数的重要性质离均差之和等于零。
Σ(x-x) = 0
离均差平方和最小。
Σ(x-x) 2 <Σ(x-a) 2
（1)伯努利大数定律设m是n次独立试验中事件A出现的次数，而p是事件A在每次试验中出现的概率，则对于任意小的正数ε，有如下关系：
n
lim P {
m p n
<ε｝= 1
若试验条件不变，重复次数n接近无限大时，频率与理论概率的差值必定要小于一个任意小的正数ε，即这两者可以基本相等，这几乎是一个必然要发生的事情。
（2)辛钦大数定律设x1,x2,x3,…,xn是来自同一总体的变量，对于任意小的正数ε，有如下关系：
n
lim P {
x
<ε｝= 1
若试验条件不变，重复次数n接近无限大时，随机变量的 X与总体平均数之间的差一定小于一个任意小的正数ε，即这两者可以基本相等，这几乎是一个必然要发生的事情。
3、n , 2 可使两类错误的概率都减小.
1、总体方差σ2已知，无论n是否大于30都可采用u检验法 2、总体方差σ2未知，但n>30时，可用样本方差s2来代替总体方差σ2 ，仍用u检验法
x u= sx
3、总体方差σ2未知，且n<30时，可用样本方差s2来代替总体方差σ2 ，采用df=n-1的t检验法
互作也有正效应（协同作用）与负效应（拮抗作用）之分。
准确性(accuracy)，也叫准确度，指在调查或试验中某一试验指标或性状的观测值与
其真值接近的程度。

精确性(precision)，也叫精确度，指调查或试验中同一试验指标或性状的重复观
测值彼此接近的程度。
生物统计分析的一般过程
统计设计统计调查、实验
假设检验
概念：
假设检验（hypothesis test）又称显著性检验（significance test），根据总体的理论分布和小概率原理，对未知或不完全知道的总体提出两种彼此对立的假设，然后由样本的实际结果，经过一定的计算，作出在一定概率意义上应该接受的那种假设的推断。
=0.05/0.01
x =

n
（1）样本平均数分布的平均数＝总体平均数。
x =
（2）样本平均数分布的方差＝总体方差除以样本容量。

2 x
=

2
n
（3）如果从正态分布总体N(μ ，σ 2）进行
抽样，其样本平均数 x 是一具有平均数 μ ,
方差σ 2/n的正态分布，记作N(μ ，σ 2/n)。
中心极限定理 (central limit theorem)
二项分布（贝努里分布）：B(n,p)
现已求出某事件发生的概率，若试验N次，则该事件发生的理论次数为：理论次数＝NP(x）
一、二项分布
统计学证明，服从二项分布B(n,p)的随机变量x所构成的总体的平均数μ x 、标准差σ x与n、p这两个参数有关。
μ
x＝n p
x = npq
在二项分布中，事件A发生的频率 x/n称为二项成数，即百分数或频率。则二项成数的平均数和标准差分别为：
２
２
双尾检验分位数
u 0.05=1.96 u 0.01=2.58
＞
否定区
接受区
否定区
接受区
否定区
单尾检验分位数
u 0.05=1.64 u 0.01=2.33
两类错误
假设检验的两类错误
H0正确否定H0 接受H0 错误() 推断正确(1-) H0 错误推断正确(1-) 错误()
第一类错误（type I error），又称弃真错误或错误; 第二类错误（ type II error ），又称纳伪错误或错误
结论
１、两类错误既有联系又有区别
错误只在否定H0时发生
错误只在接受H0时发生
错误增加错误减小错误增加错误减小
结论 2、还依赖于 - 0 的距离
μ
p ＝p
p = pq/n
泊松分布：对于小概率事件，可用泊松分布描述其概率分布。二项分布当p<0.1和np<5时，可用泊松分布来近似。
μ =λ σ 2 =λ σ=
如果所有可能样本的某一统计数的平均数等于总体的相应参数，则称该统计数为总体相应参数的无偏估计值。
样本平均数的标准误差（标准误）（standard error of mean)
x t sx
同标准正态分布曲线一样，统计应用中最为关心的是 t分布曲线下的面积（即概率Ｐ）与横轴t值间关系。为使用方便，统计学家编制不同自由度#43;∝）
Ｆ分布曲线的形状仅决定于df1和df2。在df1＝1或2时， 2 Ｆ分布曲线呈严重倾斜的反向Ｊ型，当df1≧ 3时，转为左偏曲线。
( 2)， 6.统计数：描述样本特征的数，是样本观测的已知函数
样本平均数(
x
)，样本方差(s 2)，
7.效应：通过施加试验处理，引起试验差异的作用。效应是一个相对量，而非绝对量，
表现为施加处理前后的差异。效应有正效应与负效应之分。
8. 互作（连应）：是指两个或两个以上处理因素间相互作用产生的效应。
1. 统计学特点：概率性，二元性，归纳性
2. 大数定律: 样本容量越大，样本统计数与总体参数之差越小 3. t分布与t检验法 4.变量: 或变数，指相同性质的事物间表现差异性或差异特征的数据。( xi )
5.参数：描述总体特征的数，通常未知，用希腊字母表示，总体平均数()，总体方差
（二）方差（Variance) （自由度，字母）
样本
S2 = σ 2=
(x-x ) 2
n-1
总体
(x-μ
N
)2
（三）标准差(standard deviation, Sd)
S =
(x-x ) 2
n-1
x
=
2
2 （ x ）－
n n-1
大数定律：是概率论中用来阐述大量随机
现象平均结果稳定性的一系列定律的总称。主要内容：样本容量越大，样本统计数与总体参数之差越小。
u =
x x
x
=
x
/
n
(3)从两个独立正态分布总体中抽出的样本平均数差数的分布,也是正态分布。
N (1 2 ,
2 x1 x2
)
t分布的平均数μ 和方差σ
t 2
t
t = 0(df 1)
df = (df 2) df 2
2 t
t分布曲线与横轴所围成的面积为1。

e商务文档

统计学复习整理

相关文档推荐：